公開しているとかいう辞書を使ってみる

そもそも

[辞書] ライフサイエンス統合データベースプロジェクト-統合ホームページ-LSDBっちゅうページがありまして、学術用語集を出典元を明記して、著者をリスペクト(しているふりを?)しつつ、デジタル化して公開しております。「しているふりを」っちゅうのは、こんな用語を集めるところのどこに著作権があるのか、と思う節が垣間見えるからですが。
で、最近、このデータの形式をかえて、ラテン語/日本語対訳とかが公開されたりしたので、眺めてみました。
最初に公開されていたのは、

@無足目@ is @標準和名@ for @無足目@ in @日本産爬虫両生類標準和名@ version @2008 年 5 月 27 日改訂@
@Linnaeus, 1758@ is @3rd field@ for @爬虫綱@ in @日本産爬虫両生類標準和名@ version @2008 年 5 月 27 日改訂@
@0@ is @4th field@ for @爬虫綱@ in @日本産爬虫両生類標準和名@ version @2008 年 5 月 27 日改訂@
@Reptilia@ is @学名@ for @爬虫綱@ in @日本産爬虫両生類標準和名@ version @2008 年 5 月 27 日改訂@
@爬虫綱@ is @標準和名@ for @爬虫綱@ in @日本産爬虫両生類標準和名@ version @2008 年 5 月 27 日改訂@
@http://www.erc.pref.fukui.jp/gbank/download/download.html@ is @URL@ for @福井県みどりのデータバンク, 1. 福井県産哺乳類リスト@ in @福井県みどりのデータバンク, 1. 福井県産哺乳類リスト@ version @取得年月日 2009-05-28@
@1. 福井県産哺乳類リスト@ is @リスト名@ for @福井県みどりのデータバンク, 1. 福井県産哺乳類リスト@ in @福井県みどりのデータバンク, 1. 福井県産哺乳類リスト@ version @取得年月日 2009-05-28@
@http://www.erc.pref.fukui.jp/gbank/download/download.html@ is @URL@ for @福井県みどりのデータバンク, 10. 環境省レッドリスト掲載の福井県産動物リスト@ in @福井県みどりのデータバンク, 10. 環境省レッドリスト掲載の福井県産動物リスト@ version @取得年月日 2009-05-28@
@10. 環境省レッドリスト掲載の福井県産動物リスト@ is @リスト名@ for @福井県みどりのデータバンク, 10. 環境省レッドリスト掲載の福井県産動物リスト@ in @福井県みどりのデータバンク, 10. 環境省レッドリスト掲載の福井県産動物リスト@ version @取得年月日 2009-05-28@
@http://www.erc.pref.fukui.jp/gbank/download/download.html@ is @URL@ for @福井県みどりのデータバンク, 11. 環境省レッドリスト掲載の福井県産植物リスト@ in @福井県みどりのデータバンク, 11. 環境省レッドリスト掲載の福井県産植物リスト@ version @取得年月日 2009-05-28@

な感じですね。で、最近 公開されたのは、

Abacetus leucotelus ホソツヤナガゴミムシ 北隆館 新訂 原色昆虫大圖鑑 第 II 巻 (甲虫 篇) 平成 19 年 5 月 10 日 新訂版初版発行 18334
Abacetus tanakai ヨツボシツヤナガゴミムシ 北隆館 新訂 原色昆虫大圖鑑 第 II 巻 (甲虫 篇) 平成 19 年 5 月 10 日 新訂版初版発行 18933
Abaciscus albipunctata シロテントビスジエダシャク 北隆館 新訂 原色昆虫大圖鑑 第 I 巻 (蝶・蛾 篇) 平成 19 年 1 月 25 日 新訂版初版発行 13339
Abacopteris insularis エラブコウモリシダ 平凡社 日本の野生植物 シダ 2006 年 1 月 20 日 新装版第 4 刷発行 45717
Abacopteris liukiuensis オオコウモリシダ 平凡社 日本の野生植物 シダ 2006 年 1 月 20 日 新装版第 4 刷発行 45709

な感じです。

で、使えるんですか、これ(権利編)

まぁ、上記の学名とかのは、割とカタい(誰がやっても同じになる)用語かとは思うのですが、一緒に公開されているのに学術用語集っちゅうのがありまして、

@2,6-ジアミノプリン@ is @(カナ)@ for @2,6-diaminopurine@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@
@2,6-ziaminopurin@ is @(ローマ字)@ for @2,6-diaminopurine@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@
@2,6-ジアミノプリン@ is @(和)@ for @2,6-diaminopurine@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@
@2 nセダイ@ is @(カナ)@ for @2n−generation@ in @学術用語集 植物学編 (増訂版)@ version @1990@
@フクソウセダイ@ is @(カナ)@ for @2n−generation@ in @学術用語集 植物学編 (増訂版)@ version @1990@
@2 n sedai@ is @(ローマ字)@ for @2n−generation@ in @学術用語集 植物学編 (増訂版)@ version @1990@
@hukuso^sedai@ is @(ローマ字)@ for @2n−generation@ in @学術用語集 植物学編 (増訂版)@ version @1990@
@2n世代@ is @(和)@ for @2n−generation@ in @学術用語集 植物学編 (増訂版)@ version @1990@
@複相世代@ is @(和)@ for @2n−generation@ in @学術用語集 植物学編 (増訂版)@ version @1990@
@2 x@ is @(カナ)@ for @2x@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@
@2 x@ is @(ローマ字)@ for @2x@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@
@2 x@ is @(和)@ for @2x@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@
@【二倍数】@ is @(和)の補足@ for @2x@ in @学術用語集 遺伝学編 (増訂版)@ version @1993@

これって、この編纂をした人たちが、こうしましょう、と決めたわけで、けっこうゆらぎがあるのでは、とか思うわけです。そのあたりの経緯については、陣頭指揮をとっている人がhttp://lifesciencedb.jp/cc/?p=32http://lifesciencedb.jp/cc/?p=40http://lifesciencedb.jp/cc/?p=110で語っているわけですが、問題点として

1. 著作権 冊子体には文部科学省と担当学会の著作権が明記
2. 混乱誘発の可能性 電子版改変物の流通によるノイズ発生
3. 商業出版の投資回収被害 編集、版面作成投資の回収への気遣い
4. 次回作成時問題 次回の用語集作成で出版社や学会の協力が心配
5. 冊子体固有の意義 国会図書館をはじめとする紙媒体アーカイブの完全性

をあげています。これに対して、「学術用語集のデジタルコピーを作るのでなくそれぞれの学術用語がどの学術用語集の何年版のどこに収録されているかの情報を拾い、誰がどの学術用語集の編集に協力したか、などの情報とあわせた下のような機械可読かつ人間も理解可能な巨大テキストデータを作成し無制限に共有しよう」という小さな「社会的実験」として、こういうことをやってみました、と謳っています。
個人的には、3 の問題が、一番の衝突材料かと思っていますが、

これはプリントしてもあまりに膨大で利用できず冊子体と競合することはありません。
それでいてデジタル利用や転用を考える利用者には簡単にパースできるために日本語変換や検索サービスなどの2次サービスのアイデアのあるエンジニアには便利です。 気軽にアイデアのテストや実サービスの拡張に利用してもらうことができるはずです。
メタ学術用語ファイルの配布は違法性がなく冊子体ビジネスとも競合しない最善の策だと思われます。

とのこと。もうネット上に辞書があるので、紙媒体の辞書なんか触わりもしなくなってしまった自分は、競合するよなー、と思いました(個人的な意見です)。まぁ、見るのにリテラシが必要だから、ウェブ上の辞書(goo辞書とかアルクとか)とは一概に一緒ではないですね。はい。

で、使えるんですか、これ(内容編)

とりあえずファイルを開いてみて、てれてれ見ていたところ、

Abies homolepis ウラジロモミ 北隆館 新牧野日本植物圖鑑 平成 20 年 11 月 25 日 初版発行 31733
Abies homolepis ダケモミ 北隆館 新牧野日本植物圖鑑 平成 20 年 11 月 25 日 初版発行 31734
Abies homolepis ニッコウモミ 北隆館 新牧野日本植物圖鑑 平成 20 年 11 月 25 日 初版発行 31735

え、これ、和名(スタンダードとして用いるべき日本語名称)として使うべきなのはどれなの?

Tribolodon brandti マルタ 東海大学出版会 日本産 魚類検索 全種の同定 第二版 2000 年 12 月 20 日 第 1 版第 1 刷 41476
Tribolodon ezoe エゾウグイ 東海大学出版会 日本産 魚類検索 全種の同定 第二版 2000 年 12 月 20 日 第 1 版第 1 刷 41477
Tribolodon hakonensis ウグイ 東海大学出版会 日本産 魚類検索 全種の同定 第二版 2000 年 12 月 20 日 第 1 版第 1 刷 41478
Tribolodon sachalinensis エゾウグイ 日本魚類学会 シノニム・学名の変更 取得日 2008-12-10 46374

エゾウグイは、sachalinensisの方かな? そもそもマルタってマルタウグイのことだよな。。。
と まぁ、ちょっと工夫が必要そうな感じ。。。

そもそも辞書って

使ってなんぼですよ。用語だけ集めるのに興味はなくて、どう使われているか。たとえば名寄せして、で、そこにはこういうことが書いてあったみたいなのに興味があるわけです。
なんか、まわりの話を聞いていると、辞書マンセー(辞書さえあればこわいものなし)みたいなことを言われて、そのたびに違和感を覚えているんだよねー。仮にシノニム(別名)を集めたところで、字面(じづら)が合っていれば正解、としてすべからく網羅できるか、というとできていない場面をさんざん見てきたし。逆に、以下に字面を見ないで、そのことが書いてあると決めるか(思い描いているのは、MEDLINE中での遺伝子名の同定で、字面を見るのでなく、その遺伝子に対応するMeSHとかがついていたら正解とするとか)、見ても、まわりの語を見て判断するとか、そういうのが必要だろう、と思っているわけです。

で、どうするか

ファイルに

# Note: This dictionary is still under inspection. Please use at your own risk.

とありまして、自分の方でリスクを鑑みて、使わない、ということで。
あくまでも個人的な意見です。このこんちくしょうが無駄なつまんねぇ仕事しやがって、ぶつぶつ、とか非難するのでなくて、使いたい人は使えばいい、自分はこのデータを使おうと思わないから使わないだけ、と言っているだけです。
仕事だからやっていたけど、自分がディレクションとるなら、こういうことはしないな、と会社時代に思っていたのと似ているかな。