疾患名の辞書でもつくってみるか(昨日から):ICD-10編

DBCLSでは、ライフサイエンス系の日本語文書の解析のために用語辞書をつくろうとしています。というわけで、やりはじめている。
やっぱし、疾患名と言ったら、ICD-10 (WHO | International Classification of Diseases, 11th Revision (ICD-11)) だよねー、などと思い、そっちに行ってみたり。でもって、日本語の方は、厚労省にそれゲな日本語訳を発見(「疾病、傷害及び死因の統計分類」|厚生労働省)。しかし、わざわざExcelのファイルなのに、IDと語が同じセル内で、階層をテキストの頭にスペースを入れて実現って(以下略)。
これはこれでいいのだが、Aliasとか収録されてないのかな。
いろいろ見ると、書籍やメディアを売るサイトに飛ばされる(本家の方)。こういう用語集はみんなのものだし、それにWHOなので、別に公開してもよいのでは?
メディアを焼いて売りつける商売を避けているのは理解するが、ちょっとね(それは日本も同じ)。ようするに権利関係があやしい。
ライセンスあたりを見ていたら、UMLSのライセンスがあるか、と書いてあった。っちゅうことは、UMLSに用語は入っているのか? ということで、次はUMLS編です。