UMLSから単語を抜き出してみたよ

昨日は、とりあえず日本語の用語を抜いてみたわけだけれども、今日は、英語のも含めて抜いてみた。
UMLSには、どこから用語をとってきたか、という情報のソースが載っているわけだけれども、そいつを利用して、「このDBのこのID」と名前群を対応づけられるようにテーブルを作成。これで一気にまた世界が広がった。うっしっし。とりあえず英語と日本語の名前リストみたいな感じのをつくったので、そこから、このDBにリンクのあるやつ、このSemantic Typeのやつ、としぼって料理していく予定。
あっち方面に応用さすには、実はあまり時間がないんだよな。