2009-06-01から1ヶ月間の記事一覧

専門用語抽出をやってみる(TermExtractを入れてみる)

IT

専門用語(キーワード)自動抽出用Perlモジュール "TermExtract"の解説に書いてあるまんま。 落として、ほどいて、Makefileつくって(perl Makefile.pl) → make → sudo make install 確認は、perl -M TermExtract -le '...' とかでなくて、perl -M TermExtrac…

英語で形態素解析をするためにソフトを入れてみる(使ってみるまで)

IT

普通に解凍。unzip。 MontyLinguaってpythonかJavaで動かすみたい。makeも何も必要なし。 コマンドラインで使うなら、pythonが入っている上で、pyothonフォルダで、run.batを動かせばよいようだ。中身は、"python MontyLingua.py"なだけだが。うねうね読まれ…

英語で形態素解析をするためにソフトを入れてみる(落とすまで)

IT

TermExtractをとりあえずはいじってみるかー、てなわけで、その中で英語の形態素解析をやるのに紹介されているBrill's Taggerから、ということでリンク先に行くと、どれをクリックしていいんだか。どうやら、You can still get my part of speech tagger HER…

辞書作り

id:syou6162が、出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blogなんて刺激的なことをやっていて、TermExtractなんてのを紹介してくれたので、興味津々です。自分の方は、英語の文章も相手にしているので、英語でも使えそうなのがよいです。テキ…

昨日は

日本の生命科学データベース政策 - ライフサイエンス統合データベースプロジェクトのコンテンツ追加をやってました。 総合科学技術会議−ライフサイエンスPT(第14回)というのがあり、これの内容を盛り込んだのですが、DBCLSの今後だけでなく、日本の国と…