2009-06-01から1ヶ月間の記事一覧

用語のライセンスまわりをまとめてみる

http://gendoo.dbcls.jp/pre/で、とりあえず用語の日本語も出るようにしているのだけれども、この元リソースであるUMLS日本語版は、internal use onlyという指摘があったので、そのあたりをクリアにするべく、調べ始めてみた。あまりこういうのは好きではな…

NAR Web Server Issue 2009出ました。

bio

Nucleic Acids Research の Web Server Issue 2009 が出ました。Volume 37 Issue suppl_2 | Nucleic Acids Research | Oxford Academic まだ、トップページからはリンクがないですが。 自分のもページが決まりました。Gendoo: Functional profiling of gene …

蛋白質核酸酵素に登場する生物種一覧ドラフト版(上からと下から一画面分)

2458 ヒト Human A1.1.7.2.5.1 1985 マウス Mammal A1.1.7.2.5 1385 植物 Plant A1.1.1 1332 ウイルス Virus A1.1.3 1064 細菌 Bacterium A1.1.5 1053 酵母 Fungus A1.1.2 996 大腸菌 Bacterium A1.1.5 952 動物 Animal A1.1.7 656 ショウジョウバエ Inverte…

sort2tab な Perl one liner

IT

なんか、タイトルが変だが、uniq -c | sort とかやったときには、頻度と中身の間はスペース1個なので、タブ区切りだと思って処理するとなんかできないぃ、ということが昔あった。 15407 研究 Research Activity 12489 蛋白質 Biologically Active Substance …

抽出してきてくれた名詞リストを実際の文章と照らし合わせながら見ている

見た感じ、けっこういいじゃん、という印象。真菌が菌になっていたり、好中球が中球になっていたり、「非」が複合名詞中にあると、そこで切られて非も飛んでいるとか、まぁ、そんなのはあるが。 ただ、ちょっと大きなバグが。 なんか、ここに書くと本人をは…

sshで文字化け

IT

ささいなことなのだが、sshで入って日本語の入っているのを見たりすると文字化けしていた。向こう(Mac OSX)の.bash_profile に export LANG="ja_JP.UTF-8" と書いて解決。

辞書キタ

若いののケツをたたいて、というか、こっちが懇願して、現在のスナップショットでよいから、と形を出してもらった。本人は満足していないが、こっちとしてはありがたいことこの上ない。そりゃぁ、砂漠に草がちょぼちょぼ生えて、収穫するには程遠いかもしれ…

今日のキーワード

やっぱり辞書だな。

今日の出来事

昨日のうちに仕込みをしておいて、今日は準備万端とか思ったら、再起動がかかっていて、仕込みがすべてパーになっており、泡を食いました。早く準備しすぎるとよくないパターンの典型ですよ。 まぁ、儀礼的ないつものはいつものなのでいつもどおりで、事務仕…

今日やったこと

毎度毎度の儀礼の準備。 その際に、先に出た論文絡みで、そのサービスの紹介を少しやることになっているので、それの準備。プレゼンつくるまでもないので、材料となるウェブページとかドキュメントを集めておく。しゃべることの内容メモも作った。あとは、明…

新たなタスク

って、自分の中ではちっとも新しくないのだが。 DBCLSでは、っちゅうか、ライフサイエンス統合データベースプロジェクト-統合ホームページ-LSDBでは、日本語リソースというのも重要視していて、例えば、蛋白質核酸酵素全文検索とか、[学会要旨検索] ライフサ…

日本語化つづき

例。http://gendoo.dbcls.jp/dev/cgi-bin/gendoo.cgi?taxonomy=human&omimid=222100&omimid=125853 昨日は、遺伝子に関しての関連キーワードのページを日本語が出るようにしてみたのだが、今日は、疾患に関してのキーワードのページについて日本語が出るよう…

さらに進めてみた

上の続き。 まず、日本語であるが、違うコンセプトに同じMeSHのIDがふられており、明らかに違うだろうみたいな訳がついて気になったので(この場合は、最後に出てきたのが採用されていた)、UMLSの中で、MeSHとIDを同じくしているコンセプトのうちで、同じ記…

一応、日本語が出るようになってきた

例。http://gendoo.dbcls.jp/dev/cgi-bin/gendoo.cgi?genename=5172&taxonomy=human ↑今後、いろいろいじるので、たまに出なくなってもごめん。 今まで、HTMLタグをハードコーディングしていたのだが、ある程度、テンプレートに分離。Template::Toolkitに少…

今日の出来事

昨日の件で、ヒソカに別件の仕事がらみもお願いしてみたのであるが、その件でなんだかんだと内部の関係者にメール。もともと消極的なんだけど、徐々に世の中を変えていかねばならぬ。 用語の方でもディスカッション。実際にやるべきことは目的とかゴールとし…

用語集/対訳辞書:なぜかできる前からフィードバック

今日は、裏稼業の方の縁で、出版社系(っちゅうか翻訳系)の人の集いに参加。 先ごろ できあがった、うちのパンフをひとつかみとりあえず持っていく(なんか、宮崎のトラウマで、パンフを持っていくのに抵抗が出てきているのがどうもなのだが)。 せっかくな…

botでこういうのもアリ

http://lifesciencedb.jp/ag/のbotがあるわけですが、http://lifesciencedb.jp/lsdb.cgi?gg=resource_iconのAPIもあるとかないとかいう話が出てきたので、なるほど、これでもアリだな、と。

Gendoo日本語化(つづき)

つづき、やってますよ。 基本は、テンプレート内で[% hoge %]と書いて、プログラムで hoge => $fuga する感じで。 応用として、[% foreach hoge %]...[% END %]して、[% hoge.piyo %]しての、プログラムで hoge => \@fuga の @fuga = ({piyo => piyoyo}, {..…

Gendoo日本語化

これまで書いてきたように、UMLSとかで、日英対訳はなんとなく得られたので、それをGendoo - Gene, Disease Features Ontology-based Overview Systemに反映させよう、と。シンポジウムでも日本語にして、と言われたしね。 というわけで、やりかけてみる。 …

統合データベースプロジェクトシンポジウム

https://symposium.lifesciencedb.jp/2009/ 会場は、うち(DBCLS)の近所の武田ホール@東大 当日の様子は、http://blog.dbcls.jp/portal/20090612.htmlも参照のこと。 自分もポスター発表。バイオ医療専門用語の類義語獲得。感触はおおむね良好。(えらいか…

論文が載るまで

とタイトルを書いたらば、「論文がノルマで」と変換されてしまって笑えないなぁ、などと思ってしまったりして。いや、ノルマじゃないですよ。ここは。 「2009-06-05 - chalk-less::weblog::thecla」で書いたとおり、最近、論文を無事、出せたわけですが、そ…

というわけで

急速にやる気を逸して、さっさと帰りましたとさ。

concordance

コンコーダンスとは、これすなわち、用語の使い方・共起のことである。らしい。 そもそも、こんなコンコーダンスなんて言葉なんぞ、どんな文脈で出てくるんだよ、などと思うのだが、自分と違うコンコーダンス(っちゅうか、平たく言えばワールド。例:「えげ…

雑用ディ

結局、儀礼的な会議のために時間を割く、ということになった1日。それに抱き合わせで、事務作業に専念する。 まぁ、組織である以上、こういう儀礼的な会議も(頻度が低いうちであれば)許容すべきだとは思うのだが。というのも、そこでの議事録(というより…

ポスター刷り上げた

今週金曜日のhttps://symposium.lifesciencedb.jp/2009/に向け。同じDBCLSから、しこたまポスターが出るので、間際になると印刷機が必ずやバッティングすると考え、今のうちに。まぁ、前に作ったものの焼き直しなので早い、というのもあるのだけれども。 先…

論文でました

Gendoo: Functional profiling of gene and disease features using MeSH vocabulary Takeru Nakazato, Hidemasa Bono, Hideo Matsuda and Toshihisa Takagi Nucleic Acids Research, doi:10.1093/nar/gkp483 http://nar.oxfordjournals.org/cgi/content/ful…

ハチロクでぃ

ハチロクな面々が集ってくれたので、がっつり彼らと作業。 本当は、ポスターをしあげたかったが、明日できる仕事は明日やる方針で。 自分は自分なりに、彼らは彼らなりに、いろいろ考えて進めている気がする。よきかなよきかな。相乗効果が出るといいんだけ…

今日の予定

来週金曜日のhttps://symposium.lifesciencedb.jp/2009/での発表のポスターをできるだけ先に進めるべく、イラレな1日にしようかと。明日くらいには印刷したい。

専門用語抽出をやってみる(TermExtractで処理してみる・その1)

IT

サンプルプログラムは、専門用語(キーワード)自動抽出用Perlモジュール "TermExtract"の解説にリンクがある、と。 そいつによると、ファイルを食わすようになっている。って、MontyTaggerの出力をファイルにするってどうするんだよ。よくわからんから、 ./…

カケンヒ結果来る

B (20%〜50%) 判定でした。 きっと、ま、いいんでない? 的な評定だったのかな、と。 いい勉強になります。はい。 自分の信念を認めてもらうのは大変なことです。特に、その必要性を。 別に落ち込みもしないです。次はがんばるぞ、ってとこですねぇ。