2011-05-01から1ヶ月間の記事一覧

データの発掘も

そんなこんなでプログラムの方の掃除もしつつ、そういや、昔、こういうのをやってて、またやんなきゃだなーという感じになってきたので、とっちらかしたデータの方も、きれいにしてみることに。 そもそもマシンを乗り換える度に、前のはほったらかしで、必要…

アップデートしたら急にスクリプトが動かなくなったりとかして

IT

5/11に書いたとおり、セキュリティのアップデートもあって、port -v upgrade outdated だかしたらば、手持ちのPMIDを食ってNCBIに聞きに行き、abst.のXMLを吐くスクリプト(Perl)が動かなくなった。 これって、BioPerlで書いてあって、だから素のPerlとかそ…

PubMed Central のデータを使いかける

あまりにXMLが複雑怪奇すぎる上に、はやりの「節約」か異常に改行が少なくてみづらい。 そんなこんなで XML::Simple とかでは読み解くのがしんどいので、明日は別アプローチで読みほどくとする。 そもそも、拡張子がnxmlだしな。なんだそれ(をい

単にキーワードに拾ってもらうためのつぶやき

DBCLS

GENOME INFORMATICS@Cold Spring Harbor Lab

404 | CSHL November 2 - 5, 2011で、Abstract Deadline: August 12, 2011と。 どうまとめるかが課題だね。

例によって文献を落としてきて処理

検索結果のPMIDを投げて、BioPerlで処理し、PMC IDをとって、もいちど投げ、とりあえず落ちてきたXMLから何も考えずに正規表現で抜く。 18267968 2367719 TTTTTTTTTTCATATGTCCCAGAGCAGGCACCGCGAGGCCa TTTTTTTTGCGGCCGCTTACTTTCTTTCTGCTATTATCTTTAAATA TTTTTT…

スクリプトが動かなくなったが

bioperlは、安定版が1.6.1かな。開発版は、1.6.9までいっているっぽい。 ちょうど、Perlも、5.10から5.12になるころの過渡期で、ある日、5.12でないと動かない日が来ると思っていたのだが、今日かもしれんと思いつつ、一からインストールなども試みかけたが…