2009-08-01から1ヶ月間の記事一覧

short read archiveとして集められたデータを眺めてみる

bio

いや、中身を眺めているわけではなくて、どういうラインナップになっているかとか、あとメタデータですね。ようするに、とられたシーケンスデータについて、生物種がとか、プラットフォーム(機械というかベンダー/メーカーというか)とか、そういうのがどう…

short read archive でのデータ転送

最近、http://trace.ddbj.nig.ac.jp/dra/index.shtmlができたわけですが、Overview : Main : Sequence Read Archive : NCBI/NLM/NIHとか、http://www.ebi.ac.uk/embl/Documentation/ENA-Reads.htmlもあり。つらつら眺めている。 と、NCBIでもEBIでも、Aspera…

どんな生物種がどこに出てくるかデータのアップデート の つづき

thecla@g86:~/Sites/tmp$ cat mapping.090626.txt mapping.090804.uniq.txt | wc -l 670989 thecla@g86:~/Sites/tmp$ cat mapping.090626.txt mapping.090804.uniq.txt | sort | uniq | wc -l 406434 thecla@g86:~/Sites/tmp$ wc -l mapping.090626.txt 4018…

どんな生物種がどこに出てくるかデータのアップデート

http://d.hatena.ne.jp/thecla/20090629#1246267300とかhttp://d.hatena.ne.jp/thecla/20090701の続きで、蛋白質核酸酵素のどの記事にどんな生物種が出てくるかのデータのアップデート。 アップデートのデータをもらったので、アップデートしようかと。 なん…

アタマをマインドマップにまとめるのは勝手だが、それを他人に押し付ける奴は滅びろ

本家は、http://d.hatena.ne.jp/Hash/20090804です。すみません。 最近、まとめてみた、とかいうサイトに当たったのでラッキーとか思ったら、マインドマップだった、ということが(また)ありまして。 お願いだから、あんたの頭の構造っちゅうか、思考回路を…

次世代シーケンサ(のデータ)勉強会

訊きたいことは、他の人が指摘してくれたり、そういう質問ですか、みたいなので、する気も失ったり。 やる気を思い起こさせるというか、やっぱり、外の風を浴びると化学反応が起きるよね。

2万語整理するなんて

2万なんて、スクリプトである程度 流せればちょろいのだが、イチイチ目で見てなんて気が乗らないこと限りなし。階層構造にどうやって当てようかと思っていたのだが、階層構造と言えばいわゆるExplorer-likeなインターフェースということで、その用語のディレ…

XML::Parserが動かなかったんだけど

IT

なんか、環境構築をイチからやり直してめんどくせぇ人だなぁ、と思われているかもしれないが、せっかくなので、bioperlのインストールをhttp://bugja.sourceforge.jp/で再度まとめるチャンスでもあるなぁ、とか余計なことを思ったり。 いやぁ、だいぶ楽にな…

AWStats移した

IT

sudoでは、ワイルドカードが使えないらしい。 scp thecla@hoge.org:/var/log/http/access_log* ./ なんてことはできないらしい。 幸いにも向こうがLinuxだったので、sudo su とかゆー禁断の手を使って解決。 移し方は、ServerSoftSetup - it4bio@localhostあ…

XML::Parserが動かなかった

なんか別のマシンでも動かなかった気がするが、CPANをCPANから落としてくるとか、expatを入れ直すとか、あちこちしているうちになおってしまった気がする。 で、メインで使っているMacのはにっちもさっちもになったので、/opt/local以下をすべて消す(正確に…