2009-08-01から1ヶ月間の記事一覧

文科省の来年度予算概算要求

平成22年度文部科学省 概算要求主要事項の発表資料一覧(平成21年8月):文部科学省。 うちらに直接関係あるのは、10-3.平成22年度概算要求の概要成長力の強化-経済危機の克服と将来の成長に向けた科学技術の振興 (PDF:1,798KB)。 ま、昨日、民主が大勝し…

仕様書書き

もらった情報をもとに、こっちの体裁に合わせる感じか。 とりあえず、体裁に合わすところまではしたけれども、こんなもんかなぁ。。。なんか、粘着している気がする。

本日休業

前々から決まっていたこと。

夏が終わる

7月頭に それまでの自分の仕事を発表して、ナニガシに全否定に近い対応をされてから、正直、ウツである。 研究したいと脳が反応するまで、絵描きか作家か高校の先生にでもなっていたい。 M1の、毎日、ラボに行くだけはして、ネットサーフィンしてたあの頃に…

分生アブスト

サチってるよな。

本業か裏稼業か

ここにいて、自分がやってます、と、確かに言える仕事のアップデート。 日本の生命科学データベース政策 - ライフサイエンス統合データベースプロジェクト

アブス途中

うまいこといったもんだね。> ことえり

分生アブスト中

アブスト中って、日本語としてどうかと思うが、書いている、とそういうことだ。 いっぺん、ドラフトで書いたが、世界の捉え方が違うという指摘の元、書き直し。 まだ、イマイチ ぐっときてない。

分生の要旨が今週中

AMは耳鼻科に行ってたので短縮営業。 今週金曜日が〆切で、で、今週は金曜日に休暇をとるつもりだから、さっさとカタツケたい。

分生要旨〆切1週間前

身悶えするシーズンだ。 トイレにいるときとかに、なるほど、と思えるアイデアがでたりするが、ノートに書き付けると、とたんに面白くなくなる。っちゅうか、実際のデータを見ろ、という感じもする。

一ユーザーとして

自分を信じるべし。

ディスッション

いい感じでディスカッションできた。率直に、自分の中でつっかえてたところを話ができたと思う。 志と、できることと、やるべきことと、うまく着地する糸口をもらえた気がする。 最近、やる気をそがれることばかりだったのだが、そういや、昔は、こうやって…

結局 正解セット

マニュアルでやるには大変で、だから、オートでがーっとやるんだけど、オートでやるためのしくみをつくるために、マニュアルで正解セットをつくらないといけなくて、だから、それは大変なんだって。 ま、200件くらいなら、とりあえず見るか、とか思うのは、w…

GEO→SRA

2009-08-11 - chalk-less::weblog::thecla で指摘しているとおり、GEOに入っているデータを、SRAに登録し直している、というのがあったりするようなので、リンクが書いてあるものを拾ってみた。今のところ、55件。→ ミスってた。65件に増加(16:38)

NCBIのFTPサイトを見ていて

ftp://ftp.ncbi.nlm.nih.gov/1000genomes/ というのができていて、少し気になる。

FTPサイトにデータが戻ってきた

nlmなしでもありでも、データがない感じだったが、今 見ると、戻っている。

試しにひとつ落としてみた

NCBIやEBIからは、ファイルを転送する手段として、Aspera - Next Generation File Transportとかにリンクがある。 インストールしてみて、試しにひとつ、落としてみた。なんかよくわからんが、faspというプロトコルを使っているらしい。早速、ぐーぐる先生に…

SRA FTPサイトでの連携具合

ここで公開するのか、というツッコミがありましたが、ただ単にミラーリングするだけなら技術的にはできますがねー。技術以外のところはいいんだろうか。 一応、NCBIの ftp://ftp.ncbi.nlm.nih.gov/sra/Submissions/ には、ERA (EBI) と DRA (DDBJ) のデータ…

SRAのFTPサイト

そんなわけで、 NCBI:ftp://ftp.ncbi.nlm.nih.gov/sra/ EBI ftp://ftp.era.ebi.ac.uk/ … FASTQファイルとか ftp://ftp.era-xml.ebi.ac.uk/ … XMLファイルなど DDBJ:ftp://ftp.ddbj.nig.ac.jp/ddbj_database/trace/

ファイルが消えたかと思った(向こう側

http://d.hatena.ne.jp/thecla/20090813#p1で、short read archive (SRA)のデータがダウンロードできる旨、書いたのだが、今日、作業してたら、突然、ファイルがFTPサイトになくなってしまった。 うおおぉ、どういうことだ、とおろおろしたのだが、よぉーっ…

BioPerlで、PMID→PMC ID変換:取り逃がし評価の傾向

6件のうち、PNASが4。Genome Biolが1。natureが1。 Genome Biol.はとれているものもあると確認。他は未確認。natureは、将来公開予定分を先行でIDだけふられている。

BioPerlで、PMID→PMC ID変換:取り逃がし評価

160のPMIDのうち、XMLにPMC IDが書いてあるのが92で、BioPerlで取れているのが86。(T-T)

BioPerlで、PMID→PMC ID変換:解決

目立つんで、一番下の gr.6593807 10.1101/gr.6593807 17989255 PMC2099594 を見ていたのだけれども、よく見たら途中に PMC2099594 というのが出てきていて、こっちを見ていたようだ。正常動作。 ってことは、取り逃がしが少しあるってことだな。。。むむむ…

BioPerlで、PMID→PMC ID変換:うまくいっていない

PMID(PubMed ID)から、PubMed Central のIDをとってくるというスクリプトを書いたのだが、ちゃんと変換がうまく行くやつと、うまく行かないやつがある。見るに、きちんとIDの部分がオブジェクトとしてとれているやつと、とれていないのがある。元のXML見て…

SRAのメタデータを取ってくる

統合ぐらし もSRAネタ。http://blog.dbcls.jp/portal/20090813.html 昨日は、eutilsで取ることを試みたわけだけれども、結局、efetchの部分がわからずじまい。もう少し、ちゃんと見ねばならん。 ただ、FTPサイト見ると、メタデータも置いてあるので、こいつ…

short read archiveのデータってeutilsで取れるんかな

NCBI SRA (Short Read Archive)のデータをeutilsとかで取れると、それを使ってちゃらちゃらーという流れなのだが、そもそもどうなのか。 まぁ、各シーケンスのデータは巨大なので、そういうのは、FTPサイトからとればよいと思うのだが。ここでやろうというの…

Short Read Archiveのデータを眺めてみている

たまに、GEOのデータをsubmitしました、というのがあるが、これって、今まで、SRAがなかったので、GEOに入れていたけれども、箱ができたので入れ直し、ということなんだろうな(たとえば、http://www.ncbi.nlm.nih.gov/sites/entrez?db=sra&term=SRX007142&r…

某依頼

なんかいやな予感はしていたのだが、手に負えないので、ごめんねーすることにした。 っちゅうか、リダイレクトされることにagreeはしたが、プロセスまで進むのにagreeはしていないのだが。 無視する度胸はないので、/dev/null ではなく、一応、きちんとリダ…

本日短縮営業

午後から耳鼻科のため。 分生の演題登録が徐々に迫ってくるんよねー。どう展開させるか。

Nature Biotechnology

眺めたり。 データ公開後にもその所有者がわかるタグ付けを Credit where credit is overdue. [Nature Biotechnology 27, 579 (2009) http://www.nature.com/nbt/journal/v27/n7/full/nbt0709-579.html ]とか、NCBI Peptidome: a new public repository for …