bio

Gendooのデータ更新 (allelic/non-allelic heterogeneity)

うっかり明日付けの日付でやってしまったが、まぁ、いいや。 疾患とその関連遺伝子(Allelic heterogeneity)というリストと、遺伝子とその関連疾患(Non-allelic heterogeneity)というリストを公開した。

更新用データのダウンロード(続き)

1/8は、データ更新の日でして、というか、毎年、この日の分のデータを落として、更新用のデータを作っている。ファイルの日付が1/8なんで、海の向こうのデータだから1/9に作業なのだが。 主要なデータは落としてあったのだけれども、そういえば、まだ落とし…

ついでに、BioConductorも

インストール。 (Rで)塩基配列解析とか試してみたいので。 と、そんな中、Rによるバイオインフォマティクスデータ解析 第2版 ?Bioconductorを用いたゲノムスケールのデータマイニング?の第2版が出るとの情報が。Rによるバイオインフォマティクスデータ解析 …

バイオ系テキストをマイニング

やっぱし、専門用語辞書だよね。 手でつくるのもいいけど、ある程度は自動化したいなぁ。。。(遠い目

こんな本をみつけた(科学政策)

数日前に本屋に行ったらば、こんな本を。ライフサイエンス政策の現在作者: 菱山豊出版社/メーカー: 勁草書房発売日: 2010/10/17メディア: 単行本(ソフトカバー)購入: 1人 クリック: 15回この商品を含むブログ (6件) を見る前の文科省ライフ課長ですなぁ。 …

分子生物学会で見つけた本とかアレコレ

先週は、神戸で分子生物学会(っちゅうか、正確には生化学会と合同でBMB2010ってやつだったが)でして、ブースに本屋が出てたので眺めてきた。Building Bioinformatics Solutions: With Perl, R and Mysql作者: Conrad Bessant,Ian Shadforth,Darren Oakly出…

SRAまわりの統計情報 を更新するしくみ

データを落としてくる。rsyncするのだが、前に書いた2010-08-10 - chalk-less::weblog::thecla。10分くらいで終わると思われ(更新だけで)。 で、中間ファイルをつくる。(なんかこっちの話だが) $ ./mk.idTable.sra.3.pl ../../data/sra2/ > sra.idconv.1…

本を見つけた

ちょうど、Cambridgeに来ただけにCambridge University Pressの本屋があり、物色。 Genomes, Browsers and Databases: Data-Mining Tools for Integrated Genomic Databasesってのを見つけたので、司令が購入。 EnsemblとかGbrowseとか、それを外からたたく…

学会初日

電車でケンブリッジに移動。そこからタクシーで30ポンド(30分かかるくらいだっけ?)

学会参加

14から21まで。Welcome to the Wellcome Genome Campus Conference Centre(通称:Hinxton。もうちょっと書くと、イギリスのケンブリッジの)で。404 | CSHL(2008ってあるけど2010)に参加。 初めてのイギリス(それどころか初めてのヨーロッパ)。 昼出で…

サイト設計

さすがに自分のマシンで実験的にやるフェーズでもなくなってきたので、実際の環境に近いところでやろうかと。てなわけで、自分の使っている外向けサーバーで。 プログラムを外からたたけるようにして、ID投げると結果が出るようにはした。で、こいつらに対し…

ブイブイ

先日のドウガネブイブイじゃなかった、アオドウガネは、標本にすべく針づけにしときました。が、時間が経ったので体がかたくなっており、ちょっと標本にするにはしんどいものに。。。 ま、写真撮ったし。 で、ドウガネブイブイですが、銅金蚉蚉と書くそうで…

SRAまわりの統計情報・自動化への試み

2010-05-07 - chalk-less::weblog::theclaでやったようにSRAのデータについて、実験の目的(タイプ)がどうとかプラットフォームがどうとか、生物種がどうとか、という頻度情報を出すというのをやったりしてまして、で、これが自動で更新されるようになんと…

どう見ても御器被りには見えん

今日は、来て早々に、昨日から廊下にゴなんちゃらって虫がいるんですぅ (T-T) と泣きつかれ、荷物を置く隙も与えられないままに、階下の廊下に連れて行かれる。一晩とどまるゴなんちゃらってどんだけどんくさいんだよ、とか思いながら(この時点でゴなんちゃ…

NCBIのsraメタデータにrsync

でけた。 rsync -avz --delete --include "*/" --include "*.xml" --exclude "*" ftp.ncbi.nlm.nih.gov::sra/Submissions/ sra/ */ でディレクトリを許可して、*.xml でメタデータであるXMLファイルを許可して、excludeでその他を拒絶。順番を間違えるとうま…

NCBIにrsync

[Bioclusters] FYI-- NCBI officially supports rsync:// for ftp .ncbi.nlm.nih.gov まだ、実際に動くかは確認してない。(ちょっと古いネタだしなぁ) rsync -av ftp.ncbi.nlm.nih.gov::blast/db/FASTA/ /local/data/FASTA/

文献リストでも表示さす − 準備

そんなこんなで、文献リストを表示さす、みたいなことが多々でてくるのだけれども、しかしながら手つかずであったので、この際にとりあえずのをやることにした。 仕事柄、日本語の文献も扱うのだけれども、ひな形だけの話であって、とりあえず、こっちも自分…

SRAで対応するのを対応づけてみる

なんちゅう曖昧なタイトル。。。SRAには、StudyとかExperimentとかもろもろデータ(もうちっというと、読んだシーケンスに対して、実験情報とかを書いたメタデータ)にタイプがあって、各々にIDが振られていて、でも、そいつらの対応がけっこうわかりにくい…

同じサンプルに対してマイクロアレイと次世代シーケンシング

bio

http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE10437 と http://www.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?study=SRP000105 Dynamic regulation of nucleosome positioning in the human genome GEOに登録してあって、SRAに再登録というパターンだ…

実際にモノができるだけで、ずいぶんいい感じ

開発をお願いしていた件について、打ち合わせ。 こういうのをつくりたいなぁ、というのを具現化してくれていて、変な言い方だけれども、金で解決できるうれしさよ。(そのノウハウを使って、自分でも別件でやることになるかどうか。。。) 今までに気づいた…

ミスに気づいた

データを眺めていて、関係性が複雑怪奇なので、それをほどく作業をしている。 昨日、うちの熱心な若いのが、同じ問題にぶちあたったようで、ちょっとお手伝いしたのだが、その過程で、自分のやっているのじゃ全部 拾いきれていない(ようするにミスっている…

こういう統計情報を

ちゃんと更新して公開できるようにできるといいですね。はい。わかります。

SRA/ERA/DRAのメタデータを読み解く・その3 〜 プラットフォーム別

7504 - 546 454 GS FLX 431 Illumina Genome Analyzer II 344 unspecified 332 Illumina Genome Analyzer 216 GS FLX 184 Solexa 1G Genome Analyzer 130 GS 20 38 AB SOLiD System 2.0 27 454 GS 20 16 Illumina Genome Analyzer II|unspecified 16 AB SOLi…

SRA/ERA/DRAのメタデータを読み解く・その2 〜 生物種別

8156 - 77 Homo sapiens 48 Mus musculus 45 Drosophila melanogaster 39 Drosophola melanogaster 26 Caenorhabditis elegans 21 Enterococcus faecalis 19 Arabidopsis thaliana 18 marine metagenome 18 Metagenomic 14 Lachnospiraceae bacterium 13 cor…

SRA/ERA/DRAのメタデータを読み解く・その1 〜 タイプ別

前にtwitterで流して(Loading...)、好評だったやつのアップデートをしてみた。 全部で、9918件 8199 - 913 Whole Genome Sequencing 330 Transcriptome Analysis 185 Metagenomics 137 Epigenetics 82 Other 38 Resequencing 14 Population Genomics 12 Ge…

SRA/ERA/DRAのメタデータを読み解く

やるぞー、とか思いつつ、どこを読み解くかねーとかいうこととなり、ファイルを眺めてみようとするのだが、各々のSubmissionで、Studyがあったりなかったり、Experimentがあったりなかったり、以下、云々ということとなっていて、見るのがしんどい。というわ…

出張依頼

正直、まさか来るとは思わなかったので、逆に励みになります。 今後も声をかけてもらえるようにしばらくはのさばってみようかと(てか、もっとのさばってる感が出てよいはずなんだよな

脱稿

だいたい当初のスケジュールどおりになってしまった(〆切 間違えてなかったらこのくらいにできただろうというスケジュールどおりになってしまった)。orz 今回、英語でもアブストを書いたのだけれども、普段 書かない(しかし、書く機会はあってもおかしく…

日本語処理・今年の

とりあえずPNEの文献を素のmecabで処理して、で、名詞連続のをつなげて、で、ある程度ブラックリストとかつくって、で評価してみる、なんて、なんかどこかでやっていたようなことを慣らしでやってもらってみたり。 帰りしなに話をしたらば、こういうのは例外…

執筆あと少し

心に余裕がなくなると机が汚くなって、心がさらにすさみ、で、机が汚れる、と。