通りすがりの縁ってやつですかね

前回、遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―という本を紹介したのだが、って、紹介したってほどじゃないよな、めくった記録をつけたくらいが正しいと思うが、それに対して、著者の方から、その本にかける情熱を書き付けていただいて(ryamadaの遺伝学・遺伝統計学メモ − 分子生物学オミックスと統計遺伝学と http://d.hatena.ne.jp/ryamada22/20120605 )、前書きと後書きくらいは読んでおいた方がよかったかなー、といまさらに思ったりしております。
一応、『そんなつもりでまとめたのが、この本だったのだけれど、「わかりにくい」らしい』とあったので、自分の書いたものをctrl-Fして「わかりにくい」が0件であることを確認して、
まぁ、私なんぞが、本屋でのわずか10分にも満たない、ぱらぱらめくっただけの感想に一喜一憂させては非常に忍びないと思うとともに、『大量データ科学時代の「遺伝」学の解析を勉強するのに、どこから、どう攻めるのがよいかは、画一的なアプローチがない(と思う)ので、難しい』は まったくそのとおりなわけで(いや、ここで述べられている分野に限らず)、そんな中で、どうやって勉強するか、ってのは試行錯誤だなー、と思うわけです。
まぁ、まわり(=研究者でない。というかぶっちゃけメディアとかサイエンスコミュニケーションとかの人ですよ)からすると同門らしく、自分としては専門外のGWASの解析の話とか訊かれて、で、なんで自分が、とくすぶりつつも、こういうことですかね、と連帯責任のようにこたえている、というのは、前にも書いたことですが(いや、そこまでは書いてないが)、その度に、専門の人に申し訳ないと思いつつ、精進を誓っているわけです。
いくら教科書を読んだって、それが研究活動に役立つのか(+役立たないか)は、自分もwetをやっていたからわかりますが、結局、ニーズとか現場がヘテロであるだけにOJT (on-the-job training:ようするにやって覚えろ) なわけで、そんな中、書いていただいたように、結局、そういう形式に落ち着いた、というのは、確かにそうだよなー、とじわじわ共感がわいてきます。
っちゅうか、どうして本にこたえを求めた > 自分、って感じですよね。本としてのありよう、ウェブコンテンツとしてのありようってのがあるわけで、どうしても本という媒体はコストとか儲けとかに縛られる。本では対応できない次々に出てくる「新しいこと」もウェブなら対応できる。えてして、ウェブだとルーズリーフに書かれたものが五月雨式にアップされていて的な感じで、その目次がつくられる文化さえできれば、系統だってとりこぼしなくその部分をおさえられるようになるわけで、本という媒体の必要性はさらに価値を失うのではないか、と思ったりするのですが。(一応 書きますが、本を否定しているのではないです。ウェブだと五月雨になりがちな知識を本は系統だって勉強できる、ウェブだととかく行方不明になりがちだけれども、本は手元に置いて付箋も付けて、すぐに参照できる)
それに、この界隈では言い出しっぺの法則というのがあって、こんなのがほしーなー、と言うならば、そういう自分が始めればいいんですよね。で、最初こそど素人なんで、と断りは必要かもしれませんが、論文を読むための分子遺伝学の基礎の基礎、みたいなのを始めればいい。で、自分の精進をそこに記録すればいい(いや、多分やらない、というかやれないけど)。
えっと、この文章も相変わらず支離滅裂だし、久しぶりの超口語体だけれども、なんだかんだいって、適当に本を書いて学生に教科書だから買えみたいな人には、このくらいホネのある本をつくってほしい、とは思いますね。それより何より、ウェブであそこまで発信できる、というのは、頭が下がるというか、身につまされる思いがします。
今後ともサイトを参考にさせていただきます。よろしくお願いします。とは、この場ながらお伝えしたいと思います。

ついでに見かけた本(バイオパンク)

バイオパンク DIY科学者たちのDNAハック!

バイオパンク DIY科学者たちのDNAハック!

ヘー。バイオバンクかー。生体材料の方かな、データの方かな、と思ってぱらぱら。なんか様子がおかしいと思ってよーく見ると、Bio Bank でなくて、Bio Punk だったorz。
えーっと。若者がガレージとかで現在の最先端の解析と一線を画して、DNA操作とかして何かムーブメントの予感、みたいな本みたいです。はい。

またもや立ち読みしてきた(遺伝統計学の基礎)

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―

自分はこのあたりのことは詳しくないのだが、なぜかいろいろ訊かれることが多くて、その度にいろいろ調べたりしてこたえたりしている。
で、ryamadaの遺伝学・遺伝統計学メモ ( id:ryamada22 ) をいろいろ参考にしてこたえたりしていたのだが、いまさらながら、それが本になったとかで(遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―)立ち読みしてきた。
最初、遺伝学の棚を見たのだが、なくて、おっかしぃなーとか思いながら統計学の棚に行ったらばそこに。ぱらぱらめくると、確かに統計学の本だった(あたりまえかもしれんが)。ようするに、そこに並んでいるというのは正しかった、ということだ。他にもこの手の本はあるけれども、なかなかにツボを押さえて、Rのコードも書いてあった気がしたし、とっつきやすい印象はもったりした。
ただ、これは個人的な意見なのだが、生物屋で「統計わかんないから勉強したいんですよねー」とか、本気でSNP解析をやろうと入り口に立つ人って、遺伝学の知識の方が曖昧で(って自分もそうなのだが)、mutation と variation となんちゃらとって違いって、みたいなそういう初歩の人もいて、そういう違いとかから最近の統計を使った解析まで誰か解説してくんねぇかなー、なんて、はい、ムシがよすぎますです。はい。(そもそも売れなさそうだから、PDFで配布みたいな)
あんまり役に立たないレビューですみません。

書籍部に行って見つけた

旅するウナギ―1億年の時空をこえて

旅するウナギ―1億年の時空をこえて

旅するウナギ―1億年の時空をこえて というのを見つけました。これって東大の総合研究博物館でやっていたものの書籍化みたいな感じ?(表紙から)
Mのころにウナギで研究していた身としては、かなりぐっとくる内容。ウナギの生態とか文化とか、写真もふんだんで、今にもぽちっとしそう。いや、せねば?

Amazon眺めてて見つけた

Statistics and Data Analysis for Microarrays Using R and Bioconductor (Chapman & Hall/CRC Mathematical and Computational Biology)

Statistics and Data Analysis for Microarrays Using R and Bioconductor (Chapman & Hall/CRC Mathematical and Computational Biology)

Springer → 丸善 のをAmazonで調べていて、こんなの(Statistics and Data Analysis for Microarrays Using R and Bioconductor (Chapman & Hall/CRC Mathematical and Computational Biology))が出てきたのでメモしておく。2012年1月に2nd ed.が出ていた、ということで。

SRAs データ作成のプログラム改良

今日やったよ、というログのために。
生物種の統計値をつくるのに、NCBIをたたいているのだが、XMLパースエラーみたいなのが出たりして最近よく落ちるので(NCBIが問い合わせへの回答にたまにエラーを吐くとにらんでいる)、前に見た結果を残しておいて、それを見るように変えた。

SRA のデータが汚い(いまさら)

まずはこちらをご覧ください。


...



pubmed
17916733


これは、SRX096404というデータで、実体はSRA045429.experiment.xmlですが、このデータが、PubMed の 17916773 、つまり、http://www.ncbi.nlm.nih.gov/pubmed?term=17916733Microbial population structures in the deep marine biosphere. - PubMed - NCBI)をさしている、とそういうことです。
ここで数字の後ろにスペースが入っていることは、この際、目をつぶるとして、こういうのを拾ってきて、SRAsのhttp://sra.dbcls.jp/cgi-bin/publication.cgiが作られています。
続きまして、こちらをご覧ください。


...



pubmed
1146689


これは、SRX092822というデータで、実体はSRA045571.experiment.xmlですが、上のからすると、このデータが、PubMed の 1146689 をさしているので、まぁ、普通は、http://www.ncbi.nlm.nih.gov/pubmed?term=1146689Etiology of the mitral valve prolapse-click syndrome. - PubMed - NCBI)を指すだろうことは想像に難くないわけです。はい。しかしながら、この文献は1975年に出ているものでして、SRAデータのタイトルがMoorea Reef 16S rRNA gene surveyなのに、どうしてなんちゃらsyndromeが出てくんねんっちゅう話になるわけです。こんなこともあろうかと、SRAsの文献リストにはオリジナルのID、つまり、文献中の記述そのままが書いてあって、たとえば、文献中でGEOのIDで書いてあるのを変換するとこのSRA IDになるっちゅうのがわかるようにしたのですが、どうも今回はサンプル作成の論文ではないという感じがしたわけです。
で、これはおかしいとデータをじっと眺めてみると


...



pubmed
1146689


← ここまでは前掲
multiplexed libraries
protocol_description: a long description of the library
construction nucl_acid_amp: 10.1126/science.1146689 url:
http://amarallab.mbl.edu/mirada/mirada.html;
...
elongation:72degC_10 min;28 cycles

ん? ん? んんん???

10.1126/science.1146689

これはっ。
GoogleをDOIで検索 → Resolve a DOI Name 開く → 上のを入れる → ぽちっとな → Microbial Population Structures in the Deep Marine Biosphere | Science
おおおおおおおおおおおおおおおおおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅおぅ。
ちょっと今、立ちくらみがしました。
これはねー。
どうせぃっちゅうねん。
業務連絡:個々につぶします。気にしなくてよいです。