PostgreSQLいじり+DBを構築するときの参考資料などなど
上からと下からと頼まれた仕事があったので、PostgreSQLいじり。かなーり久々。ほとんど素人に近い。ま、MySQLならここ1年、ぽつぽついじるようになってきたので、本質は変わらんし、ネットにリソースは転がっているから、こういう仕事をしていたら、やったことないとか言っている場合でないし。セキヅイで作業せんといかん。
というわけで、7割から8割ほど済。細かい仕様をつめて、ま、月曜日にはできるっしょ。
バイオ系でデータベース構築するというと、古本屋とかに行くと、たまに↓こんな本にお目にかかったりするが、
[asin:4798105457:detail]
この本も2004年出版だから、実践的というよりは概念的な話が多く(まぁ、あまりに実践に走ると読者が減るから、というのもあるんだろうが)、そもそもOracleとかが著者だから、宣伝っぽいところは否めない気はする。公共DBのデータを落としてきてOracleにつっこみますよ、とか、Oracleにはつっこんだデータからこんな解析ができますよ、なんてのが書いてあるが、本来は、ネットとかでそういうのが見られるようになってもおかしくない。というか、簡単なものなら、自分でも作っているし(バイオ系データ解析@localhost)、そもそもこれの元リソースであるSystem DB administrator 構築者養成プログラムあたりが、それを担っている気もする。Ensemblみたいに(MySQLだけど)SQLのファイルが置いてあったり、NCBIみたいにうちらにとっては「例の形式」のを取り込んでみたり、はたまたもっと一般的にXML形式のデータ(こっち系の例だとMEDLINE/PubMedのデータなんかがそうだが)を取り込んでみたりとか、そういうのもこういうことをやっていると出てきたりするしなぁ(=自然にやる流れになってしまう)。えっと、なんか、いろいろ非難しているようですが、別にそうではなくて、実際の(自分のところでやる)データベース構築作業で行うべき流れとかが概略してあって、そこはいいと思いますが、もはや、読者側で自分のデータベースの場合はどうだろうか、と、本の受け売りではしかたないフェーズになってきている気がします(後でさらにもう一言)。
より実践的なものだと、↓こんな本とかがあって、今回も参考にしましたが
バイオ研究が10倍はかどるMacOS X活用マニュアル―セットアップから超簡単データ解析まで
- 作者: 中村保一,荻島創一,礒合敦
- 出版社/メーカー: 羊土社
- 発売日: 2003/12
- メディア: 単行本(ソフトカバー)
- 購入: 1人 クリック: 11回
- この商品を含むブログ (7件) を見る
で、もう一言ですが、たとえば、自分がPerlを覚えたのは、仕事で、NCBIのデータとか独自のデータを加工してWebにしたてろ、と言われたことで、結局、やらざるを得ない状況が一番 物事を進ませる気がする。そのときには、何でもかんでもが情報源なわけで。こんな本を読んで真似事したって、所詮、それは、作者がこんなんだと役に立つかなぁ、とか自分がやっている解析の一端を見せているだけの話で、読者の方で、ある程度、こんなことやってみたい、みたいなモチベーションをもって見てもらって、で、そこに書いてあることを自分なりに応用する、という状況が理想なんだろうなぁ。今回はデータベース構築の話だったけれども、そもそも、簡単にやるためには、タブ区切りで置いておいて、grepすればいいわけで(←乱暴)、というか、自分もけっこうそうしているわけだけれども、SQLに入れて便利な部分(データ量とか速度とか、...)が必要になってはじめてそちらに行ってもいいかなー、とか思います。
まぁ、このあたりは宗教論争なんでね。wetの人みたいに、まだこのあたりにとっくんでない人に、簡単のためにとりあえずで教えるのか、将来のきれいさを考えてきっちり教えるか。