PostgreSQLいじり+DBを構築するときの参考資料などなど

上からと下からと頼まれた仕事があったので、PostgreSQLいじり。かなーり久々。ほとんど素人に近い。ま、MySQLならここ1年、ぽつぽついじるようになってきたので、本質は変わらんし、ネットにリソースは転がっているから、こういう仕事をしていたら、やったことないとか言っている場合でないし。セキヅイで作業せんといかん。
というわけで、7割から8割ほど済。細かい仕様をつめて、ま、月曜日にはできるっしょ。
バイオ系でデータベース構築するというと、古本屋とかに行くと、たまに↓こんな本にお目にかかったりするが、
[asin:4798105457:detail]
この本も2004年出版だから、実践的というよりは概念的な話が多く(まぁ、あまりに実践に走ると読者が減るから、というのもあるんだろうが)、そもそもOracleとかが著者だから、宣伝っぽいところは否めない気はする。公共DBのデータを落としてきてOracleにつっこみますよ、とか、Oracleにはつっこんだデータからこんな解析ができますよ、なんてのが書いてあるが、本来は、ネットとかでそういうのが見られるようになってもおかしくない。というか、簡単なものなら、自分でも作っているし(バイオ系データ解析@localhost)、そもそもこれの元リソースであるSystem DB administrator 構築者養成プログラムあたりが、それを担っている気もする。Ensemblみたいに(MySQLだけど)SQLのファイルが置いてあったり、NCBIみたいにうちらにとっては「例の形式」のを取り込んでみたり、はたまたもっと一般的にXML形式のデータ(こっち系の例だとMEDLINE/PubMedのデータなんかがそうだが)を取り込んでみたりとか、そういうのもこういうことをやっていると出てきたりするしなぁ(=自然にやる流れになってしまう)。えっと、なんか、いろいろ非難しているようですが、別にそうではなくて、実際の(自分のところでやる)データベース構築作業で行うべき流れとかが概略してあって、そこはいいと思いますが、もはや、読者側で自分のデータベースの場合はどうだろうか、と、本の受け売りではしかたないフェーズになってきている気がします(後でさらにもう一言)。
より実践的なものだと、↓こんな本とかがあって、今回も参考にしましたが

バイオ研究が10倍はかどるMacOS X活用マニュアル―セットアップから超簡単データ解析まで

バイオ研究が10倍はかどるMacOS X活用マニュアル―セットアップから超簡単データ解析まで

これの3章が、コマンドでデータを活用する話ですよね。PostgreSQLも載っています。この本も2003年か。MacOSも10.3が出る直前で、1章のMacを設定して使おうのあたりは、古さが出てきたけれども(今、finkなんて使わないし)、3章は、今でも全然 通用するよなぁ(ってことは、今もちょっと前も、やっていることはあまり変わらない、というか、後でもう一言)。思うに、ここいらの知識にプラスして、いろいろリテラシとしてさわることになるものってのが出てきたように思う(使うべきデータベースが増えたり、ツールとして、たとえば統計解析にRとか、Ajax [っちゅうかJSONとか] みたいな技術を踏まえた設計を行うための思想とか)。
で、もう一言ですが、たとえば、自分がPerlを覚えたのは、仕事で、NCBIのデータとか独自のデータを加工してWebにしたてろ、と言われたことで、結局、やらざるを得ない状況が一番 物事を進ませる気がする。そのときには、何でもかんでもが情報源なわけで。こんな本を読んで真似事したって、所詮、それは、作者がこんなんだと役に立つかなぁ、とか自分がやっている解析の一端を見せているだけの話で、読者の方で、ある程度、こんなことやってみたい、みたいなモチベーションをもって見てもらって、で、そこに書いてあることを自分なりに応用する、という状況が理想なんだろうなぁ。今回はデータベース構築の話だったけれども、そもそも、簡単にやるためには、タブ区切りで置いておいて、grepすればいいわけで(←乱暴)、というか、自分もけっこうそうしているわけだけれども、SQLに入れて便利な部分(データ量とか速度とか、...)が必要になってはじめてそちらに行ってもいいかなー、とか思います。
まぁ、このあたりは宗教論争なんでね。wetの人みたいに、まだこのあたりにとっくんでない人に、簡単のためにとりあえずで教えるのか、将来のきれいさを考えてきっちり教えるか。