IT

移行

担当していたアレですが、私の手を離れることに。 というわけで、ここのところ(担当の)移行作業をしていたのですが、うっかり自分のアカウントで作業してしまっていたので、それ用のアカウントに直してもらったり。rootのお世話になりました。 少しは後学…

PubMed Central (PMC)データをいじってみる

前に統合牧場で話に出ていたのだが、PMCのデータもFTPにあるのね。探すの苦労した。。。 File Validation Tools 直接的なリンクでないけれども、せっかくだから、他のツールのリンクもあるのでこっちを。 で、落としてきた。tar.gzで3GBくらい。ほどくと、雑…

カキモノ

ここのところしばらくは、ずぅーっとカキモノしとりました。 なんとか昨日、それなりに一段落を迎えました。今は、英文校閲中です。早く返ってこないかなー(って今回のは長いしな)

Gendooのデータ更新 (allelic/non-allelic heterogeneity)

うっかり明日付けの日付でやってしまったが、まぁ、いいや。 疾患とその関連遺伝子(Allelic heterogeneity)というリストと、遺伝子とその関連疾患(Non-allelic heterogeneity)というリストを公開した。

更新用データのダウンロード(続き)

1/8は、データ更新の日でして、というか、毎年、この日の分のデータを落として、更新用のデータを作っている。ファイルの日付が1/8なんで、海の向こうのデータだから1/9に作業なのだが。 主要なデータは落としてあったのだけれども、そういえば、まだ落とし…

ついでに、BioConductorも

インストール。 (Rで)塩基配列解析とか試してみたいので。 と、そんな中、Rによるバイオインフォマティクスデータ解析 第2版 ?Bioconductorを用いたゲノムスケールのデータマイニング?の第2版が出るとの情報が。Rによるバイオインフォマティクスデータ解析 …

バイオ系テキストをマイニング

やっぱし、専門用語辞書だよね。 手でつくるのもいいけど、ある程度は自動化したいなぁ。。。(遠い目

MacOS 10.6 に RMeCab

IT

いまさらながら、できましたよ。 R 2.12.1 + mecab 0.98 + RMeCab 0.93 になります。はい。 インストールなどはRMeCab - RとLinuxと...に書いてあるとおり。 今までうまくいかなかった原因ですが、mecabを/opt/local以下にインストールしていたからでありま…

分子生物学会で見つけた本とかアレコレ

先週は、神戸で分子生物学会(っちゅうか、正確には生化学会と合同でBMB2010ってやつだったが)でして、ブースに本屋が出てたので眺めてきた。Building Bioinformatics Solutions: With Perl, R and Mysql作者: Conrad Bessant,Ian Shadforth,Darren Oakly出…

json→table

収載予稿集リスト − 医学・薬学予稿集全文データベース検索をupdateしてみました。 前のバージョンでは、つどつどその場でSQL呼んでこのテーブルをつくっていたのですが、件数とかいつからいつまでみたいのが欲しいよね、ということで、そうすると、つどつど…

Excel から タブ区切りに直す

Excelでつくられた表を処理しようと、タブ区切りに直してみた。 そうしたらば、セル内での改行がそのまま改行として認識され、改行されている(わかりにくい文章だ)。というわけで、タテに見ると、中がそろっていない。 よく見ると、セル内改行の部分は、" …

副作用

CGI (Perl) とPHPを別にしていたのを一緒にしたことで、件数の情報も使えることになった。というわけで、さっそく対応。 if 文で、クエリのある/なしによって、最新XX件と、検索結果:XX件を使い分けるということもできるように。

SRAまわりの統計情報 を更新するしくみ

データを落としてくる。rsyncするのだが、前に書いた2010-08-10 - chalk-less::weblog::thecla。10分くらいで終わると思われ(更新だけで)。 で、中間ファイルをつくる。(なんかこっちの話だが) $ ./mk.idTable.sra.3.pl ../../data/sra2/ > sra.idconv.1…

MySQL+PHPで検索できるようにする(徐々に)

そもそもPHPにどうやって引数渡すんだよ、とか、その引数をどうやってSQL分に反映さすんだよ、とか、あぁーもう素人だよなぁ。 こういうのをきちんと書き留めるところが重要(と言い聞かせる。

MySQL+PHPで検索できるようにする(準備)

火曜日につくったのは、あらかじめSQL分を埋め込んでおいて、その結果をソートしたりするやつだったんだけれども、実際には検索をしたいわけで、そのあたり、クエリを渡して、なところを昨日、今日と眺めたりしている。 PHPのモジュールの違うのはあったりす…

MySQL+PHPでサイトをつくる続き

UsingDbService - it4bio@localhostとか参考にしながら、PHPのスクリプトをこさえて、でるかなー、とやってみるが、まぁ、いつものことながら出ない。 んー、なんでかなー、とか思ったら、そもそも、Apacheの方、httpd.confでPHPの項がコメントアウトされて…

portでMySQL+PHP

IT

だんだんはまりの予感。 前に書いたもの(UsingDbService - it4bio@localhost)だと、 $ sudo port -d install php5 +mysql5 +pear と書いてあるのだけれども、 nakazato@casper:/private/etc$ port -v variants php5 php5 has the variants: apache: Add Ap…

MySQL+PHPでサイトを作る方

今度はこっち(UsingDbService - it4bio@localhost)を参考に、と。。。 portでPHPをインストール中。。。 こんなの出た。↓ ########################################################### # A startup item has been generated that will aid in # starting…

MySQL+PHPでも

金曜日に関係者で話をして、HyperEstraierでもいいけど、MySQL+PHP程度でいいんじゃないかというような話になったので、実際に動きがどうか確認するべく、データをつっこみ始めようと。 マシンが新しくなっているので、MySQLをちゃんと動かせるところから。…

サイト設計

さすがに自分のマシンで実験的にやるフェーズでもなくなってきたので、実際の環境に近いところでやろうかと。てなわけで、自分の使っている外向けサーバーで。 プログラムを外からたたけるようにして、ID投げると結果が出るようにはした。で、こいつらに対し…

大量のファイルの転送

IT

この業界(とか、そっちの業界)にありげーな、大量ファイルの転送が必要な状況になっちゃいました。 まず、外付けHDDをつないだらば、ext3フォーマット(ようするにLinux)だったので、Macで読めず。とりあえず、Mac ext3とかでぐぐって、Mac OS X Ext2 Fil…

SRAまわりの統計情報・自動化への試み

2010-05-07 - chalk-less::weblog::theclaでやったようにSRAのデータについて、実験の目的(タイプ)がどうとかプラットフォームがどうとか、生物種がどうとか、という頻度情報を出すというのをやったりしてまして、で、これが自動で更新されるようになんと…

NCBIのsraメタデータにrsync

でけた。 rsync -avz --delete --include "*/" --include "*.xml" --exclude "*" ftp.ncbi.nlm.nih.gov::sra/Submissions/ sra/ */ でディレクトリを許可して、*.xml でメタデータであるXMLファイルを許可して、excludeでその他を拒絶。順番を間違えるとうま…

NCBIにrsync

[Bioclusters] FYI-- NCBI officially supports rsync:// for ftp .ncbi.nlm.nih.gov まだ、実際に動くかは確認してない。(ちょっと古いネタだしなぁ) rsync -av ftp.ncbi.nlm.nih.gov::blast/db/FASTA/ /local/data/FASTA/

文献リストでも表示さす − 準備

そんなこんなで、文献リストを表示さす、みたいなことが多々でてくるのだけれども、しかしながら手つかずであったので、この際にとりあえずのをやることにした。 仕事柄、日本語の文献も扱うのだけれども、ひな形だけの話であって、とりあえず、こっちも自分…

SRAで対応するのを対応づけてみる

なんちゅう曖昧なタイトル。。。SRAには、StudyとかExperimentとかもろもろデータ(もうちっというと、読んだシーケンスに対して、実験情報とかを書いたメタデータ)にタイプがあって、各々にIDが振られていて、でも、そいつらの対応がけっこうわかりにくい…

HyperEstraierで検索されたりされなかったり

とりあえずキーワード検索はできるように。 人の名前とか、そういうので検索できるかなーとかやってみたが、うまく行かず。 HyperEstraierに食わすための暫定データって @uri=http://www.infosta.or.jp/journal/201007j.html#3 @title=文部科学省「統合デー…

HyperEstraierのページにつながらない → 引っ越ししとった

IT

のきなみ404なんだけど。。。 と思ったら、sourceforgeからhttp://fallabs.com/hyperestraier/に引っ越してた。

HyperEstraier使ってインデックスつくってみる

しこたまのPDFと、それに対するメタデータ(独自フォーマット)に対して検索をかけたいと思っているので、http://fallabs.com/hyperestraier/uguide-ja.html#formats の文書ドラフトの項を参考に、それっぽいドラフトデータをつくってみた。 最初、1ファイル…

HyperEstraierいじり

IT

いれてみたので、実際に検索できるか、そこいらのデータで試してみる。 http://hyperestraier.sourceforge.net/intro-ja.html を参考に。インデックスをつくって、で、CGIを設置し、検索をかける、と。 とりあえず、今までためていた論文 (PDF形式) を相手に…