MEDLINE2010年版をParse

てなわけで、裏でParseを始めてみました。昨日 入れた、BioPerl利用。こういうスクリプトも公開した方がいいんかな。
MEDLINE中に、他のDB(GenBankとかOMIMとかPDBとか)のIDが登録されているところがあるので、それとPMIDとかをペアにして出す、というもの。Gendoo - Gene, Disease Features Ontology-based Overview Systemのデータ構築とかでも使うので。
GSE123みたいなこいつはGEOだろう、とかゆーIDがOMIMと記載されていて、ちょっとショック(汚いから、チェックが必要なのね orz ということ)。アメリカにメールするか?
こういうのは、スクリプト書いて回せばデータができるから楽チンだよねー。
(もちろん、データ構築としては序章なのだが)