2010-06-01から1ヶ月間の記事一覧

14日目:PMCからGEO/SRAのIDを得る

PubMedCentralのXMLには、PubMedのIDを保持するタグが用意されている → 2584661 18976483

放牧12-13日目:GEO,SRAの登録データからPudMedのIDを得る

12日目(6/9)は、GEOのデータからPudMedのIDを抽出した。 具体的には、soft形式のデータを見て、 !Series_geo_accession = xxxx !Series_pubmed_id = xxxxx の部分から、GEOのアクセッション番号とPudMedのアクセッション番号を抜いた。 結果は16960個のGEOの…

放牧10-11日目:データ集め

随分、間が空いてしまった... ここへ書きこむテンションをまだ模索中です...。現段階?はデータ集めのフェーズで、 作業内容は、文献の本文データからGEOやSRAなどのデータベースへのアクセッション番号(とPubMed,PubMedCentralのID)を抽出してくるという…