[BioRuby-ja] SwissProt,Trembleのフォーマット変更

n @ bioruby.org n @ bioruby.org
2004年 7月 21日 (水) 00:39:02 EDT


上原さん


なかおです。


From: UEHARA Keizou <uehara @ cbo.mss.co.jp>
Subject: [BioRuby-ja] SwissProt,Trembleのフォーマット変更
Date: Tue, 20 Jul 2004 11:14:23 +0900

>  BioRubyの皆様、いつもお世話になっております。
> 上原慶三と申します。
> 
> 7月11日のftp://ftp.ebi.ac.uk/pub/databases/uniprot/knowledgebase/uniprot_sprot.dat.gzをBioRubyでパースしたところ、
> 
> Invalid format in R lines,[RG   INTERNATIONAL PSEUDOMONAS AERUGINOSA TYPING STUDY GROUP;]
> 
> /.../lib/ruby/site_ruby/1.8/bio/db/embl.rb:184:in `ref'
> /.../lib/ruby/site_ruby/1.8/bio/db/embl.rb:180:in `each'
> /.../lib/ruby/site_ruby/1.8/bio/db/embl.rb:180:in `ref'
> /.../lib/ruby/site_ruby/1.8/bio/db/embl.rb:176:in `each'
> /.../lib/ruby/site_ruby/1.8/bio/db/embl.rb:176:in `ref'
> 
> のようなエラーが発生しました。
> SwissProtのフォーマットが変更されたようです。

以下の16エントリにおいて、 Bio::SPTR#ref で RuntimeError が発生する
ことを確認いたしました。これらは最近更新されたエントリであたらしいフォー
マットが利用されています。

FMK7_PSEAE 
FMPA_PSEAE 
GK10_HUMAN 
GK14_HUMAN 
NNS3_HUMAN 
OR1_ANOGA 
OR2_ANOGA 
REC9_HUMAN 
TR35_MOUSE 
TR36_MOUSE 
TR37_MOUSE 
TR38_MOUSE 
TR39_MOUSE 
TR40_MOUSE 
TR43_MOUSE

指摘されたとおり、bio/db/embl.rb では UniProt release 1.12 of 21-Jun-2004 
であらたに追加された RG 行に対応していませんでした。

参考サイト:<http://kr.expasy.org/sprot/relnotes/sp_news.html>

> CVSをのぞいた限りではまだ対応されていないようです。
> こちらでembl.rbを変更して対応しましたが、もしよろしければ正式に対応していただけないでしょうか。

embl.rb の GN 行対応はできたので、テストが終りしだい CVS にコミットします。
ありがとうございます。

-
中尾 光輝                        <nakao-mitsuteru @ aist.go.jp>
                               <http://seq.cbrc.jp/%7Enakao>
独立行政法人 産業技術総合研究所          <http://www.aist.go.jp>
生命情報科学研究センター                   <http://www.cbrc.jp>
遺伝子情報系 配列解析チーム                <http://seq.cbrc.jp>
                                           Tel: 03-3599-8058
                                           Fax: 03-3599-8081  


BioRuby-ja メーリングリストの案内