[BioRuby-ja] Re: マルチファスタの取り扱いで質問2点

takeshi kawashima kawashima @ develop.zool.kyoto-u.ac.jp
2005年 4月 24日 (日) 22:23:22 EDT


なかおさん、片山さん、回答ありがとうございます。

片山さんのコメントに対してですが、

>% megablast -i eco.nuc -d syn.genome
>'gn:syn'=='+eco:b3756' (3325859 860 3325998 998) 12
>'gn:syn'=='-eco:b3756' (2452730 998 2452869 860) 12
>'gn:syn'=='+eco:b4007' (3325859 860 3325998 999) 13
>  :
>みたいなフォーマットを適宜パースできるだけでいいでしょうか?
>参考までに、よく使われるオプションとかあれば教えてください。

僕の個人的な例ですが、megablastを使うのは、クエリーがたくさんあるときではなく、
クエリー配列がでかい(1Mb以上)時です。
ですから、部分的にちょっと似ている部分などは気にする必要がないので、

megablasr -i query -d database -W 24 -e 1e-199 -o outputfile
などとしています。
(あとは -b 1 -v 1 -a 2なども良く使います。トップヒットしか必要でないことが多いので。)

とりいそぎ
        川島より

P.S
ところで、JGIで知り合いがくれたperlのプログラムでとても便利なのが、
上記のようなmegablastの結果をパースして、blastのふつうの
フォーマット風に書き直して表示するというものです。
このプログラムがあると、後はblastの結果に対して使っている自分のいろいろな
プログラムをそのまま使えるので便利でした。

====================================
川島 武士

  京都大学・大学院理学研究科
  分子・進化発生生物学研究室
kawashima @ develop.zool.kyoto-u.ac.jp
====================================



BioRuby-ja メーリングリストの案内