[BioRuby-ja] Re: マルチファスタの取り扱いで質問2点
takeshi kawashima
kawashima @ develop.zool.kyoto-u.ac.jp
2005年 4月 24日 (日) 22:23:22 EDT
なかおさん、片山さん、回答ありがとうございます。
片山さんのコメントに対してですが、
>% megablast -i eco.nuc -d syn.genome
>'gn:syn'=='+eco:b3756' (3325859 860 3325998 998) 12
>'gn:syn'=='-eco:b3756' (2452730 998 2452869 860) 12
>'gn:syn'=='+eco:b4007' (3325859 860 3325998 999) 13
> :
>みたいなフォーマットを適宜パースできるだけでいいでしょうか?
>参考までに、よく使われるオプションとかあれば教えてください。
僕の個人的な例ですが、megablastを使うのは、クエリーがたくさんあるときではなく、
クエリー配列がでかい(1Mb以上)時です。
ですから、部分的にちょっと似ている部分などは気にする必要がないので、
megablasr -i query -d database -W 24 -e 1e-199 -o outputfile
などとしています。
(あとは -b 1 -v 1 -a 2なども良く使います。トップヒットしか必要でないことが多いので。)
とりいそぎ
川島より
P.S
ところで、JGIで知り合いがくれたperlのプログラムでとても便利なのが、
上記のようなmegablastの結果をパースして、blastのふつうの
フォーマット風に書き直して表示するというものです。
このプログラムがあると、後はblastの結果に対して使っている自分のいろいろな
プログラムをそのまま使えるので便利でした。
====================================
川島 武士
京都大学・大学院理学研究科
分子・進化発生生物学研究室
kawashima @ develop.zool.kyoto-u.ac.jp
====================================
BioRuby-ja メーリングリストの案内