[BioRuby-ja] 混合塩基

遠藤 大二 dendoh @ hotmail.co.jp
2006年 9月 7日 (木) 16:26:48 UTC


Nishiyamaさん

ありがとうございました。

>>複数の塩基配列すべてについて、 
>>mRNA上での局在を検索する。
>
>ここでいうmRNAというのは塩基配列既知のものということですよ ね?
その通りです。

>正規表現で文字列を検索することで場所が分かるはずなので、
>そのまま、正規表現で検索すれば良いように思うのですが、

実際にやってみると、正規表現で検索すると、かなり時間がかかるばかりでなく、相
手が長大な配列の場合ハングアップしてしまいました。
このことを最初に書くべきでした。すみません。

それに対して単純な完全マッチの場合は、検索スピードが速く、また、MySQLの検索
式 "Where C like '%ACCGC%'
などという検索をするとデータが大きくても検索が確実に可能でした。

それで、可能な塩基配列すべてを生成するメソッドが必要になったというわけです。


とはいえ、せっかくのご提案なので、もう一度、正規表現のままでの検索を実施して
みます。

では。


>それでは不足でmismatchを許した検索をしたいということでしょ うか?
>--
>Tomoaki NISHIYAMA
>
>Advanced Science Research Center,
>Kanazawa University,
>13-1 Takara-machi,
>Kanazawa, 920-0934, Japan
>
>
>On 2006/09/05, at 1:09, 遠藤 大二 wrote:
>
>>酪農学園大学の遠藤と申します。
>>オルソローグをHomologeneから入手して、共通のアミノ酸配列 
>>からプライマーを設計
>>するためのスクリプトを作成しています。
>>共通のアミノ酸配列を選択して、コドンテーブルに基づいて混合塩基 
>>を予測するとこ
>>ろまではできましたが、
>>その混合塩基を含む配列のmRNA上の局在を決定する段階で問題 
>>が生じました。
>>HomologeneではProtein, mRNAともにFASTAフォーマット 
>>でのみダウンロードが可能で
>>あるため、ORFの位置を決めることが私にはできません。
>>それで、
>>混合塩基を含む配列をキーとして、mRNA配列上での局在位置を 
>>検索したいと思いま
>>す。
>>混合塩基から正規表現を生成するメソッドはあるようなのですが、正 
>>規表現から複数
>>の塩基配列を生成するメソッドというのはないでしょうか。
>>
>>WATCRYGGG → [A,T]ATC[A,G][T,C]GGG → [AATCATGGG,  AATCACGGG, 
>>.....]
>>
>>複数の塩基配列を生成できれば、それらの配列すべてについて、 
>>mRNA上での局在を検
>>索することができるので、プライマーとして働く位置が複数ある可能 
>>性も含めて、確
>>認が可能になります。
>>
>>なにとぞご教示ください。
>>
>>_________________________________________________________________
>>借りるから購入、リフォームまで住宅の総合サイト MSN 住宅  
>>http://house.msn.co.jp/home.armx
>>
>

_________________________________________________________________
節約のアイディア300例。お金の悩みは、MSN マネーで自己解決 
http://plan.money.jp.msn.com/saving/index.html 




BioRuby-ja メーリングリストの案内