[BioRuby-ja] Ruby Codes for Molecule

Nobuya Tanaka tanaka @ kuicr.kyoto-u.ac.jp
2004年 4月 16日 (金) 04:58:00 EDT


後藤様

コメントありがとうございます。

At Fri, 16 Apr 2004 16:41:03 +0900,
GOTO Naohisa wrote:
> 
> 後藤@阪大遺伝情報です。
> 
> On Thu, 15 Apr 2004 17:29:07 +0000
> Nobuya Tanaka <tanaka @ kuicr.kyoto-u.ac.jp> wrote:
> 
> > いまのところ、「KCF Compound, KCF Glycan, Molfile, CDX, CDXML,
> > Gaussian98 Log, chime xyz, Tinker xyz, Pov-Ray, SWF(Ming/Ruby),
> > Postscript」の読み(and/or)書きやTinkerのインターフェース、分子量や結合
> > 推定、Gillespieのアルゴリズムを実装しています。
> 
> よく知らないファイル形式が多いのでなんとも言えませんが、XML以外の
> ファイルの読み込みは、Bio::FlatFileの枠組みを使えば統合できると思います。
> ただし、Bio::FlatFileはいったん1エントリーを全部メモリ上に文字列として
> 読み込むという富豪的な手法を取っているので、xyzのような、ひたすら座標の
> 数値が書き込まれた巨大なファイルを読み込むのに最適かどうかはわかりません。

なるほどBio::FlatFileを使えばもっときれいに実装できそうですね。さっそ
くためしてみます。

ただ、Gaussian98 Logは信じられないくらい大きなファイルになることがある
のでSAX式に必要な部分だけを取り出すようになっています。これはFlatFile 
には不向きかもしれません。CDXはバイナリファイルなのでこれも難しそうで
す。

> ちなみに、ファイルの書き出しに関しては、BioRubyには統一的な枠組みがまだ
> 存在しません。今回の件とは直接関係ありませんが、私は、ある程度は統一した
> 枠組みが必要だなあと感じているところです(が、具体案はまだない)。

よくわかっていないのですが、SOAPでもFlatFileでも同様に出力できるという
ことですか?

> > > Bio:: でいいのか (Chem:: ?)
> > 
> > 現在はChem::としていますが、もし取り込んでいただけそうなレベルになったら
> > Bio::にしていただければと思います。
> 
> 他には、Bio::Chem:: にするという手も考えられます。
> 基本的に中身次第ですが、モノによっては Chem のままの残した方がいい機能も
> あるかもしれません。たとえば周期律表や分子量計算など、Bioと関係ない分野
> にも応用ができる機能はChemのままでもいいような気が私はします。

もともとは情報化学を念頭に置いていたので、Bioと関係のない機能もあると
思います。Computer Chemistryだけしかしない人には、Bioの名前空間に入っ
ているよりもアピールするかもしれないという気はします。でも名前空間を別
けることによる「繁雑さ」というデメリットがメリットを上回りそうです。

> > すでにchemのなかではbioを使わせていただいています。BioRubyにpdb.rbが入
> > る前には独自にpdb.rbを開発していました。chemからはとてもメリットがある
> > のですが、逆はというと。。。
> 
> つくっていたんですね...
> 現 pdb.rb の改善すべき点などありましたら、ぜひ教えてください。

pdb.rbのアナウンスがあったときにはびっくりしました。とてもきれいに実装
されているので関心した覚えがあります。



BioRuby-ja メーリングリストの案内