<div dir="ltr">As there is not so much interest in this task (and people in biopython-dev were uncertain over whether it'd be useful to include kmer module into Biopython distriution), I've decided not to make it. If anyone needs a (non-Biopython) kmer library, there already are several. I haven't done a proper comparison, but kPAL seems most developed.<br></div><div class="gmail_extra"><br><div class="gmail_quote">2017-02-08 20:41 GMT+08:00 Alexey Morozov <span dir="ltr"><<a href="mailto:alexeymorozov1991@gmail.com" target="_blank">alexeymorozov1991@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi Alan, thanks for your feedback.<br>You've thrown some ideas that haven't crossed my mind. I was just wondering: why did you even find it necessary to cache distributions? What was the scale of your work? In my experience, aminoacid distributions of six complete eukaryotic proteomes up to k of 6 or 7 could fit into something like seven or so gigs (with no optimisation, without even numpy), so I thought nucleotide distributions will be prohibitive in terms of RAM only when there are tens of them.<br></div>
</blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><font face="arial,helvetica,sans-serif">Alexey Morozov,<br>LIN SB RAS, bioinformatics group.<br>Irkutsk, Russia.<br></font></div>
</div>