<div dir="ltr">Thanks,<div><br></div><div>I filed this as a feature request for the BioJava 4 series on GitHub.</div><div><br></div><div>Andreas</div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jul 13, 2016 at 4:10 AM, Peter Cock <span dir="ltr"><<a href="mailto:p.j.a.cock@googlemail.com" target="_blank">p.j.a.cock@googlemail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Jonas,<br>
<br>
Thanks for emailing me that example with an M in the sequence.<br>
Biopython could parse it fine, and having checked our existing<br>
sample test files, this one has K, R and Y bases:<br>
<br>
<a href="https://github.com/biopython/biopython/blob/master/Tests/Abi/3730.ab1" rel="noreferrer" target="_blank">https://github.com/biopython/biopython/blob/master/Tests/Abi/3730.ab1</a><br>
<br>
BioJava would be welcome to use that (double check with<br>
Bow, CC'd, if you need it explicitly under a different licence).<br>
<br>
Regards,<br>
<br>
Peter<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
On Tue, Jul 12, 2016 at 5:41 PM, Peter Cock <<a href="mailto:p.j.a.cock@googlemail.com">p.j.a.cock@googlemail.com</a>> wrote:<br>
> Hi Jonas,<br>
><br>
> Are you happy to share sample file(s) using IUPAC ambiguity<br>
> codes like M = A or C which could be freely used by BioJava<br>
> and other projects as a test case?<br>
><br>
> (I'm specifically asking for Biopython as I'm not sure if anyone<br>
> has tried this with our ABI parser)<br>
><br>
> Thanks,<br>
><br>
> Peter<br>
><br>
> On Tue, Jul 12, 2016 at 4:26 PM, Jonas Dehairs <<a href="mailto:jonas.dehairs@gmail.com">jonas.dehairs@gmail.com</a>> wrote:<br>
>> The 4.2 API currently does not have methods for importing and<br>
>> handeling Sanger sequencing files (ABI, SCF). I'm currently resorting<br>
>> to the legacy classes in 1.9.1 (ChromatogramFactory and Chromatogram).<br>
>><br>
>> ChromatogramFactory only supports Sanger trace files with standard<br>
>> ATGCN characters. It throws a<br>
>> UnsupportedChromatogramFormatException upon reading Sanger files with<br>
>> IUPAC Ambiguity Codes (for example M = A or C). Even if I would just<br>
>> like to access the traces and ignore the base calls, this is<br>
>> impossible with the current implementation since we can't even open<br>
>> the file if it contains Ambiguity codes.<br>
>><br>
>> On a side note, I have been getting more and more questions from users<br>
>> why they can't open their Sanger sequencing files (in my program that<br>
>> uses BioJava). I think the popularity of CRISPR and the<br>
>> characterization of CRISPR KO clones (which is likely to result in<br>
>> heterozygous base calls) is increasing the number of people that have<br>
>> these IUPAC Ambiguity Sanger files.<br>
>><br>
>> For now, I tell people to go back to the Sanger sequencing software<br>
>> that exports the ABI or SCF files and disable IUPAC Ambiguity in the<br>
>> export options. In that case the base calling algorithm just picks the<br>
>> strongest signals in case of ambiguity and sticks to standard ATGCN<br>
>> characters.<br>
>><br>
>> Anyway, I am requesting the addition of the Chromatogram classes to<br>
>> the new API with support for opening files if they contain UPAC<br>
>> Ambiguity Codes.<br>
>><br>
>> Thank you for this useful API,<br>
>> _______________________________________________<br>
>> Biojava-l mailing list  -  <a href="mailto:Biojava-l@mailman.open-bio.org">Biojava-l@mailman.open-bio.org</a><br>
>> <a href="http://mailman.open-bio.org/mailman/listinfo/biojava-l" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biojava-l</a><br>
_______________________________________________<br>
Biojava-l mailing list  -  <a href="mailto:Biojava-l@mailman.open-bio.org">Biojava-l@mailman.open-bio.org</a><br>
<a href="http://mailman.open-bio.org/mailman/listinfo/biojava-l" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biojava-l</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>
</div></div>