<div dir="ltr">On Tue, Jul 12, 2016 at 10:26 AM, Jonas Dehairs <span dir="ltr"><<a href="mailto:jonas.dehairs@gmail.com" target="_blank">jonas.dehairs@gmail.com</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">The 4.2 API currently does not have methods for importing and<br>
handeling Sanger sequencing files (ABI, SCF). I'm currently resorting<br>
to the legacy classes in 1.9.1 (ChromatogramFactory and Chromatogram).<br>
<br>
ChromatogramFactory only supports Sanger trace files with standard<br>
ATGCN characters. It throws a<br>
UnsupportedChromatogramFormatException upon reading Sanger files with<br>
IUPAC Ambiguity Codes (for example M = A or C). Even if I would just<br>
like to access the traces and ignore the base calls, this is<br>
impossible with the current implementation since we can't even open<br>
the file if it contains Ambiguity codes.<br>
<br>
On a side note, I have been getting more and more questions from users<br>
why they can't open their Sanger sequencing files (in my program that<br>
uses BioJava). I think the popularity of CRISPR and the<br>
characterization of CRISPR KO clones (which is likely to result in<br>
heterozygous base calls) is increasing the number of people that have<br>
these IUPAC Ambiguity Sanger files.<br>
<br>
For now, I tell people to go back to the Sanger sequencing software<br>
that exports the ABI or SCF files and disable IUPAC Ambiguity in the<br>
export options. In that case the base calling algorithm just picks the<br>
strongest signals in case of ambiguity and sticks to standard ATGCN<br>
characters.<br>
<br>
Anyway, I am requesting the addition of the Chromatogram classes to<br>
the new API with support for opening files if they contain UPAC<br>
Ambiguity Codes.<br></blockquote><div><br></div><div>The biojava 1.9.x codebase is still maintained at<br><br><a href="https://github.com/biojava/biojava-legacy">https://github.com/biojava/biojava-legacy<br></a><br></div><div>If you created a pull request to add IUPAC Ambiguity Codes support to ChromatogramFactory, a 1.9.3 release is planned for later this summer, and it could go in then.<br><br></div><div>   michael<br></div></div></div></div>