<div dir="ltr">infoalign should give you what you want. It does not do the summary statistics, but for each sequence it gives the alignment length and the %ID (note that  %ID can mean several things!) You can then programmatically parse whose numbers to calculate mean and standard deviation.  <a href="http://emboss.sourceforge.net/apps/cvs/emboss/apps/infoalign.html#output.8">http://emboss.sourceforge.net/apps/cvs/emboss/apps/infoalign.html#output.8</a><div><br></div><div>Iddo</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, May 30, 2019 at 12:48 PM Anandkumar Surendrarao <<a href="mailto:aksrao@ucdavis.edu">aksrao@ucdavis.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Greetings EMBOSS users!<br><div><br></div><div>I have ~ 18000 files, each with clustal formatted protein alignments derived from Pfam-A.full.</div><div>Some of these files are large > 500MB in size, the largest alignment is 3GB!</div><div><br></div><div>I need to calculate the following alignment statistics</div><div>A. average aligned length</div><div>B. std. dev. of aligned length<br></div><div>C. average of pairwise sequence ID %</div><div>D. std. dev. of pairwise sequence ID %</div><div><br></div><div>Here are my 2 problems that I seek help with:</div><div>1. I can calculate A and C using alistat that comes with UBUNTU, but not B or D.</div><div>2. For the really large alignments, there  is no option due to RAM requirements, and so I've used alistat's -f  (fast) option, which estimates average %id by "sampling"</div><div><br></div><div>If EMBOSS has tools / tricks to report A - D, while having reasonable RAM and disk-usage footprints, and quick processing times, please let me know.</div><div><br></div><div>I am open to suggestions regarding other tools as well.</div><div>I look forward to your replies. Thanks, in advance.</div><div><br></div><div>Sincerely,</div><div>Anand</div></div>
_______________________________________________<br>
EMBOSS mailing list<br>
<a href="mailto:EMBOSS@mailman.open-bio.org" target="_blank">EMBOSS@mailman.open-bio.org</a><br>
<a href="https://mailman.open-bio.org/mailman/listinfo/emboss" rel="noreferrer" target="_blank">https://mailman.open-bio.org/mailman/listinfo/emboss</a></blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature">Iddo Friedberg<br><a href="http://iddo-friedberg.net/contact.html" target="_blank">http://iddo-friedberg.net/contact.html</a><br>++++++++++[>+++>++++++>++++++++>++++++++++>+++++++++++<<<<<-]>>>>++++.><br>++++++..----.<<<<++++++++++++++++++++++++++++.-----------..>>>+.-----.<br>.>-.<<<<--.>>>++.>+++.<+++.----.-.<++++++++++++++++++.>+.>.<++.<<<+.>><br>>>----.<--.>++++++.<<<<------------------------------------.<br></div>