<div dir="ltr"><div><div><div><div><div><div><div><div><div><div><div>Hi Peter,<br><br></div>It seems that I may have been black-listed, unfortunately. I didn&#39;t think it was the case because I&#39;ve been traveling (and so my IP address has been changing), but when I tried running my program with a VPN, it worked fine again. I&#39;ll be more careful.<br><br></div>I am getting an error with the test_NCBI_qblast.py, though:<br><br></div>FAIL: test_orchid_est (__main__.TestQblast)<br>------------------------------------------------------------<br></div>Traceback (most recent call last):<br></div>  File &quot;test_NCBI_qblast.py&#39;, line 69, in test_orchid_est<br></div>    0.0000001, None, [&quot;21554275&quot;, &quot;18409071&quot;, &quot;296087288&quot;])<br></div>  File &quot;test_NCBI_qblast.py&#39;, line 124, in run_qblast<br></div>    % &quot;, &quot;.join(expected_hits)<br></div>AssertionError: Missing all of 21554275, 18409071, 296087288 in alignments<br>------------------------------------------------------------<br><br></div>Thank you for your help!<br><br></div>--Lev<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Jun 22, 2015 at 10:07 AM, Peter Cock <span dir="ltr">&lt;<a href="mailto:p.j.a.cock@googlemail.com" target="_blank">p.j.a.cock@googlemail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Lev,<br>
<br>
Can you run any small tests with Biopython? e.g. test_NCBI_qblast.py<br>
in the Tests folder of the Biopython source code.<br>
<br>
If they also fail, it would be interesting to see the exception message(s).<br>
That might give some clues (e.g. a local network problem).<br>
<br>
My guess is something changed at the NCBI - perhaps they are now<br>
stricter about long running jobs, or if you are very unlucky it might<br>
be that your IP address was (temporarily) black listed for too much<br>
usage?<br>
<span class="HOEnZb"><font color="#888888"><br>
Peter<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
On Mon, Jun 22, 2015 at 3:49 PM, Lev Tsypin &lt;<a href="mailto:ltsypin@uchicago.edu">ltsypin@uchicago.edu</a>&gt; wrote:<br>
&gt; Hi Peter,<br>
&gt;<br>
&gt; Unfortunately, I think that might not be an option for me. The software I&#39;m<br>
&gt; trying to write is meant to be an open-source tool that researchers would<br>
&gt; just be able to use without extensive set up required. I&#39;m afraid that I<br>
&gt; won&#39;t be able to ask people to install standalone BLAST and learn to use<br>
&gt; computer clusters, without losing the accessibility of the program.<br>
&gt;<br>
&gt; Do you think that this is really the BLAST server being busy? As I said, I<br>
&gt; didn&#39;t have any problems for a long time. The average time to get a BLAST<br>
&gt; result back would be about 6-7 minutes. Now I just don&#39;t get through.<br>
&gt;<br>
&gt; Best,<br>
&gt; Lev<br>
&gt;<br>
&gt; On Mon, Jun 22, 2015 at 4:03 AM, Peter Cock &lt;<a href="mailto:p.j.a.cock@googlemail.com">p.j.a.cock@googlemail.com</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Lev,<br>
&gt;&gt;<br>
&gt;&gt; My usual advice when dealing with any large-scale BLAST<br>
&gt;&gt; search is to download the NCBI database and use standalone<br>
&gt;&gt; BLAST+ locally, rather than the NCBI web-service which<br>
&gt;&gt; can be busy - especially during USA working hours.<br>
&gt;&gt;<br>
&gt;&gt; Do you have access to a local Linux cluster or similar? It is<br>
&gt;&gt; very likely there are people in your department/university<br>
&gt;&gt; already doing this - often the SysAdmin will keep a single<br>
&gt;&gt; shared copy of the databases up to date for everyone to<br>
&gt;&gt; use.<br>
&gt;&gt;<br>
&gt;&gt; (You would likely need to do some post-filtering to remove<br>
&gt;&gt; any Ciliata hits since the Entrez query option is only available<br>
&gt;&gt; when running BLAST at the NCBI.)<br>
&gt;&gt;<br>
&gt;&gt; Peter<br>
&gt;&gt;<br>
&gt;&gt; On Sun, Jun 21, 2015 at 7:19 PM, Lev Tsypin &lt;<a href="mailto:ltsypin@uchicago.edu">ltsypin@uchicago.edu</a>&gt; wrote:<br>
&gt;&gt; &gt; Hello everyone,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I have been writing a tool that makes use of Biopython for automatic<br>
&gt;&gt; &gt; BLAST<br>
&gt;&gt; &gt; searches--your libraries have made my life so much easier! I really<br>
&gt;&gt; &gt; appreciate your work. I&#39;ve recently begun to run into some trouble,<br>
&gt;&gt; &gt; though,<br>
&gt;&gt; &gt; and I am not quite sure how to explain it, or respond to it, so I wanted<br>
&gt;&gt; &gt; to<br>
&gt;&gt; &gt; ask for advice:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; The issue is that, of late, when I call the NCBIWWW.qblast function, it<br>
&gt;&gt; &gt; takes forever--literally never finishing. Before, there were sometimes<br>
&gt;&gt; &gt; cases<br>
&gt;&gt; &gt; that it would get stuck for a long time (up to an hour or so), but it<br>
&gt;&gt; &gt; would<br>
&gt;&gt; &gt; then manage to fight through whatever obstacle and go on. In such cases,<br>
&gt;&gt; &gt; I<br>
&gt;&gt; &gt; also found that if I were to artificially restart the request, the<br>
&gt;&gt; &gt; function<br>
&gt;&gt; &gt; would rouse itself and go much better. Here&#39;s an example of a function<br>
&gt;&gt; &gt; call:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; blastp_result = NCBIWWW.qblast(&#39;blastp&#39;, &#39;nr&#39;,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; &#39;MSLSREENIYMGKISEQTERFEDMLEYMKKVVQTGQELSVEERNLLSVAYKNTVGSRRSAWRSISAIQQKEESKGSKHLDLLTNYKKKIETELNLYCEDILRLLNDYLIKNATNAEAQVFFLKMKGDYYRYIAEYAQGDDHKKAADGALDSYNKASEIANSELSTTHPIRLGLALNFSVFHYEVLNDPSKACTLAKTAFDEAIGDIERIQEDQYKDATTIMQLIRDNLTLWTSEFQDDAEEQQE&#39;,<br>
&gt;&gt; &gt; entrez_query = &#39;NOT Ciliata&#39;).read()<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [In the protein sequence above I have multiple lines so that it fits in<br>
&gt;&gt; &gt; the<br>
&gt;&gt; &gt; email, but when I normally run the function I don&#39;t have any newline<br>
&gt;&gt; &gt; characters or anything, of course]<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; My questions are the following: Why does the function sometimes get<br>
&gt;&gt; &gt; stuck<br>
&gt;&gt; &gt; for so long, and what should I do now that it never seems to work<br>
&gt;&gt; &gt; anymore?<br>
&gt;&gt; &gt; Do you have any suggestions for introducing a &#39;time out&#39; so that if, for<br>
&gt;&gt; &gt; example, the request takes longer than 10 minutes, it would<br>
&gt;&gt; &gt; automatically<br>
&gt;&gt; &gt; retry? I know there is an optional parameter in the urllib2 library for<br>
&gt;&gt; &gt; a<br>
&gt;&gt; &gt; time out, but, looking at the source code for NCBIWWW.qblast(), it<br>
&gt;&gt; &gt; wasn&#39;t<br>
&gt;&gt; &gt; obvious to me whether and how it would work to use it.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Thank you very much for any advice.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Best regards,<br>
&gt;&gt; &gt; Lev<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; Biopython-dev mailing list<br>
&gt;&gt; &gt; <a href="mailto:Biopython-dev@mailman.open-bio.org">Biopython-dev@mailman.open-bio.org</a><br>
&gt;&gt; &gt; <a href="http://mailman.open-bio.org/mailman/listinfo/biopython-dev" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biopython-dev</a><br>
&gt;<br>
&gt;<br>
</div></div></blockquote></div><br></div>