<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div class="">The way I have traditionally done this (in bioperl) is to iterate through 500 at a time, setting retmax to 500 and varying the offset using retstart, appending records to the same file when they aren’t raw XML (e.g. seq records).  Otherwise I
 loop through and use the objects created from the XML->object mapping to grab the information I care about. I expect the same is possible via Biopython.</div>
<div class=""><br class="">
</div>
<div class="">chris</div>
<br class="">
<div>
<blockquote type="cite" class="">
<div class="">On Dec 2, 2015, at 4:04 PM, Peter Cock <<a href="mailto:p.j.a.cock@googlemail.com" class="">p.j.a.cock@googlemail.com</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div dir="ltr" class="">Hi,
<div class=""><br class="">
</div>
<div class="">Currently Biopython does not attempt to do anything about</div>
<div class="">limiting retmax on your behalf.  The suggested retmax limit of 500</div>
<div class="">is probably specific to that database and/or file format (or so I</div>
<div class="">would imagine - some records like uilists are tiny in comparison).</div>
<div class=""><br class="">
</div>
<div class="">Are you using the results as XML? It probably is possible to</div>
<div class="">merge the XML files, but it might be more hassle that its worth.</div>
<div class=""><br class="">
</div>
<div class="">I would suggest a double loop ought to work fine - loop over</div>
<div class="">the collection of XML files, and then for each file loop over the</div>
<div class="">records returned from the parser.</div>
<div class=""><br class="">
</div>
<div class="">Regards,</div>
<div class=""><br class="">
</div>
<div class="">Peter<br class="">
<div class="gmail_extra"><br class="">
<div class="gmail_quote">On Wed, Dec 2, 2015 at 9:39 PM, <span dir="ltr" class="">
<<a href="mailto:c.buhtz@posteo.jp" target="_blank" class="">c.buhtz@posteo.jp</a>></span> wrote:<br class="">
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I asked the Entrez support how should I tread the servers resources<br class="">
with "respect". :)<br class="">
<br class="">
First answer was without discrete numbers but in the second one they<br class="">
told me asking for 500 (retmax for eSearch) is a "reasonable" value<br class="">
because the eBot (a tool they offer on their website) use it, too.<br class="">
<br class="">
No I have nearly 13.000 PIDs I want to fetch their article infos via<br class="">
eFetch. It is a lot. ;)<br class="">
<br class="">
But I am not sure how to do that with biopython. When I separate that<br class="">
in 500-packages I would have 26 different record objects back.<br class="">
I don't like that. I would prefer one big record object I can analyse.<br class="">
<br class="">
Do you see a way to merge this record objects. Or maybe there is<br class="">
another way for that?<br class="">
Or does Biopython.Entrez still handle that problem internal (like the<br class="">
only-3-per-second-querys-rule or the HTTP-POST-decision)?<br class="">
<br class="">
Any suggestions?<br class="">
<span class="HOEnZb"><font color="#888888" class="">--<br class="">
GnuPGP-Key ID 0751A8EC<br class="">
_______________________________________________<br class="">
Biopython mailing list  -  <a href="mailto:Biopython@mailman.open-bio.org" class="">
Biopython@mailman.open-bio.org</a><br class="">
<a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__mailman.open-2Dbio.org_mailman_listinfo_biopython&d=BQMFaQ&c=8hUWFZcy2Z-Za5rBPlktOQ&r=fbHa8Njtvh9VmSnzJxiEUTW9NWDwMMwQAzhgZDO41GQ&m=YTXH5ZFUE3oyyEn8pjXCdNg7TSdmPT4zMpv1K5KQv50&s=Iy6RoEKNJNvviUXzy93QCC--kjF35BmgdlM_YDjDEwk&e=" rel="noreferrer" target="_blank" class="">http://mailman.open-bio.org/mailman/listinfo/biopython</a><br class="">
</font></span></blockquote>
</div>
<br class="">
</div>
</div>
</div>
_______________________________________________<br class="">
Biopython mailing list  -  <a href="mailto:Biopython@mailman.open-bio.org" class="">Biopython@mailman.open-bio.org</a><br class="">
<a href="http://mailman.open-bio.org/mailman/listinfo/biopython" class="">http://mailman.open-bio.org/mailman/listinfo/biopython</a></div>
</blockquote>
</div>
<br class="">
</body>
</html>