<div dir="ltr"><div><div>Hi all,<br><br></div><div>I am trying to download a full genome record from NCBI Entrez, using 'gbwithparts' to get the full record. However, when I run my code, I get only the 'header' portion of the record, without either the features or the sequence at the bottom (even though a simple browser access to the record (without requesting GenBank (full)) will at least provide the annotation.<br><br>If I try the same with the equivalent GenBank accession for the record, I get the full record (features and sequence).<br><br></div><div>This is reproducible at least for several other bacterial genomes.<br></div><div><br></div><div>I had previously downloaded RefSeq records using the same type of call, so I was wondering whether this might be related to NCBI transitioning to HTTPS, the phasing-out of GI numbers, or both. Before pestering the NCBI staff, however, I thought I would ask whether there have been any changes to the BioPython parser that might explain the effect. <br></div><div><br></div>Here is the code:<br><br>#******************************************************************************<br># -*- coding: utf-8 -*-<br>from Bio import Entrez<br>Entrez.email ="<a href="mailto:ivan.erill@gmail.com">ivan.erill@gmail.com</a>"<br><br>#RefSeq accession for Acetobacterium woodii DSM 1030, complete genome<br>#NC_016894 / 379009891<br>ncbi_handle = Entrez.efetch(db='nuccore',id='379009891',retmode='gbwithparts',\<br>                            rettype='gb')<br>ncbi_record = ncbi_handle.read()<br>print 'End of RefSeq retrieved record: '<br>print ncbi_record[-44:]<br>#this gives me:<br>#--> End of RefSeq retrieved record:<br>#--> CONTIG      join(CP002987.1:1..4044777)<br>#--> //<br>#showing that the record ends with a contig join statement<br>#using NC_016894 as 'id' gives same behavior<br><br>#GenBank accession for Acetobacterium woodii DSM 1030, complete genome<br>#CP002987 / 375300680<br>ncbi_handle = Entrez.efetch(db='nuccore',id='375300680',retmode='gbwithparts',\<br>                            rettype='gb')<br>ncbi_record = ncbi_handle.read()<br>print 'End of RefSeq retrieved record: '<br>print ncbi_record[-77:]<br>#this gives me:<br>#--> End of RefSeq retrieved record:<br>#-->   4044721 ttttacctgg taatgttttt ttatattatc aacatttatt cttataaatt acttgat<br>#--> //<br>#showing that the record ends with the complete sequence<br>#using CP002987 as 'id' gives same behavior<br>#******************************************************************************<br><br><br><div>Any insights will be greatly appreciated. Thanks,<br><br></div>Ivan<br><br></div></div>