<div dir="ltr">For bacteria, NCBI RefSeq is progressively adopting the non-redundant protein sequence standard. These protein records are aggregates for any bacterial genes coding for the same exact coding region (a &quot;detailed&quot; description of the implementation can be found here (<a href="ftp://ftp.ncbi.nlm.nih.gov/refseq/release/announcements/WP-proteins-06.10.2013.pdf">ftp://ftp.ncbi.nlm.nih.gov/refseq/release/announcements/WP-proteins-06.10.2013.pdf</a>).<div><br></div><div>Essentially, all traditional NP_XXXXXXX and YP_XXXXXXX protein records in bacteria RefSeq now map to a unique WP_XXXXXXX record. While this is possibly a good idea, it can create problems if one is trying to get back to (at least one of) the nucleotide sequence coding for the WP_XXXXXXX record.</div><div><br></div><div>For NP_XXXXXXX and YP_XXXXXXX records, one can easily fetch the protein record with Entrez.efetch, and then use the GB &quot;coded_by&quot; qualifier to access the corresponding nucleotide record.</div><div><br></div><div>Per specification of the new WP <a href="ftp://ftp.ncbi.nlm.nih.gov/refseq/release/announcements/WP-proteins-06.10.2013.pdf">format</a>:</div><div><div>- WP_ records will not include information about the corresponding Nucleotide sequences</div><div>on the sequence record.</div><div>- WP_ records will have links to Nucleotide in the Related Information section of the page display. Links in this section are available through NCBI’s E-utilities API.</div><div><br></div><div>I have been trying, unsuccessfully, to access the nucleotide record for WP_ proteins using Entrez.elink.</div><div><br></div><div>Here is an example:</div><div><br></div><div><div>protein ID: WP_027579184 <br></div><div><a href="http://www.ncbi.nlm.nih.gov/protein/653545797">http://www.ncbi.nlm.nih.gov/protein/653545797</a><br></div></div></div><div><br></div><div>Clicking on &quot;Genomic records&quot; in &quot;Related information&quot; will bring up the GenBank record containing the CDS for this protein, but I have been unable to use Entrez.elink to get to the information on the &quot;Related information&quot; panel. If I query:</div><div><br></div><div>handle = Entrez.elink(dbfrom=&quot;protein&quot;, id=&quot;653545797&quot;)<br></div><div><br></div><div>I essentially get an empty LinkSetDb. Any clues?</div><div><br></div><div>Ivan</div></div>