<div dir="ltr"><div style="font-family:arial,sans-serif;font-size:12.7272720336914px">Hi all,</div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px">As part of my work, I need to deal with the new WP protein records at NCBI and, specifically, with the information on their coding sequences. This information is returned by E-utils through a an integrated protein report type of view:</div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><a href="http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=protein&amp;id=231025&amp;rettype=ipg" target="_blank" style="font-size:12.7272720336914px">http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=protein&amp;id=231025&amp;rettype=ipg</a><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px">which does not use a DTD for the XML, but rather a schema. Although there has been no formal announcement, I&#39;ve been talking to NCBI people and they tell me that they will progressively be moving to schemas (which provide more fine grained validation specification). Specifically, all new XML exports from NCBI will be using schemas. I don&#39;t believe that existing DTDs are going to be replaced by schemas for now.</div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px">My original through was to branch an update for the current XML parser in BioPython, but it looks like using schemas would be a major overhaul of the existing code-base and it might make more sense to develop a parallel parser, so I first wanted to check on what approach you guys would prefer to do code-wise.</div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px">Regards,</div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px"><br></div><div style="font-family:arial,sans-serif;font-size:12.7272720336914px">Ivan</div><div><br></div></div>