<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>
<div>
<div>Hi all,</div>
<div>I have a script where I query the UniProt website for particular protein entries, following BioPython and UniProt’s own python access notes. However, as a way to be polite, I wait a few seconds between queries, but this makes my script fairly slow. I would
 like to keep the database locally, but the only downloads I can find for the UniProtKB are as two huge xml files for Swiss-Prot and TrEMBL. I am unclear how to parse these compared to the individual protein xml files on the website, which are easily parsable
 by BioPython.&nbsp;</div>
<div><br>
</div>
<div>Does anyone have guidance on parsing and running the UniProtKB locally?</div>
<div><br>
</div>
<div>Thanks in advance!</div>
<div><br>
</div>
<div>David Sauer</div>
<div>
<div>
<div><br>
</div>
<div>Da-Neng Wang Lab</div>
<div>Structural Biology Program</div>
<div>New York University School of Medicine</div>
</div>
<div><br>
</div>
<div><a href="http://scholar.google.com/citations?user=F9G61tAAAAAJ&amp;hl=en&amp;oi=ao">Publications via Google Scholar</a></div>
</div>
</div>
</div>
</body>
</html>