<div dir="ltr">The codebase can be found at <a href="https://github.com/mobiusklein/pygly2" target="_blank">https://github.com/mobiusklein/pygly2</a> where I am actively committing new code. I had borrowed a large portion of an implementation of one facet of the library from another project released under the Apache 2.0 license, which is more restrictive than the BSD license. I&#39;ve contacted the author with regard to how he would like us to treat that component.<div><br></div><div>Assuming all these things pass smoothly, namespaces may be a complicated matter now that I have read through more of the Bio codebase. At the risk of sounding too general, the vast majority of the common namespaces in Bio are related to operations on many different data formats that happen to result in Seq or SeqRecord objects. This leads to lots of infrastructure and class design being built up around ways of converting many different resources into those types of objects. It would be sensible to keep the structures I&#39;m building in a separate namespace as they talk about distinctly different data structures that don&#39;t share any class hierarchy. <br></div><div><br></div><div>I should post to the general user mailing list to find out about general interest before trying to make the value judgement on whether integration is a worthwhile investment. That&#39;s <a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a>, correct?</div><div><br></div><div>Thank you,</div><div>Joshua Klein</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Mar 3, 2015 at 1:25 PM, Peter Cock <span dir="ltr">&lt;<a href="mailto:p.j.a.cock@googlemail.com" target="_blank">p.j.a.cock@googlemail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Thanks Joshua,<br>
<br>
Outside GSoC, adding glycoinformatics to Biopython sounds interesting.<br>
As far as I know none of our existing contributors do much in this area,<br>
so our feedback may be limited to Python style (PEP8 please) and<br>
practicalities like unit tests and documentation.<br>
<br>
We should probably also ask on the main Biopython mailing list - that<br>
might reveal some potential users of the code?<br>
<br>
Is your code public already? e.g. GitHub or Bitbucket?<br>
<br>
Are there any pre-existing licences associated with your code? Can<br>
you simply adopt the Biopython Licence? This like the MIT/BSD<br>
licence in spirit (indeed we&#39;re considering moving to the 3-clause<br>
BSD licence as that is more mainstream).<br>
<br>
After a brief debate about appropriate namespace(s), I would suggest<br>
you fork our repository and work on a branch...<br>
<br>
Regards,<br>
<br>
Peter<br>
<div class="HOEnZb"><div class="h5"><br>
On Tue, Mar 3, 2015 at 5:05 PM, Joshua Klein &lt;<a href="mailto:mobiusklein@gmail.com">mobiusklein@gmail.com</a>&gt; wrote:<br>
&gt; I am sorry to hear that the OBF did not make it in this year. We are still<br>
&gt; interested in finding out if the Biopython team is interested in including<br>
&gt; glycomics tools in the core library, or in some other looser association.<br>
&gt; Real glycoinformatics is relatively inaccessible outside of two titanic Java<br>
&gt; libraries, which doesn&#39;t jive with how a lot of modern bioinformatics is<br>
&gt; done today.<br>
&gt;<br>
&gt; Thank you,<br>
&gt; Joshua Klein<br>
&gt;<br>
&gt; On Tue, Mar 3, 2015 at 10:25 AM, Peter Cock &lt;<a href="mailto:p.j.a.cock@googlemail.com">p.j.a.cock@googlemail.com</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Joshua,<br>
&gt;&gt;<br>
&gt;&gt; Thank you for you interest. Unfortunately we&#39;ve just heard that<br>
&gt;&gt; the  Open Bioinformatics Foundation (OBF) was not accepted<br>
&gt;&gt; into the Google Summer of Code 2015 programme:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; <a href="http://news.open-bio.org/news/2015/03/sadly-obf-not-accepted-for-gsoc-2015/" target="_blank">http://news.open-bio.org/news/2015/03/sadly-obf-not-accepted-for-gsoc-2015/</a><br>
&gt;&gt;<br>
&gt;&gt; It may be possible to pursue your project idea with one of the<br>
&gt;&gt; accepted organisations (perhaps the Python Software Foundation)<br>
&gt;&gt; by including a mentor from Biopython. We&#39;ve not yet approached<br>
&gt;&gt; any of the other potential partner organisations yet though.<br>
&gt;&gt;<br>
&gt;&gt; Good luck,<br>
&gt;&gt;<br>
&gt;&gt; Peter<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Peter<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Mar 3, 2015 at 2:58 AM, Joshua Klein &lt;<a href="mailto:mobiusklein@gmail.com">mobiusklein@gmail.com</a>&gt;<br>
&gt;&gt; wrote:<br>
&gt;&gt; &gt; Hello,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I&#39;ve been working on a python library for reading, writing, and<br>
&gt;&gt; &gt; manipulating<br>
&gt;&gt; &gt; glycan structures and glycomics data. One of my collaborators suggested<br>
&gt;&gt; &gt; I<br>
&gt;&gt; &gt; inquire here if this might be of interest to the Biopython team and if<br>
&gt;&gt; &gt; it<br>
&gt;&gt; &gt; was not too late to apply for a Google Summer of Code sponsorship.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; The library can currently do the following:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Read and write GlycoCT Condensed format carbohydrate structures that are<br>
&gt;&gt; &gt; concrete (having no variable or undefined structures)<br>
&gt;&gt; &gt; Read GlycoCTXML format carbohydrate structures that are concrete<br>
&gt;&gt; &gt; Manipulate the tree structure, adding and removing monosaccharide and<br>
&gt;&gt; &gt; substituent nodes, as well as altering existing nodes.<br>
&gt;&gt; &gt; Calculate elemental compositions for glycan structures<br>
&gt;&gt; &gt; Create arbitrary chemical derivitizations (e.g. permethylation) of<br>
&gt;&gt; &gt; glycan<br>
&gt;&gt; &gt; structures<br>
&gt;&gt; &gt; Generate B, C, Y, and Z fragments from structures as observed when<br>
&gt;&gt; &gt; analyzing<br>
&gt;&gt; &gt; a structure with tandem mass spectrometry.<br>
&gt;&gt; &gt; Make API calls against GlycomeDB to download structures and annotations<br>
&gt;&gt; &gt; on<br>
&gt;&gt; &gt; the fly<br>
&gt;&gt; &gt; Perform sub-tree inclusion and maximum common substructure searches with<br>
&gt;&gt; &gt; fuzzy matching.<br>
&gt;&gt; &gt; Plot glycan structures using the Consortium for Functional Glycomics<br>
&gt;&gt; &gt; symbol<br>
&gt;&gt; &gt; nomenclature with matplotlib.<br>
&gt;&gt; &gt; Perform error tolerance name inference on monosaccharides<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I am currently working on adding support for A and X cross-ring fragment<br>
&gt;&gt; &gt; generation and adding other serialization formats such as IUPAC and<br>
&gt;&gt; &gt; GlycoMinds Linear Codes.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Currently, all of the features are implemented purely in Python.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; What other information, if any, can I provide?<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Thank you,<br>
&gt;&gt; &gt; Joshua Klein<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; GSoC mailing list<br>
&gt;&gt; &gt; <a href="mailto:GSoC@mailman.open-bio.org">GSoC@mailman.open-bio.org</a><br>
&gt;&gt; &gt; <a href="http://mailman.open-bio.org/mailman/listinfo/gsoc" target="_blank">http://mailman.open-bio.org/mailman/listinfo/gsoc</a><br>
&gt;<br>
&gt;<br>
</div></div></blockquote></div><br></div>