<div dir="ltr"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">More seriously, I'd be much happier with a convention where you'd cite the<br>major biopython paper, the specific module papers if there are any, and<br>include the hash of the revision you used. This should be included in the<br>wiki page where we define 'citation guidelines'. It is simple, helps<br>everyone (although occasional contributors might feel robbed), and is fully<br>reproducible.</blockquote><div>This seems very sensible in terms of ensuring reproducibility and maintaining impact without added complications.</div><div><br></div><div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">That being said, and at the risk of opening a can of worms, I find it<br>very unfair that many people that have recently contributed hard to the<br>project are not on the author list of the 2009 paper (you, for<br>example. Bow is another). That would be fixed with a new paper. Deciding<br>on the author list would be the can of worms. We all can agree that it<br>would be another Cock et al paper, but getting the list of people that<br>are the "et al" would be complex.</blockquote></div><div>That requires analyzing whether there is substantial new stuff to warrant a new publication and whether the new pub could make it to a journal of at least similar impact. Having an old (2009!) but highly cited publication is good, but may backfire if people/funders perceive there has been no (citable) progress in the area. Being able to cite extensions (e.g. BioPhylo) helps address that problem and enticing extension developers to publish, rather than publishing updates of Biopython, might be the way to go. Then again, most major projects in bioinformatics (e.g. GO, RefSeq, RegulonDB, STRING, eggNOG...) publish frequent updates, so why not Biopython? Having several Biopython papers might dilute the citation count, but you can then state that there have been X biopython publications, so it's a tradeoff, as usual.</div><div><br></div><div>Regarding the can of worms, most journals currently accept author "lists" that may be maintained externally. A paper could be signed by the major contributors of the current version (and/or whomever actually takes the time to write the darn thing) followed by a "list" author pointing to the historical contributor list.</div><div><br></div><div>Ivan</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Dec 23, 2015 at 3:38 AM,  <span dir="ltr"><<a href="mailto:biopython-request@mailman.open-bio.org" target="_blank">biopython-request@mailman.open-bio.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Send Biopython mailing list submissions to<br>
        <a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://mailman.open-bio.org/mailman/listinfo/biopython" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biopython</a><br>
or, via email, send a message with subject or body 'help' to<br>
        <a href="mailto:biopython-request@mailman.open-bio.org">biopython-request@mailman.open-bio.org</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:biopython-owner@mailman.open-bio.org">biopython-owner@mailman.open-bio.org</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than "Re: Contents of Biopython digest..."<br>
<br>
<br>
Today's Topics:<br>
<br>
   1. Re: DOI for BioPython (<a href="mailto:c.buhtz@posteo.jp">c.buhtz@posteo.jp</a>)<br>
   2. Re: DOI for BioPython (Fields, Christopher J)<br>
   3. Re: DOI for BioPython (Iddo Friedberg)<br>
   4. Re: DOI for BioPython (Tiago Antao)<br>
   5. Re: DOI for BioPython (Jo?o Rodrigues)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Tue, 22 Dec 2015 18:35:30 +0100<br>
From: <<a href="mailto:c.buhtz@posteo.jp">c.buhtz@posteo.jp</a>><br>
To: <a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a><br>
Subject: Re: [Biopython] DOI for BioPython<br>
Message-ID: <<a href="mailto:3pQ4bR6MwMz5vNM@dovecot03.posteo.de">3pQ4bR6MwMz5vNM@dovecot03.posteo.de</a>><br>
Content-Type: text/plain; charset=UTF-8<br>
<br>
On 2015-12-22 16:38 Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>><br>
wrote:<br>
> What's better: citing the paper that describes the algorithm(s) or<br>
> the pull request that fixed a typo in the documentation?<br>
<br>
The latter because a DOI/Reference is about reproducibility.<br>
--<br>
GnuPGP-Key ID 0751A8EC<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Tue, 22 Dec 2015 18:30:47 +0000<br>
From: "Fields, Christopher J" <<a href="mailto:cjfields@illinois.edu">cjfields@illinois.edu</a>><br>
To: Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>><br>
Cc: "<a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a>" <<a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a>><br>
Subject: Re: [Biopython] DOI for BioPython<br>
Message-ID: <<a href="mailto:1E2AA25C-2269-4281-A364-0FEE6F673EE1@illinois.edu">1E2AA25C-2269-4281-A364-0FEE6F673EE1@illinois.edu</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
I agree re: tracking citations, etc, particularly for funding.  However, for attributing credit for developers it?s actually tricky, particularly with large projects that have an evolving group of core developers.<br>
<br>
My personal example: I wasn?t on the original bioperl citation (joined after), yet I am now essentially managing bioperl development when I can.  My commits and releases are the things I could to point to, so it?s nice to have something of a compromise (e.g. an updated DOI via Zenodo).  Not to mention it shows that development has continued past the point of publication (sometimes with significant changes to the API), which as we all know isn?t true for a significant chunk of published software.<br>
<br>
So in my opinion it?s never a bad thing to have an updated (officially sanctioned!) citation reflecting contributions from new developers or significant changes to the codebase.  The original citation will never go away.<br>
<br>
chris<br>
<br>
On Dec 22, 2015, at 10:38 AM, Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a><mailto:<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>>> wrote:<br>
<br>
<br>
Having all citations concentrated in one paper with all the major contributors helps tracking citation data, which helps those major contributors and OBF in future funding ventures. Further, a new release does not change the entire code base, so if you were to use Bio.PDB in say release X and Y, where there weren't any changes to this module, you'd cite two different DOIs, which wouldn't make any sense from any point of view.<br>
<br>
Also, Peter's paper is not *his* paper about the software. It's the entire team, or almost, on that paper and it describes the different modules and their purpose and functionality.<br>
<br>
What's better: citing the paper that describes the algorithm(s) or the pull request that fixed a typo in the documentation?<br>
<br>
Cheers,<br>
<br>
Jo?o<br>
<br>
A ter, 22/12/2015, 16:05,  <<a href="mailto:c.buhtz@posteo.jp">c.buhtz@posteo.jp</a><mailto:<a href="mailto:c.buhtz@posteo.jp">c.buhtz@posteo.jp</a>>> escreveu:<br>
On 2015-12-22 15:10 Peter Cock <<a href="mailto:p.j.a.cock@googlemail.com">p.j.a.cock@googlemail.com</a><mailto:<a href="mailto:p.j.a.cock@googlemail.com">p.j.a.cock@googlemail.com</a>>> wrote:<br>
> You can just say Biopython version 1.66 (for example) and<br>
> cite the paper Cock et al 2009 and its DOI:<br>
<br>
I need to cite the software not your paper about the software.<br>
It is unscientific to do it like that. And somebody could say I just<br>
want to say "thank you" in the way to increase your ImpfactFactor.<br>
<br>
If there is no DOI I will just name the main website an the release<br>
identifier (version number).<br>
<br>
> Using Zenodo.org<<a href="http://zenodo.org" rel="noreferrer" target="_blank">http://zenodo.org</a>> we'd have to register a DOI for each<br>
> release, which does not seem that useful.<br>
<br>
Exactly that would be useful and what DOIs are for - especially for a<br>
scientific software like BioPython.<br>
--<br>
GnuPGP-Key ID 0751A8EC<br>
_______________________________________________<br>
Biopython mailing list  -  <a href="mailto:Biopython@mailman.open-bio.org">Biopython@mailman.open-bio.org</a><mailto:<a href="mailto:Biopython@mailman.open-bio.org">Biopython@mailman.open-bio.org</a>><br>
<a href="http://mailman.open-bio.org/mailman/listinfo/biopython" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biopython</a><<a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__mailman.open-2Dbio.org_mailman_listinfo_biopython&d=BQMFaQ&c=8hUWFZcy2Z-Za5rBPlktOQ&r=fbHa8Njtvh9VmSnzJxiEUTW9NWDwMMwQAzhgZDO41GQ&m=v7VA0sPPM-8wrEQBkLt238WQ-og1ST_QKBqUGcABdgY&s=sgGUzE7f0glVTLTJewIX1aFy5qMG8RzPqMJ4htLwdQc&e=" rel="noreferrer" target="_blank">https://urldefense.proofpoint.com/v2/url?u=http-3A__mailman.open-2Dbio.org_mailman_listinfo_biopython&d=BQMFaQ&c=8hUWFZcy2Z-Za5rBPlktOQ&r=fbHa8Njtvh9VmSnzJxiEUTW9NWDwMMwQAzhgZDO41GQ&m=v7VA0sPPM-8wrEQBkLt238WQ-og1ST_QKBqUGcABdgY&s=sgGUzE7f0glVTLTJewIX1aFy5qMG8RzPqMJ4htLwdQc&e=</a>><br>
_______________________________________________<br>
Biopython mailing list  -  <a href="mailto:Biopython@mailman.open-bio.org">Biopython@mailman.open-bio.org</a><mailto:<a href="mailto:Biopython@mailman.open-bio.org">Biopython@mailman.open-bio.org</a>><br>
<a href="http://mailman.open-bio.org/mailman/listinfo/biopython" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biopython</a><br>
<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://mailman.open-bio.org/pipermail/biopython/attachments/20151222/91e78b6c/attachment-0001.html" rel="noreferrer" target="_blank">http://mailman.open-bio.org/pipermail/biopython/attachments/20151222/91e78b6c/attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Tue, 22 Dec 2015 13:29:13 -0600<br>
From: Iddo Friedberg <<a href="mailto:idoerg@gmail.com">idoerg@gmail.com</a>><br>
To: <a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a><br>
Subject: Re: [Biopython] DOI for BioPython<br>
Message-ID:<br>
        <<a href="mailto:CABm4-MRaG3jqz1iEgWcz22fxQogHouwynYnpiiEZKysNYs6TxA@mail.gmail.com">CABm4-MRaG3jqz1iEgWcz22fxQogHouwynYnpiiEZKysNYs6TxA@mail.gmail.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
COI: I am a paper co-author.<br>
<br>
My $0.02 is that citing the paper is much more beneficial for the project,<br>
for the reason Leighton said: a highly cited paper does help justify work<br>
on the project to funding agencies as well as institutions. Speaking for<br>
myself, I have cited the paper in two funded grant applications, one which<br>
has resulted in some code contribution (the GAF parser) and one which<br>
hopefully will benefit Biopython as well (recently funded to do some work<br>
on GO, need to talk about that in the dev list). As Leighton said, funders<br>
& bosses judge importance by citation count. While Biopython is not<br>
directly funded, some of us manage to spend some time on it using our own<br>
grants.<br>
<br>
<br>
To facilitate reproducibility, a major version citation is sufficient, IMO,<br>
as those are archived. If you used some non-major version on github, you<br>
can fork/clone the version of your liking to your own github,  assign it a<br>
DOI yourself, and cite that. For reasons mentioned, I would advocate citing<br>
both the paper and the DOI you have assigned.<br>
<br>
On Tue, Dec 22, 2015 at 11:35 AM, <<a href="mailto:c.buhtz@posteo.jp">c.buhtz@posteo.jp</a>> wrote:<br>
<br>
> On 2015-12-22 16:38 Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>><br>
> wrote:<br>
> > What's better: citing the paper that describes the algorithm(s) or<br>
> > the pull request that fixed a typo in the documentation?<br>
><br>
> The latter because a DOI/Reference is about reproducibility.<br>
> --<br>
> GnuPGP-Key ID 0751A8EC<br>
><br>
> _______________________________________________<br>
> Biopython mailing list  -  <a href="mailto:Biopython@mailman.open-bio.org">Biopython@mailman.open-bio.org</a><br>
> <a href="http://mailman.open-bio.org/mailman/listinfo/biopython" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biopython</a><br>
><br>
<br>
<br>
<br>
--<br>
Iddo Friedberg<br>
<a href="http://iddo-friedberg.net/contact.html" rel="noreferrer" target="_blank">http://iddo-friedberg.net/contact.html</a><br>
++++++++++[>+++>++++++>++++++++>++++++++++>+++++++++++<<<<<-]>>>>++++.><br>
++++++..----.<<<<++++++++++++++++++++++++++++.-----------..>>>+.-----.<br>
.>-.<<<<--.>>>++.>+++.<+++.----.-.<++++++++++++++++++.>+.>.<++.<<<+.>><br>
>>----.<--.>++++++.<<<<------------------------------------.<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://mailman.open-bio.org/pipermail/biopython/attachments/20151222/b955e520/attachment-0001.html" rel="noreferrer" target="_blank">http://mailman.open-bio.org/pipermail/biopython/attachments/20151222/b955e520/attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Tue, 22 Dec 2015 18:03:48 -0700<br>
From: Tiago Antao <<a href="mailto:tra@popgen.net">tra@popgen.net</a>><br>
To: Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>><br>
Cc: <a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a><br>
Subject: Re: [Biopython] DOI for BioPython<br>
Message-ID: <20151222180348.5d044506@urso><br>
Content-Type: text/plain; charset=UTF-8<br>
<br>
On Tue, 22 Dec 2015 16:38:37 +0000<br>
Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>> wrote:<br>
<br>
> Also, Peter's paper is not *his* paper about the software. It's the<br>
> entire team, or almost, on that paper and it describes the different<br>
> modules and their purpose and functionality.<br>
<br>
One can discuss if it is good or bad, but basic pragmatism dictates<br>
that the proper citing object is the 2009 paper, period. This for the<br>
reasons stated here by others already. Myself I would not be able to<br>
have contributed over the years if there was not a high-cited paper to<br>
put forward as a justification.<br>
<br>
Having another (non-paper) citing object will damage the project and<br>
has my full frontal objection. Things in science work as they work, and<br>
while I might object to paper citation metrics, that is the<br>
world we live in. I believe Biopython already lives too much on the<br>
volunteering of a few individuals, removing the only thing that<br>
provides "income" would be fatal. We actually need more (not less)<br>
forms of "income".<br>
<br>
That being said, and at the risk of opening a can of worms, I find it<br>
very unfair that many people that have recently contributed hard to the<br>
project are not on the author list of the 2009 paper (you, for<br>
example. Bow is another). That would be fixed with a new paper. Deciding<br>
on the author list would be the can of worms. We all can agree that it<br>
would be another Cock et al paper, but getting the list of people that<br>
are the "et al" would be complex.<br>
<br>
Tiago<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Wed, 23 Dec 2015 02:38:22 +0000<br>
From: Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>><br>
To: Tiago Antao <<a href="mailto:tra@popgen.net">tra@popgen.net</a>><br>
Cc: <a href="mailto:biopython@mailman.open-bio.org">biopython@mailman.open-bio.org</a><br>
Subject: Re: [Biopython] DOI for BioPython<br>
Message-ID:<br>
        <CAB=-<a href="mailto:b2aEPQRGOc%2BjpoGMDda-zeXYjnwPOcsP9fqo%2BWtutfzFYg@mail.gmail.com">b2aEPQRGOc+jpoGMDda-zeXYjnwPOcsP9fqo+WtutfzFYg@mail.gmail.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
Since this is a python library I'd go with the mantra of there is only one<br>
way to do things, thus, one citation to keep things simple :)<br>
<br>
More seriously, I'd be much happier with a convention where you'd cite the<br>
major biopython paper, the specific module papers if there are any, and<br>
include the hash of the revision you used. This should be included in the<br>
wiki page where we define 'citation guidelines'. It is simple, helps<br>
everyone (although occasional contributors might feel robbed), and is fully<br>
reproducible.<br>
<br>
Including DOIs for every release is only partially reproducible, since it<br>
relies on a third party service to map between the DOI and the release,<br>
which adds an unnecessary, in my opinion, extra layer of complexity. Also,<br>
it doesn't help those that do not know biopython to learn about it since<br>
they will have to Google it's publication.<br>
<br>
It's a good discussion and a good point to raise, but there are still major<br>
rules in science we have to play by in order to keep people interested and<br>
generally move forward.<br>
<br>
As Tiago, I'm also against implementing pre-release DOIs. It'll create too<br>
much entropy that has no real benefits other than ideology.<br>
<br>
A qua, 23/12/2015, 01:03, Tiago Antao <<a href="mailto:tra@popgen.net">tra@popgen.net</a>> escreveu:<br>
<br>
> On Tue, 22 Dec 2015 16:38:37 +0000<br>
> Jo?o Rodrigues <<a href="mailto:j.p.g.l.m.rodrigues@gmail.com">j.p.g.l.m.rodrigues@gmail.com</a>> wrote:<br>
><br>
> > Also, Peter's paper is not *his* paper about the software. It's the<br>
> > entire team, or almost, on that paper and it describes the different<br>
> > modules and their purpose and functionality.<br>
><br>
> One can discuss if it is good or bad, but basic pragmatism dictates<br>
> that the proper citing object is the 2009 paper, period. This for the<br>
> reasons stated here by others already. Myself I would not be able to<br>
> have contributed over the years if there was not a high-cited paper to<br>
> put forward as a justification.<br>
><br>
> Having another (non-paper) citing object will damage the project and<br>
> has my full frontal objection. Things in science work as they work, and<br>
> while I might object to paper citation metrics, that is the<br>
> world we live in. I believe Biopython already lives too much on the<br>
> volunteering of a few individuals, removing the only thing that<br>
> provides "income" would be fatal. We actually need more (not less)<br>
> forms of "income".<br>
><br>
> That being said, and at the risk of opening a can of worms, I find it<br>
> very unfair that many people that have recently contributed hard to the<br>
> project are not on the author list of the 2009 paper (you, for<br>
> example. Bow is another). That would be fixed with a new paper. Deciding<br>
> on the author list would be the can of worms. We all can agree that it<br>
> would be another Cock et al paper, but getting the list of people that<br>
> are the "et al" would be complex.<br>
><br>
> Tiago<br>
><br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://mailman.open-bio.org/pipermail/biopython/attachments/20151223/560ce6cc/attachment.html" rel="noreferrer" target="_blank">http://mailman.open-bio.org/pipermail/biopython/attachments/20151223/560ce6cc/attachment.html</a>><br>
<br>
------------------------------<br>
<br>
Subject: Digest Footer<br>
<br>
_______________________________________________<br>
Biopython mailing list  -  <a href="mailto:Biopython@mailman.open-bio.org">Biopython@mailman.open-bio.org</a><br>
<a href="http://mailman.open-bio.org/mailman/listinfo/biopython" rel="noreferrer" target="_blank">http://mailman.open-bio.org/mailman/listinfo/biopython</a><br>
<br>
------------------------------<br>
<br>
End of Biopython Digest, Vol 156, Issue 19<br>
******************************************<br>
</blockquote></div><br></div>