わがまま科学者

こちらのサイトに移動しました:http://wagamamakagakusha.hatenablog.com 米国ボストン在住の神経科学研究者のブログです。科学、教育などに関する雑多な私見、主張。1ヶ月に1度程度の更新予定。  Twitter:@yamagatm3   研究者情報:https://about.me/masahito.yamagata/

2018年01月

私が書いている複数のブログを、統一的に管理するため、別サイトの方に引っ越ししていくこととしました。

livedoorを利用している本ブログは、当分、そのままにして更新も続けていきますが、元サイトは以下に変更になります(内容は同一のものです)。

わがまま科学者(元祖版)
科学、教育などに関する雑多な私見、主張
http://wagamamakagakusha.hatenablog.com


わがまま科学者日記(純粋に科学のお話をしたい)
科学の話題が中心
http://masahito-yamagata.hatenablog.com

わがまま科学者の英語講座(科学系の英語だけでなく、広く「英語」についての話題)
日常生活や論文執筆などに役立つ英語の勉強
http://bioenglish.hatenablog.com

なお、Twitterのハッシュタグで新しいブログ記事をお知らせします。
https://twitter.com/hashtag/わがまま科学者?src=hash

    このエントリーをはてなブックマークに追加

前回は、「バイオ系プレプリントサーバを利用してみた(その1)」として、バイオ系プレプリントの最近の状況について説明してみました。

今回、たまたま論文原稿ができましたので、私のボスと相談して利用してみました。ボスは、科学論文では、Cell, Neuron, JCBなど多くの雑誌のエディトリアルボードを歴任するなど、科学研究の論文発表について一言ある人です。また、所属している学科自体が、eLifeなどの進歩的な編集ポリシーをもった雑誌の発展に積極的に関与するなど、こういうものに敏感なのです。しかし、ラボとしては、bioRxivの利用は初めてということになります。

さて、今回の論文は、副業みたいなもので、私のメインプロジェクトではないのですが、総合科学誌Proc Natl Acad Sci USA(PNAS)に投稿することにしました。ボスが全米アカデミーの会員なので、いわゆるContributedというカテゴリーの論文にすることができるということもありました。PNASのアカデミー会員によるContributed論文は、きちんと査読はやっていますが、査読者を投稿者である会員が指定できるということがあります。従って、査読者が迅速に決まり、建設的な査読が期待できるというメリットがあると思います(多くのジャーナルは、適切な査読者を探して決めるのに、非常に時間をかけている、という実情がある)。ちなみに、今回の論文は査読も終わり無事アクセプトされています。
isogashii_hakui_man

準備
最初に、正式に投稿を考えている査読雑誌が、プレプリントをどう考えているのか、ということを知る必要があります。最近のプレプリント運動で、Cellなどを含め、ほとんどのバイオ系の雑誌でプレプリントにポストすることを認めるようになってきていますが、雑誌それぞれについて、どうなっているのか、確認することが必須です。このWikipediaのページに一覧表がありますが、その後、変更になっているかもしれませんし、間違いもあるかもしれないので、雑誌の公式サイトでしっかりと確認するべきでしょう。
https://en.wikipedia.org/wiki/List_of_academic_journals_by_preprint_policy

プレプリントサーバへの投稿は、雑誌への正式な投稿と同時というケースが多いと思います。eLife, PloS系の雑誌、JCB, Development, PNASなどの場合は、雑誌投稿とプレプリントサーバへの投稿が連動していて、雑誌に投稿した時に、そのままプレプリントサーバーにポストされるというシステムを持つものがあります。この場合は、投稿時に、どこかのステップで選択する項目があるはずです。

そうではない場合、あるいは雑誌投稿システムとは独立してプレプリントサーバーに出したい場合、まず、bioRxiv用にPdfファイルを1つ作るということをする必要があるということです。もちろん、ジャーナルに投稿したもの、これから投稿するPdfを、そのままアップロードしても構いません。ただ、bioRxivにポストされた原稿をよく見ていくと、次の3つのタイプの原稿があるようです。

1)投稿と全く同じpdfの場合。これは、雑誌とサーバーが連携している場合はこうなるでしょう。また、雑誌の連携投稿システムを利用しなくても、全く同じものを投稿することもあると思います。

2)投稿とほとんど同じであるが、少しだけ内容を変えている場合(表紙、文献、図のフォーマットなど)。投稿原稿の場合は、行間にスペースを入れるダブルスペース形式が通常ですが、そのスペースだけを除去してシングルスペースにしたものもあると思います。意図的なのか、ミスなのか、部分的にデータを掲載していない場合もあるようです。

3)内容的には投稿と同じだが、フォーマットを最終的な印刷論文(2コラム形式)のように、更に読みやすくしている場合。


どうするのかは、本当に好みの問題であると思います。ただ、3にするためには、例えば図の配置など、少し手間がかかるので、面倒であることは確かです。また、どこに投稿しているのか、あからさまに見せたくないという場合は、2を利用することで工夫が可能であると思います。例えば、文献引用の体裁は、それぞれのジャーナルで違っていますので、それをわからないようにしておくというのは、やりたくなる人もいるのではないでしょうか。

私たちの場合は、2)にしました。表紙の部分だけbioRxiv用に作り変えました。投稿用のものの一部を削除して、pdfを作り直しただけなので、時間は要しません。

図を含む論文の場合、ファイルのサイズをどれくらいにするのか、というのも大切です。例えば、100MBを超えるようなものになると現状では扱いにくい。逆に、あまりに小さくすると、図の質が低くなってしまいます。おそらく写真や図を含むものですと、10-20MBくらいまでの1つのpdfが標準で、写真をほとんど含まないものですと数MBになると思います。bioRxivを使った経験のある方はわかると思いますが、pdfをウェブブラウザで閲覧はできても、pdfそのものをダウンロードすることは原則としてできないようになっています。

また、bioRxivはサプリメント書類なども添付できるのですが、これを利用しているプレプリント論文は現実にはあまりないように感じます。付属の図表などがある場合は、本文を含めたpdfファイルに一緒に入れておくのが簡単であると思います。ビデオなど特殊なファイルも、あまり利用されていないようですが、それも添付することは可能ではあると思います。

投稿
bioRxivを利用するためには、まずbioRxivでアカウントを作製する必要があります。これは、アカウントを作れば、自動的に返信があって、即投稿できます。また、投稿にあたっては、ORCIDの番号を予め取得しておくというのは研究者の常識としてやっておいた方がよいでしょう。

次に、原稿をアップロードします。これも、いくつかの選択項目がありますが簡単です。ただ、分野別の選択が一つしかできないようで、学際的な内容を含む論文ですと、選択に悩むかもしれません。そして、投稿のボタンを押して待つだけです。
biorxiv

公開
ボタンを押して翌朝、載せますというメールが来て、それで公開されていました。bioRxivの方では、この半日ほどの間に、剽窃や懸念される内容が含まれていないかチェックしていて、問題なければそのままポストしています。この内容チェックの判断は恣意的ですが、普通のバイオ系論文でしたらまず問題はないでしょう。それから半日ほどで、TwitterのbioRxivでも紹介されていました。公にでてしまったので、私のTweetでも紹介しました。その日には、購読しているbioRxivの電子メールAlertにも掲載されていました。つまり、翌日には完全にオープンになります。

ここで指摘しておきたいのは、アップロードしたからといって、直後に公開されるのではなくて、公開までに半日から1日要するということです(週末でしたらもっと時間がかかるのでしょうか)。つまり、bioRxivで公開されるのは、半日後になるので、査読雑誌に投稿するのと、bioRxivに投稿するのを、どちらを先にやるか、とか気にする必要はないでしょう。ただ、一般論としては、査読雑誌に投稿した後に、プレプリントをアップロードするというのが、普通なのかもしれません。

また、プレプリント情報を集めている外部サイトにも数日後にはでていました。バイオ系の場合、このPrePubMedというサイトが、そのようなサイトです。ただ、このサイト、httpsではなくて、httpになっているので、企業などの研究者の方の利用は注意した方がよさそうです。
http://www.prepubmed.org

公開後、査読後の扱い
ここで大切なのは、公開されれば、URLとしてアクセスできるようになるdoi (デジタルオブジェクト識別子)が付与されるということです。つまり、引用も可能になります。プレプリント論文が引用可能なのか、というのは雑誌によりますし、人によって議論もあるでしょうが、現実にプレプリントのdoiを引用している査読雑誌やニュース記事などを見かけます。たまたま、Nature Reviews Geneticsが、総説でプレプリントを引用するのをどう考えるのか、という意見を募集していました。まだ、議論のあるところだと思います。
https://twitter.com/NatureRevGenet/status/951786493026201600

査読が終わると、追加実験をしたり、文章を明確にするために、原稿を変更するのは常です。初稿と違うものになります。この改訂原稿をプレプリントとして、古いものと入れ替えるのか、これも投稿者の好みや都合によると思います。ほとんど変更がなければ、交換はしない。あるいは大幅に変更があったりした場合は、新しい原稿に交換するということになると思います。doiは、同じものを使って、改訂稿も管理されることになります。ただ、プレプリントはプレプリントですので、正式な査読雑誌に掲載されたpdfをそのままポストしたりすることはできません。古い原稿がそのまま残るということになります。

以上、実際に利用してみた経験から、気づいたことを書いてみました。もし、現在、投稿中の論文があったら、bioRxivにポストしてみたらどうでしょうか?
document_research_taba
    このエントリーをはてなブックマークに追加

2017年のSCIENCE誌「Breakthrough of the Year」の一つに、「Biology preprints take off」というものが入っていました。
http://vis.sciencemag.org/breakthrough2017/finalists/#bio-preprints

1年半ほど前に、「バイオ系のプレプリントサーバ (こちらをclick)」というブログを書いたのですが、その後、バイオ系のプレプリントというのが大きな動きとなってきたという印象を受けます。特に、コールド・スプリング・ハーバー・ラボが提供している「bioRxiv」に、査読前の興味深い論文が沢山上がるようになってきていて、研究者として、絶対無視できないということになっていると思います。

bioRxivのページ
https://www.biorxiv.org

Wikipediaの説明(日本語)
https://ja.wikipedia.org/wiki/BioRxiv

(正式な表記はbioRχivで、χはエックスではなくギリシャ文字のχ(カイ)である)ということです。

また、米国NIHがそのグラントの関連書類にプレプリントの掲載を認める、そして、バイオ系の注目財団であるChan-Zuckerbergイニシアティブ(CZI)が、bioRxivの支援をするほか、CZIの援助を受けているBiohubから発表する研究は、プレプリントの利用を必須にする、というような積極的な方針を打ち出してきたのも、大きな影響を与えていると思います。

Reporting Preprints and Other Interim Research Products March 24, 2017(NIH)
https://grants.nih.gov/node/1143

'Riskiest ideas' win $50 million from Chan Zuckerberg Biohub
http://www.nature.com/news/riskiest-ideas-win-50-million-from-chan-zuckerberg-biohub-1.21440?WT.mc_id=TWT_NatureNews

BioRxiv preprint server gets funding from Chan Zuckerberg Initiative
http://www.sciencemag.org/news/2017/04/biorxiv-preprint-server-gets-funding-chan-zuckerberg-initiative

ところが、bioRxivを見ているのですが、日本の研究者からの利用が非常に少ないという印象を受けます。この熱意の差には、いろいろな理由があるのでしょうが、基本的には日本の研究者コミュニティが保守的で新しいものの利用について、単に知識がないか、躊躇する傾向があるということなのだと思っています。

そこで、先日、Twitterのアンケート機能を利用して、こんなアンケートを取ってみました。


一般にTwitterの利用者というのは、情報技術に明るくて、進歩的な傾向があるので、例えば日本の大学にたむろしている保守的な教授達とは違うと思いますが、多くの人が利用にポジティブな意見を持つ一方で、「様子見」という立場の人も多いようです。
document_research_taba

プレプリント最大の懸念:スクープと競争
プレプリントについて、もっともよくある懸念は、いわゆる「スクープ Scooping」についての問題だと思います。これについては、バイオ系プレプリントの促進活動をしているASAPBIOのサイトのFAQでも詳しく議論されています。特に、物理学などでは、昔からよく利用されているarXivの創始者の話が興味深いです。

http://asapbio.org/preprint-info/preprint-faq#qe-faq-923
ArXiv founder Paul Ginsparg’s thoughts on scooping
"It can’t happen, since arXiv postings are accepted as date-stamped priority claims."

つまり、プレプリントは先取権を主張できると見なされている、ということです。

また、こんな記事も目にしました。
成果のオープン化でAI研究者の評価法が変わり始めた!
https://newswitch.jp/p/11608?from=np
引用
「このように学会での発表や科学誌に掲載される前に論文を公開することが当たり前になってきている。理化学研究所革新知能統合研究センターの杉山将センター長は、「AIの分野では、最先端の研究を評価できる人材が限られていることも一因」と説明する。

 技術の発達のスピードに論文の査読が追いつかないため、アイデアの先進性と公表日時を確定させるため、国際学会への投稿にあわせて論文を公開する。

 投稿から数カ月後になってようやく学会で正式に発表するころには、研究室では数段階技術が進む。「学会で発表を聞いて驚いているようだと、2周以上遅れることになりかねない」(杉山センター長)。

 さらに論文だけでなく開発したプログラムは、開発共有ウェブサービスの「GitHub」(ギットハブ)などで公開される。例え論文が良かったとしても、使えない技術は淘汰(とうた)される一方、使える技術にはユーザーが集まり、各方面への応用開発が進んでいく。」


プレプリントで早く「発見」を発表してしまえば、その発見者がプレプリントの発表時ということなら、査読を経なくても競争の勝者になれる。バイオ系以外の分野では既にそういうことになっているということです。

ただ、逆に、結果を早く報告することで、自分だけが知っているために自分だけに有利になっている情報を、早く競争相手に知らせてしまうという懸念はあるでしょう。例えば、これまでの雑誌出版ですと、結果を見るのは、雑誌に正式に掲載された時(最近ですと、ネットで公開時)でした。プレプリントですと、競争相手が早く結果を知ってしまうので、自分と同じことをやっている人がその情報に触れてしまい、それがヒントとなって競争相手に有利になる可能性があるということでしょうか。もちろん、学会などで、論文に未発表の研究を公開するのはこれまでも一般的でしたが、研究内容や状況によっては、こういうことが気になるという人もいるかもしれません。しかし、将来的にはすべてがプレプリントという社会になってしまえば、こういうことはなくなるのかもしれませんが、当面は、プレプリントとして出すのは、それに適したものということになるのでしょう。

一方で、競争より、研究コミュニティに早く知らせた方が、研究コミュニティの発展に役立つという研究内容もあるでしょう。そして、こういう他者に利益を与える善意の行動をしていれば、良心のある品位の高い研究者としての評判が高まることでしょう。

また、例えば、疾患の研究というのも、科学者の名誉などより、疾患の治療などに役立つという観点からいえば、新知見はいち早く発表するというのが倫理的であると思います(もちろん、査読がないという危険もある)。


プレプリントの利点
西川伸一先生が毎日論文を紹介しているサイトAASJでも、サイエンスの2017年ブレークスルーの記事を話題にしていて、そこに私が問題を提起したところ、artkqtarksさんという方が詳しく議論してくださっています。是非ごらんください。

http://aasj.jp/news/watch/7804
artkqtarksさんの文章より引用
「プレプリントの利点としては以下のことがあると思います:
・査読を待たずに早く研究結果を発表できること。
・数人の査読者だけでない他の研究者に研究の検証の機会を与えること。
・税金によってなされた研究でもジャーナルを購読していないと論文を読むことが難しいです。プレプリントとして発表されていれば誰でも読むことができます。」


artkqtarksさんもABC予想の例などを出して説明されていますが、研究の検証の機会というのは、例えば、こういうことでしょうか。

1)論文の論理性。理論などを発表した場合、その論理に問題がないのか、複数の人が検証できる。査読者より専門家かもしれません。あるいは、こんな理論はすでに別の人がだしているというがっかりな情報がでてくる可能性もある。

2)実験でしたら、再現性の検証ができる。もちろん、大掛かりで長期にわたるような実験をプレプリントを見てやるということはないでしょう。ただ、簡単にできる実験なら、実際にやってみて、再現ができることを確認するということがあるかもしれません。もちろん、プレプリントの全部をやるというのは、やらないでしょうが、キーとなる実験だけ、やってみる。そして、それがコミュニティで共有されれば、そのプレプリントを論文にするという方向になるでしょう。

例えば、撤回することになったSTAP論文やNgAgo(DNAオリゴでできる新しいゲノム編集の画期的ツールとして発表されたが誰も再現できなかった)のようなものが、発表前にプレプリントサーバに出たらどうなるのか。おそらく、プレプリントをみて、そのデータそのものに問題を提起する前に、そういうことが本当に起こるのか、本当に使えるのか、再現してみるという実験をやろうとする人が多数でてくることと思います。そして、結果が再現できれば、そういう評判がうわさになるでしょうし、逆に誰も再現できなければ、ゴミ論文であるといううわさが広がる。査読と同時進行で進むこういううわさが、正式な査読の経緯に何らかの影響を与えるということはありうると思います。つまり、確実な論文だけが雑誌に載るようになる可能性が高まるということです。

最近の傾向として、査読に極めて長い時間がかかる。普通の雑誌ですと、査読結果が戻ってくるまでに1ヶ月以上、そして大幅な変更が必要な場合、投稿論文を修正し再投稿し、また返事を待つのに、1ヶ月。こんなことを何回もやらなければならない場合もあります。投稿してから、半年から1年くらいかかるのが普通。こういう状態ですと、正式な査読のスピードに依存して、キャリアの決定をしなければならないとすると、無駄な時間の浪費ということになりかねません。

こういうのは、結構、問題なのです。若い人でしたら、早く次を決めたいのに、投稿論文の査読に時間がかかり、先に踏み出せない。そんなことは日常茶飯事でしょう。ところが、プレプリントを出して、それをもとに、次に踏み出せるとしたら、大きなメリットがあるはずです。結果的には、若い人達の動きや人生の決断をスピーディにすることができるということです。日本の大学の人事、研究費申請などで、プレプリントがどのように考慮されるのか、これは重要な論点であると、私は思います。もちろん、プレプリントサーバに出たものが、本当に正式の論文になるのか、という懸念はあります。人事、研究費の評価に使う場合は、(インパクトファクターが付いた発表雑誌ではなく)発表雑誌不明のプレプリントを評価しないといけないという興味深い状況が生まれることも考えられます。

そして、オープンアクセスのプレプリントは、お金を払わなくても、その論文の内容を誰でも見ることができる。これは雑誌の図書費が高騰し、運営費が少なっている昨今、大きな意義があると思います。

バイオ系プレプリントに関する議論は、下のコメント欄から自由にご投稿ください。

●次回は、実際に、最近、bioRxivにプレプリントを出してみた経験から、注意する点などを書きたいと思います(こちらです)。

shimekiri_report_hakui_woman
    このエントリーをはてなブックマークに追加

このページのトップヘ