神経科学研究者のブログです。科学、教育などに関する雑多な私見、主張など。
Twitter:@yamagatm3
研究者情報:https://about.me/masahito.yamagata


バイオ系プレプリントサーバを利用してみた(その1)

2017年のSCIENCE誌「Breakthrough of the Year」の一つに、「Biology preprints take off」というものが入っていました。
http://vis.sciencemag.org/breakthrough2017/finalists/#bio-preprints

1年半ほど前に、「バイオ系のプレプリントサーバ (こちらをclick)」というブログを書いたのですが、その後、バイオ系のプレプリントというのが大きな動きとなってきたという印象を受けます。特に、コールド・スプリング・ハーバー・ラボが提供している「bioRxiv」に、査読前の興味深い論文が沢山上がるようになってきていて、研究者として、絶対無視できないということになっていると思います。

bioRxivのページ
https://www.biorxiv.org

Wikipediaの説明(日本語)
https://ja.wikipedia.org/wiki/BioRxiv

(正式な表記はbioRχivで、χはエックスではなくギリシャ文字のχ(カイ)である)ということです。

また、米国NIHがそのグラントの関連書類にプレプリントの掲載を認める、そして、バイオ系の注目財団であるChan-Zuckerbergイニシアティブ(CZI)が、bioRxivの支援をするほか、CZIの援助を受けているBiohubから発表する研究は、プレプリントの利用を必須にする、というような積極的な方針を打ち出してきたのも、大きな影響を与えていると思います。

Reporting Preprints and Other Interim Research Products March 24, 2017(NIH)
https://grants.nih.gov/node/1143

'Riskiest ideas' win $50 million from Chan Zuckerberg Biohub
http://www.nature.com/news/riskiest-ideas-win-50-million-from-chan-zuckerberg-biohub-1.21440?WT.mc_id=TWT_NatureNews

BioRxiv preprint server gets funding from Chan Zuckerberg Initiative
http://www.sciencemag.org/news/2017/04/biorxiv-preprint-server-gets-funding-chan-zuckerberg-initiative

ところが、bioRxivを見ているのですが、日本の研究者からの利用が非常に少ないという印象を受けます。この熱意の差には、いろいろな理由があるのでしょうが、基本的には日本の研究者コミュニティが保守的で新しいものの利用について、単に知識がないか、躊躇する傾向があるということなのだと思っています。

そこで、先日、Twitterのアンケート機能を利用して、こんなアンケートを取ってみました。



一般にTwitterの利用者というのは、情報技術に明るくて、進歩的な傾向があるので、例えば日本の大学にたむろしている保守的な教授達とは違うと思いますが、多くの人が利用にポジティブな意見を持つ一方で、「様子見」という立場の人も多いようです。
document_research_taba

プレプリント最大の懸念:スクープと競争
プレプリントについて、もっともよくある懸念は、いわゆる「スクープ Scooping」についての問題だと思います。これについては、バイオ系プレプリントの促進活動をしているASAPBIOのサイトのFAQでも詳しく議論されています。特に、物理学などでは、昔からよく利用されているarXivの創始者の話が興味深いです。

http://asapbio.org/preprint-info/preprint-faq#qe-faq-923
ArXiv founder Paul Ginsparg’s thoughts on scooping
"It can’t happen, since arXiv postings are accepted as date-stamped priority claims."

つまり、プレプリントは先取権を主張できると見なされている、ということです。

また、こんな記事も目にしました。
成果のオープン化でAI研究者の評価法が変わり始めた!
https://newswitch.jp/p/11608?from=np
引用

「このように学会での発表や科学誌に掲載される前に論文を公開することが当たり前になってきている。理化学研究所革新知能統合研究センターの杉山将センター長は、「AIの分野では、最先端の研究を評価できる人材が限られていることも一因」と説明する。

 技術の発達のスピードに論文の査読が追いつかないため、アイデアの先進性と公表日時を確定させるため、国際学会への投稿にあわせて論文を公開する。

 投稿から数カ月後になってようやく学会で正式に発表するころには、研究室では数段階技術が進む。「学会で発表を聞いて驚いているようだと、2周以上遅れることになりかねない」(杉山センター長)。

 さらに論文だけでなく開発したプログラムは、開発共有ウェブサービスの「GitHub」(ギットハブ)などで公開される。例え論文が良かったとしても、使えない技術は淘汰(とうた)される一方、使える技術にはユーザーが集まり、各方面への応用開発が進んでいく。」



プレプリントで早く「発見」を発表してしまえば、その発見者がプレプリントの発表時ということなら、査読を経なくても競争の勝者になれる。バイオ系以外の分野では既にそういうことになっているということです。

ただ、逆に、結果を早く報告することで、自分だけが知っているために自分だけに有利になっている情報を、早く競争相手に知らせてしまうという懸念はあるでしょう。例えば、これまでの雑誌出版ですと、結果を見るのは、雑誌に正式に掲載された時(最近ですと、ネットで公開時)でした。プレプリントですと、競争相手が早く結果を知ってしまうので、自分と同じことをやっている人がその情報に触れてしまい、それがヒントとなって競争相手に有利になる可能性があるということでしょうか。もちろん、学会などで、論文に未発表の研究を公開するのはこれまでも一般的でしたが、研究内容や状況によっては、こういうことが気になるという人もいるかもしれません。しかし、将来的にはすべてがプレプリントという社会になってしまえば、こういうことはなくなるのかもしれませんが、当面は、プレプリントとして出すのは、それに適したものということになるのでしょう。

一方で、競争より、研究コミュニティに早く知らせた方が、研究コミュニティの発展に役立つという研究内容もあるでしょう。そして、こういう他者に利益を与える善意の行動をしていれば、良心のある品位の高い研究者としての評判が高まることでしょう。

また、例えば、疾患の研究というのも、科学者の名誉などより、疾患の治療などに役立つという観点からいえば、新知見はいち早く発表するというのが倫理的であると思います(もちろん、査読がないという危険もある)。


プレプリントの利点
西川伸一先生が毎日論文を紹介しているサイトAASJでも、サイエンスの2017年ブレークスルーの記事を話題にしていて、そこに私が問題を提起したところ、artkqtarksさんという方が詳しく議論してくださっています。是非ごらんください。

http://aasj.jp/news/watch/7804
artkqtarksさんの文章より引用

「プレプリントの利点としては以下のことがあると思います:
・査読を待たずに早く研究結果を発表できること。
・数人の査読者だけでない他の研究者に研究の検証の機会を与えること。
・税金によってなされた研究でもジャーナルを購読していないと論文を読むことが難しいです。プレプリントとして発表されていれば誰でも読むことができます。」



artkqtarksさんもABC予想の例などを出して説明されていますが、研究の検証の機会というのは、例えば、こういうことでしょうか。

1)論文の論理性。理論などを発表した場合、その論理に問題がないのか、複数の人が検証できる。査読者より専門家かもしれません。あるいは、こんな理論はすでに別の人がだしているというがっかりな情報がでてくる可能性もある。

2)実験でしたら、再現性の検証ができる。もちろん、大掛かりで長期にわたるような実験をプレプリントを見てやるということはないでしょう。ただ、簡単にできる実験なら、実際にやってみて、再現ができることを確認するということがあるかもしれません。もちろん、プレプリントの全部をやるというのは、やらないでしょうが、キーとなる実験だけ、やってみる。そして、それがコミュニティで共有されれば、そのプレプリントを論文にするという方向になるでしょう。

例えば、撤回することになったSTAP論文やNgAgo(DNAオリゴでできる新しいゲノム編集の画期的ツールとして発表されたが誰も再現できなかった)のようなものが、発表前にプレプリントサーバに出たらどうなるのか。おそらく、プレプリントをみて、そのデータそのものに問題を提起する前に、そういうことが本当に起こるのか、本当に使えるのか、再現してみるという実験をやろうとする人が多数でてくることと思います。そして、結果が再現できれば、そういう評判がうわさになるでしょうし、逆に誰も再現できなければ、ゴミ論文であるといううわさが広がる。査読と同時進行で進むこういううわさが、正式な査読の経緯に何らかの影響を与えるということはありうると思います。つまり、確実な論文だけが雑誌に載るようになる可能性が高まるということです。

最近の傾向として、査読に極めて長い時間がかかる。普通の雑誌ですと、査読結果が戻ってくるまでに1ヶ月以上、そして大幅な変更が必要な場合、投稿論文を修正し再投稿し、また返事を待つのに、1ヶ月。こんなことを何回もやらなければならない場合もあります。投稿してから、半年から1年くらいかかるのが普通。こういう状態ですと、正式な査読のスピードに依存して、キャリアの決定をしなければならないとすると、無駄な時間の浪費ということになりかねません。

こういうのは、結構、問題なのです。若い人でしたら、早く次を決めたいのに、投稿論文の査読に時間がかかり、先に踏み出せない。そんなことは日常茶飯事でしょう。ところが、プレプリントを出して、それをもとに、次に踏み出せるとしたら、大きなメリットがあるはずです。結果的には、若い人達の動きや人生の決断をスピーディにすることができるということです。日本の大学の人事、研究費申請などで、プレプリントがどのように考慮されるのか、これは重要な論点であると、私は思います。もちろん、プレプリントサーバに出たものが、本当に正式の論文になるのか、という懸念はあります。人事、研究費の評価に使う場合は、(インパクトファクターが付いた発表雑誌ではなく)発表雑誌不明のプレプリントを評価しないといけないという興味深い状況が生まれることも考えられます。

そして、オープンアクセスのプレプリントは、お金を払わなくても、その論文の内容を誰でも見ることができる。これは雑誌の図書費が高騰し、運営費が少なっている昨今、大きな意義があると思います。

バイオ系プレプリントに関する議論は、下のコメント欄から自由にご投稿ください。

●次回は、実際に、最近、bioRxivにプレプリントを出してみた経験から、注意する点などを書きたいと思います(こちらです)。

shimekiri_report_hakui_woman