STI Hz Vol.6, No.1, Part.7:(ほらいずん)MedRxiv,ChemRxivにみるプレプリントファーストへの変化の兆しとオープンサイエンス時代の研究論文STI Horizon

  • PDF:PDF版をダウンロード
  • DOI: https://doi.org/10.15108/stih.00205
  • 公開日: 2020.03.23
  • 著者: 林 和弘
  • 雑誌情報: STI Horizon, Vol.6, No.1
  • 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)

ほらいずん
MedRxiv, ChemRxivにみるプレプリントファースト
への変化の兆しとオープンサイエンス時代の研究論文

科学技術予測センター 上席研究官 林 和弘

概 要

1990年代初頭に物理系で始まった論文の草稿(プレプリント)を掲載するプレプリントサーバーは、2010年代になって、幅広い分野で浸透し始め、最近では、保守的とされた化学、医学系でもプレプリントサーバーが立ち上がった。後発分野のプレプリントには、研究者コミュニティに論文を知らしめて先取権を確保する役割に加えて、査読付きジャーナルに投稿する前や同時に広く共有して社会インパクトを含めてその価値を様々に問う意味合いが強まっている。また、査読前の事前チェックの役割を果たすなど、論文のベータバージョンとも言える役割に変容しつつあり、ChemRxivでは学協会がその運用費用を負担するなど、事業的にも、より確実な運営が始まっている。あるいは、査読が終了していないプレプリントサーバーの論文が速報として対外的に評価される例も出始めた。プレプリントが研究成果公開メディアとしてより重要に扱われ、研究成果公開の作法とその受け止め方が変わる兆しが見えており、学術ジャーナルと査読の在り方が改めて問われることになる。

キーワード:オープンサイエンス,オープンアクセス,プレプリントサーバー,MedRxiv,ChemRxiv

1.プレプリントとプレプリントサーバー

プレプリントとは、主に査読付きジャーナルに投稿する前の草稿原稿のことを指し、プレプリントを研究者仲間に事前に共有して意見を求めることは従来より分野を問わず広く行われる情報共有活動である1)。そして、プレプリントは査読済みでも、出版されたものでもないという位置づけである。1990年代に入ってWebが登場すると、このプレプリントを掲載して誰でも読めるようにするプレプリントサーバーが登場し、新しい知見の迅速な共有とより多くのフィードバックを得ることができるようになった(図表1、図表2)。

当初、プレプリントサーバー上のプレプリントは査読付きジャーナルの論文を置き換えるものではなく、独立したものとして、別途研究者は査読付きジャーナルに投稿することが多かったが、2010年代になって、プレプリントサーバーの位置づけが変わる兆しが見えている2)。本稿では、2020年を前に一部の分野にて限定的に利用されていたプレプリントサーバーが、化学、医学系等これまで保守的だった分野にも登場したことを踏まえ、プレプリントサーバーのプレプリントと、査読付きジャーナルから出版された論文の関係を整理して考察する(図表1)。一方で、研究成果公開メディアとして書籍(モノグラフ等)、国際会議の予稿(プロシーディングス等)が主流となる分野もあるが、議論を明瞭にするために、本稿では研究論文と査読付きジャーナルを中心とした学術情報流通について議論する。

図表1 査読付きジャーナルとプレプリントサーバーの活用図表1 査読付きジャーナルとプレプリントサーバーの活用

図表2 出版プロセスにおけるプレプリントと公開の位置づけ図表2 出版プロセスにおけるプレプリントと公開の位置づけ

2.物理学から、生物学、化学、医学へ浸透し始めたプレプリントサーバー

これまでの主なプレプリントサーバーの概要をまとめたものを図表3に示す。高エネルギー物理分野では1991年からプレプリントをWebプレプリントサーバー上で広く公開し始め、社会科学では長い査読期間への対応としてプレプリントサーバーでの公開が1993年から始まっている。2000年代までは、これら一部の分野と数学、経済、統計など、その近縁の分野への拡張に限られていたプレプリントサーバーの利用は、2013年に生物系BioRxivが立ち上がると一気にその利用が進んで掲載数が増大し、また、COS(Center for Open Science)が社会科学、工学、心理学、農学を始めとする多分野への展開を推し進めた3)(図表4)。

化学系では、2000年に商業出版社が化学系プレプリントサーバーを立ち上げて頓挫した4)が、2017年に米国、英国、ドイツの化学会がChemRxivの運営を開始した5)。さらに、医学系でも、2019年6月にMedRxivが運用開始となった6)。従来医学系では、1969年に制定されたインゲルフィンガールールに基づき、原稿の内容が既にジャーナル等に投稿されていたり、どこか別の場所で報告されていたりした場合は、原稿の受け取りを拒否する、というジャーナル運用が続けられていたために、プレプリントサーバーへの搭載を事実上認めていなかったが、その方針が変化している。このようにして、主要分野のほとんどに幅広くプレプリントサーバーが利用され始めた。

図表3 主なプレプリントサーバーの概要図表3 主なプレプリントサーバーの概要

図表4 プレプリントサーバーの月間登録数図表4 プレプリントサーバーの月間登録数

3.プレプリントサーバーのメリットと課題

プレプリントサーバーによるプレプリント公開のメリットは第一に研究の先取権について一定の主張ができることにある。一番目に価値を発見したことをアピールできることは研究者にとって非常に重要な要素であり、査読を待つことなく、誰でも読めるオープンアクセスの形式でタイムスタンプ付きで第3者のサーバーに論文を掲載することで、その先取権を主張できる。

次に、幅広い意見を伺う機会が確保できる。現在の査読付きジャーナルの課題である、査読や出版に時間がかかって公開までに時間がかかることや、必ずしも適切な査読者が担当するとは限らないことなど、現行のピアレビューの問題や限界を補完する格好となっている。特に、査読の結果として、科学としての妥当性はありながらも新規性、速報性などから却下となる論文も、プレプリントサーバーで共有することができ、出版バイアスの一部である、査読者や出版社が良いと判断した結果しか公開されないというバイアスをある程度軽減することができる。さらに、現在では、AIなど機械が活用できるという点がより重要になっており、オープンであるプレプリントによって、先のバイアスの少ない情報がAIによって処理できることも重要である。

一方、課題としては、第一にぜい弱なビジネスモデルがある。例えば、嚆矢であるarXivでは、個人の活動から組織的活動に転換し、助成団体から多額の支援を得ながら、利用の多い大学等の上位200機関を対象に、費用負担を求めるビジネスモデルを取っており、利用の多寡に応じて負担額を変えているが、その分担金の調整や収集に苦労している7)。1993年に始まったSSRNも同様の事業継続性の問題を抱えていたが、結果的に商業出版社に買収されることでその問題を解決した格好となった8)。なお、この問題は2010年代に立ち上がったプレプリントサーバーでも同様である9)

他にも、プレプリントサーバーに載った論文を横取りして査読付きジャーナルに投稿してしまうスクープ問題や、プレプリントサーバーにだけ登録された原稿の質の保証はどうするのかなど課題も挙げられている10)

4.ChemRxivにみるプレプリントサーバーの変容

2010年代後半に創設されたプレプリントサーバーは、先行したプレプリントサーバーが持つ課題に対応し、また、査読付きジャーナルが持つ問題を補完する、あるいは査読付きジャーナルへの展開を効率よく行うための工夫がなされている。例としてChemRxivとarXivの立ち上げ方を比較すると、図表5に示すように、査読付き論文への受渡し(ダイレクトトランスファー)、編集事務局チェックの高度化、学協会運営による事業継続性の確保などの特徴を持つ。

これらの特徴は、もともとジャーナルとは独立して運営されていたプレプリントサーバーの位置づけや運営が変容していることを表していると言え、同様にジャーナル運営にも影響を与え始めたと言える。

図表5 arXivからみたChemRxivの立ち上げ方の違い図表5 arXivからみたChemRxivの立ち上げ方の違い

* arXivは立ち上げから順次改善を加え、(ひょう)(せつ)チェックや学協会との連携等を行っている

5.プレプリントファーストへの変容と、成果公開メディアの今後の可能性

プレプリントサーバーの進展と変容はプレプリント自身の位置づけも変えている。特に査読付きジャーナルの論文に固有の識別子(DOI)を付与していたCrossrefが、2016年にプレプリントサーバー上のプレプリントにもDOIを付与できるようにした11)。DOIが付与されることは、その存在が世界の中で一意に固定され、また、プレプリントの存在場所が誰でも分かることになる。飽くまで身内で公開するような草稿段階であったプレプリントが、学術論文出版のライフサイクルの中における研究成果公開メディアとしてより公式の位置づけを確保しうるものになる。これを論文のいわばβ版のようにみなすのかどうかは、分野ごとに判断が問われている12)。いずれにせよ、先に述べた即時公開による先取権の確保という研究者にとって最も重要なメリットを考えると、まずはプレプリントを投稿する“プレプリントファースト”と呼ぶ時代が早かれ遅かれやってくる可能性がある(図表6)。

むしろ、プレプリントをより積極的に研究成果公開メディアとして認めようという動きもある。F1000Researchを中心としたOpen Research Central13)では、プレプリントに当たる原稿をむしろ正式なPublishingとして一旦認め、ピアレビューを後で行うことを推進しており、このモデルで先に述べた出版バイアスの軽減も可能であることを訴えている。

このように、出版プロセスの上位工程にプレプリントがより明示的に位置づけられるようになり、その結果として、学協会や商業出版社などジャーナルを運営する組織がプレプリントの運営に積極的に参加して、先に草稿を囲い込むようになったと見ることも可能である。あるいは、もし、すべての研究者が“プレプリントファースト”を行えば、横取りのスクープ問題も構造的に発生しない。

プレプリントサーバーの登場と進展によるプレプリントの変容は、研究成果公開の在り方を着実に変えつつある。論文と査読付きジャーナルの位置づけも変容し、特に査読という、その学界コミュニティの見識によるフィルターという機能の重要性が再認識されるとともにその在り方が改めて問われていることになる。例えば、高エネルギー物理のように、著者と読者の重なりが大きい分野では、読者自身で論文の中身を判断しやすいのでプレプリントの共有が有効であるが、化学・医学など、著者に対して読者が圧倒的に多い分野や、産業への影響が大きいトピックにおいては、その内容の信頼性が担保されていることが重要である。したがって、プレプリントの共有だけでは不十分となって、査読を含めて研究成果の信頼性を担保するメディアの役割がこれまで以上に大きくなりうる。

プレプリントによる成果公開をどのように評価するかもこれからの大きな課題であり、変化の兆しが見え始めている。例えば、Science誌が選ぶ2019年の10大発見の中にまだ査読が通っていないプレプリントの成果が挙げられた14)。また、中国武漢で起きた新型コロナウイルスの感染拡大に関するプレプリントが大きなインパクトを与え、査読前のその内容について専門家を含めた論議を呼んでいる15)。オープンサイエンスが浸透し、学術出版サイクルの中のプレプリントの扱いが、医学を含む幅広い分野で変わる中、人事採用を含む研究評価において、プレプリントの公開を研究成果としてどのように取り扱うかが今後の鍵である。引き続き分野などの属性の違いを考慮しながら、プレプリント共有の文化が、世代交代を含む時間をかけて判断され、受け入れられていくことになろう。

図表6 プレプリントサーバーの進展・変容と査読付きジャーナルの関係図表6 プレプリントサーバーの進展・変容と査読付きジャーナルの関係

参考文献・資料

1) Sharing Preprints https://www.fosteropenscience.eu/learning/sharing-preprints/

2) 林 和弘. 学術情報流通のオープン化がもたらすオープンサイエンスに向けた成果公開プロセスと共有の変革. STI Horizon. 2017, Vol. 3, No. 3, p. 35-39. https://doi.org/10.15108/stih.00092

3) OSF Preprints https://osf.io/preprints/

4) Robert F. Service. Chemists Launch Preprint Server
https://www.sciencemag.org/news/2000/08/chemists-launch-preprint-server

5) 化学系プレプリントサーバ「ChemRxiv」の設立が決定
https://www.chem-station.com/chemistenews/2016/09/ChemRxiv.html

6) 佐藤翔. [第3回]medR χ ivの挑戦 医学分野対象のプレプリントサーバーの登場
http://www.igaku-shoin.co.jp/paperDetail.do?id=PA03333_03

7) arXiv、2018-2022年のビジネスプランを発表 会費の値上げへ https://current.ndl.go.jp/node/33782

8) Gregg Gordon. 学術情報共有とオープンアクセスの未来. 第2回 SPARC Japan セミナー2017「プレプリントとオープンアクセス」 https://www.nii.ac.jp/sparc/event/2017/pdf/20171030_doc3.pdf

9) Popular preprint servers face closure because of money troubles. Nature 578, 349 (2020)
https://doi.org/10.1038/d41586-020-00363-3

10) Jan Conrad. Reproducibility: Don’t cry wolf
https://www.nature.com/news/reproducibility-don-t-cry-wolf-1.17859

11) Crossref、2016年8月からプレプリント版へのDOIの付与を可能に https://current.ndl.go.jp/node/31515

12) 2017年はプレプリントの年(記事紹介) https://jipsti.jst.go.jp/johokanri/sti_updates/?id=9638

13) Open Research Central https://openresearchcentral.org/about

14) A‘missing link’ microbe emerges
https://vis.sciencemag.org/breakthrough2019/finalists/#microbe-emerges

15) 新型コロナウイルスの世界的な急拡大を、科学者たちは“予見”している
https://wired.jp/2020/01/26/scientists-predict-wuhans-outbreak-will-get-much-worse/