STI Hz Vol.9, No.1, Part.10:(レポート)論文のオープンアクセスとプレプリントの公開及び入手状況と認識STI Horizon

  • PDF:PDF版をダウンロード
  • DOI: https://doi.org/10.15108/stih.00328
  • 公開日: 2023.03.20
  • 著者: 池内 有為、林 和弘
  • 雑誌情報: STI Horizon, Vol.9, No.1
  • 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)

レポート
論文のオープンアクセスとプレプリントの 公開及び入手状況と認識
-State of Open Science in Japan 2022の調査結果から得られた示唆-

データ解析政策研究室 客員研究官 池内 有為、室長 林 和弘

概 要

科学技術・学術政策研究所(NISTEP)は、日本の研究者による論文とプレプリント(PP)の入手や公開の状況を明らかにするために、2022年7月から8月にかけてオンライン調査を実施した。科学技術専門家ネットワークに所属する研究者から得た1,104名の回答を分析した結果、必要な論文を十分に入手できている研究者は42.0%であり、論文のオープンアクセス(OA)経験は83.3%が有していた(2020年の調査から3.2ポイント増加)。PPの入手経験は67.3%(+15.2ポイント)、公開経験は29.5%(+9.1ポイント)といずれも増加していた。OAの主な障壁は資金であり、若年層や公的機関・団体、大学の研究者は不足感が強かった。論文をOAとしていない理由が解消された場合、66.7%がOAにしても良いと考えていることもわかった。PPの主な未公開理由は「公開する必要性を感じない」や「最初に査読誌に投稿したいから」であり、未公開理由が解消されたとしても公開意思をもつ回答者は28.3%にとどまった。分野別では、2020年から継続して数学、物理学・天文学、計算機科学分野においてPP利用や公開が盛んであり、arXivがよく使われていたほか、心理学の利用率や医学の公開率が増加していた。

キーワード:オープンアクセス(OA),プレプリント,オープンサイエンス,学術情報流通,オンライン調査

1. はじめに

学術論文やプレプリント(学術雑誌に投稿する予定の論文草稿等)をインターネット上に公開して共有する動きは、オープンサイエンス政策やCOVID-19を契機とした研究成果の即時公開の潮流のもと、世界的に推進されている。論文については、欧州のPlanS1)や米国大統領府科学技術政策局(OSTP)の方針2)により、オープンアクセス(以下、「OA」と記載する)として迅速な公開が進むと予想され、プレプリントについては「第6期科学技術・イノベーション基本計画」3)において“論文のオープンアクセス化や研究成果の迅速な公開の場の一つとしてのプレプリントの活用も一層加速”していると指摘されている。一方で、論文をOAにするための費用(APC)の高騰は継続的な課題となっており4)、Morrisonらの調査5)によれば2011年から2021年にかけてOAジャーナルの平均APCは906ドル(USD)から958ドルまで上昇している。また、プレプリント(以下、「PP」)は査読前の草稿が中心であることから信頼性の問題が存在する6)

科学技術・学術政策研究所(NISTEP)は、日本の研究者によるオープンサイエンスの動向を捉えるために、科学技術専門家ネットワーク(以下、「専門家NW」)7)を対象として、2016年から論文と研究データの公開に関するオンライン調査を隔年で実施してきた8〜10)。また、2020年にはPPの入手や公開状況を調査した11)。この一連の調査(State of Open Science in Japan)の一環として、2022年に実施した論文とPPに関するオンライン調査の結果を報告する。PPはOA実現のための一手段とも捉えられるが、本調査では別途尋ねることとした。

調査対象の専門家NWとは、大学、企業、公的機関・団体に所属する研究者、技術者、マネージャーなど、多分野かつ幅広い年齢層を含む専門家集団である。ただし、専門家NWは毎年一定数の入れ替わりがあるため、パネル調査には相当しない。

質問項目は、論文とPPを比較するために入手や公開状況等について尋ねた共通の質問(14問)、それぞれの特徴に応じた質問(9問)、その他(研究分野や自由回答など3問)の合計26問である。質問や選択肢は基本的に2020年に実施した調査(以下、「2020年調査」)と同様としたが、論文やPPの公開理由や未公開理由等は2020年調査の自由回答を集約して新たに追加した。

調査期間は2022年7月19日から8月1日として、専門家NWの1,671名にE-mailで回答を依頼した。多重回答を防ぐため、回答者ごとに個別URLを作成した上で、回答完了後には再度回答が行えないよう設定した。締切り後も回答の入力があったため、8月22日までの回答を結果に含めた。

本稿では、1,173名(回答率70.2%)の有効回答のうち、現在研究活動を行っている1,104名の回答を分析した結果から、論文とPPの利用状況と公開状況について紹介する。調査の詳細やその他の結果については、2023年3月に公開予定の報告書(NISTEP RESEARCH MATERIAL)や発表資料12)を御参照いただきたい。

2. 論文とプレプリントの利用状況

2-1 論文の入手状況

直近半年について、研究に必要な論文を入手できたかどうかを尋ねた結果、「ほとんど入手できた」を選択した回答者は全体の42.1%、「ある程度入手できた」は52.1%、「あまり入手できなかった」は4.8%、「ほとんど入手できなかった」は1.0%であった(「わからない」1名と未回答の2名を除く)。

分野別に「ほとんど入手できた」の比率をみると、計算機科学(75.5%)、数学(62.5%)、物理学・天文学(55.6%)は高く、化学(31.9%)、人文学・社会科学(33.3%)、生物科学(38.5%)は低かった(図表1)。なお、分野によって回答者数(図表では「n」と記載する)に差があることに御留意いただきたい。

年齢層別に論文を「ほとんど入手できた」比率をみると、30代以下が46.3%、40代が43.2%、50代が34.8%、60代以上が40.0%であった。所属は大学が43.2%、公的機関・団体が40.1%、企業が32.9%の順であった。

図表1 論文の入手状況(n=1,101)図表1 論文の入手状況(n=1,101)

2-2 プレプリントの入手経験

PPの入手経験をもつ回答者は67.3%、もたない回答者は46.3%、わからないという回答者は1.5%であった。2020年調査において入手経験をもつ回答者は52.1%であり、約2年間で15.2ポイント増加していた。PPの入手経験を有していた回答者742名を対象として、PPを入手した際に利用したPPサーバ(以下、PPS)やサービスを複数選択方式で尋ねた結果、選択率が高かったのは1991年に運用を開始したPPSのarXiv(55.0%)、学術系SNSのResearchGate(44.1%)、生物学分野のPPSであるbioRxiv(38.1%)、個人や研究室のウェブサイト(16.4%)、化学分野のPPSであるChemRxiv(13.1%)、健康科学分野のmedRxiv (10.6%)等であった。2022年にサービスを開始した日本のPPSであるJxivは1.3%が選択していた。

分野別に入手率をみると、数学(100.0%)、心理学(92.9%)、物理学・天文学(92.6%)、計算機科学(89.8%)の順に高く、人文学・社会科学(50.0%)、工学(52.9%)、医学と農学(いずれも60.8%)は低かった(図表2)。

年齢層別のPPの入手経験について、30代以下が70.3%、40代が68.5%、50代が63.3%、60代以上が56.7%であり、若年層ほど入手率が高かった。所属は公的機関・団体が71.1%、大学が67.6%、企業が56.6%の順であった。

図表2 分野別プレプリントの入手経験(n=1,104)図表2 分野別プレプリントの入手経験(n=1,104)

3. 論文のオープンアクセスとプレプリントの公開状況及びその理由

3-1 論文のオープンアクセス経験とプレプリントの公開経験

これまでに、論文をOAにした経験をもつ回答者は83.3%、もたない回答者は15.4%、わからないという回答者は1.3%であった。PPの公開経験をもつ回答者は29.5%、もたない回答者は68.2%、わからないという回答者は2.3%であった。2020年調査と比較すると、論文のOA経験は80.1%から3.2ポイント、PPの公開経験は20.4%から9.2ポイント増加していた。

PPの公開経験を有していた回答者318名を対象として、PPを公開した際に利用したPPSやサービスを複数選択方式で尋ねた結果は、選択率が高かった順にarXiv(50.2%)、bioRxiv(30.5%)、ResearchGate(16.0%)、個人や研究室のウェブサイト(8.2%)、Research Square(7.9%)、ChemRxiv(6.0%)等であった。日本のJxivは0.9%が選択していた。

分野別の論文のOA経験とPPの公開経験を図表 3に示す。OA経験は心理学(100.0%)、生物科学(91.0%)、地球科学(88.9%)の順に多く、PPの公開経験は数学(100.0%)、物理学・天文学(76.5%)、計算機科学(57.1%)の順に多かった。分野別のOA経験とPPの公開経験には相関がみられなかった。

一方、PPの入手経験と公開経験には正の相関がみられた(Pearsonの相関係数0.83, p<0.01)。ただし、心理学と化学は、入手率に比べて相対的に公開率が低かった(図表4)。2020年調査では、化学と医学で同様の傾向がみられたが、医学は公開率が8.0%(2020年)から21.6%(2022年)まで13.6ポイント増加していた。今後、心理学や化学についても公開率が増加するのかどうか、注視したい。

年齢層別の経験について、OAは30代以下が84.1%、40代が86.0%、50代が77.8%、60代以上が75.0%であり、PPは30代以下が36.7%、40代が29.2%、50代が22.2%、60代以上が30.0%であった。おおむね、若年層ほど公開率が高い傾向がみられた。PPについては2020年調査及び前章に示した入手経験ともに同様の傾向であった。

所属機関別の経験について、OAは公的機関・団体(86.1%)と大学(85.9%)が同程度であり企業(51.8%)は相対的に低く、PPも大学(31.5%)と公的機関・団体(27.7%)とが同程度であり企業(14.1%)は相対的に低かった。PPについては2020年調査でも同様の傾向であり、また、前章に示したPPの入手経験も同様の傾向であった。

図表3 分野別論文のオープンアクセス経験とプレプリントの公開経験図表3 分野別論文のオープンアクセス経験とプレプリントの公開経験

図表4 PPの入手経験と公開経験図表4 PPの入手経験と公開経験

3-2 論文のオープンアクセスとプレプリントの公開理由

論文をOAにした理由を複数選択方式で尋ねた結果を、2020年調査の結果とともに図表 5に示す(第1章で述べたように、2020年調査の自由回答を集約して選択肢を追加したため、2020年調査の値が示されていない選択肢も存在する)。最も選択率が高かったのは「論文を投稿した雑誌がOAだから」(73.8%)、次いで「研究成果を広く認知してもらいたいから」(61.5%)であった。2020年調査よりも選択肢が増加したことで全体的に選択率が下がっているものの、「研究成果を広く認知してもらいたいから」、「OAに貢献したいから」「助成機関のポリシーだから」「分野やコミュニティの規範・慣習だから」は選択率が増加していた。

PPの公開理由を複数選択方式で尋ねた結果を、OAと同様に図表6に示す。最も選択率が高かったのは「速報性が高いから」(58.3%)、次いで「研究成果を広く認知してもらいたいから」(57.1%)、「研究の先取権を確保するため」(48.2%)の順であった。論文と同様に、2020年調査よりも全体的に選択率が下がっているものの「分野やコミュニティの規範・慣習だから」は増加していた。

図表5 論文をオープンアクセスにした理由(複数回答)図表5 論文をオープンアクセスにした理由(複数回答)

図表 6 プレプリントの公開理由(複数回答)図表 6 プレプリントの公開理由(複数回答)

3-3 論文とプレプリントの未公開理由

論文をOAにしていない理由を複数選択方式で尋ねた結果、最も選択率が高かったのは「資金がないから」(54.7%)次いで「投稿したい雑誌がOAではないから」(35.3%)であった。2020年調査よりも選択率が増加していたのは、「特に理由はない」「OAではない発表方式の方が望ましいと思うから」「ニーズがないと思うから」「時間がないから」であった(図表7)。

PPを公開していない理由を複数選択方式で尋ねた結果、最も選択率が高かったのは「PPを公開する必要性を感じないから」(53.6%)、次いで「最初に査読誌に投稿したいから」(53.2%)、であった。2020年調査よりも選択率がやや増加していたのは、「業績にならないから」であった(図表8)。

図表7 論文をオープンアクセスにしていない理由(複数回答)図表7 論文をオープンアクセスにしていない理由(複数回答)

図表8 プレプリントを公開していない理由(複数回答)図表8 プレプリントを公開していない理由(複数回答)

3-4 論文のOA意思とプレプリントの公開意思

OA経験やPPの公開経験がない回答者を対象として、それぞれの理由が解消した場合の公開意思を尋ねた。その結果、OA経験がない回答者147名のうち、OA意思をもつ回答者は66.7%、もたない回答者は11.6%、わからないという回答者は21.8%であった。PPの公開経験がない回答者676名のうち、公開意思をもつ回答者は28.3%、もたない回答者は30.8%、わからないという回答者は41.0%であり、論文とPPで差がみられた。

未公開理由のうち、公開意思の有無によって選択率に有意な差がみられた項目を図表9に示す。χ二乗検定の結果、公開意思をもつ回答者の選択率が有意に高かったのは、論文は「資金がないから」、PPは「投稿したい雑誌がPPを認めていないから」であった。なお、「資金がないから」の選択率は30代以下が56.8%、40代が57.5%、50代が53.2%、60代以上が38.5%であり、若年層ほど選択率が高い傾向がみられた。また、公的機関・団体(68.2%)や大学(62.4%)の選択率が高く、企業(25.6%)は低かった。一方、公開意思をもたない回答者の選択率が有意に高かったのは、論文は「OAではない発表方式の方が望ましいと思うから」、PPは「PPを公開する必要性を感じないから」「査読がないから」であった。

図表9 論文のOA意思とプレプリントの公開意思及び未公開理由図表9 論文のOA意思とプレプリントの公開意思及び未公開理由

※公開意思の有無により、選択率に有意な差がみられた理由(p<.05 *, p<.01 **, p<.001 ***)

4. おわりに

本調査は、2022年時点における日本の研究者による論文のOAとPPの公開や入手状況、及び認識を明らかにした。まず、論文を十分に入手できている研究者は42.0%であった。論文のOA化やPPの公開が促進されることによって、研究に必要な情報にアクセスしやすい環境が整うことが期待される。

論文のOA経験は83.3%が有しており、2020年調査と比較して3.2ポイント増加していた。論文をOAにするための資金が公開を阻む主要な要因であり、特に若年層や公的機関・団体及び大学の研究者ほど不足感が強い。公開のための資金を充足させることによってOA化が進む可能性が示唆された。一方で、OAではない発表方式の方が望ましいという認識から、OAにしない研究者も一定数存在する可能性が示唆された。

PPの入手経験は67.3%が有しており、約2年間で15.2ポイント増加していた。PPの公開経験は29.5%が有しており、9.1ポイント増加していた。利用、公開ともに盛んになっているといえよう。ただし、PPは未公開理由が解消された場合であっても公開意思をもつ回答者は28.3%にとどまった(論文は66.7%)。投稿したい雑誌がPPを認めるならば公開しても良いと考える研究者が存在する一方で、PPを公開する必要性を感じない、査読がないといった理由で公開しない可能性が高い研究者も多いことが確認された。

分野別の状況をみると、1990年代からPPサーバが活用されている数学、物理学・天文学、計算機科学は、2020年調査から継続して入手、公開経験をもつ回答者の比率が高かった。また、入手、公開ともにarXivが最も利用されていた。2020年調査と比較すると、心理学は入手、公開、公開意思をもつ研究者の比率が増加していた。心理学分野は入手率に対して公開率が低かったが、2020年調査で同様の傾向がみられた医学分野は今回の調査で公開率が上昇していたため、今後、公開率が上がる可能性もあると考えられる。

全体的に論文をOAにする研究者やPPを公開する研究者は増加しているものの、特にPPについては分野による差がみられた。今後も継続的に調査を行うことによって学術情報流通がどのように変化するのかを明らかにしていきたい。

謝辞

調査及びプレテストに御協力いただいた皆様、調査実施及び集計に御助力いただいたリサーチアシスタントの大森悠生氏に心より感謝申し上げる。

参考文献・資料

1) 船守美穂. プランS改訂―日本への影響と対応. 情報の科学と技術, 2019, vol. 69, no. 8, p. 390-396. https://doi.org/10.18919/jkg.69.8_390, (accessed 2023-01-06).

2) 脇谷史織. 米国・OSTPによる研究成果公開に関する政策方針について. カレントアウェアネス-E, 2022, No. 449, E2564. https://current.ndl.go.jp/e2564, (accessed 2023-01-06).

3) 第6期科学技術・イノベーション基本計画. 内閣府, 2021, p. 58.
https://www8.cao.go.jp/cstp/kihonkeikaku/index6.html, (accessed 2023-01-06).

4) 大隅典子. Wiley社との「転換契約」締結 : 学術情報のコストは誰が払うのか? 科学, 2022, Vol. 92, No. 6, p. 507-510.

5) Morrison, H., et al. Change and growth in open access journal publishing and charging trends 2011–2021. Journal of the Association for Information Science and Technology. vol. 73, no. 12, p. 1793-1805.
https://doi.org/10.1002/asi.24717, (accessed 2023-01-06).

6) Vlasschaert, C., et al. Proliferation of Papers and Preprints During the Coronavirus Disease 2019 Pandemic: Progress or Problems with Peer Review? Advances in Chronic Kidney Disease. 2020, vol. 27, no. 5, p. 418-426. https://doi.org/10.1053/j.ackd.2020.08.003, (accessed 2023-01-06).

7) “科学技術専門家ネットワーク”. 文部科学省科学技術・学術政策研究所.
https://www.nistep.go.jp/activities/st-experts-network, (accessed 2023-01-06).

8) 池内有為, 林和弘. 研究データ公開と論文のオープンアクセスに関する実態調査—オープンサイエンスの課題と展望—. STI Horizon. 2017, Vol. 3, No. 4, p. 27-32. https://doi.org/10.15108/stih.00106, (accessed 2023-01-06).

9) 池内有為, 林和弘. 研究データ公開と論文のオープンアクセスに関する実態調査2018—オープンサイエンスの進展状況と課題—. STI Horizon. 2020, Vol. 6, No. 1, p. 37-42.
https://doi.org/10.15108/stih.00207, (accessed 2023-01-06).

10) 池内有為, 林和弘. 研究データ公開と論文のオープンアクセスに関する実態調査2020—オープンサイエンスとデータ駆動型研究の推進に向けた課題—. STI Horizon. 2021, Vol. 7, No. 4, p. 38-43.
https://doi.org/10.15108/stih.00277, (accessed 2023-01-06).

11) 池内有為, 林和弘. プレプリントの利活⽤と認識に関する調査2020—COVID-19と学術情報流通の現状—. STI Horizon. 2021, Vol. 7, No. 2, p. 41-46. https://doi.org/10.15108/stih.00259, (accessed 2023-01-06).

12) 池内有為, 大森悠生, 林和弘. “研究者によるオープンアクセスとプレプリント公開の実践状況と認識”. 第70回日本図書館情報学会研究大会. 宮城, 2022年10月29日.
https://doi.org/10.6084/m9.figshare.21432312, (accessed 2023-01-06).