STI Hz Vol.6, No.1, Part.9:(レポート)研究データの公開と論文のオープンアクセスに関する実態調査2018-オープンサイエンスの進展状況と課題-STI Horizon

  • PDF:PDF版をダウンロード
  • DOI: https://doi.org/10.15108/stih.00207
  • 公開日: 2020.03.23
  • 著者: 池内 有為、林 和弘
  • 雑誌情報: STI Horizon, Vol.6, No.1
  • 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)

レポート
研究データの公開と論文のオープンアクセスに関する実態調査2018
-オープンサイエンスの進展状況と課題-

科学技術予測センター 客員研究官・文教大学 専任講師 池内 有為
科学技術予測センター 上席研究官 林 和弘

概 要

公的資金による研究の成果である論文やデータを社会に広く共有・公開し、科学の発展やイノベーションの創出につなげるオープンサイエンスが政策として推進されており、統合イノベーション戦略においてその実態把握が明記されている。

科学技術・学術政策研究所(NISTEP)では、2016年にデータ公開を中心とした日本のオープンサイエンスの実態調査を行い、進展状況や課題を明らかにするために、2018年10月から11月にかけて科学技術専門家ネットワークを活用したウェブ質問紙調査を実施して、2016年の調査結果と比較した。その結果、回答者1,516名のうち51.8%がデータの、78.0%が論文の公開経験を有しており、研究論文に比較してデータの共有が進んでいないことが分かった。また、論文の補足資料として、あるいは特定分野のリポジトリに研究データを公開する割合が増えていることや、コミュニティの規範やオープンデータへの貢献という理由で研究データを公開する割合が増えていることが分かった。2018年の新規質問項目によって、18.7%の回答者がデータマネジメントプラン(DMP)の作成経験があること、データ公開には具体的なインセンティブがある一方で、データの所有権・契約に対する懸念が高いことも分かった。研究データの共有の意識は高まる傾向にあるものの、実際の公開が進んでいない点について、今回得られた研究者の懸念等をふまえた施策が求められる。

キーワード:オープンサイエンス,研究データ公開,オープンアクセス(OA),データマネジメントプラン(DMP),ウェブ質問紙調査

1.はじめに

公的資金による研究成果(論文や関連するデータセット等)に学術関係者だけでなく、民間企業や一般市民が、広く利用・アクセスできるようにするオープンサイエンス1)は政策としても重要視されている。論文のオープンアクセス(以下、「OA」)や研究データの公開と利活用によって、新たな科学の発展やイノベーションの創出、研究の透明性の向上などが期待されることから、G7科学大臣会合をはじめとする国際組織や各国の政府機関がオープンサイエンスの推進を表明し、具体的な活動に取り組んでいる。日本でもオープンサイエンスの推進が明記された第5期科学技術基本計画(2016年度~2020年度)2)を実践する統合イノベーション戦略3)において、研究データを管理・保存・共有・公開できる基盤づくりや、各種のガイドラインづくりが進められている。

しかし、データの公開については分野によってデータの種類や機密性、取扱いの慣習などが異なるため、それぞれの特性をふまえた施策づくりが必要である。2015年に公開された内閣府による報告書では、“各省庁等のステークホルダーは、オープンサイエンスを推進すべき領域、プロジェクトを選定し、研究活動上の利益・損失や研究途上の取扱及び機微の判断など各分野の専門家・研究者、技術者の意見を十分に取り入れ、その分野の活動・研究成果が最大化されることを旨として、オープンサイエンス実施方針を定める”4)と述べられており、先の統合イノベーション戦略においても実態調査を行うことが明記されている。

そこで科学技術・学術政策研究所(NISTEP)科学技術予測センターは、政策立案や研究マネジメントに資することを目的として、日本の研究者によるデータ公開を中心としたオープンサイエンスの実態や課題を把握するためのウェブ質問紙調査を実施した。これは、2016年11月から12月にかけて実施した調査56)(以下、「2016年調査」)の後続調査である。本調査の期間は2018年10月19日から11月9日であり、調査対象は、大学、企業、公的機関・団体に所属する研究者や専門家、技術者等によって構成される約2,000名の科学技術専門家ネットワークである。科学技術専門家ネットワークの構成員は毎年一部入替えがあるため、パネル調査ではないことに御留意いただきたい。

本稿では、1,516名(回答率69.1%)の有効回答を分析した結果から、(1)データと論文の公開状況の変化、(2)データマネジメントプラン(DMP)の作成経験、(3)データ公開のインセンティブに対する認識について報告する。調査の詳細については、調査資料として公開される報告書や発表資料7)を御参照いただきたい。

2. データと論文の公開状況と課題

2-1 データと論文の公開状況

研究のために収集・作成・観測したデジタルデータで、論文など研究成果の根拠となるもの(以下、「データ」)の公開経験がある回答者は全体の51.9%(787名)、論文のOA経験がある回答者は78.0%(1,182名)であった。2016年調査と比較すると、データ公開経験は51.0%からわずか0.9ポイントしか増加していなかった(図表1)。一方、論文のOA経験がある回答者は70.8%から78.0%まで7.8ポイント増加していた。

分野別にデータ公開経験を確認すると、生物科学(66.5%)、農学(63.9%)、化学(60.6%)の順に公開率が高かった(図表2)。2016年調査と同様に、分野によってデータ公開経験に差があることが分かった。

データ公開方法として、図表3の7種類の公開方法を複数選択方式で示した。データ公開方法のうち、最も選択率が高かったのは「論文の補足資料(47.6%)」であり、2016年調査で1位であった「個人や研究室のサイト(45.7%)」と順位が逆転していた。論文とともにデータの公開を求める雑誌が増えている8)ことが主な要因であると考えられる。一方、オープンサイエンス政策や学術雑誌のデータ共有ポリシーで推奨されている、永続性のあるリポジトリによる公開は「所属機関のリポジトリ」が27.1%、「特定分野のリポジトリ」が18.6%にとどまった。

図表1 データ公開経験の変化図表1 データ公開経験の変化

図表2 分野別データ公開経験図表2 分野別データ公開経験

※「n」及び「%」は2018年調査の値を示す。

図表3 データ公開方法(複数選択)図表3 データ公開方法(複数選択)

2-2 データの公開理由

データ公開経験がある回答者(787名)に、公開理由を尋ねた。図表 4に2016年調査の結果とともに示す。

データの公開理由は、「研究成果を広く認知してもらいたいから(54.9%)」、「論文を投稿した雑誌のポリシー(投稿規定)だから(41.7%)」、「科学研究や成果実装を推進したいから(22.0%)」の順に選択率が高く、2016年調査と順位の変動はなかった。国外の調査で公開理由とされることが多い「オープンデータに貢献したいから(13.0%)」は2.5ポイント、「分野・コミュニティの規範だから(10.4%)」は0.9ポイント選択率が増加していた。

図表4 データの公開理由(複数選択)図表4 データの公開理由(複数選択)

2-3 データ公開の障壁

データの公開経験の有無にかかわらず、研究にデータを用いる回答者(1,513名)を対象として、“論文などの成果を発表済みの、最近の主要な研究1件のために収集・作成・観測したデータ(以下、「カレントデータ」)”を管理し、公開することを想定していただいた上で、資源の充足度や懸念の強さを尋ねた。

まず、データ公開に関する資源を挙げて、それぞれの充足度を「不十分」から「十分」の4件法で尋ねた。結果を図表5に示す。

データを管理・公開するために必要な資源は全体的に不足しており、特に人材、時間、資金が不足していると認識されていた。2016年調査から変化がみられた点として、「データ公開用のリポジトリ」は、「わからない」とする回答が27.1%から17.2%まで9.9ポイント減少した。2016年調査では、“分野リポジトリや機関リポジトリの整備が行われているものの、認知度が低い、あるいは十分ではないということが示唆された”と述べたが、認知度については多少改善されたのではないだろうか。

データを公開する場合の懸念については、2016年調査の6項目に新たな3項目を加えて「問題である」から「問題ではない」までの4件法で尋ねた。結果を図表6に示す。

最も懸念が強かったのは、2016年調査と同様に「引用せずに利用される可能性」(「問題」と「やや問題」の合計は84.2%)であった。次いで、新たな調査項目である「データの所有権・契約」(同75.9%)への懸念が強かった。2016年調査と比較すると、全体的に「問題」と「やや問題」の比率は低下していた。しかしながら、「研究の誤りを発見される可能性」(同13.7%)を除く全ての項目について、「問題」と「やや問題」の合計が5割を超えていた。

図表5 データ公開に関する資源の充足度(n=1,513)図表5 データ公開に関する資源の充足度(n=1,513)

図表6 データを公開する場合の懸念の強さ(n=1,513)図表6 データを公開する場合の懸念の強さ(n=1,513)

*2018年調査で新たに加えた項目

3. データマネジメントプラン(DMP)

研究のために収集・作成するデータをどのように管理するか、取扱いや整備・保存・公開についての計画を記したDMPの提出を求める助成機関や研究機関が増えつつある。そこで、DMPの作成経験を明らかにするために、科学技術振興機構(JST)など、DMPを実施している機関の名称を列挙して、複数選択方式で尋ねた。併せて「ない」、「わからない」という排他的選択肢も設けた。DMPの種類を1つ以上選択した回答者をDMP作成経験「あり」とみなすと18.7%(284名)、「なし」は76.1%(1,153名)、「わからない」は5.2%(79名)であった(図表7)。

具体的には、「所属機関のDMP」(46.8%)や「個人や研究グループのためのDMP」(38.0%)が多かった。研究助成機関のDMPは、「科学技術振興機構(JST)」が26.1%、「新エネルギー・産業技術総合開発機構(NEDO)」が5.6%、「日本医療研究開発機構(AMED)」が3.5%であった(図表8)。

図表7 DMP作成経験(n=1,516)
図表7 DMP作成経験(n=1,516)

図表8 作成経験があるDMP(複数回答, n=284)図表8 作成経験があるDMP(複数回答, n=284)

4. データ公開のインセンティブ

データ公開によって得られるインセンティブについて、実際の経験と認識をそれぞれ尋ねた。

4-1 データ公開によって得られたインセンティブ

回答者のうち、データ公開経験をもつ787名を対象として、データ公開によって良い結果が得られた経験を自由記述方式で尋ねた。図表9に、195名から得られた回答を7項目に分類した結果を示す。

最も多かったのは、研究上の利点が得られたことであった(合計104名)。具体的には、共同研究の契機となった(82名)、研究が進展した(10名)といった記述がみられた。次いで、研究やデータ、研究者本人のビジビリティが向上したとする回答者が多く(合計66名)、例えば、認知度が向上した(36名)、引用が増えた(20名)、学生獲得につながった(6名)といった回答がみられた。

図表9 データ公開によって得られたインセンティブ(n=195)図表9 データ公開によって得られたインセンティブ(n=195)

4-2 インセンティブの重要性

データ公開のインセンティブとされている事柄を挙げて、それぞれの重要度について、「重要」から「重要ではない」までの4件法で尋ねた。図表10に、「重要」とした回答者の比率が高い順に示す。

インセンティブの重要性は、おおむね3つに分けられる。まず、インセンティブとして最も重要であると考えられていたのは「データに紐づいた論文の引用」(「重要」と「やや重要」の合計は90.5%)と「データの引用」(同88.0%)であった。次いで「業績として論文と同様に評価されること」(同70.9%)、「利用者からの報告」(68.5%)、「研究資金の獲得」(64.2%)を重要であると考える回答者の比率が高かった。一方、「利用料金などの対価」(同31.8%)を重要であると考える回答者は約3割にとどまった。

図表10 データ公開のインセンティブの重要性(n=1,513)図表10 データ公開のインセンティブの重要性(n=1,513)

5. おわりに

本調査は、日本の研究者によるデータ公開や論文のOAに関する実態と課題の一部を明らかにした上で、2016年調査との比較を行った。研究データの共有に対する意識は高まる傾向にあるものの、実際の公開が進んでいないという点について、今回得られた研究者の懸念等未解決の課題に対応する施策が求められる。

謝辞

調査及びプレテストに御協力を賜りました皆様に心よりお礼申し上げます。


注 研究によって扱うデータの量や種類が異なる場合があると予想されるため、カレントデータを公開することを想定して回答していただいた。

参考文献・資料

1) G7茨城・つくば科学技術大臣会合. つくばコミュニケ(共同声明). 内閣府. 2016, p. 9.
https://www8.cao.go.jp/cstp/kokusaiteki/g7_2016/2016communique.html

2) 内閣府. 第5期科学技術基本計画. 2016, 53p. https://www8.cao.go.jp/cstp/kihonkeikaku/5honbun.pdf

3) 内閣府. 統合イノベーション戦略2019. 2019, 107p. https://www8.cao.go.jp/cstp/tougosenryaku/index.html

4) 国際的動向を踏まえたオープンサイエンスに関する検討会. 我が国におけるオープンサイエンス推進のあり方について~サイエンスの新たな飛躍の時代の幕開け~. 内閣府. 2015, 23p.
https://www8.cao.go.jp/cstp/sonota/openscience/

5) 池内有為, 林和弘, 赤池伸一. 研究データ公開と論文のオープンアクセスに関する実態調査. 文部科学省科学技術・学術政策研究所, 2017, NISTEP RESEARCH MATERIAL No.268, 108p. https://doi.org/10.15108/rm268

6) 池内有為, 林和弘. 研究データ公開と論文のオープンアクセスに関する実態調査—オープンサイエンスの課題と展望—. STI Horizon. 2017, vol. 3, no. 4, p. 27-32. https://doi.org/10.15108/stih.00106

7) 池内有為, 林和弘. “日本の研究者によるデータ公開の実践状況と認識の変化”. 第67回日本図書館情報学会研究大会. 京都, 2019年10月19日.

8) Ikeuchi, Ui; Abe, Manabu; Hayashi, Kazuhiro; Nomura, Norimasa; Okayama, Nobuya; Owashi, Mizuho; Sumimoto, Kenichi; Takahashi, Nanako; Toda, Yuko; Nosé, Masahito. Journal Research Data Policy Across Disciplines: Comparison Between 2014 and 2019. Research Data Alliance (RDA) 14th Plenary, Helsinki, October 23-25, 2019.