STI Hz Vol.10, No.3, Part.9:(レポート)日本の研究機関における 研究データ管理(RDM)の実践状況2022 -経年変化と課題-STI Horizon

  • PDF:PDF版をダウンロード
  • DOI: https://doi.org/10.15108/stih.00383
  • 公開日: 2024.09.25
  • 著者: 池内 有為、南山 泰之、林 和弘
  • 雑誌情報: STI Horizon, Vol.10, No.3
  • 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)

レポート
日本の研究機関における
研究データ管理(RDM)の実践状況2022
-経年変化と課題-

データ解析政策研究室 客員研究官 池内 有為、客員研究官 南山 泰之、室長 林 和弘

概 要

オープンアクセスリポジトリ推進協会(JPCOAR)と大学ICT推進協議会(AXIES)は、2020年に引き続き2022年にも国内の大学や研究機関を対象とした研究データ管理の取組状況に関するオンライン調査を実施した。科学技術・学術政策研究所データ解析政策研究室は、結果データの提供を受けて二次分析を行った。

2020年調査(有効回答352件)と2022年調査(同309件)の結果を比較すると、データポリシーを策定・検討している機関は23.6%から35.9%に、RDM体制を構築・検討している機関は23.0%から32.0%に増加した。研究データを長期保存するためのストレージを検討・提供している機関は21.9%から52.1%に、機関リポジトリ(IR)等の公開基盤を検討・提供している機関は35.7%から62.4%に増加した。しかし、IRによるデータ公開事例をもつ機関は26.9%にとどまり、2020年調査と同様に人材不足が主な課題であった。全体的な傾向として、実施・検討率は大学共同利用機関や国立研究開発法人の方が大学よりも高かった。大学の実施・検討率は、国立大学、私立大学、公立大学の順に高く、また、学部数が多い大学の方が高い傾向がみられた。先進事例の共有等によって取組が拡がることが期待される。

キーワード:オープンサイエンス,データポリシー,研究データ管理(RDM),研究データ共有,研究支援

1. はじめに

2021年4月に統合イノベーション戦略会議は「公的資金による研究データの管理・利活用に関する基本的な考え方」において、研究データ基盤システムの運用とメタデータの付与による研究データの検索体制の構築や、研究開発を行う機関の責務としてデータポリシーの策定等の方針を示した1)。続く2021年6月に閣議決定された『統合イノベーション戦略2021』2)では、「科学技術・イノベーション政策において目指す主要な数値目標」(主要指標)として、(1)機関リポジトリ(Institutional Repository, IR)を有する全ての大学・大学共同利用機関法人・国立研究開発法人において、2025年までにデータポリシーの策定率が100%になること、(2)公募型の研究資金の新規公募分において、2023年度までにDMP及びこれと連動したメタデータの付与を行う仕組みの導入率が100%になることを求めている。

オープンアクセスリポジトリ推進協会(JPCOAR)及び大学ICT推進協議会(AXIES)は、国内の大学や研究機関における研究データ管理(Research Data Management, RDM)の取組状況の把握を目的として、2020年3)と2022年の2回にわたりオンライン質問紙調査を実施した。図書館や情報システム部門でRDMの実践を担う現場主体の調査であり、政策の視点によるモニタリングとは異なるフレームワークで設計されている。一方で、同調査には大学・研究機関におけるデータポリシーの策定状況、RDM体制の構築状況など、一連の政策による効果を評価するために有益な項目も多く含まれている。

このような理解のもと、データ解析政策研究室は、RDMの課題と展望を明らかにするために、2020年4)と2022年に実施された調査データの二次分析を行った。本稿では、これらの結果を用いた経年変化を中心に報告する。なお、2回分の調査データ及び質問票は、東京大学社会科学研究所附属社会調査・データアーカイブ研究センターが運営するSSJデータアーカイブに掲載されている56)

2. 調査の概要

調査期間は2022年11月から12月である。調査対象はJPCOAR会員機関、AXIES参加機関及び国内の大学・研究機関のRDM担当者として、Webサイト及びSNSでの広報、会員機関へのメール配信を通じて参加を呼びかけた。

質問紙の構成は、2020年調査と同様①メールアドレス、②基礎情報(回答部署等)、③機関構成員のニーズの把握状況、④RDM体制の構築状況、⑤RDMサービスの実施状況、⑥情報インフラの整備状況、⑦JPCOARについての7セクションである。質問項目も基本的に2020年と同様であるが、研究データ管理サービスに関する一部質問の変更や、研究データ保存用ストレージ及びRDM体制構築の予算に関する新規の質問があり、合計48問となった。また、質問文や選択肢の表現に微修正が行われた。例えば、データポリシーの定義や判断基準を明確化するために、“「公的資金による研究データの管理・利活用に関する基本的な考え方」7)で、研究開発を行う機関に求められているものを想定しています。「一部の部局で策定済み又は検討中である」及び「機関全体でのポリシーを委員会、ワーキンググループ等で検討中である」の両方に該当する場合は、後者を選択してください”という説明が追加された。

最終的な回答数は313件、うち重複回答等を除いた有効回答は309件であった。機関の種類別の内訳は、大学が283件(全体の91.6%、以下同様)、研究機関等が12件(3.9%)、その他が14件(4.5%)であった。うち、大学は国立大学が71件(23.0%)、公立大学が35件(11.3%)、私立大学が177件(57.3%)であり、研究機関は国立研究開発法人が7件(2.3%)、大学共同利用機関が5件(1.6%)であった。その他には、短期大学や高等専門学校、独立行政法人等が含まれる。

3. 分析結果

本章では、(1)データポリシーの策定状況、(2)RDM体制の構築状況、(3)RDMサービスの実施状況、(4)情報インフラの提供状況、(5)IRによるデータの公開状況と障壁について、2020年調査の結果と比較しながら示す。なお、以下ではそれぞれの回答者数を「n」で表す。

3.1 データポリシーの策定状況

大学のデータポリシーは、文部科学省の「学術情報基盤実態調査」による悉皆調査が行われている8)。JPCOARの調査は約300機関からの回答であるものの、検討の進捗状況を尋ねている点や国立研究開発法人等を含んでいる点に特徴がある。図表1に「貴機関では、研究データ管理に関する何らかのデータポリシーは定められていますか」という質問に対する回答の集計結果を示す。

全体的にはデータポリシーの策定や検討が進み、未対応や「わからない」という回答の比率は減少していた。ただし、「機関としてのポリシーを制定した(図では「機関ポリシーあり」)」は17.6%から13.3%に減少していた。「一部の部局で議論・実施されている(「一部の部局」)」は0.9%から7.8%に、「機関全体での検討のための委員会、ワーキンググループ等が組織されている(「検討中」)」は5.1%から14.9%に増加していた。「ポリシーは策定されておらず、検討も行われていない(「未対応」)」は56.5%から49.2%に、「わからない」は16.5%から11.0%に減少していた。

「機関ポリシーあり」が減少した要因として、2020年調査では研究データの10年保存9)に対応するためのポリシーを含めている可能性が指摘される(このため、2022年調査では2章で述べたようにポリシーの定義や判断基準を明示した)。また、2020年調査とは回答者群が一部異なることも影響している可能性がある。

図表2に、機関の種類ごとにデータポリシーの策定状況を集計した結果を示す。配列は、「機関ポリシーあり」、「一部の部局」、「検討中」の合計が多い順とした。

ポリシーの策定・検討率は、国立研究開発法人(100.0%)と大学共同利用機関(100.0%)が高く、次いで国立大学(60.6%)、公立大学(25.7%)、私立大学(24.8%)、その他(21.4%)の順であった。図表3に、大学のみを対象として、大学の規模(学部数)ごとにデータポリシーの策定状況を集計した結果を示す(n=283)。配列は、規模の昇順とした。

ポリシーの策定・検討率は、おおむね規模が大きいほど高く、8学部以上の大学(50.0%)、5~7学部(45.6%)、2~4学部(21.0%)、単科大学(33.3%)であった。策定・検討率が低い2~4学部の大学は、「未対応」(61.0%)、「わからない」(14.3%)の選択率が高かった。

図表1 データポリシーの策定状況図表1 データポリシーの策定状況

図表2 機関別:データポリシーの策定状況図表2 機関別:データポリシーの策定状況

図表3 大学の規模別:データポリシーの策定状況図表3 大学の規模別:データポリシーの策定状況

3.2 研究データ管理(RDM)体制の構築状況

研究者が効率的にRDMを実践するためには、組織として支援体制を構築する必要があると考えられる。図表4に「貴機関では、機関全体での研究データ管理体制構築に向けた何らかの取り組みが始まっていますか」という質問に対する回答の集計結果を示す。

全体的にはRDM体制の構築や検討が進み、未対応や「わからない」という回答の比率は減少していた。ただし、「体制が構築され、機関として実施している(図では「機関として実施」)」は8.5%から5.8%まで2.7ポイント減少していた。このことは3.1のポリシーと同様、質問に対する解釈の違いや回答者群の違いに起因すると考えられる。

図表5に、機関の種類ごとにRDM体制の構築状況を集計した結果を示す。配列は、何らかの動きがある(「機関として実施」、「一部の部局で議論・実施」、「ワーキンググループ(WG)等を組織化」)比率が高い順とした。

RDM体制について何らかの動きがある比率が高かったのは、国立研究開発法人と大学共同利用機関(いずれも100.0%)であり、次いで国立大学(62.0%)、私立大学(20.3%)、公立大学(14.3%)、その他(14.3%)の順であった。

図表6に、大学のみを対象として、大学の規模ごとにRDM体制の構築状況を集計した結果を示す。配列は、規模の昇順とした。

RDM体制について何らかの動きがある大学の比率は、おおむね規模が大きいほど高かったが、2~4学部の大学が最も低かった(21.9%)。「具体的な動きなし」の大学の比率は、規模が大きいほど低かった。

また、「研究データ管理体制に関する議論で、ステークホルダーになり得る部署、又は既に関与している部署はどこでしょうか」という複数選択方式の質問について、2020年から2022年にかけて順位の変動はなかったものの、選択率が上昇していた。1位は「研究推進・協力系部門」(61.9%→73.8%)、2位は「図書館」(43.2%→66.3%)、3位は「情報系センター」(31.5%→52.1%)、4位は「知財系部門」(20.2%→24.3%)の順であった。

図表4 RDM体制の構築状況図表4 RDM体制の構築状況

図表5 機関別:RDM体制の構築状況図表5 機関別:RDM体制の構築状況

図表6 大学の規模別:RDM体制の構築状況図表6 大学の規模別:RDM体制の構築状況

3.3 RDMサービスの実施状況

それでは実際に、どのようなRDMサービスを実施しているのか。図表7に「貴機関では、何らかの研究データ管理サービスを実施していますか」という質問に対する回答の集計結果を示す。質問紙では、各サービスについて「提供している」、「検討中」、「提供していない」、「わからない」のいずれか1つを選択させているが、ここでは経年変化をみるために2020/2022年調査における「提供している」の選択率を示した。

2020年調査と同様に、「データ公開用IR等の提供」(44.7%)が最も多く、次いで「研究データのストレージ提供」(12.6%)、「研究データの利用・引用支援」(6.8%)、「研究データの知財管理支援」(6.1%)の選択率が高かった。

図表7 提供しているRDMサービス図表7 提供しているRDMサービス

3.4 情報インフラの提供状況

RDMに関連する情報インフラ、すなわちストレージや公開用リポジトリ、データ分析基盤等の提供状況に関する結果を示す。

3.4.1 RDMサービスに関する情報インフラ整備の検討状況

まず、図表8に「現在、機関における研究データ管理サービスの情報インフラ整備はどのように検討が進められていますか」という質問に対する回答の集計結果を示す。

2020年調査と比較すると、「機関レベルで検討・対応が進められている」は10.4%から19.4%まで9.0ポイント増加した。「部局ごとに検討・対応が進められている」は7.4%から4.2%まで3.2ポイント減少しているが、これらの合計は17.8%から23.6%まで5.8ポイント増加している。「特に検討・対応は行われていない(「なし」)」(37.2%)は5.9ポイント減少、「研究者個人に委ねられている」(23.9%)は3.0ポイント増加し、「わからない」(11.7%)は6.1ポイント減少していた。

図表9に、機関の種類ごとに情報インフラ整備の検討状況を集計した結果を示す。配列は、「機関レベル」と「部局ごと」の合計が多い順とした。

データポリシーやRDM体制と同様に、機関による差がみられた。国立研究開発法人や大学共同利用機関、及び国立大学は相対的に情報インフラ整備の検討・対応が進められており、「なし」の比率が低かった。また、私立大学や公立大学で検討・対応が進められている大学は一部にとどまった。

図表10に、大学のみを対象として、大学の規模ごとに情報インフラ整備の検討状況を集計した結果を示す(n=283)。配列は、規模の昇順とした。

規模が大きい大学ほど情報インフラ整備の検討・対応が進められており、「なし」の比率が低い傾向がみられた。また、「研究者個人に委ねられている」の比率は、8学部以上(17.4%)の選択率が低かった。

図表8 RDMサービスに関する情報インフラ整備の検討状況図表8 RDMサービスに関する情報インフラ整備の検討状況

図表9 機関別:RDMサービスに関する情報インフラ整備の検討状況図表9 機関別:RDMサービスに関する情報インフラ整備の検討状況

図表10 大学の規模別:RDMサービスに関する情報インフラ整備の検討状況図表10 大学の規模別:RDMサービスに関する情報インフラ整備の検討状況

3.4.2 研究データの長期保存用ストレージの提供状況

長期保存用のストレージについては2つの質問を行っている。まず、「貴機関では、研究データを長期的(5年以上)に保存するためのストレージ(オンプレミス又は商用クラウド)として、ユーザー1人当たりのどの程度の基本容量の提供が必要と考えていますか」と質問した結果、「わからない」が72.5%であり、「1TB以上」(9.4%)、「100GB以上1TB未満」(6.8%)、「10GB以上100GB未満」(7.4%)、「1GB以上10GB未満」(3.2%)、「1GB未満」(0.6%)であった(n=309)。

続いて、図表11に「貴機関では、ユーザーに対してストレージをどのように提供していますか」と尋ねた結果を示す。

「商用クラウド」の提供率は6.4%から25.6%まで19.2ポイント、「検討中」も7.4%から17.8%まで10.4ポイント増加していた。「提供する予定はない」は47.1%から19.4%まで27.7ポイント減少しており、ストレージの提供が進んでいることがわかった。

図表11 研究データを長期保存するためのストレージの提供状況図表11 研究データを長期保存するためのストレージの提供状況

3.4.3 研究データ公開のためのリポジトリシステムの提供状況

研究データ公開のためのリポジトリシステムについては、「貴機関では、研究データを公開するためのリポジトリシステムを提供していますか」と複数選択方式で尋ね、「分野別リポジトリ(例:SSJDA、DDBJ)を提供している」、「機関リポジトリを提供している」、「汎用リポジトリ(例:Figshare、Zenodo)の利用を推奨している」、「提供方法を検討中」、「提供する予定はない」、「わからない」という選択肢を提示した。その結果、「分野別リポジトリ」(1.6%)、「汎用リポジトリ」(0.6%)を選択した回答者もみられたが、全て「機関リポジトリ」も同時に選択していた(n=309)。つまり、図表12の2022年の集計結果のうち、「機関リポジトリ」(44.0%)には、「分野別リポジトリ」を提供している機関や「汎用リポジトリ」を推奨している機関も含まれる。

「機関リポジトリを提供している」は26.3%から44.0%まで17.7ポイント、「提供方法を検討中は」9.4%から18.4%まで9.0ポイント増加しており、IRの提供及び検討が進んでいることがわかった。

図表12 研究データ公開のためのリポジトリの提供状況図表12 研究データ公開のためのリポジトリの提供状況

3.5 機関リポジトリ(IR)による研究データの公開状況と障壁

IRによる研究データの公開状況は増加したのだろうか。「2021年~2022年の間に、貴機関の機関リポジトリで研究データを公開した事例はありますか」という質問に対して、「ある」と回答したのは26.9%、「ない」は70.6%、「わからない」は2.6%であり、2020年調査からほとんど変化していなかった(図表13)。

図表12に示したように、IRは44.0%が提供している一方で、過去2年間で研究データを公開した事例をもつ機関は26.9%にとどまった。機関の種類ごとに集計すると、「ある」の選択率が高い順に大学共同利用機関(80.0%)、国立研究開発法人(57.1%)、国立大学(32.4%)、私立大学(24.3%)、公立大学(22.9%)、その他(7.1%)の順であった(n=309)。また、大学の規模別に集計すると、8学部以上(34.8%)、5~7学部(24.6%)、2~4学部(25.7%)、単科大学(22.7%)であった(n=283)。全ての機関種別、規模で公開事例がみられるものの、差があることが明らかになった。

図表14に「機関リポジトリでの研究データ公開に当たり、課題や障壁となり得ることをお聞かせください」という複数選択方式の質問について、回答の集計結果を示す。

最も選択率が高かったのは2020年調査と同様「公開に当たってのマンパワーが足りない」(65.4%)であり、次いで「適切なライセンス・利用条件がわからない」(54.7%)、「機関リポジトリの運用規程等が未整備である」(51.5%)の順であった。選択率が増加していたのは、「公開希望がある研究データのサイズ」(39.8%)や「公開に当たっての資金が不足している」(25.9%)、「上記以外の点で、IRのシステムが対応していない」(14.6%)であった。

図表13 機関リポジトリ(IR)による研究データの公開状況図表13 機関リポジトリ(IR)による研究データの公開状況

図表14 IRによる研究データ公開の課題や障壁となり得ること図表14 IRによる研究データ公開の課題や障壁となり得ること

4. 研究データ管理(RDM)の実践状況の変化と課題

本稿のまとめとして、(1)データポリシーとRDM体制の構築状況の変化、(2)物的資源と人的資源の状況の変化について概括した後、主な課題である人的資源の不足について述べる。

データポリシーを策定・検討している機関は23.6%から35.9%に、RDM体制を構築・検討している機関は23.0%から32.0%に増加していた。2020年調査と同様に機関種別や規模による差が大きく、おおむね研究開発法人や大学共同利用機関の実施率が高く、次いで国立大学であり、公立大学や私立大学の実施率は低い傾向にあった。大学の規模別にみると、大学の規模が大きいほど実施率が高い傾向がみられた。RDMサービスはIRの提供が中心である点は変わらないが、その他のサービスを提供する機関もわずかに増加していた。

RDMのための物的資源、すなわち情報インフラ整備の検討・対応状況には比較的大きな進展がみられた。研究データを長期保存するためのストレージを検討・提供している機関は21.9%から52.1%に、機関リポジトリ(IR)等の公開基盤を検討・提供している機関は35.7%から62.4%に増加しており、提供予定はないとする機関も減少していた。しかし、IRで過去2年間に研究データを公開した事例をもつ機関は26.9%にとどまり、2020年調査からほとんど変化がなく、研究データの公開にはつながっていないことがわかった。IRによるデータ公開の最も大きな課題は2020年調査と同様に人的資源であり、65.4%が公開に当たってのマンパワーが足りないとしていた。また、公開に当たって適切なライセンスや利用条件、メタデータの記述、研究データの利用形態やフォーマットなど、基本的な事項についても課題となっており、RDMのための人材配置及び人材育成が急務であることが明らかになった。

人的資源の不足は長期的な課題である。2024年3月から5月にかけて文部科学省は「オープンアクセス加速化事業」の公募を行い、83件が採択された10)。採択機関による取組の共有によって、日本全体で効率的にRDMが進められることが期待される。九州大学によるRDM支援のための取組11)や、名古屋大学による学内組織で用いられているメタデータスキーマ調査12)等の公開は、その先駆けと言えるだろう。さらに、本調査によって小規模大学ほどRDMの取組が進んでいないことが明らかになったことから、より多くの大学・研究機関を対象とした支援が望まれる。

本調査の発展として、JPCOARの協力のもとデータ解析研究室による調査結果13)を用いて研究者が求める研究支援との比較14)を行ったり、自己評価のためのフレームワークの設計15)を行ったりしている。RDM体制の適切な構築に向けて、研究者及び研究機関との対話や検討を重ねていきたい。

謝辞

二次分析に当たり、オープンアクセスリポジトリ推進協会(JPCOAR)及び大学ICT推進協議会(AXIES)から「国内機関における研究データ管理の取り組み状況調査2022」データの提供を受けた。また、JPCOARとAXIESの皆様には情報の提供や議論に御協力いただいた。ここに記して御礼申し上げる。


注 サーバやソフトウエアなどの情報システムを機関内に設置して運用する方式。

参考文献・資料

1) 統合イノベーション戦略推進会議.公的資金による研究データの管理・利活用に関する基本的な考え方.2021, 18p.
https://www8.cao.go.jp/cstp/tyousakai/kokusaiopen/sanko1.pdf, (accessed 2024-06-24).

2) 統合イノベーション戦略2021:本文.2021, 113p.
https://www8.cao.go.jp/cstp/tougosenryaku/togo2021_honbun.pdf, (accessed 2024-06-24).

3) 南山泰之,結城憲司,田邉浩介,安原通代.2020年度RDM事例形成プロジェクト中間報告書
https://jpcoar.repo.nii.ac.jp/records/2000003, (accessed 2024-06-24).

4) 池内有為,林和弘.日本の研究機関における研究データ管理(RDM)の実践状況―オープンサイエンスの実現に向けた課題と展望―.STI Horizon, 2022, vol. 8, no. 1, p. 50-55.
https://doi.org/10.15108/stih.00287, (accessed 2024-06-24).

5) オープンアクセスリポジトリ推進協会.国内機関における研究データ管理の取り組み状況調査,2020 [dataset]. 2024, SSJDA.https://ssjda.iss.u-tokyo.ac.jp/Direct/gaiyo.php?lang=jpn&eid=1587, (accessed 2024-06-24).

6) オープンアクセスリポジトリ推進協会.国内機関における研究データ管理の取り組み状況調査,2022 [dataset]. 2024, SSJDA.https://ssjda.iss.u-tokyo.ac.jp/Direct/gaiyo.php?lang=jpn&eid=1588, (accessed 2024-06-24).

7) 前掲1)

8) 文部科学省.“学術情報基盤実態調査”.
https://www.mext.go.jp/b_menu/toukei/chousa01/jouhoukiban/1266792.htm, (accessed 2024-08-08).

9) 日本学術会議.科学研究における健全性の向上について(回答).2015, 35p.
https://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-23-k150306.pdf, (accessed 2024-06-24).

10) 文部科学省.オープンアクセス加速化事業の採択機関の決定について.2024-07-05.
https://www.mext.go.jp/b_menu/boshu/detail/1421775_00009.html, (accessed 2024-07-22).

11) 九州大学.研究データ管理支援.https://rds.dx.kyushu-u.ac.jp/, (accessed 2024-07-22).

12) 直江千寿子,能勢正仁,新堀淳樹,ほか.名古屋大学における専門分野のデータベース・研究データ調査.情報の科学と技術.2024, [早期公開], 2024-002.https://doi.org/10.18919/jkg.2024-002, (参照2024-07-23).

13) 池内有為,林和弘.研究データ公開と研究データ管理に関する実態調査2022:日本におけるオープンサイエンスの現状.文部科学省科学技術・学術政策研究所,2023, NISTEP RESEARCH MATERIAL No. 335, 132p.
https://doi.org/10.15108/rm335, (accessed 2024-06-24).

14) Ikeuchi, Ui; Minamiyama, Yasuyuki; Hayashi, Kazuhiro. RDM Service for Trust Data Sharing: Bridging the Gaps between Researchers and Institutions. 18th International Digital Curation Conference (IDCC 2024). Edinburgh, February 19-21, 2024.https://doi.org/10.6084/m9.figshare.25251376, (accessed 2024-06-24).

15) 南山泰之,池内有為,田辺浩介,結城憲司,林和弘,青木学聡.“研究データ管理サービス構築状況の自己評価フレームワーク設計”.電子情報通信学会インターネットアーキテクチャ研究会(IA),技術と社会・倫理研究会(SITE),情報処理学会オープンサイエンスと研究データマネジメント(RDM)研究グループ合同研究会.2023年3月16日.
http://id.nii.ac.jp/1001/00224854/, (accessed 2024-06-24).