STI Hz Vol.9, No.1, Part.5:(ほらいずん)経済協力開発機構(OECD)における研究開発資金配分データベースを用いた分析の取組STI Horizon

  • PDF:PDF版をダウンロード
  • DOI: https://doi.org/10.15108/stih.00323
  • 公開日: 2023.03.20
  • 著者: 村上 昭義
  • 雑誌情報: STI Horizon, Vol.9, No.1
  • 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)

ほらいずん
経済協力開発機構(OECD)における研究開発資金配分
データベースを用いた分析の取組
-Fundstatプロジェクト及びMARIADの紹介と日本への示唆-

科学技術予測・政策基盤調査研究センター 主任研究官 村上 昭義

概 要

各国の資金配分機関は、資金配分を行っている研究開発プロジェクトについての情報を収載した研究開発資金配分データベースを整備している。経済協力開発機構(OECD)では、各国の資金配分機関の研究開発資金配分データベースに収載されているデータを収集し、研究開発プロジェクトレベルでの研究開発資金配分の動向を分析するFundstatプロジェクトを実施している。また、Fundstatプロジェクトの取組を促進・拡張するために、各国の研究開発・イノベーションに関する管理データを運営・分析している専門家を集めたグループ(MARIAD)がOECDに設置されている。本稿では、それらの取組を紹介し、[1]研究開発資金配分データベースを分析に用いる点、[2]「研究開発プロジェクト」という単位でデータを収集・分析する点、[3]研究開発資金配分データベース等の専門家グループが設置された点という3点の取組のポイントを踏まえて、日本の科学技術・イノベーション政策分析への示唆をまとめる。

キーワード:研究開発資金配分データベース,研究開発プロジェクト,資金配分機関, 科学技術・イノベーション政策,科学技術指標

1. はじめに:OECDの概要及び科学技術・イノベーション政策に関連した取組

経済協力開発機構(OECD:Organisation for Economic Co-operation and Development)は、1961年に設立された、事務局に2,000名を超える専門家を抱える世界最大のシンク・タンクであり、経済・社会の幅広い分野において多岐にわたる活動を行っている国際機関である。OECD加盟国(現在38か国、日本は1964年加盟)は、OECDの活動への参加を通じて、自国の経済・社会政策や制度を調整・改善する機会を得ている1~3)

OECDの数多くの活動の1つに、科学技術・イノベーションに関連するものがあり、事務局では科学技術・イノベーション局(DSTI:Directorate for Science, Technology and Innovation)がその 活動を担当している4)。DSTIには、[1]デジタル経済政策、[2]構造・産業政策、[3]生産性・イノベーション・起業、[4]科学技術政策に関連する大きく4つの課があり、その中でも「科学技術政策課(STP:Science and Technology Policy Division)」は、科学技術政策委員会(CSTP:Committee for Scientific and Technological Policy)の事務局を担当している。CSTPでは、各国間の科学技術政策に関する情報及び意見交換を行うとともに、科学技術・イノベーションが経済や社会に果たす役割や国際的な研究開発協力の在り方等について検討を行っている5)。CSTPの下には、科学技術指標各国専門家作業部会(NESTI:Working Party of National Experts on Science and Technology Indicators)、イノベーション・技術政策作業部会(TIP:Working Party on Innovation and Technology Policy)、バイオ・ナノ・コンバージングテクノロジー作業部会(BNCT:Working Party on Biotechnology, Nanotechnology and Converging Technologies)、グローバル・サイエンス・フォーラム(GSF:OECD Global Science Forum)6〜8)などの作業部会等があり、OECDのSTP内の各ユニットは、それぞれの作業部会等を担当する事務局として機能している。

その中のNESTIは、OECDの作業部会の中でも、最も長い歴史を持つものの1つであり、2022年に60周年を迎えた。これまでに、各国の研究開発統計の測定基準を記述した「OECDフラスカティ・マニュアル」9~11)や各国のイノベーション調査12)の指針を示す「OECDオスロ・マニュアル」1314)の策定を行ってきた作業部会として有名である。また、各国の科学技術・イノベーションや研究開発に関する統計情報を収集し、データ基盤、指標、定量分析の開発を行い、親委員会であるCSTPの要求と優先事項を満たすための統計的な側面において貢献している。特に、毎年3月頃と9月頃にNESTIのOECD事務局(以下、NESTI事務局)が更新している「Main Science and Technology Indicators (MSTI)」15)は、科学技術・学術政策研究所 (NISTEP)の「科学技術指標」16)の主な参照データとなっており、日本の科学技術活動を国際比較するために活用されている。NESTI事務局のその他の取組としては、科学計量学としての論文データベースの整備(SCISTAT)、研究開発税制の各国比較を行うための取組(microBeRD、RDTAX)、研究者等への国際的なアンケート調査(ISSA)などの取組が行われている。これらの取組の詳細は、OECDのWebサイト上で適宜データのダウンロード及び参照などが可能となっている(図表1)。

図表1 NESTI事務局に関連する主な取組図表1 NESTI事務局に関連する主な取組

(注)筆者が把握しているNESTI事務局に関連する主な取組をOECDの各Webサイト等を参照して図表にまとめた。NESTI事務局には、上記以外にも多様な取組が存在する。

2. Fundstatプロジェクトの背景と概要

各国の政策立案者が、自国の科学技術・イノベーション政策を検討・立案する際に、前述のNESTI事務局が整備するデータベース等を参照して、各国の科学技術予算や研究開発支出額などの指標を国際比較するために利用することができる。そうした科学技術・イノベーションに関連する指標において、従来の国レベルからより小さい粒度で研究開発活動を把握することができるようになれば、既存の研究開発統計データに基づく指標等を補完することになり、政策立案の詳細な検討を促進するものと考えられる。

「研究開発活動(R&D activity)」がどのように行われているかを理解する際に、「研究開発プロジェクト(R&D project)」という単位が役立つという概念は、前述の「フラスカティ・マニュアル2015」で明示されている。また、科学技術・イノベーションの統計・指標について、将来の政策に関連した展開の道筋を探ることなどを目的とした10年ごとに開催されている国際会議「OECD Blue Sky Forum 2016」1718)においても、研究開発資金配分の統計分析に対する代替的で補完的な経路を開発する可能性が検討され、各国政府に蓄積されている「研究開発プロジェクト」に関するデータを国際比較可能な形で積極的に活用しようとする概念の提案につながった。

このような背景を踏まえ、Fundstat(ファンドスタット)プロジェクト注1がNESTI事務局内の取組として2017年頃から開始された。Fundstatプロジェクトの目的は、各国の研究開発資金配分データベースを用いて、研究開発に対する各国政府の公的資金の動向を、国レベルや各省庁の事業レベルからより小さい「研究開発プロジェクト」レベルでの分析によって明らかにすることである。研究開発資金配分データベースとは、各国の資金配分機関等が資金配分を行っている個別の研究開発プロジェクトの情報を収載するデータベース(例:米国の国立科学財団(NSF)のAward Searchデータベース注2や、日本の科学研究費助成事業データベース(KAKEN)注3等)を意味する。これらのデータベースの特徴として、研究開発プロジェクトレベルでの資金配分額が把握できることに加えて、各国の資金配分機関にわたる研究開発プロジェクトのタイトルやアブストラクト等に記載されているテキストデータが豊富である点が挙げられる。これらのテキストデータは、テキストマイニング等の自然言語処理の手法を取り入れることで、特定分野における研究開発資金配分の動向を調べることに利用可能である。

3. Fundstatプロジェクトの概念実証として:人工知能(AI)分野の研究開発資金配分の動向分析

Fundstatプロジェクトの初期段階では、上述の概念が実現可能であるかを検証することを目的(概念実証)として、研究開発プロジェクトデータを用いた政府の研究開発支援に関する分析基盤の構築及び研究開発資金配分の動向分析が人工知能(AI)分野において実施された。AI分野が概念実証の分野として選択された理由は、AI分野が政策課題として優先度が高いことを示すOECD理事会の勧告19)を反映しているが、それに加えて、AIの研究開発という明確な定義が存在しない分野においても、テキストマイニング等の自然言語処理の手法を活用することで、研究開発資金配分の動向分析が可能であることを実証するためであった。これらの分析内容は、2021年6月にOECDのWorking Paper20)として公表された注4

当該調査研究では、AI分野における各国の政府支援の範囲と特徴を調べるために、 [1] AIの研究開発を網羅的に検索するためのキーターム群の作成、[2]各資金配分機関の研究開発プロジェクトデータのドキュメントからAIに関連する研究開発プロジェクトの特定、[3] AIに分類された研究開発プロジェクトのテキストデータにトピックモデリング分析を適用することでAIに関連する研究開発プロジェクトのトピック抽出、という大きく3つのステップで分析が実施された。また、分析には、OECD加盟8か国とEUの計13の研究開発資金配分データベースが用いられた(図表2)。日本のデータベースとしては、科学研究費助成事業データベース(KAKEN)の公開データに加えて、国立研究開発法人日本医療研究開発機構(AMED)から、研究開発課題データベース(AMEDfind)注5のバルクデータがOECDに提供された。

主な分析結果としては、AI分野の研究開発資金配分の時系列変化として、AI関連の研究開発プロジェクトの資金総額は、近年、顕著に増加していることを示した。また、トピックモデリング分析を用いたテキスト分析からは、カナダのCIHR(カナダ保健研究機構)、日本のAMED、米国のNIH(国立衛生研究所)において、「AI医療応用」に該当するドキュメントが大きなシェアを持つことなどを示し、各国の資金配分機関の特徴を試行的に明らかにした。

さらに、これらの分析を進める過程において、各資金配分機関の研究開発資金配分データベースが、公開されダウンロード可能となっている場合と各機関内で秘匿されている場合という2パターンが見いだされた。公開されダウンロード可能な研究開発資金配分データベースについては、OECD側でデータベースをダウンロード及び収集することで、データベースインフラを構築・分析することが可能である。他方、各機関内で秘匿されているデータベースについては、OECD側から資金配分機関に分析用のプログラムコードを送り、資金配分機関内の秘匿データベースでプログラムを実行してもらい、分析結果のみをOECD側に返送してもらう分散型分析アプローチが、このプロジェクトでもプロトタイプとして実施された。

以上のように、AI分野でFundstatプロジェクトの概念実証がなされたことによって、Fundstatプロジェクトは、次の段階に進み、分析対象の研究開発資金配分データベースを拡大することや、多言語のテキストデータに対応するために分析手法の更なる検討・改良等を行っている。

図表2 人工知能(AI)分野の分析に用いられた研究開発資金配分データベース図表2 人工知能(AI)分野の分析に用いられた研究開発資金配分データベース

(注)参考文献・資料20)の図表等を基に筆者が作成。

4. 研究開発・イノベーションの管理データに関する専門家グループ(MARIAD)の設置

研究開発やイノベーションへの公的支援や資金配分に関する情報は、各国政府や各資金配分機関において管理データ(administrative data)として蓄積されている。これらの研究開発・イノベーションに関する管理データは、多くの場合、Fundstatプロジェクトの分析対象であるような研究開発プロジェクトへの資金配分に関する情報であるが、それに加えて、研究開発・イノベーションへの直接的又は間接的な公的支援として、公共調達や租税優遇措置の管理データも各国で整備が進められており、それらも各国の科学技術・イノベーション政策をモニタリングするためには重要な情報となり得る。また、研究開発プロジェクトへの資金配分に関する管理データには、資金配分のプロセスに関連する情報、例えば、研究開発プロジェクト内の研究者、研究チーム、それらの所属組織などの情報も含まれている場合が多い。このような管理データに含まれる情報は、分析用データとして当初から活用されることが想定されていなかった情報も含むが、これまで各国比較が可能な状態でデータベースが整備されておらず、標準化された形で活用することができないという課題を持つ。この課題が解決できれば、科学技術・イノベーション政策分析に追加の観点を付与できると考えられる。

そこで、研究開発・イノベーション管理データ運営・分析専門家グループ(MARIAD:OECD Expert Group on the Management and Analysis of R&D and Innovation Administrative Data)がNESTIの下に設置された。MARIADには、各国の資金配分機関において管理データの運営又は分析を担当する者が多く参加しており、上記のような課題に応じた活動(例えば、管理データの収集・分析のための方法論の検討、各国専門家間での相互学習の促進等)が期待されている。

Fundstatプロジェクトとの関連では、NESTI事務局内で各国の研究開発資金配分データベースに収載されているデータの収集・分析をこれまで行っていたが、MARIADの参加者は、各国でそのデータベースを管理・分析する立場の専門家であることから、Fundstatプロジェクトの分析内容の方向性等に関して意見交換を行うことやデータ面での調整を行うことが期待されている。特に、各資金配分機関内で秘匿されているデータベースにアクセス権限を持つ分析担当者がMARIADに参加することになれば、MARIADの枠組みを用いて分散型分析アプローチをより効果的に実施することが可能となると考えられる。また、研究開発・イノベーションに関する管理データは、公共調達や租税優遇措置に関連するデータも含まれることから、それらのデータを扱うNESTI事務局内のFundstat以外の取組においても、MARIADの枠組みが今後活用される可能性がある。

5. 最後に:Fundstatプロジェクト及びMARIADの取組から日本への示唆

最後に、OECDのFundstatプロジェクト及びMARIADの取組のポイントから、今後の日本の科学技術・イノベーション政策分析への示唆についてまとめる。具体的には、[1]研究開発資金配分データベースを分析に用いる点、[2]「研究開発プロジェクト」という単位でデータを収集・分析する点、[3]研究開発資金配分データベース等の専門家グループが設置された点という3点である。

まず、[1]研究開発資金配分データベースを分析に用いる点については、新規指標の開発につながり、既存の指標を補完する強力なツールとなる可能性がある。NISTEPにおいても、Fundstatプロジェクトと同様な分析アプローチの調査研究がなされている21~24)。また、研究開発プロジェクトの豊富なテキストデータに、テキストマイニング等の自然言語処理を用いた分析手法は、特定分野だけでなく、まだ固有名詞化していない研究初期段階の領域などの動向や具体的な中身を把握するものであることから、統計データでは分からない部分を補完することになり、大きな可能性を秘めていると考えられる。他方で、自然言語処理から抽出された結果について、妥当性を検証するプロセスの工夫が求められるかもしれない。また、テキストデータがすべて英語で記載されているデータばかりではないため、多言語にも対応した形で自然言語処理の分析を行うことも課題である。

次に、[2]「研究開発プロジェクト」という単位でデータを収集・分析する点については、国レベルや各省庁の事業レベルの統計データと比較して、より具体的な科学技術・イノベーション政策の立案や研究マネジメント等に向けた重要な分析単位であると考えられる注6。NISTEPにおいても、「研究活動把握データベースを用いた研究活動の実態把握(研究室パネル調査)」25〜28)という調査を2020年度から2024年度までの5か年にわたって実施中であり、この調査において、調査対象者の「研究プロジェクト」についてもアンケートの質問項目がある。研究活動におけるインプットやアウトプットに関する情報の個別の把握を超えた、研究活動のプロセスの解明を、「研究プロジェクト」という分析単位を踏まえながら目指している。

終わりに、[3]研究開発資金配分データベース等の専門家グループが設置された点については、各国が保持している情報及びデータベースに収載されているデータ等を国際比較できるような形で統合・分析するための議論・検討を行う場が設けられたと言える。日本においても、異なるデータベース間を接続する試みとして、内閣府のe-CSTI (Evidence data platform constructed by Council for Science, Technology and Innovation)29)が、論文データベース上のデータと他のデータとを接合して分析しており、これまで明らかにできなかった観点での分析結果を示している。NISTEPにおいては、論文等の謝辞に記載する体系的番号の取組30)を行っており、研究開発資金配分データベースと論文データベースを効率よく接続することが今後可能となるかもしれない。各国が保持している情報及びデータベースに収載されているデータ等を国際比較できるような形で統合・分析することは、既存の統計データだけではなく、新しいデータベースインフラやモニタリングシステムの構築につながるのではないかと考える。MARIADには、そのような取組を国際的な枠組みで促進することが期待され、日本もMARIADの議論・検討に参加・貢献しながら、日本が取り組んでいる科学技術・イノベーション政策分析を国際的な枠組みにつなげることが今後重要になると考える。


注1 Fundstatプロジェクトは、NESTI事務局内の取組であるが、日本の文部科学省から人的リソースの貢献(Voluntary Contribution:VC)がなされている。筆者は、2020年6月下旬から2022年9月末まで、NESTI事務局にNISTEPから国際派遣されており、Fundstatプロジェクトを担当していた。

注2 NSF Award Searchデータベース, https://nsf.gov/awardsearch/download.jsp

注3 科学研究費助成事業データベース(KAKEN), https://kaken.nii.ac.jp/

注4 人工知能(AI)分野の研究開発資金配分の動向分析には、筆者の国際派遣の前任者である山下泉主任研究官がプロジェクトの初期段階から携わり、データベースインフラの構築及び分析が進められた。

注5 研究開発課題データベース(AMEDfind), https://amedfind.amed.go.jp/amed/index.html

注6 各国の科学技術関係予算から研究開発プロジェクトの研究費となるまでの “文化”や制度は、国ごとに異なるため、「研究開発プロジェクト」を分析単位として国際比較分析を行う際には、その点に注意が必要である。

参考文献・資料

1) 経済協力開発機構(OECD), https://www.oecd.org/ja/about/

2) 外務省, OECD(経済協力開発機構)の概要, https://www.mofa.go.jp/mofaj/gaiko/oecd/gaiyo.html

3) 経済産業省, OECD(経済協力開発機構), https://www.meti.go.jp/policy/trade_policy/oecd/index.html

4) OECD, Science and technology, https://www.oecd.org/science/

5) 外務省, OECD日本政府代表部, OECDの概要:科学技術政策委員会(CSTP),
https://www.oecd.emb-japan.go.jp/itpr_ja/00_000170.html

6) 林 和弘(2016),OECD グローバル・サイエンス・フォーラム(GSF)の新潮流と日本の役割:OECD 松原 太郎 政策分析官インタビュー. STI Horizon. Vol.2, No.3, https://doi.org/10.15108/stih.00041

7) 林 和弘(2018),オープンサイエンスへの取組にみるOECDグローバル・サイエンス・フォーラム(GSF)の新潮流:松原 政策分析官インタビュー. STI Horizon, Vol.4, No.1, https://doi.org/10.15108/stih.00113

8) 岡村 麻子・林 和弘(2021),経済協力開発機構(OECD)グローバル・サイエンス・フォーラム事務局 田村 嘉章 政策分析官インタビュー -OECDグローバル・サイエンス・フォーラムからの提言-. STI Horizon. Vol.7, No.2, https://doi.org/10.15108/stih.00256

9) OECD(2015), Frascati Manual 2015: Guidelines for Collecting and Reporting Data on Research and Experimental Development, The Measurement of Scientific, Technological and Innovation Activities, OECD Publishing, Paris. http://dx.doi.org/10.1787/9789264239012-en

10) 伊地知 寛博(2016a), 科学技術・イノベーションの推進に資する研究開発に関するデータのより良い活用に向けて:OECD『Frascati Manual 2015(フラスカティ・マニュアル 2015)』の概要と示唆(前編), STI Horizon, Vol.2, No.3, pp.64–68, https://doi.org/10.15108/stih.00047

11) 伊地知 寛博(2016b), 科学技術・イノベーションの推進に資する研究開発に関するデータのより良い活用に向けて:OECD『Frascati Manual 2015(フラスカティ・マニュアル 2015)』の概要と示唆(後編), STI Horizon, Vol.2, No.4, pp.42–47, https://doi.org/10.15108/stih.00048

12) 文部科学省科学技術・学術政策研究所,全国イノベーション調査,
https://www.nistep.go.jp/research/rd-and-innovation/national-innovation-survey

13) OECD and Eurostat (2018), Oslo Manual 2018: Guidelines for Collecting, Reporting and Using Data on Innovation, 4th Edition, The Measurement of Scientific, Technological and Innovation Activities, OECD Publishing, Paris/Eurostat, Luxembourg, https://doi.org/10.1787/9789264304604-en

14) 伊地知 寛博(2019), 『Oslo Manual 2018 :イノベーションに関するデータの収集、報告及び利用のための指針』-更新された国際標準についての紹介-, STI Horizon, Vol.5, No.1, pp.41–47, https://doi.org/10.15108/stih.00168

15) OECD Main Science and Technology Indicators (MSTI), https://www.oecd.org/sti/msti.htm

16) 文部科学省科学技術・学術政策研究所,科学技術指標2022,調査資料-318,2022年8月,
https://doi.org/10.15108/rm318

17) OECD (2018), “Blue Sky perspectives towards the next generation of data and indicators on science and innovation”, in OECD Science, Technology and Innovation Outlook 2018: Adapting to Technological and Societal Disruption, OECD Publishing, Paris, https://dx.doi.org/10.1787/sti_in_outlook-2018-19-en

18) 富澤 宏之(2017), OECDブルースカイⅢ科学・イノベーション指標フォーラム報告. STI Horizon. Vol.3, No.1,https://doi.org/10.15108/stih.00074

19) OECD (2019), Recommendation of the Council on Artificial Intelligence, OECD-LEGAL-0449,
https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0449

20) Yamashita, I., et al. (2021), “Measuring the AI content of government-funded R&D projects: A proof of concept for the OECD Fundstat initiative”, OECD Science, Technology and Industry Working Papers, No. 2021/09, OECD Publishing, Paris, https://doi.org/10.1787/7b43b038-en

21) 小柴 等・岡村 麻子・黒木 優太郎 (2022), 「NSFデータを用いた研究課題動向分析の試み」,NISTEP DISCUSSION PAPER,No.216,文部科学省科学技術・学術政策研究所.https://doi.org/10.15108/dp216

22) 小柴 等・岡村 麻子・村木 志穂 (2021), 「英国における公的資金研究成果の試行的分析」,NISTEP DISCUSSION PAPER,No.203,文部科学省科学技術・学術政策研究所.https://doi.org/10.15108/dp203

23) 荒木 寛幸(2022), 米国における研究動向の調査研究-NSFを事例とした共起ネットワーク分析から見る研究動向-. STI Horizon, Vol.8, No.1, https://doi.org/10.15108/stih.00288

24) 荒木 寛幸(2020), EBPMのための研究プログラムの分析(科研費を事例として) -Advanced Research Analysis in Keen-Keywords Investigation-. STI Horizon, Vol.6, No.1, https://doi.org/10.15108/stih.00208

25) 松本 久仁子・山下 泉・伊神 正貫(2021), 研究活動把握データベースを用いた研究活動の実態把握(研究室パネル調査2020): 基礎的な発見事実, 科学技術・学術政策研究所 調査資料-314. https://doi.org/10.15108/rm314

26) 松本 久仁子(2021), 我が国の大学の研究活動における国内・海外とのつながりに関する分析, 科学技術・学術政策研究所, Discussion Paper No. 202. https://doi.org/10.15108/dp202

27) 松本 久仁子・伊神 正貫(2022), 我が国の大学の研究活動における研究マネジメントの状況に関する分析, 科学技術・学術政策研究所, Discussion Paper No. 208. https://doi.org/10.15108/dp208

28) 伊神 正貫・松本 久仁子・山下 泉(2022), 大学の研究規模による研究活動の違いと新型コロナウイルス感染症が大学の研究活動に与えた影響: 研究室パネル調査定常報告2021,科学技術・学術政策研究所 調査資料-322.
https://doi.org/10.15108/rm322

29) 内閣府 e-CSTI (Evidence data platform constructed by Council for Science, Technology and Innovation), https://e-csti.go.jp/

30) 伊神 正貫(2022),成長期を迎えた研究費に係る体系的番号-現状と更なる浸透のために求められること-. STI Horizon. Vol.8, No.2, https://doi.org/10.15108/stih.00292