STI Hz Vol.2, No.4, Part.12:(レポート)サイエンスマップ2014STI Horizon

  • PDF:PDF版をダウンロード
  • DOI: http://doi.org/10.15108/stih.00060
  • 公開日: 2016.12.20
  • 著者: 伊神 正貫
  • 雑誌情報: STI Horizon, Vol.2, No.4
  • 発行者: 文部科学省科学技術・学術政策研究所 (NISTEP)

レポート
サイエンスマップ2014

科学技術・学術基盤調査研究室 室長 伊神 正貫

概 要

 科学技術・学術政策研究所(NISTEP)では、論文データベースを用いて国際的に注目を集めている研究領域を見いだし、それらを俯瞰した「サイエンスマップ」を作成している。本レポートでは、サイエンスマップ2014から見える世界における研究動向と日本の活動状況を紹介する。また、レポートの後半では、インタラクティブ表示を特徴とするサイエンスマップ2014(ウェブ版)や各種データの公開及びその活用事例について紹介する。

キーワード:計量書誌学,知識の構造化・可視化,共引用分析,マッピング,研究動向,大学,
公的研究機関

1. はじめに

科学技術の知の構造や発展を計量書誌学の立場から記述する試みは古くからなされている1~3)。2000年代に入ってからの劇的な情報処理技術の進展や、論文や特許のデータベース整備は、この分野の研究に革新をもたらした。特に“論文や特許を用いた知識の構造化や可視化”(以下、マッピングと呼ぶ)は新たな研究として注目を浴び、多くの研究が欧米を中心に行われている4)。マッピングの対象は多様であり、ジャーナルの引用関係を用いた分野間の関係、国や組織間の共著関係、研究者間の共著関係などを対象としたマッピングが行われている。

科学技術・学術政策研究所(NISTEP)では、論文データベースを用いて国際的に注目を集めている研究領域を見いだし、それらを俯瞰した「サイエンスマップ」を作成し、世界における研究動向と日本の活動状況の分析を実施している。当研究所が作成しているサイエンスマップは、マッピングの対象を研究領域としている点が特徴である。既刊のサイエンスマップ2002~2012では、それぞれ隔年で6時点のマップを継続的に作成しており、その成果は各種審議会資料5)、科学技術白書6)、経済協力開発機構(OECD)の報告書7)などにも活用されている。

最新版となるサイエンスマップ2014(2009~14年を対象)の結果を2016年9月に公表した8)。本レポートの前半では、サイエンスマップ2014から見える世界における研究動向と日本の活動状況を紹介する。また、レポートの後半では、インタラクティブ表示を特徴とするサイエンスマップ2014(ウェブ版)(報告書と同時公表)や各種データの公開及びその活用事例について紹介する。

なお、本レポートはサイエンスマップ2014の一部を紹介したものであるので、詳細はサイエンスマップ2014の報告書(http://www.nistep.go.jp/sciencemap8)を御覧いただきたい。

2. サイエンスマップに見る科学研究の状況

サイエンスマップ2014では、2009年から2014年までの6年間に発行された論文の中で、各年、各分野で被引用数が全体の上位1%に位置する論文(Top1%論文)約7.9万件を分析に用いた注1。これらTop1%論文に対して、「共引用」を用いたグループ化を2段階(第1段階では論文からリサーチフロント注2を抽出。第2段階でリサーチフロントから研究領域を抽出)行うことで、国際的に注目を集めている844の研究領域を得た。

844研究領域の相対的な位置関係を、共引用関係が強い領域を互いに近くに配置する方法で、2次元平面状にマッピングした結果を図表1に示す。図表1で、白丸が研究領域の位置、破線は研究領域群の大まかな位置を示している。研究領域群は研究内容を大まかに捉えるときのガイドである。研究領域群に含まれていない研究領域は、類似のコンセプトを持つ研究領域の数が一定数に達していないだけであり、したがって研究領域群に包含されているか否かという情報は研究領域の重要性を示すものではない。また、本マップの作成(研究領域の配置)にはForce-directed placementアルゴリズム9)を用いているため、上下左右に意味はなく、相対的な位置関係が意味を持つ。ここでは、生命科学系が左上、素粒子・宇宙論研究が右下に配置されるマップを示している。

図表1 サイエンスマップ2014

注1:本マップ作成にはForce-directed placementアルゴリズムを用いているため、上下左右に意味はなく、相対的な位置関係が意味を持つ。報告書内では、生命科学系が左上、素粒子・宇宙論研究が右下に配置されるマップを示している。
注2:白丸が研究領域の位置、破線は研究領域群の大まかな位置を示している。他研究領域との共引用度が低い一部の研究領域は、マップの中心から外れた位置に存在するため、上記マップには描かれていない。研究領域群を示す破線は研究内容を大まかに捉えるときのガイドである。研究領域群に含まれていない研究領域は、類似のコンセプトを持つ研究領域の数が一定数に達していないだけであり、研究領域の重要性を示すものではない。
データ: 科学技術・学術政策研究所がトムソン・ロイター社Essential Science Indicators (NISTEP ver.)及びWeb of Science XML (SCIE, 2015年末バージョン)を基に集計・分析、可視化を実施。
2-1 過去10年にわたって、拡大を続ける科学研究

研究領域数の時系列変化を見ると、サイエンスマップ2002で598領域、サイエンスマップ2014では844領域となっており、サイエンスマップ2002から2014にかけて41%増加している。研究領域数の増加は、世界における論文数の増加、中国などの新たなプレーヤーの参画による研究者コミュニティの拡大、新たな研究領域の出現、既存の研究領域の分裂等、複合的な要因によるものである。

2-2 世界の研究領域数が拡大する中、停滞する日本の参画領域数

サイエンスマップ2002からの時系列を見ると(図表2)、日本の参画領域数はサイエンスマップ2008以降、停滞している。日本の参画割合を見ると、サイエンスマップ2008では41%だったものが、サイエンスマップ2014では32%と9ポイント低下した。英国やドイツの参画領域数は増加しており、サイエンスマップの参画割合も50~60%を保っている。中国については、急激に参画領域数及び割合を増加させている。

図表2 サイエンスマップにおける日英独中の参画領域数(コアペーパでの参画)の推移

データ:科学技術・学術政策研究所がトムソン・ロイター社Essential Science Indicators (NISTEP ver.)及びWeb of Science XML (SCIE, 2015年末バージョン)を基に集計・分析を実施。

サイエンスマップの研究領域のうち、研究領域を先導している論文(コアペーパ)と、それを引用しているサイティングペーパ(Top10%)注3における参画状況を比較すると(図表3)、いずれの国もコアペーパの参画数よりサイティングペーパ(Top10%)における参画数の方が多くなっている。サイティングペーパ(Top10%)まで含めると、日本と英独中との参画領域数の差は小さくなる。しかし、サイティングペーパ(Top10%)での参画数に対するコアペーパでの参画数の割合を見ると、日本の43%に対して英国は69%、ドイツは63%となっており、日本は研究領域を先導する研究者が少ないことが示唆される。

図表3 サイエンスマップ2014におけるコアペーパとサイティングペーパ(Top10%)

注:コアペーパを引用している論文を「サイティングペーパ」、その中でも被引用数の高い論文を「サイティングペーパ(Top10%)」と呼ぶ。コアペーパは研究領域を先導する論文であり、研究領域を山に例えるならば山頂部分である。サイティングペーパはコアペーパをフォローしている論文であるので山の裾野、サイティングペーパ(Top10%)は山の中腹部分と考えることができる。
データ:科学技術・学術政策研究所がトムソン・ロイター社Essential Science Indicators (NISTEP ver.)及びWeb of Science XML (SCIE, 2015年末バージョン)を基に集計・分析を実施。

3. Sci-GEOチャートを用いた研究領域の分類と、それを用いた日本の活動状況の理解

サイエンスマップの時系列変化を見ると、研究領域が継続的に存在しており、他の研究領域との関係性も強い「硬い部分」と、常に変化を続けている「柔らかい部分」が存在している。この「硬い部分」「柔らかい部分」を分類するために、サイエンスマップ2010&2012において、Sci-GEOチャートという概念を導入した10)

Sci-GEOチャートでは、研究領域を継続性(時間軸)と他の研究領域との関与の強さ(空間軸)を用いて分類する。具体的には図表4に示したように、過去のマップとの継続性がある場合について、他の研究領域との関与が強い「コンチネント型領域」、他の研究領域との関与が弱い「アイランド型領域」に分類した。また、過去のマップとの継続性がなく新たに研究領域が見いだされた場合について、他の研究領域との関与が強い「ペニンシュラ型領域」、他の研究領域との関与が弱い「スモールアイランド型領域」に分類した。

図表4 Sci-GEO チャートによる研究領域の分類

3-1 世界の主要国とは異なるSci-GEOチャートに見る日本の研究領域タイプのバランス

サイエンスマップ2014における研究領域タイプのバランスを見ると(図表5(A))、日本は、スモールアイランド型が24%、コンチネント型が32%であり、世界のバランス(スモールアイランド型41%、コンチネント型18%)とは違いがある。サイエンスマップ2004(図表5(B))との比較を見ると、過去10年で、英国やドイツではスモールアイランド型の割合が増加している一方、日本では研究領域タイプのバランスについての大きな変化は見られない。

図表5 Sci-GEOチャートに見る世界と主要国の研究活動動向

データ:科学技術・学術政策研究所がトムソン・ロイター社Essential Science Indicators (NISTEP ver.)及びWeb of Science XML (SCIE, 2015年末バージョン)を基に集計・分析を実施。

スモールアイランド型とコンチネント型を比較すると、後述するような違いが存在している。したがって、これらの違いを認識した上で、日本にとってどのようなバランスが望ましいのかを議論していく必要がある。

スモールアイランド型領域は数が多いことから、研究の多様性を担う役割が大きい。また、一定の割合で、スモールアイランド型から継続性を持って発展する研究領域に移行する。これまでの観察によれば、スモールアイランド型の3割程度の領域がアイランド型に移行し、1割程度の領域がコンチネント型に移行している。残り6割程度の領域は次回のサイエンスマップでは検出されず、入れ替わりが活発である。スモールアイランド型領域は小さい領域が多く、存在感を発揮しやすい反面、入れ替わりが活発である。したがって、スモールアイランド型領域を増やす(研究の多様性を増す)には、このような研究領域が生み出される土壌を耕すことが重要である。

コンチネント型領域については、6割程度の領域が次回のサイエンスマップでもコンチネント型領域として継続している。1割程度の領域はアイランド型へ移行し、3割程度の領域は次回のサイエンスマップでは検出されない。全体で7割程度の領域が継続しており安定的である。コンチネント型領域は、研究領域の継続性という観点から見ると、研究推進のターゲットとして他の領域に比べて確実性があると言えるが、コミュニティが大きく、世界的な研究競争が行われていることから、存在感の維持には多くの投資が必要となる可能性がある。

4. 各種データの公開及びその活用事例

NISTEPサイエンスマップ調査では、論文を用いた知識の構造化や可視化に関連した膨大なデータが得られており、これらは国レベルや機関レベルの各種分析にも有用と考えられる。そこで、科学技術・学術政策の立案に関わる方、大学や公的研究機関のマネジメントに関わる方にもこれらのデータを活用してもらうために、サイエンスマップ2014の844領域それぞれについて、コアペーパ数、主要国シェア、国際共著論文率などの情報をNISTEPサイエンスマップ調査のホームページ(http://www.nistep.go.jp/sciencemap)に掲載している。

ここでは、各研究領域の情報に加えて、日本の170大学・公的研究機関等について、その活動状況をサイエンスマップ上にオーバーレイした、サイエンスマップ活動状況シートを公表するとともに、インタラクティブに表示するサイエンスマップ2014(ウェブ版)(http://www.nistep.go.jp/wp/wp-content/uploads/ScienceMapWebEdition2014.html)も公表している。

図表6 サイエンスマップ2014(ウェブ版)

サイエンスマップ2014(ウェブ版)では、次のような表示が可能である。以下では、A)、B)、C)の表示について説明する。
A) 特徴語による研究領域の表示
B) 170大学・公的研究機関等の活動状況のオー バーレイ表示注4
C) 研究領域の変遷についてのTrajectory表示
D) 主要国シェア(分数カウント)表示
E) 論文シェア(分数カウント)による領域の表示

4-1 A)特徴語による研究領域の表示

図表7に「特徴語による研究領域の表示」の例を示した。サイエンスマップ2014では、研究領域を構成するコアペーパ及びサイティングペーパのタイトル及びアブストラクトのテキストマイニングから、研究領域を特徴付ける言葉(特徴語)を抽出し、各領域について概ね上位20までの特徴語を和訳した。「特徴語による研究領域の表示」では、ユーザが検索対象とした特徴語が含まれている研究領域をハイライトする。図表7では「超伝導」、「クロスカップリング」、「暗黒物質」、「グラフェン」、「幹細胞」、「シロイヌナズナ」、「気候変動」の七つの語を検索した結果を示している。ここでは、OR検索の結果を示しているが、AND検索を実施することも可能である。

「特徴語による研究領域の表示」の活用例の一つとして、一見つながりがないと思われる二つの特徴語(例えば「細胞」と「グラフェン」など)をAND検索することで、意外なつながりを持つ特徴語を探索することが挙げられる。

図表7 特徴語による検索の例

4-2 B)170大学・公的研究機関等の活動状況のオーバーレイ表示

サイエンスマップ2014(ウェブ版)では、国立大学(64)、公立大学(15)、私立大学等(62)、大学共同利用機関法人(3)、独立行政法人等(26)の合計170大学・公的研究機関等の活動状況をオーバーレイ表示することが可能である注5

図表8は、東京工業大学の活動状況をサイエンスマップ上にオーバーレイした結果である。赤色は東京工業大学に所属する研究者が著者となっているコアペーパが1件以上含まれる研究領域、黄色はサイティングペーパ(Top10%)が1件以上含まれる研究領域、緑色はサイティングペーパが2件以上含まれる研究領域である。図表8の中で、ナノサイエンス(物理学)の研究領域群の周辺を拡大した結果を図表9に示す。東京工業大学の場合、IDが587、694、704の研究領域でコアペーパが存在しており、これらの研究領域を先導する研究が行われていることが分かる。

図表8 東京工業大学の例

図表9 東京工業大学の例(ナノサイエンス(物理学)周辺の拡大)

これらの三つの研究領域についての情報を図表10に示す注6。特徴語から、ID587は鉄系超伝導についての研究領域、ID694はトポロジカル絶縁体についての研究領域、ID704はエンタングルメントエントロピーと共形場理論についての研究領域であることが分かる。各研究領域から伸びている線は、他の研究領域とのリンク(関連性)を表している注7。トポロジカル絶縁体についての研究領域(ID694)は、多くの研究領域とリンクを持っている一方で、鉄系超伝導についての研究領域(ID587)については他の研究領域とのリンクが見られない。これは、科学における知識の関連性という視点で見たときに、前者の方がより多くの研究領域に影響を与え得る/影響を受けていることを示唆している。また、エンタングルメントエントロピーと共形場理論についての研究領域(ID704)については、量子物性科学研究と素粒子・宇宙論研究の研究領域群を結ぶような位置に存在している。ここで例示した研究領域は、物理学に軸足を持つ研究領域であるが、他の研究領域の関連性という観点から見ると、その位置付けは大きく異なることが分かる。

図表10 三つの研究領域の詳細情報

なお、NISTEPサイエンスマップ調査ホームページに掲載している付録のAppendix 6にはWeb of Scienceにおける論文のアクセッション番号を示している。この情報を基に論文の書誌を調べることで、具体的にどの研究者が研究に関わっているのかを分析することができる。

4-3 C)研究領域の変遷についてのTrajectory表示

Trajectory表示は異なる時点のサイエンスマップで得られた研究領域間のコアペーパの共通度を調べ、一定の共通度を持つ研究領域の変遷(Trajectory)を可視化したものである。研究領域の位置を示す灰色の丸をクリックすることで、その研究領域のサイエンスマップ2008からの変遷の可視化が可能である。図表11(a)は鉄系超伝導についての研究領域(ID587)を含む関連した研究領域の変遷を束として示したもの(以降ではStreamと呼ぶ)を示している。本研究領域は2008年から2010年にかけて急激に成長し、その後継続している様子が分かる。図表11(b)はトポロジカル絶縁体についての研究領域(ID694)を含むStreamを示している。鉄系超伝導についての研究領域(ID587)はほぼ一つのStreamとして研究の変遷が見えているが、トポロジカル絶縁体についての研究領域(ID694)については、Streamが多くのTrajectoryから構成されており、多様な研究領域が入り混じりながら研究が変遷していることが分かる。このようにTrajectory表示では、他の研究領域との時系列の関連性も含めた、研究領域の変遷の状況が把握できる。

図表11 Trajectory表示の例

5. 最後に

本レポートでは、サイエンスマップ2014の結果概要や各種データの公開及びその活用事例を紹介した。NISTEPサイエンスマップ調査のホームページ(http://www.nistep.go.jp/sciencemap)では、本レポートで示した以外のデータも公表しているので、適時、御活用いただきたい。


注1 サイエンスマップは、トムソン・ロイター社Essential Science Indicators(NISTEP ver.)及びWeb of Science XML(SCIE, 2015年末バージョン)を基に集計・分析を行っている。サイエンスマップの特徴として、1)既存の学問分野にとらわれない研究領域全体の俯瞰的な分析、2)統計情報に基づく客観的な研究領域の分析、3)同一の手法を用いた継続的な分析が可能な点が挙げられる。他方で、以下に述べる留意点もある。1)論文ではなく、会議録、特許、プログラムなどで成果が報告される研究についてはサイエンスマップでは把握できない。2)論文数が一定の規模に達していない場合(小さいコミュニティが長い期間をかけて取り組んでいる場合、6年間の最後の1,2年に研究が進展した場合)は、抽出できていない可能性がある。3)サイエンスマップで見えているのは、あくまで近過去の状況であり、科学研究の今の姿ではない。

注2 リサーチフロントは、「共引用」を用いた第1段階のグループ化で得られる論文のグループであり、研究領域よりも小さな概念に対応している。サイエンスマップ2014では約7,000のリサーチフロントが得られた。

注3 サイティングペーパ(Top10%)は研究領域において重要な成果を出しているフォロワーと考えることができる。

注4 これらに加えて、論文の謝辞に掲載されている12の資金配分機関等の活動状況の可視化も可能である。

注5 これらに加えて、論文の謝辞に掲載されている12の資金配分機関等の活動状況の可視化も可能である。

注6 各研究領域の特徴語や世界におけるコアペーパ数等の情報はNISTEPサイエンスマップ調査ホームページに掲載している付録のAppendix 1で確認できる。

注7 ここでは、同時点の研究領域間の共引用度が0.02以上の場合、リンクを示している。

参考文献

1)Garfield, E., Sher, I.H., and Torpie, R.J. (1964). The use of citation data in writing the history of science, Institute for Scientific Information, Philadelphia.

2)Small, H. and Sweeney, E. (1985). Clustering the science citation index using co-citations. I. A comparison of methods. Scientometrics, 7(3–6), 391–409.

3)Small, H., Sweeney, E., and Greenlee, E. (1985). Clustering the science citation index using co citations. II. Mapping science. Scientometrics, 8(5–6), 321–340.

4)総合的なレビューとしては次がある。Börner, K., Chen, C., and Boyack, K. W. (2003), “Visualizing Knowledge Domains”, Annual Review of Information Science and Technology, 37, 179-255.

5)例えば、総合科学技術・イノベーション会議第2回基本計画専門調査会, 2015年1月22日, 資料5 基礎研究力の現状について.

6)平成27年版 科学技術白書 第1部第2章 p. 82, 第1-2-4図/主要国における研究領域タイプの特徴.

7)OECD (2010), Measuring Innovation: A New Perspective, OECD, Paris.

8)科学技術・学術政策研究所(2016), サイエンスマップ2014, NISTEP REPORT No. 169, 文部科学省科学技術・学術政策研究所. DOI: http://doi.org/10.15108/nr169

9)Force-directed graph drawing (https://en.wikipedia.org/wiki/Force-directed_graph_drawing) (2016年10月4日参照)

10)科学技術・学術政策研究所(2014), サイエンスマップ2010&2012, NISTEP REPORT No. 159, 文部科学省科学技術・学術政策研究所