Microsoft Academic Graph の書誌情報データとしての評価 [DISCUSSION PAPER No.162] の公表について

2018年10月24日(水)

科学技術・学術政策研究所 (NISTEP) では、Microsoft 社の書誌情報データ Microsoft Academic Graph (MAG) の利用可能性について、Elsevier 社の Scopus をベンチマークとして、大規模なサンプルで評価を行いました。

MAG はウェブをクローリングして得られた情報に基づくデータベースです。我々は Open Academic Society から無償でダウンロードできるバルクデータを分析に利用しました。このバルクデータには 1800 年から 2017 年に出版された 166,192,182 件の文献の書誌情報が収録されています。MAG と Scopus に収録されている論文を DOI で接続して、接続できた 19,166,705 件の論文について、各データベースから得られる書誌情報を比較しました。

その結果、出版年は 97.0% 、著者数は 98.8% の論文で一致しました。参考文献数の値は Scopus の方が大きいですが、書誌情報とリンク可能な参考文献は MAG の方が多い傾向にあります。また、MAG と Scopus のそれぞれから求めた被引用数のスピアマン順位相関係数は 0.945 であり、強い相関を示しています。一方で、MAG では論文著者の所属機関情報に欠損が多いことが分かりました。

品質の高い書誌情報データベースの選択肢が増えること、また、各データベースの特性を明らかにすることは、計量書誌学の発展のために重要です。MAG は全体としてはとても有用なデータベースです。しかし、現状では、大学ランキングの作成のような所属機関情報を用いる研究目的のためには、既存の商用データベースに頼る必要があると考えられます。

詳細につきましては、以下のリンクより御覧ください。
要旨
報告書全文

ライブラリ:Microsoft Academic Graph の書誌情報データとしての評価 [DISCUSSION PAPER No.162]