NISTEP機関同定プログラム公開版の試用実験協力者を募集します

2020年7月13日(月)

文部科学省科学技術・学術政策研究所(NISTEP)では、日本の大学・公的機関の研究活動についての体系的な分析の基礎となるデータを構築・公開しています。その中核的役割を果たすNISTEP大学・公的機関名辞書、及びそれを用いたWeb of Science Core Collection (WoS)及びScopusの著者所属機関データの機関同定(名寄せ)の結果をNISTEPのサイトから公開しています。

今後、その機関同定プログラムも公開する計画ですが、今年度はその第一弾として、機関同定プログラムの公開初版を希望者の方々に試用していただき、その評価によりプログラムを改善して、来年度以降の本格的公開に備えることとしました。

以下では、試用実験の説明会の開催、協力者の募集、試用実験の概要についてご案内します。

1.試用実験説明会のお知らせ

(1) 日時

2020年8月3日10時30分~11時30分

(2) 開催形式

電子会議ソフトZoomによるオンライン開催とします。

(3) 内容(予定)

  • NISTEP機関同定プログラム公開版の試用実験についての説明
  • NISTEP機関同定プログラム公開版のデモンストレーション
  • 質疑応答

(4) 参加申し込み方法

参加登録は締め切りました。参加登録いただいた方には、7月30日の夕方にアクセス情報を送信しております。
届いていない場合は、kiban_seminar[at]nistep.go.jp (担当: 永田、伊神)([at] を”@”に変更してください)にお知らせください。

2.協力者の募集

説明会終了後、8月14日までにdata-infra[at]nistep.go.jp (担当: 伊神、小野寺)([at] を”@”に変更してください)にお申し込みください。参加資格は下記の通りです。説明会に出席できなかった方もご協力いただけます。申込者に、試用のためのプログラム、附属ファイル及び説明資料を8月中にお送りします。

  • 4.2に示す作業環境が準備できる方
  • 試用実験の利用条件を順守いただける方(条件については説明会でお知らせします)
  • 試用実験による簡単な評価報告を提出できる方(9月末、12月末の2回を予定)

3.試用実験の概要

(1) 実施期間

申し込み後2020年12月末日まで(予定)

(2) お願いすること

この期間中、お渡ししたプログラムを用いて、協力者が用意する入力ファイル(国内機関の英語名が入った指定フォーマットのファイル)の機関同定を自由に行っていただき、簡単な評価報告を2回提出していただきます。それ以外に、ご質問、ご要望を随時受け付けます。試用実験終了後に、結果を共有する機会も設ける予定です。

  • 9月末まで:動作環境について、その他の中間評価
  • 12月末まで:最終評価

4.プログラムとファイルの概要

詳細は説明会及び協力者申込時にお渡しする資料に示しますので、ここではごく簡単に説明します。NISTEP大学・公的機関名辞書と機関同定プログラムは、文部科学省の「科学技術イノベーション政策における「政策のための科学」推進事業」(SciREX(サイレックス))事業の一環として、NISTEPが開発しています。

4.1 NISTEP大学・公的機関名辞書(以下「機関名辞書」と表記)

研究開発に携わっている国内の約20,000機関を収録しています。このうち約4,000は親機関(代表機関)に所属する主要な下部組織です。また、現存しない機関・組織(約6,000)を含みます。代表機関とその下部組織、非現存機関とその継承機関の間には、関係づけがなされています。

「大学・公的機関名辞書」という名称ですが、主要な地方自治体の機関、企業、非営利団体も多数含まれています。これらの機関・組織には延べ約26,000の英語名が付けられ、これに基づいて機関同定が行われます。詳細は、こちらで公開されている機関名辞書とその利用マニュアルをご覧ください。

4.2 機関同定プログラム試用公開版

(1) 同定の仕組み

基本的には、対象となる英語名データと最長マッチする機関名辞書中の名称データを持つ機関に同定しますが、同定の正確さと精度を向上させるための様々な工夫をしています。詳しくは協力者にお渡しするプログラム説明書に記述します。

(2) プログラムの実行方法

  • プログラム動作環境: Python3で実行可能(Python3.7.4で開発・検証)
  • 実行環境: Linux、Windows10+Anaconda、及びmacOSで確認

(3) 協力者が用意するファイル

同定対象データファイル(入力ファイル):指定のファイル形式に従ったものであれば任意。但し、英語名で書かれた日本の機関のデータを想定。

(4) NISTEPから提供するファイル

機関名辞書(2020年5月に更新したもの)及びサポートファイル(略記辞書など)

(5) 出力ファイルの項目

  • 同定フラグ
  • 同定機関数と同定機関連番:1つの機関データ中の同定機関の数とそれらの番号
  • 同定された機関の機関ID、日本語正式名、英語名称(同定機関のほか、その代表機関、継承機関の機関ID、日本語正式名、英語名称も出力)
  • 入力ファイルのデータ

問い合わせ先

科学技術・学術政策研究所 科学技術・学術基盤調査研究室(担当: 伊神、小野寺)

E-mail: data-infra[at]nistep.go.jp ([at] を”@”に変更してください)

Tel:03-6733-4910