2026年1月30日(金)
科学技術・学術政策研究所(NISTEP)では、産学連携から生まれる発明・イノベーションの分析において基盤となる「特許出願データ」の利活用を高度化するため、特許出願に記載される同姓同名発明者の識別(名寄せ)に焦点を当てた研究を実施し、その成果をNISTEP DISCUSSION PAPER No.245「特許出願における発明者の識別 ― 識別の自動化手法とその性能評価―」(2026年1月)として取りまとめました。
本報告書では、大規模特許データに内在する同姓同名問題が、発明者ネットワーク分析や研究者活動の推定を歪めうる点を踏まえ、(i)共同発明者・住所等のメタデータ照合、(ii)文書類似度に基づく識別、(iii)機械学習(Random Forest)による分類を実装し、複数ケースで性能を比較評価しました。さらに、同一技術分野に別の同姓同名者が存在する場合に誤識別(偽陽性)が残り得ることを示したうえで、技術的内容とメタデータを統合する「多段識別モデル」により、誤識別を大幅に低減しつつ高精度な識別を実現できることを示しています。
詳細につきましては以下のリンクより御覧ください。
ライブラリ:特許出願における発明者の識別― 識別の自動化手法とその性能評価 ―[DISCUSSION PAPER No.245]
