科研費 - 松原 茂樹
-
学術論文における被引用文献の貢献度測定:文献の新たな評価法を目指して
研究課題/研究課題番号:23K18506 2023年6月 - 2026年3月
科学研究費助成事業 挑戦的研究(萌芽)
松原 茂樹, 加藤 芳秀, 中村 剛士
担当区分:研究代表者
配分額:6500000円 ( 直接経費:5000000円 、 間接経費:1500000円 )
文献の被引用回数は、学術における影響力を示す代表的な指標である。しかし、その影響を適切に評価するには、ある論文で引用された文献が、その論文の産出にどの程度貢献したのかを考慮する必要がある。本研究では、文献の新たな評価法を提起するという動機のもと、論文内の引用文脈の解析可能性と被引用文献の貢献度測定の実現可能性を示すことを目的とする。論文の本体及びメタデータから判定可能な客観的な評価法を開発する。
-
研究課題/研究課題番号:22K12148 2022年4月 - 2025年3月
科学研究費助成事業 基盤研究(C)
加藤 芳秀, 松原 茂樹
担当区分:研究分担者
自然言語推論とは,2つのテキストが与えられたとき,それらのテキスト間に成り立つ「含意」,「矛盾」といった推論的関係を同定するタスクである.本研究では,構文構造に基づきテキストを分割・変換し,自然言語推論の問題を複数の部分問題に還元する推論エンジンを開発する.推論エンジンは,ニューラルネットワークモデルと統合できるように設計する.開発した推論エンジンとニューラルネットワークモデルの統合により,次の性質を持つ自然言語推論システムを実現する.
(1)推論的関係を導出する過程が人に解釈できる形で提示できる.
(2)ニューラルネットワークモデルに基づく自然言語推論システムと同程度の正解率を達成できる.
本研究では,構文構造を操作対象とした推論と,ニューラルネットワークに基づく推論とを組み合わせた自然言語推論システムを開発する.テキスト間の推論的関係を,ニューラルネットワークに基づく手法と同程度の精度・カバー率で同定し,かつ,それが同定される過程を人が解釈できる形で提示できる自然言語推論システムの実現を目標とする.本年度は,(1)開発する自然言語推論システムのモデル理論的な定式化,(2)自然言語推論を指向した構文解析の開発,を行った.
(1)本研究では,ニューラルネットワークに基づく推論と,タブロー法に基づく証明を統合した自然言語推論システムを開発している.本システムの理論的な限界を明らかにするために,開発する自然言語推論システムをモデル理論的に定式化し,その理論的性質を明らかにした.開発するシステムにおいては,ある種の健全性が常に成り立つ一方で,完全性については成り立たないケースがあることが明らかとなった.
(2)文中に出現する否定表現について,その影響が及ぶ範囲(スコープ)を同定する構文解析手法を開発した.自然言語推論において,スコープの同定は重要な役割を担う.本手法では,否定表現のスコープを構文構造に基づき同定する.本手法は,ヒューリスティックなルールに基づく従来手法を改良したものである.ニューラルネットワークに基づく構文解析とルールに基づくスコープ同定を組み合わせることにより,否定スコープ認識タスクにおいて,ニューラルネットワークに基づく最新の手法と同程度の精度・再現率が達成できることを実験により確認した.
(1)本研究で開発する自然言語推論システムの理論的限界を明らかにした.開発するシステムの限界を明らかにすることは研究の方向性を見定める上で重要であり,意義のある研究成果である.本研究成果は,国際会議PACLICにおいて発表した.
(2)自然言語推論システムのコンポーネントとなる構文解析システムを開発した.当初の研究計画通り,スコープを同定できる構文解析を実現し,否定スコープ認識タスクにおいて従来手法と同程度の性能を達成することができた.
当初の研究計画通り,令和5年度は以下の研究課題に取り組む.
(1)自然言語推論を指向した構文解析を開発する.今年度の研究成果である否定スコープ同定の機能を組み込んだ構文解析を拡張し,量化子,命題的態度などのスコープを扱える構文解析を開発する.
(2)自然言語推論のための推論ルールを拡充する.最新の常識的知識ベースの成果などを取り入れ,常識的知識に基づく推論についてその推論ルールを検討する. -
研究データリポジトリの構築に向けた学術論文テキストの解析と利用
研究課題/研究課題番号:21H03773 2021年4月 - 2025年3月
科学研究費助成事業 基盤研究(B)
松原 茂樹, 加藤 芳秀, 青木 学聡
担当区分:研究代表者
配分額:17160000円 ( 直接経費:13200000円 、 間接経費:3960000円 )
オープンサイエンスを推進する方策として,研究データリポジトリの整備が挙げられる。本研究では、論文テキストを用いた研究データの検出とメタデータの生成の実現可能性を示すことを目的とする。その方法として、研究データの引用情報を付与した学術論文テキストを整備し、研究データを識別する技術、引用テキストを検出する技術、メタデータ情報の抽出技術の開発に利用する。大規模な論文アーカイブデータを用いた実験により、研究データ検索への貢献を評価する。
研究データリポジトリ構築の自動化は、オープンサイエンスの促進に効果的である。本研究では、学術論文データを活用した研究データ登録とそのためのメタデータ生成の実現性とその有用性を示すことを目的とする。二年目にあたる今年度は、昨年度整備した論文テキストデータを用いて、(1)論文におけるURLによる引用の多次元分類、及び、(2)メタデータ情報の論文テキストからの抽出、の項目の研究を推進した。
(1)論文における研究データの引用を識別・解析することは、研究データリポジトリの拡充や研究データの検索・推薦・評価などにつながる。論文におけるURL引用の多くが研究データを参照している。そこで本研究ではそのような引用に対し、参照先リソースが研究で果たす役割、URLで参照するリソースの種類、および、著者が引用した理由に関する分類問題に取り組んだ。提案する手法では従来手法のフレームワークに、節タイトルや脚注の文を入力素性として追加した。データセットを作成し、国際会議論文を用いた分類実験の結果、提案手法の有効性を確認した。
(2)研究データリポジトリの効率的な拡充を目的に、研究資源のメタデータに関する情報を学術論文から抽出する手法を検討した。具体的には、論文テキストに出現するエンティティ及びそれらの間の関係を抽出し、エンティティを節点、関係を有向辺とする知識グラフを獲得する仕組みを開発した。論文データを用いて構築した知識グラフを用いて、既存のメタデータリポジトリにおけるメタデータ及びエントリの拡充可能性を実験的に検証した。実験の結果、既存のメタデータに対する新たな情報の追加可能性、ならびに、研究資源を示すエンティティを識別するニューラルモデルによる研究資源エントリの拡充可能性を確認した.
プロジェクトの二年目は、初年度に整備した大規模論文テキストデータを用いて、論文テキストに記された引用文から引用文脈を検出する技術を開発すること、及び、論文で記載された研究データをテキスト上で識別するための研究開発を行うことを計画していた。
今年度の推進により現在までに、学術論文における引用文脈を示すテキストを引用文献ごとに抽出する手法の研究開発、ならびに、本文や脚注に出現する研究データを参照するURL引用を識別するとともに、それを役割と目的の観点から分類する方式の研究開発に取り組んだ。その結果、研究データリポジトリの自動構築に向けたいくつかの有用な知見を得ることができた。本研究成果をとりまとめた論文が、自然言語処理、及び、デジタルライブラリに関する国際会議において査読を経て採択されるに至っており、本課題はおおむね順調に進展しているといえる。
次年度以降においても、初年度に整備した大規模論文テキストコーパスを引き続き使用して研究を推進する。ただし、使用するデータの規模的拡張、及び、分野的拡張については必要に応じて継続的に推進する。今後は、今年度の技術的な成果と知見に基づき、研究データに関わるメタデータ要素を生成する技術を中心的に取り組むとともに、学術論文における研究データ引用の実際について、大規模かつ多分野テキストの解析に基づき分析を与える。それらの成果についてデジタルライブラリや自然言語処理に関する著名な国際会議に投稿する方針である。代表研究者と分担研究者間の連携、ならびに、研究協力者との連絡など、本プロジェクト推進上の問題は生じておらず、当初の研究計画を大きく変更する必要はない。 -
研究課題/研究課題番号:18K19811 2018年6月 - 2022年3月
科学研究費助成事業 挑戦的研究(萌芽)
松原 茂樹, 大野 誠寛, 村田 匡輝
担当区分:研究代表者 資金種別:競争的資金
配分額:6370000円 ( 直接経費:4900000円 、 間接経費:1470000円 )
本研究では、語りのリスナーとしての役割を担うスマートスピーカーが、話し手に対して共感的応答を生成する方式について検討した。聴き手による応答を大規模に収集し、共感の深さと応答の種類の関係について定量的な分析を与えた。繰り返し応答や不同意応答など共感的応答を表出すべき語句の検出技法、及び、表出されやすさの推定技法を開発した。実験により検出及び推定性能を評価し、語りに傾聴を示す応答の生成可能性を確認した。
語ることは人間に備わる基本的な欲求である。高齢化や独居化が進む現代社会では、人が語る機会の減少が問題となっている。スマートスピーカーなどの情報機器が語りを聴く役割を担うことにより、語りのある生活が身近になることが期待される。スマートスピーカーが語りのリスナーとしての役割を担い、話し手にとって語りたいと思える存在になるための応答とその表出技法にアプローチした。実験により、傾聴を示す応答生成の実現性を示した。 -
発達障がいグレーゾーン児童の自尊感情育成のための教育支援ロボット開発
研究課題/研究課題番号:18H03321 2018年4月 - 2022年3月
科学研究費助成事業 基盤研究(B)
中村 剛士, 松原 茂樹, 吉川 大弘, 永田 雅子, ジメネス フェリックス, 加納 政芳
担当区分:研究分担者
本研究では, 発達障害児向け教育支援ロボットを試作し, 小学生を対象に互いに音読を行い褒めるロボットによる学習支援効果を調査した. 実験の結果, ロボットとの音読は, 単独で音読をするよりも句読点での停止割合が増え, 誤読数が減少していた.このことから, 褒めるロボットと互いに音読を行うことで音読の正確性が向上する可能性があることを示した.
また, 学習者の状態を把握するために,ロボットにカメラを付け学習者の注視領域を推定できるか調査した. 実験の結果, 各分類器での精度は約75%であったが, 注視点ごとに精度を見ると, カメラより下方向にある注視点で精度が悪い傾向があった.
本研究成果の学術的意義は,発達障害グレーゾーン児童向けの教育支援ロボットとして,「ロボットとの共同学習」「ロボットからの褒め」「Learning by Teaching」を実装したTabot Eggを提案・試作し,その教育効果が有効である可能性を示した点にある.有効な教育効果は児童の自尊感情を育成することが期待できる.
一方,社会的意義については,グレーゾーン児童というこれまで教育支援の対象でなかった群に注目し,そのための教育支援ロボットによる教育支援方法や学習状態の把握機能について基礎的な検討を行った点が挙げられる. -
知的創造活動の大規模マルチモーダルデータベースの構築と生産性向上手法の発見
研究課題/研究課題番号:16H02867 2016年4月 - 2019年3月
科学研究費助成事業
長尾 確
担当区分:研究分担者
主に大学での研究に関する、様々な知的創造活動の科学的分析を可能にする基盤を実現した。具体的には、さまざまな情報を含む構造化ディスカッション・プレゼンテーションデータベースを構築した。また、このデータベースの応用として、知的創造活動の質の評価手法を実現した。ディスカッションの評価モデルは、発言の音響的・言語的特徴および、発言者の心拍数に基づく精神生理学的特徴を抽出することで入力データを取得し、統計的機械学習モデルによって構築した。プレゼンテーションの評価モデルは、VR環境を構築し、発表者の音声・視線・スライド内容・ジェスチャから入力データを作成し、ディープラーニングの手法を用いて構築した。
我々は、すでに知的創造活動の記録・分析・支援に関して多くの実績を有している。その技術を研究活動支援およびディスカッションスキルの評価に利用している。最先端のシステムを長期間保守・運用するノウハウは一朝一夕に得られるものではなく、このような、今後の研究を牽引する準備の整っている研究グループは世界的にも少ない。知的創造活動の詳細な記録をデータベース化し、その特徴を分析することで、生産性向上のための方法論が導かれる。この技術は、人間の創造的活動を科学的に分析し、人間が気づきにくい特徴を発見する手段にもなる。多くの優秀な人材を養成し、日本の世界的な競争力を強化するために、本研究は多大な効果をもたらす。 -
話し手の語る意欲を高めるパーソナルロボットの傾聴技術
研究課題/研究課題番号:15K12095 2015年4月 - 2019年3月
科学研究費助成事業
松原 茂樹
担当区分:研究代表者
配分額:3510000円 ( 直接経費:2700000円 、 間接経費:810000円 )
相槌生成タイミングを検出するための対話コーパスの作成とその利用方式を考案した。対話データに網羅的かつオフラインで相槌タグを付与することにより、揺れの小さいコーパスを作成できる.実験により,本方式の有効性を確認した。また、傾聴を示す多様な応答の収集を実施した。語りの音声に対し、表出するに相応しい応答の表現と生成タイミングを付与するという収集方式を採用した。本方式により自然で多様な応答を効率的に収集できることを確認した。
ロボットとの対話では、対話の過程が快適であることも重要である。ロボットの認識や理解の状態を、ユーザに適宜フィードバックすることが有効であり、聴覚的フィードバック手段である相槌は重要な役割を果たす。本研究で、適したタイミングでの相槌生成の実現性を示した。一方、語ることは人間に備わる基本的な欲求といえる。人が語れる機会を増やすことは現代社会の重要な課題に対し、パーソナルロボットが語りを聞く役割を担うことが考えられる。本研究では、ロボットによる傾聴を実現するための効果的な応答データ収集を提案した。 -
通訳方略の体系化と文構造の逐次解析に基づく講演音声の同時通訳
研究課題/研究課題番号:26280082 2014年4月 - 2020年3月
科学研究費助成事業
松原 茂樹
担当区分:研究代表者
配分額:15990000円 ( 直接経費:12300000円 、 間接経費:3690000円 )
講演の同時通訳では、同時通訳に特化した訳出方略の活用、及び、講演の逐次的な解析による構造的なまとまりの随時作成が求められる。本研究では、同時通訳データベースを用いて、プロの同時通訳者が使用する訳出方略の獲得を行い、語の省略、順送りの訳出といった通訳方略の利用について整理した。また、構文・意味解析に関する研究を推進し、文の逐次的な解析を実行する技術を開発し、評価実験により高精度な構文・意味解析が可能となることを検証した。
講演の同時通訳に向けた訳出方略の獲得と同時的な解析技術において、いくつかの成果を得ることができた。訳出方略の解明は通訳学の中核的テーマであり、語の省略及び順送りの訳出という代表的な方略の運用を大規模データを用いた獲得したことは、科学的な意義がある。また、音声通訳を含めた言語処理技術の応用において、インタラクションの自然さと円滑さに重点が置かれつつあり、逐次的な解析を高精度に実行できる技術の開発は、工学的に意義がある。 -
音声対話における発話からの話者の個人性検出
2012年4月 - 2014年3月
科学研究費補助金 挑戦的萌芽研究
担当区分:研究代表者
-
同時的な発話理解のための話し言葉処理に関する研究
2010年4月 - 2014年3月
科学研究費補助金 基盤研究(B)
松原 茂樹
担当区分:研究代表者
-
音声対話システムの個性化に関する基礎的研究
2009年4月 - 2011年3月
科学研究費補助金
松原 茂樹
担当区分:研究代表者
-
英語講演の同時通訳システムの実現に関する研究
2001年4月 - 2003年3月
科学研究費補助金 若手研究(B)
担当区分:研究代表者
-
同時通訳システムの実現を目指した日英話し言葉翻訳に関する研究
1999年4月 - 2001年3月
科学研究費補助金 奨励研究
担当区分:研究代表者