2023/03/07 更新

写真a

コマミズ タカヒロ
駒水 孝裕
KOMAMIZU Takahiro
所属
数理・データ科学教育研究センター 基幹教育部門 准教授
大学院担当
大学院情報学研究科
職名
准教授
連絡先
メールアドレス
ホームページ

学位 3

  1. 博士(工学) ( 2015年3月   筑波大学 ) 

  2. 修士(工学) ( 2011年3月   筑波大学 ) 

  3. 学士(情報工学) ( 2009年3月   筑波大学 ) 

研究キーワード 5

  1. 情報検索

  2. Linked Open Data

  3. OLAP

  4. データ工学

  5. データベース

研究分野 3

  1. 情報通信 / ウェブ情報学、サービス情報学

  2. 情報通信 / データベース

  3. 情報通信 / ウェブ情報学、サービス情報学

経歴 1

  1. 筑波大学   計算科学研究センター   研究員

    2015年4月 - 2018年1月

      詳細を見る

    国名:日本国

学歴 3

  1. 筑波大学   システム情報工学研究科   コンピュータサイエンス専攻

    2011年4月 - 2015年3月

      詳細を見る

    国名: 日本国

  2. 筑波大学   システム情報工学研究科   コンピュータサイエンス専攻

    2009年4月 - 2011年3月

      詳細を見る

    国名: 日本国

  3. 筑波大学   第三学群   情報学類

    2005年4月 - 2009年3月

      詳細を見る

    国名: 日本国

所属学協会 8

  1. 電子情報通信学会   正会員

    2018年6月 - 現在

  2. 人工知能学会   正会員

    2018年4月 - 現在

  3. 言語処理学会   正会員

    2018年2月 - 現在

  4. the American Association for Artificial Intelligence

    2016年12月 - 2017年12月

  5. Association for Computing Machinery   Regular Member

    2012年5月 - 現在

  6. Institute of Electrical and Electronics Engineers

    2012年3月 - 現在

  7. 情報処理学会   正会員

    2010年6月 - 現在

  8. 日本データベース学会   正会員

    2008年12月 - 現在

▼全件表示

委員歴 18

  1. the 9th International Workshop on Semantic Computing for Social Networks (SCSN 2021)   Program committee  

    2020年11月 - 2021年1月   

  2. 第18回情報学ワークショップ   プログラム委員  

    2020年9月 - 2020年11月   

  3. he 4th International Conference on Multimedia Information Processing and Retrieval (MIPR 2021)   Web and SNS Co-Chair  

    2020年6月 - 現在   

  4. the r3rdInternational Workshop on EntitY REtrieval (EYRE@CIKM2020)   Program committee  

    2020年4月 - 2020年10月   

  5. PC member  

    2019年9月 - 2020年2月   

  6. 第17回情報学ワークショップ プログラム委員会   プログラム委員  

    2019年7月 - 2019年11月   

  7. 電子情報通信学会データ工学研究専門委員会   専門委員  

    2019年6月 - 現在   

  8. PC member  

    2019年4月 - 2019年11月   

  9. 第12回データ工学と情報マネジメントに関するフォーラム (DEIM 2020) 実行委員会   幹事(Web・出版担当)  

    2019年3月 - 現在   

  10. PC member  

    2018年12月 - 2019年2月   

  11. PC member  

    2018年10月 - 2019年7月   

  12. 第16回情報学ワークショップ 実行委員会   現地実行委員  

    2018年9月 - 2918年11月   

  13. 言語処理学会第25回年次大会 実行委員会   実行委員  

    2018年6月 - 2019年3月   

  14. 第11回 Webとデータベースに関するフォーラム 実行委員会   出版・印刷担当幹事  

    2018年5月 - 2018年9月   

  15. 第11回データ工学と情報マネジメントに関するフォーラム (DEIM 2019) 実行委員会   Web・出版委員長  

    2018年3月 - 2019年3月   

  16. 第10回 Webとデータベースに関するフォーラム 実行委員会   Web担当幹事  

    2017年9月   

  17. 第9回 Webとデータベースに関するフォーラム 学生奨励賞評価委員会   学生奨励賞評価委員  

    2016年9月   

  18. DBSJ電子広報編集委員会   編集委員  

    2015年8月 - 現在   

▼全件表示

受賞 13

  1. Best Paper Runner-up

    2022年12月   The 24th International Conference on Asia-Pacific Digital Libraries (ICADL 2022)   Towards Efficient Data Access Through Multiple Relationship in Graph-Structured Digital Archives

    Kazuma Kusu, Takahiro Komamizu, Kenji Hatano

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞  受賞国:ベトナム社会主義共和国

  2. 人工知能学会研究会優秀賞

    2021年6月   人工知能学会   法令沿革LOD構築のためのDBpediaにおける法令エンティティの同定

    駒水 孝裕, 小川 泰弘, 外山 勝彦

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  3. 最優秀賞

    2020年11月   第18回情報学ワークショップ   利用規約中の不公平文検出における不均衡データ分類に対する EasyEnsemble の利用

    近藤 匠, 駒水 孝裕, 小川 泰弘, 外山 勝彦

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

  4. オンラインプレゼンテーション賞

    2020年3月   第12回データ工学と情報マネジメントに関するフォーラム   不均衡データ分類フレームワークにおけるサンプリング比率の最適化

    植原 リサ, 駒水 孝裕, 小川 泰弘, 外山 勝彦

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

  5. FUJITSU賞

    2019年9月   第12回Webとデータベースに関するフォーラム   弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

    植原 リサ, 駒水 孝裕, 小川 泰弘, 外山 勝彦

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

  6. マイクロアド賞

    2019年9月   第12回Webとデータベースに関するフォーラム   弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

    植原 リサ, 駒水 孝裕, 小川 泰弘, 外山 勝彦

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

  7. 株式会社FRONTEO賞

    2019年9月   第12回Webとデータベースに関するフォーラム   弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

    植原 リサ, 駒水 孝裕, 小川 泰弘, 外山 勝彦

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

  8. JURIX 2018 Best paper award

    2018年12月   Japanese Legal Term Correction using Random Forests

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞  受賞国:オランダ王国

  9. 優秀インタラクティブ賞

    2018年3月   第10回データ工学と情報マネジメントに関するフォーラム   ノードがテキスト情報を持つ動的ネットワークにおけるノードと単語の分散表現学習

    伊藤 寛祥, 駒水 孝裕, 天笠 俊之, 北川 博之

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞 

  10. iiWAS 2015 Best paper award

    2015年12月   the 17th International Conference on Information Integration and Web-based Applications & Services (iiWAS 2015)  

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞  受賞国:ベルギー王国

  11. 情報処理学会 第73回全国大会 学生奨励賞

    2011年3月   情報処理学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  12. 山下記念研究賞

    2011年3月   情報処理学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  13. 第2回データ工学と情報マネジメントに関するフォーラム 2010 学生奨励賞

    2010年3月   第2回データ工学と情報マネジメントに関するフォーラム  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

▼全件表示

 

論文 60

  1. Multi-Task Learning-based Text Classification with Subword-Phrase Extraction

    Kimura Y., Komamizu T., Hatano K.

    ACM International Conference Proceeding Series     頁: 23 - 30   2022年12月

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM International Conference Proceeding Series  

    Text classification using deep learning, which is trained with a tremendous amount of text, has achieved superior performance than traditional methods. In addition to its success, multi-Task learning has become a promising approach for text classification; for instance, a multi-Task learning approach employs named entity recognition as an auxiliary task for text classification. The existing MTL-based text classification methods depend on auxiliary tasks using supervised labels, which require large human and/or financial efforts to create. To reduce these efforts, this paper proposes a multi-Task learning-based text classification framework which reduces the additional efforts on supervised label creation. A basic idea to realize this is that to utilize phrasal expressions consisting of subwords (called subword-phrase). To the best of our knowledge, there has been no text classification approach on top of subword-phrases, because subwords do not always express a coherent set of meanings. The proposed framework is new to add subword-phrase recognition as an auxiliary task, and to utilize subword-phrases for text classification. To realize the low-cost auxiliary recognition task, the framework extracts subword-phrases in an unsupervised manner. The experimental evaluation of the five popular datasets for text classification showcases the effectiveness of the involvement of the subword-phrase recognition as an auxiliary task. It also shows comparative results with the state-of-The-Art method.

    DOI: 10.1145/3568562.3568635

    Scopus

  2. Detection of Birds in a 3D Environment Referring to Audio-Visual Information

    Kawanishi Yasutomo, Ide Ichiro, Chu Baidong, Matsuhira Chihaya, Kastner Marc A., Komamizu Takahiro, Deguchi Daisuke

    2022 18TH IEEE INTERNATIONAL CONFERENCE ON ADVANCED VIDEO AND SIGNAL BASED SURVEILLANCE (AVSS 2022)     2022年

     詳細を見る

    出版者・発行元:AVSS 2022 - 18th IEEE International Conference on Advanced Video and Signal-Based Surveillance  

    We propose a method to detect birds in a 3D environment referring to both audio information observed from a microphone array and visual information observed from a panorama camera. In general, in panorama images, birds appear relatively too small to be detected accurately even with the state-of-the-art deep learning models. Thus, the proposed method takes a two step approach where the birds are first roughly located referring to audio information by Sound Source Localization (SSL), and then image detection is applied within its vicinity. Through evaluation on a dataset annotated with bounding boxes surrounding the birds, we show that the proposed method improves detection performance of birds that appear in relatively small sizes in the image, in both accuracy and processing speed.

    DOI: 10.1109/AVSS56176.2022.9959510

    Web of Science

    Scopus

  3. Towards Efficient Data Access Through Multiple Relationship in Graph-Structured Digital Archives

    Kusu Kazuma, Komamizu Takahiro, Hatano Kenji

    FROM BORN-PHYSICAL TO BORN-VIRTUAL: AUGMENTING INTELLIGENCE IN DIGITAL LIBRARIES, ICADL 2022   13636 巻   頁: 377 - 391   2022年

     詳細を見る

    掲載種別:論文集(書籍)内論文   出版者・発行元:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  

    The research field of digital libraries mainly deals with data with graph structure. Graph database management systems (GDBMSs) are suitable for managing data in the digital library because the data size is large and its structure is complex. However, when performing a non-simple search or analysis on a graph, GDBMSs cannot avoid reaching already-scanned nodes from different starting nodes by repeatedly traversing edges such as property paths pattern in SPARQL. Therefore, when a GDBMS reaches high degree nodes, the number of graph traversals increases in proportion to the number of its adjacent nodes. Consequently, the cost of traversing multiple paths extremely increases affected by nodes connected enormous the number of edges in conventional GDBMSs. In this paper, we propose a data access approach by repeatedly traversing edges belonging to a specific relationship or anything one while distinguishing between high degree nodes and low degree ones. Finally, a result of our experiment indicated our approach can increase the speed of repeat traversals by a factor of a maximum of ten.

    DOI: 10.1007/978-3-031-21756-2_29

    Web of Science

    Scopus

  4. Intuitive Gait Modeling using Mimetic-Words for Gait Description and Generation

    Kato H., Hirayama T., Doman K., Ide I., Kawanishi Y., Komamizu T., Deguchi D., Murase H.

    Proceedings - 5th International Conference on Multimedia Information Processing and Retrieval, MIPR 2022     頁: 240 - 245   2022年

     詳細を見る

    出版者・発行元:Proceedings - 5th International Conference on Multimedia Information Processing and Retrieval, MIPR 2022  

    Gait is one of the most familiar action for us, that is why we can distinguish slight difference of human gaits and perceive their impressions. However, the relationship has been never explored because of the absence of intuitive labels for the slight differences. In this paper, to solve this problem, we propose a intuitive gait model using Japanese mimetic-words. A mimetic-word has sound-symbolism, which means that there is an association between linguistic sounds and sensory experiences, and the phonemes of a mimetic-word is strongly related to the visual sensation. Thanks to the sound-symbolism, Japanese mimetic-words have a possibility of modeling gaits intuitively. Thus, we have previously proposed a method which describes gait with a mimetic-word. In this paper, in the opposite direction, we propose a method which generates gait from a mimetic-word, and confirm the effectiveness of the proposed intuitive gait model which consists of the phonetic-vector through evaluations of both the generation task and the description task.

    DOI: 10.1109/MIPR54900.2022.00050

    Scopus

  5. Action Semantic Alignment for Image Captioning

    Huo D., Kastner M.A., Komamizu T., Ide I.

    Proceedings - 5th International Conference on Multimedia Information Processing and Retrieval, MIPR 2022     頁: 194 - 197   2022年

     詳細を見る

    出版者・発行元:Proceedings - 5th International Conference on Multimedia Information Processing and Retrieval, MIPR 2022  

    Image captioning is one of the main goals in vision and language processing, which aims to generate proper descriptions of images. Recently, the attention mechanisms became crucial in captioning tasks, as they can capture global dependencies between modalities. Moreover, some works have used objects detected from the input image as anchor points, so called object tags, to ease such alignments resulting in good performance for this task. In this paper, we newly introduce action information as a prior to further improve this, by adding action tags for training. The action tags can learn alignment at action semantic level and catch the previously ignored dimension of action, that could be very important in image captioning. We found that training with action tags can be used to describe images in a dynamic style. Furthermore, we found it can actually lead to a significant improvement compared with other methods in captioning performance measured by common metrics.

    DOI: 10.1109/MIPR54900.2022.00041

    Scopus

  6. An Ensemble Framework of Multi-ratio Undersampling-based Imbalanced Classification 査読有り

    駒水 孝裕

    Journal of Data Intelligence   2 (1) 巻   頁: 30 - 46   2021年

     詳細を見る

  7. MMEnsemble: Imbalanced Classification Framework Using Metric Learning and Multi-sampling Ratio Ensemble

    Komamizu Takahiro

    DATABASE AND EXPERT SYSTEMS APPLICATIONS, DEXA 2021, PT II   12924 巻   頁: 176 - 188   2021年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  

    In classification, class imbalance is a factor that degrades the classification performance of many classification methods. Resampling is one widely accepted approach to the class imbalance; however, it still suffers from an insufficient data space, which also degrades performance. To overcome this, in this paper, an undersampling-based imbalanced classification framework, MMEnsemble, is proposed that incorporates metric learning into a multi-ratio undersampling-based ensemble. This framework also overcomes a problem with determining the appropriate sampling ratio in the multi-ratio ensemble method. It was evaluated by using 12 real-world datasets. It outperformed the state-of-the-art approaches of metric learning, undersampling, and oversampling in recall and ROC-AUC, and it performed comparably with them in terms of Gmean and F-measure metrics.

    DOI: 10.1007/978-3-030-86475-0_18

    Web of Science

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/dexa/dexa2021-2.html#Komamizu21

  8. FPX-G: First Person Exploration for Graph

    Komamizu T., Ito S., Ogawa Y., Toyama K.

    Proceedings - 4th International Conference on Multimedia Information Processing and Retrieval, MIPR 2021     頁: 70 - 76   2021年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Proceedings - 4th International Conference on Multimedia Information Processing and Retrieval, MIPR 2021  

    Data exploration is a fundamental user task in the information seeking process. In data exploration, users have ambiguous information needs, and they traverse across the data for gathering information. In this paper, a novel data exploration system, called FPX-G, is proposed that uses virtual reality (VR) technology. VR-based data exploration (or immersive analytics) is a recent trend in data analytics, and the existing work approaches involve aggregated information in an interactive and 3D manner. However, exploration for individual pieces of data scarcely has been approached. Traditional data exploration is done on 2D displays, therefore space is limited, and there is no depth. FPX-G fully utilizes 3D space to make individual piece of data visible in the user’s line of sight. In this paper, the data structure in FPX-G is designed as a graph, and the data exploration process is modeled as graph traversal. To utilize the capability of VR, FPX-G provides a first person view-based interface from which users can look at individual pieces of data and can walk through the data (like walking in a library). In addition to the walking mechanism, to deal with limited physical space in a room, FPX-G introduces eye-tracking technology for traversing data through a graph. A simulation-based evaluation reveals that FPX-G provides a significantly efficient interface for exploring data compared with the traditional 2D interface.

    DOI: 10.1109/MIPR51284.2021.00018

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/mipr/mipr2021.html#KomamizuIOT21

  9. Evaluation Scheme of Focal Translation for Japanese Partially Amended Statutes

    Yamakoshi T., Komamizu T., Ogawa Y., Toyama K.

    WAT 2021 - 8th Workshop on Asian Translation, Proceedings of the Workshop     頁: 124 - 132   2021年

     詳細を見る

    出版者・発行元:WAT 2021 - 8th Workshop on Asian Translation, Proceedings of the Workshop  

    For updating the translations of Japanese statutes based on their amendments, we need to consider the translation “focality;” that is, we should only modify expressions that are relevant to the amendment and retain the others to avoid misconstruing its contents. In this paper, we introduce an evaluation metric and a corpus to improve focality evaluations. Our metric is called an Inclusive Score for DIfferential Translation: (ISDIT). ISDIT consists of two factors: (1) the n-gram recall of expressions unaffected by the amendment and (2) the n-gram precision of the output compared to the reference. This metric supersedes an existing one for focality by simultaneously calculating the translation quality of the changed expressions in addition to that of the unchanged expressions. We also newly compile a corpus for Japanese partially amendment translation that secures the focality of the post-amendment translations, while an existing evaluation corpus does not. With the metric and the corpus, we examine the performance of existing translation methods for Japanese partially amendment translations.

    Scopus

  10. Combining Multi-ratio Undersampling and Metric Learning for Imbalanced Classification.

    Takahiro Komamizu

    Journal of Data Intelligence   2 巻 ( 4 ) 頁: 462 - 474   2021年

     詳細を見る

    掲載種別:研究論文(学術雑誌)  

    DOI: 10.26421/JDI2.4-5

  11. Random walk-based entity representation learning and re-ranking for entity search

    Komamizu Takahiro

    KNOWLEDGE AND INFORMATION SYSTEMS   62 巻 ( 8 ) 頁: 2989 - 3013   2020年8月

     詳細を見る

    掲載種別:研究論文(学術雑誌)   出版者・発行元:Knowledge and Information Systems  

    Linked Data (LD) has become a valuable source of factual records, and entity search is a fundamental task in LD. The task is, given a query consisting of a set of keywords, to retrieve a set of relevant entities in LD. The state-of-the-art approaches for entity search are based on information retrieval techniques. This paper first examines these approaches with a traditional evaluation metric, recall@k, to reveal their potential for improvement. To obtain evidence for the potentials, an investigation is carried out on the relationship between queries and answer entities in terms of path lengths on a graph of LD. On the basis of the investigation, learning representations of entities are dealt with. The existing methods of entity search are based on heuristics that determine relevant fields (i.e., predicates and related entities) to constitute entity representations. Since the heuristics require burdensome human decisions, this paper is aimed at removing the burden with a graph proximity measurement. To this end, in this paper, RWRDoc is proposed. It is an RWR (random walk with restart)-based representation learning method that learns representations of entities by using weighted combinations of representations of reachable entities w.r.t. RWR. RWRDoc is mainly designed to improve recall scores; therefore, as shown in experiments, it lacks capability in ranking. In order to improve the ranking qualities, this paper proposes a personalized PageRank-based re-ranking method, PPRSD (Personalized PageRank-based Score Distribution), for the retrieved results. PPRSD distributes relevance scores calculated by text-based entity search methods in a personalized PageRank manner. Experimental evaluations showcase that RWRDoc can improve search qualities in terms of recall@1000 and PPRSD can compensate for RWRDoc’s insufficient ranking capability, and the evaluations confirmed this compensation.

    DOI: 10.1007/s10115-020-01445-4

    Web of Science

    Scopus

  12. ランダムフォレストを用いた法令用語の校正

    山腰 貴大, 小川 泰弘, 駒水 孝裕, 外山 勝彦

    人工知能学会論文誌   35 巻 ( 1 ) 頁: H-J53_1 - 14   2020年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)   出版者・発行元:一般社団法人 人工知能学会  

    We propose a method that assists legislation drafters in finding inappropriate use of Japanese legal terms and their corrections from Japanese statutory sentences. In particular, we focus on sets of similar legal terms whose usages are strictly defined in legislation drafting rules that have been established over the years. In this paper, we first define input and output of legal term correction task. We regard it as a special case of sentence completion test with multiple choices. Next, we describe a legal term correction method for Japanese statutory sentences. Our method predicts suitable legal terms using Random Forest classifiers. The classifiers in our method use adjacent words to a target legal term as input features, and are optimized in various parameters including the number of adjacent words to be used for each legal term set. We conduct an experiment using actual statutory sentences from 3,983 existing acts and cabinet orders that consist of approximately 47M words in total. As for legal term sets, we pick 27 sets from legislation drafting manuals. The experimental result shows that our method outperformed existing modern word prediction methods using neural language models and that each Random Forest classifier utilizes characteristics of its corresponding legal term set.

    DOI: 10.1527/tjsai.h-j53

    Scopus

    CiNii Research

  13. Japanese mistakable legal term correction using infrequency-aware bert classifier

    Yamakoshi T., Komamizu T., Ogawa Y., Toyama K.

    Transactions of the Japanese Society for Artificial Intelligence   35 巻 ( 4 ) 頁: 1 - 17   2020年

     詳細を見る

    記述言語:英語   出版者・発行元:Transactions of the Japanese Society for Artificial Intelligence  

    We propose a method to assist legislative drafters that locates inappropriate legal terms in Japanese statutory sentences and suggests corrections. We focus on sets of mistakable legal terms whose usages are defined in legislation drafting rules. Our method predicts suitable legal terms using a classifier based on BERT (Bidirectional Encoder Representations from Transformers). The BERT classifier is pretrained with a huge number of whole sentences; thus, it contains abundant linguistic knowledge. Classifiers for predicting legal terms suffer from two-level infrequency: term-level infrequency and set-level infrequency. The former causes a class imbalance problem and the latter causes an underfitting problem; both degrade classification performance. To overcome these problems, we apply three techniques, namely, preliminary domain adaptation, repetitive soft undersampling, and classifier unification. The preliminary domain adaptation improves overall performance by providing prior knowledge of statutory sentences, the repetitive soft undersampling overcomes term-level infrequency, and the classifier unification overcomes set-level infrequency while saving storage consumption. Our experiments show that our classifier outperforms conventional classifiers using Random Forest or language models, and that all three training techniques improve performance.

    DOI: 10.1527/tjsai.E-K25

    Scopus

    CiNii Research

  14. 事前学習モデルBERTによる法令用語の校正

    山腰 貴大, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    人工知能学会全国大会論文集   2020 巻 ( 0 ) 頁: 4P3OS805 - 4P3OS805   2020年

     詳細を見る

    出版者・発行元:一般社団法人 人工知能学会  

    <p>法令文書には,「者」「物」「もの」や「規定」「規程」のように互いに類似している法令用語が出現する.このような法令用語は,法制執務(法令の起草・制定・改廃など法令文書の作成・管理に関する業務)の慣習や規則によって使用法とともに定義されている.法令において,これらの法令用語はそれに従い,厳密に書き分ける必要がある.契約書や約款などの広義の法令文書においても,誤解を防ぐために,法令に準じて正しく書き分けることが望ましい.そこで,本研究では,与えられた法令文から法令用語を検出し,誤用と思われるものに対してその修正案を出力することにより,法令文書の作成を支援する手法を提案する.本手法では,このタスクを選択肢付き穴埋め問題とみなし,分類器により解決する.分類器は,一般文によって事前学習したBERTモデルから構築する.このとき,(1)法令文によるドメイン適応,(2)訓練データのアンダーサンプリング,(3)分類器の統一の三つの工夫を施すことにより性能向上を図る.実験の結果,ランダムフォレストやニューラル言語モデルによる分類器よりも本手法の方が高い性能を発揮することを明らかにした.</p>

    DOI: 10.11517/pjsai.JSAI2020.0_4P3OS805

  15. Exploring Relevant Parts Between Legal Documents Using Substructure Matching 査読有り

    Komamizu Takahiro, Fujioka Kazuya, Ogawa Yasuhiro, Toyama Katsuhiko

    NEW FRONTIERS IN ARTIFICIAL INTELLIGENCE, JSAI-ISAI 2019   12331 巻   頁: 5 - 19   2020年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)   出版者・発行元:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  

    Legal documents are typically hierarchically structured. This paper focuses on ordinances and rules (OR documents for short) in the local governments, which are designed for social lives under the governments. OR documents are composed of provisions for social lives in various aspects such as healthy development of youths and landscape preservation. OR documents in different local governments share common provisions but also include different provisions depending on their social situations. There is a large demand on helping governmental officers draft OR documents, especially searching “relevant parts” of OR documents. To help drafting OR documents, this paper designs the relevancy of OR documents with two basic measurements; matching ratio and provision commonality. Based on the relevancy, this paper develops a structured document search algorithm for OR documents. Experimental evaluation on real OR documents in Japan demonstrates that the proposed algorithm successfully discovers relevant parts of OR documents.

    DOI: 10.1007/978-3-030-58790-1_1

    Web of Science

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/jsai/jsai2019w.html#KomamizuFOT19

  16. SPARQL with XQuery-based Filtering.

    Takahiro Komamizu

    CoRR   abs/2009.06194 巻   2020年

     詳細を見る

    掲載種別:研究論文(学術雑誌)  

    その他リンク: https://dblp.uni-trier.de/db/journals/corr/corr2009.html#abs-2009-06194

  17. SPARQL with XQuery-based filtering

    Komamizu T.

    CEUR Workshop Proceedings   2721 巻   頁: 69 - 73   2020年

     詳細を見る

    出版者・発行元:CEUR Workshop Proceedings  

    Linked Open Data (LOD) has been proliferated over various domains, however, there are still lots of open data in various format other than RDF. Document-centric XML data are such open data that are connected with entities in LOD as supplemental documents for these entities. To utilize document-centric XML data linked from entities in LOD, in this paper, a SPARQL-based seamless access method on RDF and XML data is proposed. In particular, an extension to SPARQL, XQueryFILTER, which enables XQuery as a filter in SPARQL is proposed. For efficient query processing of the combination of SPARQL and XQuery, a query optimization is proposed. Experimental scenarios using real-world data showcase the effectiveness of XQueryFILTER and optimization efficiency.

    Scopus

  18. MUEnsemble: Multi-ratio Undersampling-Based Ensemble Framework for Imbalanced Data

    Komamizu Takahiro, Uehara Risa, Ogawa Yasuhiro, Toyama Katsuhiko

    DATABASE AND EXPERT SYSTEMS APPLICATIONS, DEXA 2020, PT II   12392 巻   頁: 213 - 228   2020年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  

    Class imbalance is commonly observed in real-world data, and it is still problematic in that it hurts classification performance due to biased supervision. Undersampling is one of the effective approaches to the class imbalance. The conventional undersampling-based approaches involve a single fixed sampling ratio. However, different sampling ratios have different preferences toward classes. In this paper, an undersampling-based ensemble framework, MUEnsemble, is proposed. This framework involves weak classifiers of different sampling ratios, and it allows for a flexible design for weighting weak classifiers in different sampling ratios. To demonstrate the principle of the design, in this paper, three quadratic weighting functions and a Gaussian weighting function are presented. To reduce the effort required by users in setting parameters, a grid search-based parameter estimation automates the parameter tuning. An experimental evaluation shows that MUEnsemble outperforms undersampling-based methods and oversampling-based state-of-the-art methods. Also, the evaluation showcases that the Gaussian weighting function is superior to the fundamental weighting functions. In addition, the parameter estimation predicted near-optimal parameters, and MUEnsemble with the estimated parameters outperforms the state-of-the-art methods.

    DOI: 10.1007/978-3-030-59051-2_14

    Web of Science

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/dexa/dexa2020-2.html#KomamizuUOT20

  19. Japanese Mistakable Legal Term Correction using Infrequency-aware BERT Classifier" 査読有り

    Takahiro Yamakoshi, Takahiro Komamizu, Yasuhiro Ogawa, Katsuhiko Toyama

    the 3rd Annual Workshop on Applications of Artificial Intelligence in the Legal Industry (LegalAI 2019)     頁: 4342-4351   2019年12月

     詳細を見る

    記述言語:英語  

  20. Japanese Mistakable Legal Term Correction using Infrequency-aware BERT Classifier Matching 査読有り

    Takahiro Yamakoshi, Takahiro Komamizu, Yasuhiro Ogawa, Katsuhiko Toyama

    Proc. 3rd Annual Workshop on Applications of Artificial Intelligence in the Legal Industry     頁: - - 4351   2019年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)   出版者・発行元:Proceedings - 2019 IEEE International Conference on Big Data, Big Data 2019  

    We propose a method that assists legislative drafters in locating inappropriate legal terms in Japanese statutory sentences and suggests corrections. We focus on sets of mistakable legal terms whose usages are defined in legislation drafting rules. Our method predicts suitable legal terms using a classifier based on a BERT (Bidirectional Encoder Representations from Transformers) model. We apply three techniques in training the BERT classifier, specifically, preliminary domain adaptation, repetitive soft undersampling, and classifier unification. These techniques cope with two levels of infrequency: legal term-level infrequency that causes class imbalance and legal term set-level infrequency that causes underfitting. Concretely, preliminary domain adaptation improves overall performance by providing prior knowledge of statutory sentences, repetitive soft undersampling improves performance on infrequent legal terms without sacrificing performance on frequent legal terms, and classifier unification improves performance on infrequent legal term sets by sharing common knowledge among legal term sets. Our experiments show that our classifier outperforms conventional classifiers using Random Forest or a language model, and that all three training techniques contribute to performance improvement.

    DOI: 10.1109/BigData47090.2019.9006511

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/bigdataconf/bigdataconf2019.html#YamakoshiKOT19

  21. Exploring Relevant Parts between Legal Documents using Substructure Matching 査読有り

    Takahiro Komamizu, Kazuya Fujioka, Yasuhiro Ogawa, Katsuhiko Toyama

    the Thirteenth International Workshop on Juris-informatics (JURISIN 2019)     頁: 16-28   2019年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

  22. 言い換えによる自然言語-SPARQL対訳コーパスの拡張

    李偉嘉, 小川泰弘, 駒水孝裕, 外山勝彦

    第17回情報学ワークショップ論文集     頁: -   2019年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  23. Analyzing Japanese Law History through Modeling Multi-versioned Entity 査読有り

    Takahiro Komamizu, Yushi Uchida, Yasuhiro Ogawa, Katsuhiko Toyama

    the 2nd International Workshop on Contextualized Knowledge Graphs (CKG 2019)     頁: -   2019年10月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

  24. 利用規約中の不公平文の自動検出

    青山恵子, 小川泰弘, 駒水孝裕, 外山勝彦

    第15回テキストアナリティクス・シンポジウム NLC2019-8(2019-9)     頁: 1-6   2019年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  25. Thai Legal Term Correction using Random Forests with Outside-the-sentence Features 査読有り

    Takahiro Yamakoshi, Vee Satayamas, Hutchatai Chanlekha, Yasuhiro Ogawa, Takahiro Komamizu, Asanee Kawtrakul, Katsuhiko Toyama

    the 33rd Pacific Asia Conference on Language, Information and Computation (PACLIC 33)     頁: 161-170   2019年9月

     詳細を見る

    記述言語:英語  

  26. 弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク 査読有り

    植原 リサ, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    第12回Webとデータベースに関するフォーラム     頁: 81-84   2019年9月

     詳細を見る

    記述言語:日本語  

  27. 共通BERT分類器による紛らわしい法令用語の校正

    山腰貴大, 駒水孝裕, 小川泰弘, 外山勝彦

    言語処理学会NLP若手の会第14回シンポジウム     頁: -   2019年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  28. nagoy Team's Summarization System at the NTCIR-14 QA-Lab PoliInfo 査読有り

    Yasuhiro Ogawa, Michiaki Satou, Takahiro Komamizu, Katsuhiko Toyama

    the Fourteenth NTCIR conference (NTCIR-14) , Revised Selected Papers     頁: 110-121   2019年6月

     詳細を見る

    記述言語:英語  

  29. 法律の要約のためのランダムフォレストを用いた重要文抽出

    小川泰弘, 佐藤充晃, 駒水孝裕, 外山勝彦

    人工知能学会全国大会(第33回)論文集   JSAI2019 巻 ( 0 ) 頁: 4E2OS7a02 - 4E2OS7a02   2019年6月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)   出版者・発行元:一般社団法人 人工知能学会  

    本研究の目標は,日本法令の要約を提供することである.そのためにランダムフォレストによる重要文抽出に基づく自動要約を提案する. 従来の自動要約に関する研究においては,原文書の情報のみが用いられてきた.近年では機械学習に基づく手法なども提案されている. しかし,そうした機械学習において利用される学習データの量は,特に日本語においては,充分でなかった. それに対し,本研究の法令の要約においては,政府が作成する「法令のあらまし」を利用することにより,この問題を解決する. さらに,従来利用されてきた決定木やSVMを使った手法に代えて,ランダムフォレストを用いた重要文抽出を提案し,その性能が従来手法を上回ることを示す. 本論文の貢献は,従来よりもサイズの大きな要約用コーパスを作成した点と,重要文抽出におけるランダムフォレストの有効性を確認した点にある.

    DOI: 10.11517/pjsai.jsai2019.0_4e2os7a02

    CiNii Research

  30. Detecting Communities and Correlated Attribute Clusters on Multi-Attributed Graphs 査読有り

    Ito Hiroyoshi, Komamizu Takahiro, Amagasa Toshiyuki, Kitagawa Hiroyuki

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS   E102D 巻 ( 4 ) 頁: 810 - 820   2019年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:IEICE Transactions on Information and Systems  

    Multi-attributed graphs, in which each node is characterized by multiple types of attributes, are ubiquitous in the real world. Detection and characterization of communities of nodes could have a significant impact on various applications. Although previous studies have attempted to tackle this task, it is still challenging due to difficulties in the integration of graph structures with multiple attributes and the presence of noises in the graphs. Therefore, in this study, we have focused on clusters of attribute values and strong correlations between communities and attribute-value clusters. The graph clustering methodology adopted in the proposed study involves Community detection, Attribute-value clustering, and deriving Relationships between communities and attribute-value clusters (CAR for short). Based on these concepts, the proposed multi-attributed graph clustering is modeled as CAR-clustering. To achieve CAR-clustering, a novel algorithm named CARNMF is developed based on non-negative matrix factorization (NMF) that can detect CAR in a cooperative manner. Results obtained from experiments using real-world datasets show that the CARNMF can detect communities and attribute-value clusters more accurately than existing comparable methods. Furthermore, clustering results obtained using the CARNMF indicate that CARNMF can successfully detect informative communities with meaningful semantic descriptions through correlations between communities and attribute-value clusters.

    DOI: 10.1587/transinf.2018DAP0022

    Web of Science

    Scopus

    CiNii Research

  31. Japanese Mistakable Legal Term Correction using Infrequency-aware BERT Classifier

    Yamakoshi Takahiro, Komamizu Takahiro, Ogawa Yasuhiro, Toyama Katsuhiko

    2019 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA)     頁: 4342 - 4351   2019年

     詳細を見る

  32. Analyzing Japanese law history through modeling multi-versioned entity

    Komamizu T., Uchida Y., Ogawa Y., Toyama K.

    CEUR Workshop Proceedings   2599 巻   2019年

     詳細を見る

    出版者・発行元:CEUR Workshop Proceedings  

    As law is a blueprint of a society and is changed over time as social environments changed, analyzing histories (change provenances) of laws can reveal important facts such as legislative facts and critical events for the society. Linked Open Data (LOD) has emerged as a preferred method for publishing and sharing open data, however, there is an ontological barrier for publishing law history data as LOD. To break through the barrier, this paper proposes an ontology for law history data of the Japanese statute law. The ontology is inspired from PROV-O and SIOC ontologies. The LOD dataset based on the proposed ontology enables wide variety of analyses on the law history data by simple SPARQL queries. The analyses include simple search, visualization, temporal analysis, data mining, etc. This paper displays parts of the analyses which indicate several legislative facts behind changes of laws. The analyses demonstrate the proposed ontology and LOD dataset are useful for legal data analysis. The proposed ontology is comparable with ELI (European Legislation Identifier) which is designed for EU laws, this paper thus discusses the comparability and future directions of the proposed ontology.

    Scopus

  33. Thai legal term correction using random forests with outside-the-sentence features

    Yamakoshi T., Satayamas V., Chanlekha H., Ogawa Y., Komamizu T., Kawtrakul A., Toyama K.

    Proceedings of the 33rd Pacific Asia Conference on Language, Information and Computation, PACLIC 2019     頁: 279 - 287   2019年

     詳細を見る

    出版者・発行元:Proceedings of the 33rd Pacific Asia Conference on Language, Information and Computation, PACLIC 2019  

    We propose a method for finding and correct- ing misused Thai legal terms in Thai statu- tory sentences. Our method predicts legal terms using Random Forest classifiers, each of which is optimized for each set of similar legal terms. Each classifier utilizes outside- the-sentence features, namely, promulgation year, title keywords, and section keywords of statutes, in addition to words adjacent to the targeted legal term. Our experiment shows that our method outperformed not only a Ran- dom Forest method without the outside-the- sentence features, but also BERT (Bidirec- tional Encoder Representations from Trans- formers), a powerful language representation model, in overall accuracy.

    Scopus

  34. nagoy Team's Summarization System at the NTCIR-14 QA Lab-PoliInfo 査読有り

    Yasuhiro Ogawa, Michiaki Satou, Takahiro Komamizu, Katsuhiko Toyama

    Post-conference Proceedings of the 14th NTCIR Conference on Evaluation of Information Access Technologies   11966 LNCS 巻   頁: to appear - 121   2019年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(その他学術会議資料等)   出版者・発行元:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  

    The nagoy team participated in the NTCIR-14 QA Lab-PoliInfo’s summarization subtask. This paper describes our summarization system for assembly member speeches using random forest classifiers. Since we encountered an imbalance in the data, we were unable to achieve good results in this subtask when training on all data. To solve this problem, we developed a new summarization system that applies multiple random forest classifiers training on different-sized data sets step by step. As a result, our system achieved good performance, especially in the evaluation by ROUGE scores. In this paper, we also compare our system with a single random forest classifier using probability.

    DOI: 10.1007/978-3-030-36805-0_9

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/ntcir/ntcir2019.html#OgawaSKT19

  35. Graph Analytical Re-ranking for Entity Search

    Komamizu T.

    CEUR Workshop Proceedings   2482 巻   2019年

     詳細を見る

    出版者・発行元:CEUR Workshop Proceedings  

    Entity search is a fundamental task in Linked Data (LD). The task is, given a keyword search query, to retrieve a set of entities in LD which are relevant to the query. The state-of-the-art approaches for entity search are based on information retrieval technologies such as TF-IDF vectorization and ranking models. This paper examines the approaches by applying a traditional evaluation metrics, recall@k, and shows ranking qualities still room left for improvements. In order to improve the ranking qualities, this paper explores possibilities of graph analytical methods. LD is regarded as a large graph, graph analytical approaches are therefore appropriate for this purpose. Since query-based graph analytical approaches fit to entity search tasks, this paper proposes a personalized PageRank-based re-ranking method, PPRSD (Personalized PageRank based Score Distribution), for retrieved results by the state-of-the-art. The experimental evaluation recognizes improvements but its results are not satisfactory, yet. For further improvements, this paper reports investigations about relationship between queries and entities in terms of path lengths on the graph, and discusses future directions for graph analytical approaches.

    Scopus

  36. Graph Analytical Re-ranking for Entity Search

    Takahiro Komamizu

    Proceedings of the 1st International Workshop on EntitY REtrieval (EYRE 2018)     頁: (to appear)   2018年10月

     詳細を見る

    記述言語:英語  

  37. Learning Interpretable Entity Representation in Linked Data 査読有り

    Takahiro Komamizu

    Proc. the 29th International Conference on Database and Expert Systems Applications     頁: 153-168   2018年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

  38. Community Detection and Correlated Attribute Cluster Analysis on Multi-Attributed Graphs 査読有り

    Hiroyoshi Ito, Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 2nd International workshop on Data Analytics solutions for Real-LIfe APplications (DARLI-AP 2018) co-located with the 21st International Conference on Extending Database Technology (EDBT 2018)     2018年3月

     詳細を見る

    記述言語:英語  

    DOI: 2-9

  39. Network-Word Embedding for Dynamic Text Attributed Networks 査読有り

    Hiroyoshi Ito, Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 6th International Workshop on Semantic Computing for Social Networks and Organization Sciences (SCSN 2018) co-located with the 12th IEEE International Conference on Semantic Computing (ICSC 2018)     2018年1月

     詳細を見る

    記述言語:英語  

    DOI: 334-339

  40. Analytical toolbox for smart city applications: Garbage collection log use case 査読有り

    Takahiro Komamizu, Jin Nakazawa, Toshiyuki Amagasa, Hiroyuki Kitagawa, Hideyuki Tokuda

    Proceedings - 2017 IEEE International Conference on Big Data, Big Data 2017   2018- 巻   頁: 4105 - 4110   2018年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Institute of Electrical and Electronics Engineers Inc.  

    Analyzing and feeding back the results on real-world services are important missions in the Big Data era to realize smart city. However, analyzing real-world data is still challenging because of dirtiness of data and large variety of analytic requirements. To cope with the challenges, this paper proposes and develops an analytical toolbox for smart city applications. The analytical toolbox consists of three phases: preparation, analysis, and visualization. The preparation phase deals with the dirtiness of the data by including fundamental data cleansing techniques and data integration techniques. The analysis phase is responsible for ETL (extract, transform and load) process and analytical query processing from the next phase. The visualization phase deals with analytical requirements from users and visualization of analytical results. This paper showcases a real-world use case of the proposed analytical toolbox. The use case is now open in public with help of Fujisawa city, Japan, and this fact indicates that the proposed analytical toolbox is feasible for real-world data analysis and feeding back to citizens.

    DOI: 10.1109/BigData.2017.8258429

    Scopus

  41. Implicit order join: Joining log data with property data by discovering implicit order-oriented keys with human assistance 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proceedings - 2017 IEEE International Conference on Big Data, Big Data 2017   2018- 巻   頁: 4400 - 4406   2018年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Institute of Electrical and Electronics Engineers Inc.  

    Data integration is still laboursome task when integrating data are not consistently managed. Such inconsistency can happen easily in real-world situations, such as properties of objects are managed by a central organization and trajectories (or logs) of the objects are recorded by other peripheral organizations. This paper deals with a case of missing ordering information. Integrating property data and log data without ordering information causes duplicated results. In order to solve this problem, this paper proposes a join algorithm, called implicit order join, which discovers implicit ordering information from both property data and log data with help of partial true integrated results from human assistance. With the discovered ordering information, the implicit order join enables to integrate the property data and log data. In order to discover the implicit ordering information, ordering correlation between attribute sequences of property data and log data should be found from comprehensive examination of possible attribute sequence pairs. The potential number of sequence pairs is as high as factorial order of the number of attributes. Therefore, this paper develops a heuristic approach to prune unnecessary examinations based on ordering dependency between attribute sequences. Experimental evaluation in this paper indicates that implicit order join can reduce 77% labouring tasks for integration and the pruning method reduces the number of attribute sequences in orders of magnitude.

    DOI: 10.1109/BigData.2017.8258474

    Scopus

  42. Japanese Legal Term Correction Using Random Forests 査読有り

    Yamakoshi Takahiro, Komamizu Takahiro, Ogawa Yasuhiro, Toyama Katsuhiko

    LEGAL KNOWLEDGE AND INFORMATION SYSTEMS (JURIX 2018)   313 巻   頁: 161 - 170   2018年

     詳細を見る

    記述言語:英語   出版者・発行元:Frontiers in Artificial Intelligence and Applications  

    We propose a method that assists legislation officers in finding inappropriate Japanese legal terms in Japanese statutory sentences and suggests corrections. In particular, we focus on sets of similar legal terms whose usages are defined in legislation drafting rules. Our method predicts suitable legal terms in statutory sentences using Random Forest classifiers, each of which is optimized for each set of similar legal terms. Our experiment shows that our method outperformed existing modern word prediction methods using neural language models.

    DOI: 10.3233/978-1-61499-935-5-161

    Web of Science

    Scopus

  43. Learning Interpretable Entity Representation in Linked Data

    Komamizu Takahiro

    DATABASE AND EXPERT SYSTEMS APPLICATIONS, DEXA 2018, PT I   11029 巻   頁: 153 - 168   2018年

     詳細を見る

    掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  

    Linked Data has become a valuable source of factual records. However, because of its simple representations of records (i.e., a set of triples), learning representations of entities is required for various applications such as information retrieval and data mining. Entity representations can be roughly classified into two categories; (1) interpretable representations, and (2) latent representations. Interpretability of learned representations is important for understanding relationship between two entities, like why they are similar. Therefore, this paper focuses on the former category. Existing methods are based on heuristics which determine relevant fields (i.e., predicates and related entities) to constitute entity representations. Since the heuristics require laboursome human decisions, this paper aims at removing the labours by applying a graph proximity measurement. To this end, this paper proposes RWRDoc, an RWR (random walk with restart)-based representation learning method which learns representations of entities by weighted combinations of minimal representations of whole reachable entities w.r.t. RWR. Comprehensive experiments on diverse applications (such as ad-hoc entity search, recommender system using Linked Data, and entity summarization) indicate that RWRDoc learns proper interpretable entity representations.

    DOI: 10.1007/978-3-319-98809-2_10

    Web of Science

    Scopus

    その他リンク: https://dblp.uni-trier.de/db/conf/dexa/dexa2018-1.html#Komamizu18

  44. CROISSANT: Centralized Relational Interface for Web-scale SPARQL Endpoints 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 19th International Conference on Information Integration and Web-based Applications & Services (iiWAS2017)     2017年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 284-288

  45. SOLA: Stream OLAP-based Analytical Framework for Roadway Maintenance 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Salman Ahmed Shaikh, Hiroaki Shiokawa, Hiroyuki Kitagawa

    Proc. the 9th International Conference on Management of Digital EcoSystems (MEDES 2017)     2017年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 35-42

  46. GitHubとStack Overflowの開発者の活動記録を併用したリポジトリ推薦 査読有り

    永野 真知, 早瀬 康裕, 駒水 孝裕, 北川 博之

    ソフトウェアエンジニアリングシンポジウム 2017論文集     2017年8月

     詳細を見る

    記述言語:日本語  

    DOI: 138-145

  47. FORK: Feedback-Aware ObjectRank-Based Keyword Search over Linked Data 査読有り

    Takahiro Komamizu, Sayami Okumura, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   10648 巻   頁: 58 - 70   2017年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer Verlag  

    Ranking quality for keyword search over Linked Data (LD) is crucial when users look for entities from LD, since datasets in LD have complicated structures as well as much contents. This paper proposes a keyword search method, FORK, which ranks entities in LD by ObjectRank, a well-known link-structure analysis algorithm that can deal with different types of nodes and edges. The first attempt of applying ObjectRank to LD search reveals that ObjectRank with inappropriate settings gives worse ranking results than PageRank which is equivalent to ObjectRank with all the same authority transfer weights. Therefore, deriving appropriate authority transfer weights is the most important issue for encouraging ObjectRank in LD search. FORK involves a relevance feedback algorithm to modify the authority transfer weights according with users’ relevance judgements for ranking results. The experimental evaluation of ranking qualities using an entity search benchmark showcases the effectiveness of FORK, and it proves ObjectRank is more feasible raking method for LD search than PageRank and other comparative baselines including information retrieval techniques and graph analytic methods.

    DOI: 10.1007/978-3-319-70145-5_5

    Scopus

  48. Exploring identical users on GitHub and stack overflow 査読有り

    Takahiro Komamizu, Yasuhiro Hayase, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proceedings of the International Conference on Software Engineering and Knowledge Engineering, SEKE     頁: 584 - 589   2017年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Knowledge Systems Institute Graduate School  

    Analyzing behaviours of developers in different platforms (in particular, GitHub and Stack Overflow in this paper) can reveal interesting facts related to development activities. There are only few datasets for analysing crossplatform user behaviours, especially across GitHub and Stack Overflow. Users on GitHub and Stack Overflow are identifiable by equivalences of email addresses. In order to increase the number of identifiable users on these datasets, this paper retrieves potentially identifiable users between GitHub and Stack Overflow not relying only on email addresses. This paper employs a classification-based link prediction, which design the user identification problem as a link prediction problem on the bipartite graph consisting of users of GitHub and those of Stack Overflow. With the identification method, this paper generates a probabilistic dataset containing pairs of users with probabilities (or confidences). This paper, as well, publishes the identification tool in order to enable further data generation on appearing datasets of GitHub, Stack Overflow and others. The generated dataset and tool are highly helpful to accelerate researches on mining software repositories.

    DOI: 10.18293/SEKE2017-109

    Scopus

  49. Towards Real-time Analysis of Smart City Data: A Case Study on City Facility Utilizations 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Salman Ahmed Shaikh, Hiroaki Shiokawa, Hiroyuki Kitagawa

    Proc. the 14th IEEE International Conference on Smart City (SmartCity 2016)     頁: 1357-1364   2016年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1109/HPCC-SmartCity-DSS.2016.0192

  50. Interleaving Clustering of Classes and Properties for Disambiguating Linked Data 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 18th International Conference on Asia-Pacific Digital Libraries (ICADL 2016)     2016年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 251-256

  51. Visual Spatial-OLAP for Vehicle Recorder Data on Micro-sized Electric Vehicles 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 20th International Database Engineering & Applications Symposium (IDEAS 2016)     頁: 358-363   2016年7月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1145/2938503.2938532

  52. H-SPOOL: A SPARQL-based ETL Framework for OLAP over Linked Data with Dimension Hierarchy Extraction 招待有り 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

      12 巻 ( 3 ) 頁: 359-378   2016年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1108/IJWIS-03-2016-0014

  53. SPOOL: A SPARQL-based ETL Framework for OLAP over Linked Data 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 17th International Conference on Information Integration and Web-based Applications & Services (iiWAS 2015)   ( 49 ) 頁: 1-10   2015年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1145/2837185.2837230

  54. Facet-value Extraction Scheme from Textual Contents in XML Data 招待有り 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

      11 巻 ( 3 ) 頁: 270-290   2015年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1108/IJWIS-04-2015-0012

  55. Extracting Facets from Textual Contents for Faceted Search over XML Data 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 16th International Conference on Information Integration and Web-based Applications & Services (iiWAS 2014)     頁: 420-429   2014年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1145/2684200.2684294

  56. Frequent-Pattern based Facet Extraction from Graph Data 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 17th International Conference on Network-Based Information Systems (NBiS 2014)     頁: 318-323   2014年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1109/NBiS.2014.77

  57. A Scheme of Automated Object and Facet Extraction for Faceted Search over XML Data 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 18th International Database Engineering & Applications Symposium (IDEAS 2014)     頁: 338-341   2014年7月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1145/2628194.2628241

  58. A Scheme of Fragment-Based Faceted Image Search 査読有り

    Takahiro Komamizu, Mariko Kamie, Kazuhiro Fukui, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 23rd International Conference on Database and Expert Systems Applications (DEXA 2012)     頁: 450-457   2012年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1007/978-3-642-32597-7_40

  59. Faceted Navigation Framework for XML Data 招待有り 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

      8 巻 ( 4 ) 頁: 348-370   2012年8月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1108/17440081211282865

  60. A Framework of Faceted Navigation for XML Data 査読有り

    Takahiro Komamizu, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 13th International Conference on Information Integration and Web-based Applications & Services (iiWAS 2011)     頁: 28-35   2011年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語  

    DOI: 10.1145/2095536.2095544

▼全件表示

MISC 4

  1. 法令間の関係を利用したモビリティ関連法令検索に関する一考察

    駒水 孝裕, 外山 勝彦, 河口 信夫, 佐野 智也  

    人工知能学会第二種研究会資料2022 巻 ( SWO-057 ) 頁: 04   2022年8月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    本稿では,法令間の関係を用いた法令検索について述べる.特に,モビリティに関連する法令を対象として,その検索方法および検索結果を示す.法令データのオープンデータ化は徐々に進みつつある.これまでに,法令オープンデータのハブとなる法令の Linked Open Data (LOD) としてのデータ化をはじめに,種々の法令文書,国会での会議録や議案に関するデータのオープン化が進められてきた.一方で,その応用については十分に研究されていない.本稿では,モビリティを題材に,関連する法令を検索する方法について示す.具体的には,法令に関する LOD から法令間の関係を抽出し,グラフにおける検索技術であるPersonalized PageRank を用いて,関連法令を検索する.この検索を通して,現状の法令オープンデータの限界を明らかにするとともに,今後の展開について議論する.

    DOI: 10.11517/jsaisigtwo.2022.swo-057_04

    CiNii Research

  2. The Web Conference 2020 参加報告

    駒水, 孝裕  

    情報処理61 巻 ( 10 ) 頁: 1078 - 1079   2020年9月

     詳細を見る

    記述言語:日本語  

    CiNii Books

  3. 法令沿革 LOD 構築のための DBpedia における法令エンティティの同定

    駒水 孝裕, 小川 泰弘, 外山 勝彦  

    人工知能学会第二種研究会資料2020 巻 ( SWO-051 ) 頁: 06   2020年7月

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    本稿では,法令沿革オントロジーの設計および DBpedia 中の法令エンティティへの紐付けについて述べる.社会のさまざまな事柄が法令に関係しているにもかかわらず,日本の法令に関するデータのオープン化はほとんど進んでいない.特に,再利用性の高い LOD (Linked Open Data) としてのオープンデータはほとんどない.本稿で提案する法令沿革オントロジーは次の2点を達成するために設計されたオントロジーである.(1) 日本の法令を網羅できる.(2) ある時点で有効であった法令(法令バージョン)を特定できる.前者は,法令に関するオープンデータの LOD としての公開を促進することがねらいである.後者は,法令における不遡及の原則や経過措置などの理由から必要である.法令の内容の変更は,その変更内容を記述する法令を施行することにより実現される.このような法令の内容変更の履歴を法令の沿革と呼ぶ.本稿では,法律を対象に設計した先行研究のオントロジーを拡張し,法律以外の法令の沿革も扱えるようにした.拡張したオントロジーをもとに,国立国会図書館・日本法令索引からデータを取得し,法令沿革 LOD を構築した.構築した LOD は,3,412,748 個のトリプルで構成され,106,341 法令を含む.外部ドメインのLODと接続するために,DBpedia 内の法令エンティティとの紐付けを行った.法令名を用いた単純な紐付けにより,99%の適合率,96%の再現率が達成可能であることを明らかにした.

    DOI: 10.11517/jsaisigtwo.2020.swo-051_06

    CiNii Research

  4. 事前学習モデルBERTによる法令用語の校正

    山腰 貴大, 駒水 孝裕, 小川 泰弘, 外山 勝彦  

    人工知能学会全国大会論文集JSAI2020 巻 ( 0 ) 頁: 4P3OS805 - 4P3OS805   2020年

     詳細を見る

    記述言語:日本語   出版者・発行元:一般社団法人 人工知能学会  

    法令文書には,「者」「物」「もの」や「規定」「規程」のように互いに類似している法令用語が出現する.このような法令用語は,法制執務(法令の起草・制定・改廃など法令文書の作成・管理に関する業務)の慣習や規則によって使用法とともに定義されている.法令において,これらの法令用語はそれに従い,厳密に書き分ける必要がある.契約書や約款などの広義の法令文書においても,誤解を防ぐために,法令に準じて正しく書き分けることが望ましい.そこで,本研究では,与えられた法令文から法令用語を検出し,誤用と思われるものに対してその修正案を出力することにより,法令文書の作成を支援する手法を提案する.本手法では,このタスクを選択肢付き穴埋め問題とみなし,分類器により解決する.分類器は,一般文によって事前学習したBERTモデルから構築する.このとき,(1)法令文によるドメイン適応,(2)訓練データのアンダーサンプリング,(3)分類器の統一の三つの工夫を施すことにより性能向上を図る.実験の結果,ランダムフォレストやニューラル言語モデルによる分類器よりも本手法の方が高い性能を発揮することを明らかにした.

    DOI: 10.11517/pjsai.jsai2020.0_4p3os805

    CiNii Research

講演・口頭発表等 32

  1. 法令沿革オントロジーの設計

    内田 勇志, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    第47回人工知能学会セマンティックウェブとオントロジー(SWO)研究会 

     詳細を見る

    開催年月日: 2019年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  2. グラフ構造を利用したエンティティ検索

    駒水 孝裕

    第11回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2019年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  3. 部分構造を用いた類似例規の検索

    藤岡 和弥, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    第11回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2019年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  4. nagoy Team’s Summarization System at the NTCIR-14 QA Lab-PoliInfo

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    DOI: 10.1007/978-3-030-36805-0_9

    Scopus

  5. 並列構造の分割による法令文の読解性向上

    青山 恵子, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    平成30年度 電気・電子・情報関係学会 東海支部連合大会 

     詳細を見る

    開催年月日: 2018年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  6. ランダムフォレストによる法令用語の校正

    山腰 貴大, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    平成30年度 電気・電子・情報関係学会 東海支部連合大会 

     詳細を見る

    開催年月日: 2018年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  7. ニューラルモデルと翻訳メモリを併用した機械翻訳

    重野 泰和, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    平成30年度 電気・電子・情報関係学会 東海支部連合大会 

     詳細を見る

    開催年月日: 2018年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  8. 分類器を用いた法令要約に利用する法令文の自動抽出

    佐藤 充晃, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    平成30年度 電気・電子・情報関係学会 東海支部連合大会 

     詳細を見る

    開催年月日: 2018年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  9. 単語の分散表現を用いた法令用語間の関係の獲得

    植原 リサ, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    平成30年度 電気・電子・情報関係学会 東海支部連合大会 

     詳細を見る

    開催年月日: 2018年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  10. Zipf の法則は例規文の出現数においても成立する

    藤岡 和弥, 駒水 孝裕, 小川 泰弘, 外山 勝彦

    平成30年度 電気・電子・情報関係学会 東海支部連合大会 

     詳細を見る

    開催年月日: 2018年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  11. グラフ集約に基づくRDFデータに対するOLAP分析

    仁木 美来, 天笠 俊之, 駒水 孝裕, 北川 博之

    情報処理学会第80回全国大会 

     詳細を見る

    開催年月日: 2018年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  12. ノードがテキスト情報を持つ動的ネットワークにおけるノードと単語の分散表現学習

    伊藤 寛祥, 駒水 孝裕, 天笠 俊之, 北川 博之

    第10回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2018年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  13. ゴミ減量G1グランプリ 招待有り

    駒水 孝裕

    第1回 地域IoTと情報力シンポジウム 

     詳細を見る

    開催年月日: 2017年4月

    記述言語:日本語   会議種別:ポスター発表  

    国名:日本国  

  14. GitHubとStack Overflowにおけるユーザ行動の統一的な分析

    永野 真知, 早瀬 康裕, 駒水 孝裕, 北川 博之

    情報処理学会第79回全国大会 

     詳細を見る

    開催年月日: 2017年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  15. ノードが複数の属性を持つグラフにおけるコミュニティ検出

    伊藤 寛祥, 駒水 孝裕, 天笠 俊之, 北川 博之

    第9回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2017年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  16. XMLデータに対するファセット検索のためのファセット抽出の自動化

    駒水 孝裕, 天笠 俊之, 北川 博之

    第13回情報科学技術フォーラム 

     詳細を見る

    開催年月日: 2014年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  17. グラフデータに対するファセット探索のための頻出パターンを利用したオブジェクト抽出手法

    駒水 孝裕, 天笠 俊之, 北川 博之

    第4回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2012年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  18. データ工学分野における技術と研究 招待有り

    駒水 孝裕

    科目「ICT活用」 

     詳細を見る

    開催年月日: 2012年2月

    記述言語:日本語   会議種別:公開講演,セミナー,チュートリアル,講習,講義等  

    国名:日本国  

  19. ソフトウェア部品検索に適したファセット探索の一考察

    駒水 孝裕, 早瀬 康裕, 北川 博之

    ソフトウェアサイエンス研究会 

     詳細を見る

    開催年月日: 2011年10月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  20. FACTUS: Faceted Twitter User Search Using Twitter Lists 国際会議

    Takahiro Komamizu, Yuto Yamaguchi, Toshiyuki Amagasa, Hiroyuki Kitagawa

    Proc. the 12th International Conference on Web Information System Engineering (WISE 2011) 

     詳細を見る

    開催年月日: 2011年10月

    記述言語:英語   会議種別:ポスター発表  

    国名:オーストラリア連邦  

  21. XMLデータに対するファセット検索のユーザビリティ評価

    駒水 孝裕, 天笠 俊之, 北川 博之

    情報処理学会第73回全国大会 

     詳細を見る

    開催年月日: 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  22. キーワード検索が可能なXMLデータに対するファセット探索

    駒水 孝裕, 天笠 俊之, 北川 博之

    第3回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2011年2月 - 2011年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  23. 異種XMLデータに対するファセット検索システムの性能評価

    駒水 孝裕, 天笠 俊之, 北川 博之

    情報処理学会第72回全国大会 

     詳細を見る

    開催年月日: 2010年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  24. 異種XMLデータに対するファセット検索における多様な検索

    駒水 孝裕, 天笠 俊之, 北川 博之

    第2回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2010年2月 - 2010年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  25. 異種XMLデータに対するファセット検索手法の提案

    駒水 孝裕, 天笠 俊之, 北川 博之

    デジタルドキュメント研究会 

     詳細を見る

    開催年月日: 2009年9月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  26. XMLデータに対するファセットナビゲーションのためのフレームワークFoXの提案

    駒水 孝裕, 天笠 俊之, 北川 博之

    第1回データ工学と情報マネジメントに関するフォーラム 

     詳細を見る

    開催年月日: 2009年3月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  27. Analyzing Japanese law history through modeling multi-versioned entity

    Komamizu T.

    CEUR Workshop Proceedings  2019年  CEUR Workshop Proceedings

     詳細を見る

  28. Thai legal term correction using random forests with outside-the-sentence features

    Yamakoshi T.

    Proceedings of the 33rd Pacific Asia Conference on Language, Information and Computation, PACLIC 2019  2019年  Proceedings of the 33rd Pacific Asia Conference on Language, Information and Computation, PACLIC 2019

     詳細を見る

  29. SPARQL with XQuery-based filtering

    Komamizu T.

    CEUR Workshop Proceedings  2020年  CEUR Workshop Proceedings

     詳細を見る

  30. Muensemble: Multi-ratio undersampling-based ensemble framework for imbalanced data

    Komamizu T.

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  2020年  Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)

     詳細を見る

  31. Learning Interpretable Entity Representation in Linked Data

    Komamizu T.

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  2018年  Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)

     詳細を見る

  32. Exploring Relevant Parts Between Legal Documents Using Substructure Matching

    Komamizu T.

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)  2020年  Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)

     詳細を見る

▼全件表示

共同研究・競争的資金等の研究課題 1

  1. 公益財団法人 人工知能研究振興財団 研究助成

    2019年1月 - 2020年9月

科研費 6

  1. 言語情報がもつ視覚的性質の分析とそのマルチメディア統合処理への応用

    研究課題/研究課題番号:22H03612  2022年4月 - 2026年3月

    科学研究費助成事業  基盤研究(B)

    井手 一郎, 平山 高嗣, 駒水 孝裕, 川西 康友, 道満 恵介

      詳細を見る

    担当区分:研究分担者 

    いわゆる「セマンティックギャップ」を越えて言語情報と視覚情報を関連付けるための方法論を提案する.従来,視覚情報から言語情報を表現する特徴を抽出する方法論,いわば「視覚情報がもつ言語的性質」の解明について取り組まれてきたのと逆に,「言語情報がもつ視覚的性質」の解明に取り組む.これは従来,高コストの主観評価実験によって定量化されてきたが,画像生成技術を用いたデータ駆動型手法で,これを低コストで定量化する.また,印象の程度に応じて挙動が変化する応用事例を通じて,視覚情報の言語的性質及び言語情報の視覚的性質の両者に基づいてセマンティックギャップを縮小したうえで,マルチメディア統合処理の効果を実証する.

  2. 地方自治体における法情報のDX化と発信

    研究課題/研究課題番号:22H03901  2022年4月 - 2026年3月

    科学研究費助成事業  基盤研究(B)

    小川 泰弘, 木村 泰知, 駒水 孝裕

      詳細を見る

    担当区分:研究分担者 

    近年進められている地方自治体のDX化においては,行政側が住民にサービスを提供するという視点で進められてきた.しかし,自治体の主役は住民であるのだから,住民側が新しいサービスを簡単に要求・実現できるようにすることが真の自治体DXだと本研究では考える.そこで,地方自治体の条例や議会会議録の情報を分かりやすく発信するシステムを開発し,それらの実現を目指す.
    具体的には,条例や会議録の要約システムや,それらの情報を有機的に結合したデータベースを開発し,それらに簡単にアクセスできる仕組みを実現する.

  3. 品質を保証するEnd-to-Endビッグデータ近似処理技術に関する研究

    研究課題/研究課題番号:22H03594  2022年4月 - 2026年3月

    科学研究費助成事業  基盤研究(B)

    石川 佳治, 杉浦 健人, 駒水 孝裕

      詳細を見る

    担当区分:研究分担者 

    近年大いに着目されている近似的問合せのアプローチをビッグデータ処理のワークフロー全体に展開する,End-to-Endの近似的ビッグデータ処理の技術を確立する.コンパクトな要約情報を活用することと,ビッグデータ処理プロセスを通じて近似的データ処理の統合モデルを用いることで,従来型のビッグデータ処理に比べ大幅な速度向上を達成し,システム全体での近似品質の統一的な管理を可能とする.また,近似の品質と処理効率のトレードオフを適切に制御できることが重要であるため,本研究では求められた近似品質を満たすようにビッグデータ処理のワークフローを制御する品質駆動型の近似的データ処理技術を開発する.

  4. 異種オープンデータ活用のためのデータ統合・管理基盤の研究開発

    研究課題/研究課題番号:21H03555  2021年4月 - 2025年3月

    科学研究費助成事業  基盤研究(B)

    駒水 孝裕, 井手 一郎, 石川 佳治, 波多野 賢治

      詳細を見る

    担当区分:研究代表者 

    配分額:17160000円 ( 直接経費:13200000円 、 間接経費:3960000円 )

    オープンデータ化が進み,公開されるデータの種類もテキストからマルチメディアと多様になり,かつそれぞれが Web 上に散在している.そのため,異種データを横断的に利用するには,データを収集し,相互の関連性を構造化することが必要となる.本研究では,Linked Open Data を起点にマルチメディアを含む異種フォーマットのオープンデータ統合・管理するための技術を確立する.
    本年度は,(1) データ統合の際に課題となる属性推定における不均衡性への対処と,(2) テキストデータ処理における``フレーズ''についての一考察を行った.
    (1) データ統合の際に,異なるデータソースに存在する同一のエンティティが異なる情報を属性として持っていることで,データ統合の性能に影響を与えている.望ましい状況としては,両エンティティが同じ属性を持ち,その属性の一致度合いから,エンティティの同一性を判定することである.しかし,世の中のデータがこの望ましい性質を持っていることは稀である.これに対する解決方法として,クラス分類を用いた属性推定である.これは,エンティティのクラスを属性として用いることであり,そのためにエンティティのクラスを分類するモデルを構築する必要がある.このクラス分類において,データの偏りによって分類性能が十分に向上させられない,という問題がある.これを不均衡性問題という.本研究では,これに対する手法として,昨年度に提案したアンダーサンプリングをベースとしたアンサンブル手法に,距離学習と呼ばれる,特徴量の変換手法を組み合わせることで,性能を向上させた.
    (2) (1) と関連し,テキストデータの分類に焦点をあて,分類性能を向上させる方法を模索した.昨今では,サブワードと呼ばれる単位でテキストデータを扱うことが多い.また,テキストデータ分類においては,特定の意味を表すフレーズを明示的に扱うことで,その性能が向上することが知られている.一方で,フレーズの考え方をサブワードの文脈ではほとんど考えられていない.本研究では,サブワードの列を明示的に扱うことがどのような効果をもたらすかについて,検証・考察を行った.具体的には,高頻度のサブワード列をストップワードとして扱い,分類性能の向上に寄与することを示した.
    エンティティ同定のための技術の開発ができており,また,テキストデータとの統合・活用に向けた研究が進められており,概ね順調に進展していると言える.
    今後の推進方策としては,当初計画で扱う予定であった表形式データと画像データの優先順位を入れ替える.これは,当初計画時点よりも画像処理技術が向上しており,データ統合・検索において,優先的に取り組むべきであると判断したためである.

  5. 大規模データ分析のための多視点分析管理システムの研究開発

    2018年4月 - 2021年3月

    科学研究費補助金 

      詳細を見る

    担当区分:研究代表者 

  6. 大規模データ分析のための多視点分析管理システムの研究開発

    研究課題/研究課題番号:18K18056  2018年4月 - 2021年3月

    科学研究費助成事業  若手研究

    駒水 孝裕

      詳細を見る

    担当区分:研究代表者 

    配分額:4160000円 ( 直接経費:3200000円 、 間接経費:960000円 )

    オープンデータ化が推進される中で,公開されたデータを以下に活用するかが未だに課題である.本研究では,複雑に構造化されたデータを効率的に検索する技術,独立に作成されたデータを横断的に扱うために統合する技術を開発した.これらにより,活用のための分析技術を用いるためのデータの抽出が可能となった.また,関連する情報を結びつけることでより高度で精緻な分析が可能となった.
    オープンデータやデジタルトランスフォーメーションが進行している現状において,デジタル化・オープン化したデータを活用することは重要である.一方で,データを作成する組織は別々であることも多く,横断的な活用には障害が残る.本研究では,異なる組織が公開したデータの関連性に基づいたデータ統合や複雑化したデータから必要な情報を一般的な検索方法を用いて検索できるようにした.これらは今後のオープンデータ活用における基礎的な技術である

▼全件表示

 

担当経験のある科目 (本学) 3

  1. 情報工学実験

    2018

  2. 数理科学基礎演習

    2018

  3. データ処理ツール演習

    2018