2024/09/27 更新

写真a

デグチ ダイスケ
出口 大輔
Deguchi Daisuke
所属
大学院情報学研究科 知能システム学専攻 基盤知能情報学 准教授
大学院担当
大学院情報科学研究科
大学院情報学研究科
学部担当
情報学部 コンピュータ科学科
職名
准教授

学位 1

  1. 博士(情報科学) ( 2006年3月   名古屋大学 ) 

研究キーワード 5

  1. コンピュータービジョン

  2. 画像処理

  3. コンピューターグラフィックス

  4. 医用画像処理

  5. パターン認識

研究分野 2

  1. その他 / その他  / 医用システム

  2. その他 / その他  / 知覚情報処理・知能ロボティクス

現在の研究課題とSDGs 2

  1. 実世界センシングにより得られる環境依存情報を活用した環境適応型画像認識に関する研究

  2. 過去と現在の対比による環境適応型画像認識に関する研究

経歴 6

  1. 名古屋大学大学院情報学研究科知能システム学専攻   准教授

    2020年1月 - 現在

      詳細を見る

    国名:日本国

  2. 名古屋大学情報連携統括本部情報戦略室   准教授

    2012年2月 - 2019年12月

      詳細を見る

    国名:日本国

  3. 名古屋大学大学院情報科学研究科   助教

    2008年10月 - 2012年1月

      詳細を見る

    国名:日本国

  4. 名古屋大学大学院工学研究科   研究員

    2006年11月 - 2008年9月

      詳細を見る

    国名:日本国

  5. 名古屋大学大学院情報科学研究科   研究員

    2006年4月 - 2006年10月

      詳細を見る

    国名:日本国

  6. 日本学術振興会   特別研究員(DC2)

    2004年4月 - 2006年3月

      詳細を見る

    国名:日本国

▼全件表示

学歴 3

  1. 名古屋大学   情報科学研究科   メディア科学専攻

    2003年4月 - 2006年3月

      詳細を見る

    国名: 日本国

  2. 名古屋大学   工学研究科   情報工学専攻

    2001年4月 - 2003年3月

      詳細を見る

    国名: 日本国

  3. 名古屋大学   工学部   電気電子情報工学科

    1997年4月 - 2001年3月

      詳細を見る

    国名: 日本国

所属学協会 3

  1. IEEE

  2. 電子情報通信学会

  3. 情報処理学会

委員歴 20

  1. 画像の認識・理解シンポジウム MIRU2023   実行委員  

    2022年 - 2023年   

      詳細を見る

    団体区分:学協会

  2. 情報処理学会 コンピュータービジョンとイメージメディア研究会   幹事  

    2020年4月 - 2024年4月   

  3. 画像の認識・理解シンポジウム MIRU2021   実行委員  

    2020年 - 2021年   

      詳細を見る

    団体区分:学協会

  4. 情報処理学会 コンピュータービジョンとイメージメディア研究会   運営委員  

    2019年4月 - 2020年3月   

      詳細を見る

    団体区分:学協会

  5. 電子情報通信学会情報・和文論文誌A編集委員会   編集委員  

    2018年6月 - 2022年5月   

  6. 電子情報通信学会情報・英文論文誌A編集委員会   編集委員  

    2018年6月 - 2022年5月   

  7. Ja Sakaiコミュニティ   副代表  

    2014年4月 - 2020年3月   

  8. 電子情報通信学会情報・英文論文誌D編集委員会   英文論文誌編集委員  

    2013年5月 - 2017年5月   

  9. 画像センシング技術研究会 SSII2013   実行委員 出版部会 副部会長  

    2012年9月 - 2013年8月   

  10. HCGシンポジウム2012   運営委員  

    2012年7月 - 2012年12月   

  11. Ja Sakai コミュニティ   幹事  

    2012年4月 - 2014年3月   

  12. ICPR 2012 Contest on Kitchen Scene Context based Gesture Recognition   Organizer  

    2011年10月 - 2012年12月   

  13. HCGシンポジウム2011   運営委員  

    2011年7月 - 2011年12月   

  14. 第15回パターン認識・マルチメディア理解アルゴリズムコンテスト   実行委員  

    2011年4月 - 2011年9月   

  15. HCGシンポジウム2010   運営委員  

    2010年7月 - 2010年12月   

  16. 第14回パターン認識・マルチメディア理解アルゴリズムコンテスト   幹事  

    2009年12月 - 2011年3月   

  17. 電子情報通信学会情報・システムソサイエティ ソサイエティ論文誌編集委員会   常任査読委員  

    2009年5月 - 現在   

  18. 電子情報通信学会パターン認識・メディア理解研究会 研究専門委員   専門委員  

    2009年4月 - 2015年5月   

  19. 電子情報通信学会ヒューマンコミュニケーショングループ 料理メディア研究会 研究専門委員会   幹事補佐  

    2009年4月 - 2013年5月   

  20. 第13回パターン認識・マルチメディア理解アルゴリズムコンテスト   実行委員  

    2009年4月 - 2009年9月   

▼全件表示

受賞 17

  1. 研究奨励賞

    2024年3月   動的画像処理実用化ワークショップDIA2024   交通シーン画像からの歩行者の注視対象物推定

    村上 大斗, 陳 嘉雷, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  2. Best Paper Award

    2023年1月   International Workshop on Advanced Image Technology 2023   A Preliminary Study on View Independent Panoptic Scene Change Detection

    Jiaxin Li, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞 

  3. MVE賞

    2020年3月   電子情報通信学会 マルチメディア・仮想環境基礎研究専門委員会   心像性に基づく画像キャプショニングの検討

    梅村 和紀, カストナー マークアウレル, 井手 一郎, 川西 康友, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  4. 研究奨励賞

    2020年3月   動的画像処理実利用化ワークショップDIA2020   超低解像度FIR画像内での人物位置と動作の違いに着目した骨格推定法の検討

    岩田 紗希, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  5. 優秀ポスター賞

    2019年12月   一般社団法人大学ICT推進協議会   手書きレポートとLMSの連携を実現する名大版紙レポシステムの全学運用

    出口 大輔, 清谷 竣也, 大平 茂輝, 戸田 智基

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  6. 優秀論文賞

    2018年11月   一般社団法人大学ICT推進協議会   名古屋大学におけるサーバ型紙レポート・LMS 連携システムの開発

    清谷 竣也, 伊藤 瑠哉, 岡本 康佑, 谷川 右京, 大平 茂輝, 出口 大輔, 戸田 智基

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  7. MVE賞

    2016年10月   電子情報通信学会 マルチメディア・仮想環境基礎研究専門委員会   SNS 投稿写真の画像内容に基づく地域間の類似度算出に関する検討

    滝本 広樹, 川西 康友, 井手 一郎, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  8. Excellent Paper Award

    2016年2月   Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV)   Human Wearable Attribute Recognition using Decomposition of Thermal Infrared Images

    Brahmastro Kresnaraman, Yasutomo Kawanishi, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞  受賞国:日本国

  9. MVE賞

    2012年9月   電子情報通信学会 マルチメディア・仮想環境基礎研究専門委員会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  10. 研究奨励賞

    2012年3月   動的画像処理実利用化ワークショップDIA2012  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

    2件受賞

  11. MVE賞

    2011年10月   電子情報通信学会 マルチメディア・仮想環境基礎研究専門委員会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  12. 電子情報通信学会 学術奨励賞

    2010年3月   電子情報通信学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  13. 日本医用画像工学会論文賞

    2009年8月   日本医用画像工学会  

     詳細を見る

    受賞区分:学会誌・学術雑誌による顕彰  受賞国:日本国

  14. 日本コンピュータ外科学会講演論文賞

    2007年4月   日本コンピュータ外科学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  15. 日本医用画像工学会奨励賞

    2006年7月   日本医用画像工学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  16. 第14回コンピュータ支援画像診断学会大会・大会賞

    2004年12月   コンピュータ支援画像診断学会  

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  17. CARS2004 Poster Award 1st Prize

    2004年6月   18th International Congress on Computer Assisted Radiology and Surgery  

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞 

▼全件表示

 

論文 248

  1. Frozen is better than learning: A new design of prototype-based classifier for semantic segmentation 査読有り

    Jialei Chen, Daisuke Deguchi, Chenkai Zhang, Xu Zheng, Hiroshi Murase

    Pattern Recognition   152 巻   2024年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Semantic segmentation models comprise an encoder to extract features and a classifier for prediction. However, the learning of the classifier suffers from the ambiguity which is caused by two factors: (1) the weights of a classifier for similar categories may have positive similarities lowing the performance for similar categories, named correlation ambiguity, and (2) the classifier is prone to predict the category with a larger L2 norm and vice versa, termed prior ambiguity. To comedy the issues, we propose Category-Basis Prototype (CBP), frozen and mutually orthogonalized prototypes with equal L2 norm. Orthogonalization prevents the prototypes from being similar to each other and the equality decouples the prediction from the L2 norm. To better shape the feature space, we propose Online Centroid Contrastive Loss (OCCL) equipped with centroid and category- level losses. Experiments show that our method yields compelling results over two widely applied benchmarks indicating the effectiveness of our methods.

    DOI: 10.1016/j.patcog.2024.110431

  2. Toward Explainable End-to-End Driving Models via Simplified Objectification Constraints 査読有り

    Chenkai Zhang, Daisuke Deguchi, Jialei Chen, Hiroshi Murase

    IEEE Transactions on Intelligent Transportation Systems   ( 1558-0016 ) 頁: 1 - 14   2024年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    The end-to-end driving models (E2EDMs) convert environmental information into driving actions using a complex transformation which makes E2EDMs have high prediction accuracy. Due to the black-box nature of transformation, the E2EDMs have low explainability. To solve this problem, explanation methods are used to generate explanations for observation. Based on current explanation methods, previous studies tried to further improve the explainability of E2EDMs by integrating an object detection module, however, these methods have many problems: Firstly, due to the requirement of the object detection module, they lack flexibility. Secondly, they neglect an essential property, i.e. , simplicity, to improve explainability. In this paper, since humans prefer object-level and simple explanations in driving tasks, we argue that explainability is decided by two properties which are the objectification degree (the extent to which driving related-object features are utilized) and simplification degree (the simplicity of the explanation), thus we propose Simplified Objectification Branches (SOB) to improve the explainability of E2EDMs. Firstly, this structure could be integrated into any existing E2EDMs and thus have high flexibility. Secondly, the SOB explicitly improves the simplification degree without sacrificing the objectification degree of the explanations. By designing several indicators, i.e. , heatmap satisfaction, driving action reproduction score, deception level, etc. , we proved that SOB could help E2EDMs generate better explanations. Notably, the SOB could also further enhance E2EDMs’ prediction accuracy.

    DOI: 10.1109/TITS.2024.3385754

  3. Eye-contact Transformer: シーンコンテクストを考慮した遠方歩行者のアイコンタクト検出

    畑 隆聖, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    電子情報通信学会論文誌   J107-D 巻 ( 4 ) 頁: 231 - 242   2024年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    歩行者が自車に気づいているかどうかの判断は,安全に車両を運転する上でとても重要である.このような自車への気付きの判断において,歩行者とのアイコンタクトは重要な役割を担っている.従来,このようなアイコンタクト検出には眼球計測により得られる視線推定結果が広く用いられており,道路環境のように歩行者と車両の距離が遠く歩行者の眼球を高解像度に計測できない場合は適用できない.そこで本論文では,歩行者の骨格系列と周囲環境の特徴を統合利用することにより,複雑な交通環境であっても歩行者とのアイコンタクトを精度良く検出可能な手法を提案する.具体的には,歩行者の骨格系列と周囲環境の特徴間の関係性をTransformerベースのモデルで捉えるEye-contact Transformerを構築する.車載カメラ画像群に対してアイコンタクトのアノテーションを付与したデータセットを用いた実験により,提案手法の有効性を確認した.

    DOI: 10.14923/transinfj.2023PDP0024

  4. Centroid Module for Shaping Feature Space in Semantic Segmentation

    Jialei Chen, Daisuke Deguchi, Chenkai Zhang, Hiroshi Murase

    Proceedings of 3rd Asia Conference on Cloud Computing, Computer Vision and Image Processing (3CVIP 2024)     2024年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  5. Subjective Baggage-Weight Estimation Based on Human Walking Behavior 査読有り

    Masaya Mizuno, Tomohiro Fujita, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    IEEE Access   12 巻   頁: 39390 - 39398   2024年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1109/ACCESS.2024.3376656

  6. Category-Level Object Pose Estimation in Heavily Cluttered Scenes by Generalized Two-Stage Shape Reconstructor 査読有り

    Hiroki Tatemichi, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEEE Access   12 巻   頁: 33440 - 33448   2024年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1109/ACCESS.2024.3372658

  7. Comprehensive Evaluation of End-to-End Driving Model Explanations for Autonomous Vehicles 査読有り

    Chenkai Zhang, Daisuke Deguchi, Jialei Chen, Hiroshi Murase

    Proceedings of the 19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP) 2024   2 巻 ( 2184-4321 ) 頁: 509 - 518   2024年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Deep learning technology has rapidly advanced, leading to the development of End-to-End driving models (E2EDMs) for autonomous vehicles with high prediction accuracy. To comprehend the prediction results of these E2EDMs, one of the most representative explanation methods is attribution-based. There are two kinds of attribution-based explanation methods: pixel-level and object-level. Usually, the heatmaps illustrate the importance of pixels and objects in the prediction results, serving as explanations for E2EDMs. Since there are many attribution-based explanation methods, evaluation methods are proposed to determine which one is better at improving the explainability of E2EDMs.
    Fidelity measures the explanation's faithfulness to the model's prediction method, which is a bottommost property. However, no evaluation method could measure the fidelity difference between object-level and pixel-level explanations, making the current evaluation incomplete. In addition, without considering fidelity, previous evaluation methods may advertise manipulative explanations that solely seek human satisfaction (persuasibility). Therefore, we propose an evaluation method that further considers fidelity, our method enables a comprehensive evaluation that proves the object-level explanations genuinely outperform pixel-level explanations in fidelity and persuasibility, thus could better improve the explainability of the E2EDMs.

  8. Pedestrian's Gaze Object Detection in Traffic Scene 査読有り

    Hiroto Murakami, Jialei Chen, Daisuke Deguchi, Takatsugu Hirayama, Yasutomo Kawanishi, Hiroshi Murase

    Proceedings of the 19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP) 2024   2 巻   頁: 333 - 340   2024年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we present a new task of detecting an object that a target pedestrian is gazing at in a traffic scene called PEdestrian's Gaze Object (PEGO). We argue that the detection of gaze object can provide important information for pedestrian's behavior prediction and can contribute to the realization of automated vehicles. For this task, we construct a dataset of in-vehicle camera images with annotations of the objects that pedestrians are gazing at. Also, we propose a Transformer-based method called PEGO Transformer to solve the PEGO detection task. The PEGO Transformer directly performs gaze object detection with the utilization of whole-body features without a high-resolution head image and a gaze heatmap which the traditional methods rely on. Experimental results showed that the proposed method could estimate pedestrian's gaze object accurately even if various objects exist in the scene.

  9. Texture-guided transfer learning for low-quality face recognition 査読有り

    Meng Zhang, Rujie Liu, Daisuke Deguchi, Hiroshi Murase

    IEEE Transactions on Image Processing     2023年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Although many advanced works have achieved significant progress for face recognition with deep learning and large-scale face datasets, low-quality face recognition remains a challenging problem in real-word applications, especially for unconstrained surveillance scenes. We propose a texture-guided (TG) transfer learning approach under the knowledge distillation scheme to improve low-quality face recognition performance. Unlike existing methods in which distillation loss is built on forward propagation; e.g., the output logits and intermediate features, in this study, the backward propagation gradient texture is used. More specifically, the gradient texture of low-quality images is forced to be aligned to that of its high-quality counterpart to reduce the feature discrepancy between the high-and low-quality images. Moreover, attention is introduced to derive a soft-attention (SA) version of transfer learning, termed as SA-TG, to focus on informative regions. Experiments on the benchmark low-quality face DB’s TinyFace and QMUL-SurFace confirmed the superiority of the proposed method, especially more than 6.3% Rank1 accuracy improvement is achieved on TinyFace.

    DOI: 10.1109/TIP.2023.3335830

  10. Computational measurement of perceived pointiness from pronunciation 査読有り

    Chihaya Matsuhira, Marc A. Kastner, Takahiro Komamizu, Ichiro Ide, Takatsugu Hirayama, Yasutomo Kawanishi, Keisuke Doman, Daisuke Deguchi

    Multimedia Tools and Applications     2023年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/s11042-023-15732-z

  11. Refined Objectification for Improving End-to-End Driving Model Explanation Persuasibility 査読有り

    Chenkai Zhang, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 2023 IEEE Intelligent Vehicles Symposium (IV2023)     2023年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/IV55152.2023.10186742

  12. 観衆の顔向きの時空間統合による注目対象の位置及び被注目度の推定 査読有り

    武田 一馬, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 柏野 邦夫

    電子情報通信学会論文誌   J106-A 巻 ( 3 ) 頁: 58 - 69   2023年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.14923/transfunj.2022HAP0006

  13. End-to-End gaze grounding from a person pictured from behind 査読有り

    Hayato Yumiya, Daisuke Deguchi, Yasutomo Kawanishi, Hiroshi Murase

    Proceedings of the 18th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications   5 巻   頁: 898 - 905   2023年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  14. Subjective Baggage-Weight Estimation from Gait: Can You Estimate How Heavy the Person Feels? 査読有り

    Masaya Mizuno, Tomohiro Fujita, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP) 2023   5 巻   頁: 567 - 574   2023年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  15. A Preliminary Study on View Independent Panoptic Scene Change Detection 査読有り

    Jiaxin Li, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    Proceedings of International Workshop on Advanced Image Technology (IWAIT) 2023     2023年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  16. More Persuasive Explanation Method for End-to-End Driving Models 査読有り

    Chenkai Zhang, Daisuke Deguchi, Yuki Okafuji, Hiroshi Murase

    IEEE Access   11 巻   頁: 4270 - 4282   2023年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    With the rapid development of autonomous driving technology, a variety of high-performance end-to-end driving models (E2EDMs) are being proposed. In order to understand the computational methods of E2EDMs, pixel-level explanations methods are used to obtain the explanations of the E2EDMs. However, little attention has been paid to the excellence of the explanations of E2EDMs. Therefore, in order to build trustworthy E2EDMs, we focus on improving the persuasibility of the explanations of E2EDMs. We propose an object-level explanation method (main approach) for E2EDMs, which masks the objects in the image and then treats the change in the prediction result as the importance of the objects, then we explain the E2EDM by the importance of each object. To further validate the effectiveness of object-level explanations, we propose another approach (validation approach), which trains E2EDMs with object information as input and generates the importance of objects using general explanation methods. Both approaches generate object-level explanations, in order to compare these object-level explanations with traditional pixel-level explanations, we propose experimental methods to measure the persuasibility of explanations of E2EDMs through a subjective and objective method. The subjective method evaluates persuasibility based on the extent to which participants think the importance of features indicated by the explanations is correct. The objective method evaluates the persuasibility based on the human annotation similarity between provided with only the important part of images and provided with the complete images. The experimental results show that the object-level explanations are more persuasive than the traditional pixel-level explanations.

    DOI: 10.1109/ACCESS.2023.3235739

  17. Analysis of Gaze while Viewing Videos at Various Playback Speeds 査読有り

    Hideaki Takahira, Yasutomo Kawanishi, Takatsugu Hirayama, Hiroshi Murase, Daisuke Deguchi

    Proceedings of the International Display Workshops   29 巻   頁: 702 - 705   2022年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We analyze gaze while viewing videos at various playback speeds.
    The aims of this paper are to evaluate the comprehension and viewability of videos.
    In our experiment, we used 0.75x to 3.0x speed, and measured gaze.
    We report differences in gaze behavior among different playback speeds in viewing same video.

  18. Detection of Birds in a 3D Environment Referring to Audio-Visual Information 査読有り

    Yasutomo Kawanishi, Ichiro Ide, Baidong Chu, Chihaya Matsuhira, Marc A. Kastner, Takahiro Komamizu, Daisuke Deguchi

    Proceedings of the 18th IEEE International Conference on Advanced Video and Signal-Based Surveillance     頁: 1 - 7   2022年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We propose a method to detect birds in a 3D environment referring to both audio information observed from a microphone array and visual information observed from a panorama camera. In general, in panorama images, birds appear relatively too small to be detected accurately even with the state-of-the-art deep learning models. Thus, the proposed method takes a two step approach where the birds are first roughly located referring to audio information by Sound Source Localization (SSL), and then image detection is applied within its vicinity. Through evaluation on a dataset annotated with bounding boxes surrounding the birds, we show that the proposed method improves detection performance of birds that appear in relatively small sizes in the image, in both accuracy and processing speed.

    DOI: 10.1109/AVSS56176.2022.9959510

  19. Detection of distant eye-contact using spatio-temporal pedestrian skeletons 査読有り

    Ryusei Hata, Daisuke Deguchi, Takatsugu Hirayama, Yasutomo Kawanishi, Hiroshi Murase

        2022年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  20. サラウンド映像視聴時の注視点分布の分析 査読有り

    高比良 英朗, 篠原 未歩, 野坂 祐介, 横内 雅也, 山田 光穗, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    ヒューマンインタフェース学会論文誌   24 巻 ( 3 ) 頁: 195 - 204   2022年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    We have been conducting research focusing on the human gaze as a principal biological reaction while viewing videos. In this paper, we clarify the difference in the area of gaze region under different sound conditions; monaural (1.0 ch), stereo (2.0 ch), and surround (5.1 ch). We measured the gaze of subjects viewing video scenes of natural landscapes and calculated the horizontal and vertical standard deviations of the gaze points and the area of gaze region defined from them. A two-way analysis of variance shows the main effects of each of the sound and scene conditions on the vertical standard deviation of the gaze points and the interaction effect and the main effect of the sound condition on the area of gaze region. In addition, a multiple comparison test shows the significant differences in the vertical standard deviation for the interaction effect between the sound and scene conditions and in the area of gaze region for the sound conditions between monaural and stereo or surround. The hypothesis that the variance of gaze points is expanded by the surround sound is confirmed experimentally.

    DOI: 10.11184/his.24.3_195

  21. 車両歩行者間のインタラクション行動のモデル化のための 2 段階入出力隠れマルコフモデル 査読有り

    新村 文郷, 赤井 直紀, 平山 高嗣, 劉 海龍, 川西 康友, 出口 大輔, 村瀬 洋

    情報処理学会論文誌   63 巻 ( 8 ) 頁: 1371 - 1382   2022年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    自動車と歩行者が交差するシーンに着目し,車両歩行者間のインタラクティブな行動をモデル化するための2段階入出力隠れマルコフモデル(TS-IOHMM)を提案する.従来の入出力隠れマルコフモデルは,相手の行動に依存して自己の意図と行動が決定される過程をモデル化した.提案するTS-IOHMMは,相手の行動の影響に加え,自己の行動もまた相手の意図に影響を与える点を考慮したモデルで,これまで注目されなかった意図と行動の変化にある法則性(ルール)の獲得を目指したモデルである.検証用に設定したルールに従って意図や行動が変化するシミュレーションデータを作成し,それを用いて提案モデルがどのようなルールを獲得できるか検証する実験を行った.その結果から,提案モデルがシミュレーションと同等の意図や行動を出力する行動ルールを獲得できたことを確認した.

    DOI: 10.20729/00218987

  22. Intuitive Gait Modeling using Mimetic-Words for Gait Description and Generation 査読有り

    Hirotaka Kato, Takatsugu Hirayama, Keisuke Doman, Ichiro Ide, Yasutomo Kawanishi, Takahiro Komamizu, Daisuke Deguchi, Hiroshi Murase

        頁: 240 - 245   2022年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/MIPR54900.2022.00050

  23. Context-Aware Contribution Estimation for Feature Aggregation in Video Face Recognition 査読有り

    Meng Zhang, Rujie Liu, Daisuke Deguchi, Hiroshi Murase

    IEEE Access   10 巻   頁: 79301 - 79310   2022年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    The difficulties in video-based face recognition, such as dramatic pose variations and low quality, can be alleviated by leveraging the rich complementary information between the frames. However, limited by the mini-batch training strategy, the current deep learning methods only utilizes the frames in each batch during training, which ignore the context of the entire video. In this paper, we propose a context-aware feature aggregation scheme to aggregate complementary information between different frames. Firstly, a two-branch structure is designed as the C ontext-aware feature A ggregation N etwork ( CAN ). Secondly, a context-aware training strategy using a context bank is proposed, which alleviates the limitation of mini-batch samples by using the context of the entire video or several images belonging to the same ID and thus achieves global contribution estimation result. Comparative studies on benchmark datasets, such as IJB-C, YouTube Face (YTF), PaSC and COX, confirm that the proposed approach can achieve state-of-the-art level. Meanwhile, qualitative analysis on Multi-PIE dataset indicates that the contribution learned by the CAN is reasonable and beneficial to video face recognition.

    DOI: 10.1109/ACCESS.2022.3193787

  24. SfM-student: SfM法を用いたデータ拡張による列車前方映像からのセマンティックセグメンテーション 査読有り

    振津 勇紀, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋, 向嶋 宏記, 長峯 望

    電子情報通信学会論文誌   J105-A 巻 ( 4 ) 頁: 48 - 57   2022年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    重要な公共交通機関として広く社会に普及している鉄道の沿線には,信号機や踏切など列車の安全運行を支える多くの設備が設置されている.これらの設備の日常的な整備や設置状況などに関する情報収集業務の多くは人手により行われており,その維持管理作業の自動化・効率化を実現する技術が強く求められている.このような課題に対して,営業運転中の列車に搭載したカメラにより前方を撮影した列車前方映像のみを用い,セマンティックセグメンテーションを施すことで鉄道環境における沿線設備などを自動認識する技術に期待が寄せられている.しかし,セマンティックセグメンテーションでは画素単位でクラス情報を人手で付与した学習データが必要であり,高い性能を得るために必要な大量の学習データを用意するコストは非常に高い.そこで本論文では,教師なしデータに対するセマンティックセグメンテーション結果とStructure from Motion(SfM)法による3次元復元結果を組み合わせることによってラベル付き3次元点群を生成し,それらを画像平面に投影することで擬似的なデータ拡張を行うSfM-student法を提案する.これにより,限られたラベルあり学習データのみからセマンティックセグメンテーションの精度向上を図る.実際の鉄道環境で撮影したデータを用いた実験を行ったところ,提案する3次元情報を利用した擬似的なデータ拡張手法は既存のデータ拡張手法と比べてセマンティックセグメンテーション精度を向上させることを確認した.

    DOI: 10.14923/transfunj.2021JAP1021

  25. 歩行者属性と運転スキルを考慮したリスクポテンシャル関数による歩行者に対する安全マージン予測 査読有り

    前川 大和, 平山 高嗣, 川西 康友, 出口 大輔, 劉 海龍, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J105-A 巻 ( 3 ) 頁: 38 - 42   2022年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,電動車いすのより安全な自動運転のための経路計画を目的として,歩行者属性と運転スキルを考慮したリスクポテンシャル関数を運転データから推定する手法を提案し,それらによる歩行者に対する電動車いすの安全マージンの違いを明らかにする.

    DOI: 10.14923/transfunj.2021JAL2005

  26. Masked face recognition with mask transfer and self-attention under the COVID-19 pandemic 査読有り

    Zhang Meng, Rujie Liu, Daisuke Deguchi, Hiroshi Murase

    IEEE Access   10 巻   頁: 20527 - 20538   2022年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Face masks bring a new challenge to face recognition systems especially against the background of the COVID-19 pandemic. In this paper, a method mitigating the negative effects of mask defects on face recognition is proposed. Firstly, a low-cost, accurate method of masked face synthesis, i.e. mask transfer, is proposed for data augmentation. Secondly, an attention-aware masked face recognition (AMaskNet) is proposed to improve the performance of masked face recognition, which includes two modules: a feature extractor and a contribution estimator. Therein, the contribution estimator is employed to learn the contribution of the feature elements, thus achieving refined feature representation by simple matrix multiplications. Meanwhile, the end-to-end training strategy is utilized to optimize the entire model. Finally, a mask-aware similarity matching strategy(MS) is taken to improve the performance in the inference stage. The experiments show that the proposed method consistently outperforms on three masked face recognition datasets: RMFRD [1], COX [2] and Public-IvS [3]. Meanwhile, qualitative analysis experiments using CAM [4] indicate that the contribution learned by AMaskNet is more conducive to masked face recognition.

    DOI: 10.1109/ACCESS.2022.3150345

  27. Active Learning for Human Pose Estimation based on Temporal Pose Continuity 査読有り

    Taro Mori, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Tetsuo Inoshita

    Proceedings of International Workshop on Advanced Image Technology (IWAIT) 2022     2022年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  28. Soft-boundary label relaxation with class placement constraints for semantic segmentation of the railway environment 査読有り

    Yuki Furitsu, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Hiroki Mukojima, Nozomi Nagamine

    Pattern Recognition Letters   150 巻   頁: 258 - 264   2021年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1016/j.patrec.2021.07.014

  29. Pointedness of an Image: Measuring How Pointy an Image is Perceived 査読有り

    Chihaya Matsuhira, Marc A. Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    Proceedings of HCII 2021   37 巻   頁: 137 - 144   2021年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    For computers to understand human perception, metrics that can capture human perception well are important. However, there are few metrics that characterize the visual perception of humans towards images. Therefore, in this paper, we propose a novel concept and a metric of pointedness of an image, which describes how pointy an image is perceived. The algorithm is inspired by the Features from Accelerated Segment Test (FAST) algorithm for corner detection which looks on the number of continuous neighboring darker pixels surrounding each pixel. We assume that this number would be proportional to the perceived pointedness in the region around the pixel. We evaluated our method towards how well it could capture the human perception of images. To compare the method with similar metrics that describe shapes, we prepared silhouette images of both artificial shapes and natural objects. The results showed that the proposed method gave nearly equivalent perceptual performance to other metrics and also worked in a larger variety of images.

    DOI: https://doi.org/10.1007/978-3-030-78635-9_20

  30. Best next-viewpoint recommendation by selecting minimum pose ambiguity for category-level object pose estimation 査読有り

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Journal of the Japan Society for Precision Engineering   87 巻 ( 5 ) 頁: 440 - 446   2021年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.2493/jjspe.87.440

  31. 画像特徴点の対応を制約とした疎なLiDAR点群からのOdometry推定 査読有り

    清水 政行, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    精密工学会誌   87 巻 ( 5 ) 頁: 447 - 454   2021年5月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.2493/jjspe.87.447

  32. 光線方向の違いを考慮したライトフィールド特徴量の提案 査読有り

    清水 政行, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    精密工学会誌   87 巻 ( 2 ) 頁: 197 - 205   2021年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    Many camera and photo applications, for example image mosaicing, Simultaneous Localization And Mapping (SLAM), and so on, use image keypoints, descriptors, and their matching. Recently, obtaining light-field has become easier thanks to the commercialization of light-field cameras. Light-field is a record of not only light ray intensity but also directions, and multi-view images can be acquired with it. In this paper, a light-field descriptor with light ray directions using light-field is proposed. A light-field descriptor is defined as a set of feature vectors that change according to the direction of the light ray. In addition, a method to match these descriptors is proposed. As the method focuses on the direction of the light ray, it allows more accurate matching than a conventional method when the camera pose changes against the target. To confirm the effectiveness, the proposed method is evaluated by using light-field image recorded in a real scene. As a result, the proposed method is shown to improve the accuraccy over a conventional method. In particular, the closer the distance between the target and the camera, the better accuracy of the proposed method could be achieved.

    DOI: 10.2493/jjspe.87.197

  33. ColAtt-Net: In Reducing the Ambiguity of Pedestrian Orientations on Attribute-Aware Semantic Segmentation Task 査読有り

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Takatsugu Hirayama, Hiroshi Murase

    IEEJ Transactions on Electrical and Electronic Engineering   16 巻 ( 2 ) 頁: 295 - 306   2021年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Semantic segmentation has become one of the trending topics in the world of computer vision and deep learning. Recently, due to an increasing demand to solve a semantic segmentation task simultaneously with attribute recognition of objects, a new task named attribute-aware semantic segmentation has been introduced. Since the task requires to handle pixel-wise object class estimation with its attributes such as a pedestrian’s body orientation, previous works had difficulties to handle ambiguous attributes such as body orientations in object-level, especially when segmenting the pedestrians with their attributes correctly. This paper proposes the ColAtt-Net that is an attribute-aware semantic segmentation model augmented by a column-wise mask branch to predict the pedestrians’ orientations in the horizontal perspective of the input image. We firmly assume that the pedestrians captured by a car-mounted camera are distributed horizontally so that for each column of the input image, the pedestrian pixels can be labeled with one orientation uniformly. In the proposed method, we split the output of the base semantic segmentation model into two branches; one branch for segmenting the object categories, while the other one, as the novel column-wise attribute branch, is to map the recognition of pedestrian’s orientations that are distributed horizontally. This method successfully enhances the performance of attribute-aware semantic segmentation by reducing the ambiguity on segmenting the pedestrian’s orientation. Improvements on the pedestrian orientation segmentation are confidently shown by the proposed method in the experimental results, both in quantitative and qualitative views. This paper also discusses how the improved performance becomes an advantage in the autonomous driving system.

    DOI: https://doi.org/10.1002/tee.23296

  34. LFIR2Pose: Pose Estimation from an Extremely Low-Resolution FIR Image Sequence 査読有り

    Saki Iwata, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa

    Proceedings of the 25th International Conference on Pattern Recognition     2021年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we propose a method for human pose estimation from a Low-resolution Far-InfraRed (LFIR) image sequence captured by a 16 × 16 FIR sensor array. Human body estimation from such a single LFIR image is a hard task. For training the estimation model, annotation of the human pose to the images is also a difficult task for human. Thus, we propose the LFIR2Pose model which accepts a sequence of LFIR images and outputs the human pose of the last frame, and also propose an automatic annotation system for the model training. Additionally, considering that the scale of human body motion is largely different among body parts, we also propose a loss function focusing on the difference. Through an experiment, we evaluated the human pose estimation accuracy using an original data set, and confirmed that human pose can be estimated accurately from an LFIR image sequence.

  35. OMEga-GAN: Object Manifold Embedding GAN for Image Generation by Disentangling Parameters into Pose and Shape Manifolds 査読有り

    Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 25th International Conference on Pattern Recognition     頁: 7945 - 7952   2021年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we propose Object Manifold Embedding GAN (Ω-GAN) to generate images of variously shaped and arbitrarily posed objects from a noise variable sampled from a distribution defined over the pose and the shape manifolds in a vector space. We introduce Parametric Manifold Sampling to sample noise variables from a distribution over the pose manifold to conditionally generate object images in arbitrary poses by tuning the pose parameter. We also introduce Object Identity Loss for clearly disentangling the pose and shape parameters, which allows us to maintain the shape of the object instance when only the pose parameter is changed. Through evaluation, we confirmed that the proposed Ω-GAN could generate variously shaped object images in arbitrary poses by changing the pose and shape parameters independently. We also introduce an application of the proposed method for object pose estimation, through which we confirmed that the object poses in the generated images are accurate.

  36. Median-Shape Representation Learning for Category-Level Object Pose Estimation in Cluttered Environments 査読有り

    Hiroki Tatemichi, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Ayako Amma, Hiroshi Murase

    Proceedings of the 25th International Conference on Pattern Recognition     頁: 4473 - 4480   2021年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we propose an occlusion-robust pose
    estimation method of an unknown object instance in an
    object category from a depth image. In a cluttered
    environment, objects are often occluded mutually. For
    estimating the pose of an object in such a situation, a
    method that de-occludes the unobservable area of the object
    would be effective. However, there are two difficulties;
    occlusion causes offset between the actual object center
    and the center of its observable area, and different
    instances in a category may have different shapes. To cope
    with these difficulties, we propose a two-stage
    Encoder-Decoder model to extract features with objects
    whose centers are aligned to the image center. In the
    model, we also propose the Median-shape Reconstructor as
    the second stage to absorb shape variations in a category.
    By evaluating the method with both a large-scale virtual
    dataset and a real dataset, we confirmed the proposed
    method achieves good performance on pose estimation of an
    occluded object from a depth image.

  37. 超低解像度FIR画像系列中での人物位置と行動の違いに着目した骨格推定法 査読有り

    岩田 紗希, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎

    精密工学会誌   87 巻 ( 1 ) 頁: 99 - 106   2021年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    Elderly monitoring systems are gaining attention in the modern aging society. For the purpose, Far-InfraRed (FIR) sensors are often used, because they can avoid privacy concerns and are robust to environmental lightings. The authors have previously proposed several methods for human skeleton estimation from an extremely low-resolution FIR image sequence whose resolution is 16 × 16 pixels. For more accurate estimation, this paper proposes a method that is robust to variations of human positions and actions in the FIR sequences. Specifically, to extract features robust to the human positions from the images by using a Convolutional Neural Network (CNN), a global max-pooling layer is inserted into the last layer instead of multiple pooling layers which are not suitable for low-resolution inputs. Also, a network with two branches is introduced that focuses on capturing spatial and temporal information respectively. Moreover, the network has a weighted sum mechanism of their outputs, which depends on the human actions. For evaluation, a dataset was created by capturing action sequences of a human at various positions in the FIR images. Through an experiment, we confirmed that the human motion can be smoothly estimated and that the estimation accuracy is improved by the proposed method.

  38. Imageability Estimation using Visual and Language Features 査読有り

    Chihaya Matsuhira, Marc A. Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the 2020 International Conference on Multimedia Retrieval     頁: 306–310   2020年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Imageability is a concept from Psycholinguistics quantizing the human perception of words. However, existing datasets are created through subjective experiments and are thus very small. Therefore, methods to automatically estimate the imageability can be helpful. For an accurate automatic imageability estimation, we extend the idea of a psychological hypothesis called Dual-Coding Theory, that discusses the connection of our perception towards visual information
    and language information, and also focus on the relationship between the pronunciation of a word and its imageability. In this research, we propose a method to estimate imageability of words
    using both visual and language features extracted from corresponding data. For the estimation, we use visual features extracted from low- and high-level image features, and language features extracted from textual features and phonetic features of words. Evaluations how that our proposed method can estimate imageability more accurately than comparative methods, implying the contribution of each feature to the imageability.

    DOI: 10.1145/3372278.3390731

  39. Modeling Eye-Gaze Behavior of Electric Wheelchair Drivers via Inverse Reinforcement Learning 査読有り

    Yamato Maekawa, Naoki Akai, Takatsugu Hirayama, Luis Yoichi Morales, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2020 IEEE International Conference on Intelligent Transportation Systems     頁: 158 - 164   2020年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    It is intuitively obvious that eye-gaze behaviors of experienced drivers are different from those of novice drivers. However, it is not easy to understand the difference in their behavior quantitatively. In this work, we present an explainable eye-gaze behavior modeling method for electric wheelchair drivers based on Inverse Reinforcement Learning (IRL). We first create feature maps that represent risk factors during driving. These feature maps are able to represent not only to what but also from where drivers pay attention. IRL uses the feature maps to learn the reward representing the eye-gaze behaviors and allows us to see important features via the automatic acquisition of the reward. Through analysis of the learned model, we show quantitative evidence that eye-gaze behaviors of experienced drivers are better-balanced by paying attention to multiple risks.

    DOI: 10.1109/ITSC45102.2020.9294255

  40. Estimating the imageability of words by mining visual characteristics from crawled image data 査読有り

    Marc Aurel Kastner, Ichiro Ide, Frank Nack, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    Multimedia Tools and Applications   79 巻 ( 25 ) 頁: 18167 - 18199   2020年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/s11042-019-08571-4

  41. Performance Boost of Attribute-aware Semantic Segmentation via Data Augmentation for Driver Assistance 査読有り

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Takatsugu Hirayama, Hiroshi Murase

        頁: 293 - 298   2020年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper is an extension of our work in developing an attribute-aware semantic segmentation method which focuses on pedestrian understanding in a traffic scene. Recently, the trending topic of semantic segmentation has been expanded to be able to collaborate with the object’s attributes recognition task; Here, it refers to recognizing a pedestrian’s body orientation. The attribute-aware semantic segmentation can be more beneficial for driver assistance compared to the conventional semantic segmentation because it can provide a more informative output to the system. In this paper, we conduct a study of the data augmentation usage as an effort to enhance the performance of the attribute-aware semantic segmentation task. The experiments show that the proposed method in augmenting the training data is able to improve the model’s performance. We also demonstrate some of qualitative results and discuss the benefits to a driver assistance system.

    DOI: 10.1109/ICoICT49345.2020.9166219

  42. 車両部位検出に基づく回帰を利用した車両台数の推定 査読有り

    新村 文郷, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    知能と情報   32 巻 ( 3 ) 頁: 705 - 712   2020年6月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

  43. Simultaneous Image Matching for Person Re-identification via the Stable Marriage Algorithm 査読有り

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEEJ Transactions ON Electrical AND Electronic Engineering   15 巻 ( 6 ) 頁: 909 - 917   2020年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

  44. SOANets: Encoder-Decoder based Skeleton Orientation Alignment Network for White Cane User Recognition from 2D Human Skeleton Sequence 査読有り

    Naoki Nishida, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Jun Piao

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2020   5 巻   頁: 435 - 443   2020年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, various facilities have been deployed to support visually impaired people. However, accidents caused by visual disabilities still occur. In this paper, to support the visually impaired people in public areas, we aim to identify whether a pedestrian image sequence obtained by a surveillance camera indicates the presence of a white cane user by analyzing the temporal transition of a human skeleton represented as 2D coordinates. Our previously proposed method aligns the orientation of the human skeletons to various orientations and identifies a white cane user from the corresponding sequences, relying on multiple classifiers related to each orientation. The method employs an exemplar-based approach to perform the alignment. However, it heavily depends on the number of exemplars and consumes excessive memory. In this paper, we propose a method to align 2D human skeleton representation sequence to various orientations using the proposed Skeleton Orientation Alignment Networks (SOANets) based on an encoder-decoder model. Using SOANets, we can obtain 2D skeleton representation sequences aligned to various orientations, extract richer skeleton features, and recognize white cane users accurately. We conducted an experiment to confirm that the
    proposed method improves the recognition rate by 16%, compared to the method that does not use the skeleton
    orientation alignment.

  45. LMS経由で手書きレポートを返却するWebサービス「かみレポ」の開発・評価 査読有り

    大平 茂輝, 清谷 竣也, 伊藤 瑠哉, 岡本 康佑, 谷川 右京, 出口 大輔, 戸田 智基

    情報処理学会論文誌:教育とコンピュータ(TCE)   6 巻 ( 1 ) 頁: 52 - 68   2020年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    高等教育における学習支援システム(LMS: Learning Management System)の重要性は年々高まっており,授業改善や学習分析などさまざまな目的のために活用されている.一方で,数式の記述や作図を必要とする授業や演習,試験など,紙媒体を主体的に扱う教育・学習環境は依然として多く残っており,それらの活動を支援するシステムが強く求められている.そこで本研究では,LMSと連携して手書きレポートを返却するWebサービスの実現を目指し,2016年度から「かみレポ」システムの開発を進めている.本稿では,半年間の試験運用時に実施した手書き数字の認識性能に関する評価と,運用開始後の1年6カ月間の運用評価をもとに,かみレポサービスの有効性と課題,今後の展望についてまとめる.

  46. Occlusion-Aware Skeleton Trajectory Representation for Abnormal Behavior Detection 査読有り

    Onur Temuroglu, Yasutomo Kawanishi, Daisuke Deguchi, Takatsugu Hirayama, Ichiro Ide, Hiroshi Murase, Mayuu Iwasaki, Atsushi Tsukada

        2020年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Surveillance cameras are expected to play a large role in the development of ITS technologies. They can be used to detect abnormally behaving individuals which can then be reported to drivers nearby. There are multiple works that tackle the problem of abnormal behavior detection. However, most of these works make use of appearance features which have redundant information and are susceptible to noise. While there are also works that make use of pose skeleton representation, they do not consider well how to handle cases with occlusions, which can occur due to the simple reason of pedestrian orientation preventing some joints from appearing in the frame clearly. In this paper, we propose a skeleton trajectory representation that enables handling of occlusions. We also propose a framework for pedestrian abnormal behavior detection that uses the proposed representation and detect relatively hard-to-notice anomalies such as drunk walking. The experiments we conducted show that our method outperforms other representation methods.

  47. Browsing Visual Sentiment Datasets Using Psycholinguistic Groundings

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    Lecture Note in Computer Science   11962 巻   頁: 697 - 702   2020年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Recent multimedia applications commonly use text and imagery from Social Media for tasks related to sentiment research. As such, there are various image datasets for sentiment research for popular classification tasks. However, there has been little research regarding the relationship between the sentiment of images and its annotations from a multi-modal standpoint. In this demonstration, we built a tool to visualize psycholinguistic groundings for a sentiment dataset. For each image, individual psycholinguistic ratings are computed from the image's metadata. A sentiment-psycholinguistic spatial embedding is computed to show a clustering of images across different classes close to human perception. Our interactive browsing tool can visualize the data in various ways, highlighting different psycholinguistic groundings with heatmaps.

    DOI: 10.3758/s13428-018-1099-3

  48. More-Natural Mimetic Words Generation for Fine-Grained Gait Description 査読有り

    Hirotaka Kato, Takatsugu Hirayama, Ichiro Ide, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    Lecture Note in Computer Science   11962 巻   頁: 214 - 225   2020年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    A mimetic word is used to verbally express the manner of a phenomenon intuitively. The Japanese language is known to have a greater number of mimetic words in its vocabulary than most other languages. Especially, since human gaits are one of the most commonly represented behavior by mimetic words in the language, we consider that it should be suitable for labels of fine-grained gait recognition. In addition, Japanese mimetic words have a more decomposable structure than these in other languages such as English. So it is said that they have sound-symbolism and their phonemes are strongly related to the impressions of various phenomena. Thanks to this, native Japanese speakers can express their impressions on them briefly and intuitively using various mimetic words. Our previous work proposed a framework to convert the body-parts movements to an arbitrary mimetic word by a regression model. The framework introduced a phonetic space" based on sound-symbolism, and it enabled fine-grained gait description using the generated mimetic words consisting of an arbitrary combination of phonemes. However, this method did not consider the "naturalness" of the description. Thus, in this paper, we propose an improved mimetic word generation module considering its naturalness, and update the description framework. Here, we define the co-occurrence frequency of phonemes composing a mimetic word as the naturalness. To investigate the co-occurrence frequency, we collected many mimetic words through a subjective experiment. As a result of evaluation experiments, we confirmed that the proposed module could describe gaits with more natural mimetic words while maintaining the description accuracy."

    DOI: 10.1007/978-3-030-37734-2_18

  49. Attribute-Aware Loss Function for Accurate Semantic Segmentation Considering the Pedestrian Orientations 査読有り

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Takatsugu Hirayama, Jiang-Yu Zheng, Hiroshi Murase

    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences   E103-A 巻 ( 1 ) 頁: 231 - 242   2020年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Numerous applications such as autonomous driving, satellite imagery sensing, and biomedical imaging use computer vision as an important tool for perception tasks. For Intelligent Transportation Systems (ITS), it is required to precisely recognize and locate scenes in sensor data. Semantic segmentation is one of computer vision methods intended to perform such tasks. However, the existing semantic segmentation tasks label each pixel with a single object’s class. Recognizing object attributes, e.g., pedestrian orientation, will be more informative and help for a better scene understanding. Thus, we propose a method to perform semantic segmentation with pedestrian attribute recognition simultaneously. We introduce an attribute-aware loss function that can be applied to an arbitrary base model. Furthermore, a re-annotation to the existing Cityscapes dataset enriches the ground-truth labels by annotating the attributes of pedestrian orientation. We implement the proposed method and compare the experimental results with others. The attribute-aware semantic segmentation shows the ability to outperform baseline methods both in the traditional object segmentation task and the expanded attribute detection task.

    DOI: 10.1587/transfun.2019TSP0001

  50. インテリジェントヘッドライトシステムにおける運転者による歩行者認知に効果的な点滅光照射パターンの分析 査読有り

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    精密工学会誌   85 巻 ( 12 ) 頁: 1157 - 1162   2019年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    DOI: https://doi.org/10.2493/jjspe.85.1157

  51. 入力可変長PointNetによる自転車認識 査読有り

    山本 大貴, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 加藤 一樹, 村瀬 洋

    精密工学会誌   85 巻 ( 12 ) 頁: 1117 - 1126   2019年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    近年,自動運転の実用化を目指して,距離センサであるLIDAR(Light Detection and
    Ranging)を用いた周辺環境認識に関する研究が活発に行われている.これらの研究
    の多くは自動車や歩行者の認識を目的としているが,一般道における自動運転を実用
    化するためには,自転車の認識も重要である.自転車は歩行者に比べて移動速度が速
    いため,衝突の危険性が高く,安全のために迅速かつ正確な認識が求められる.近年
    ,3D点群データを直接扱うDNN手法としてPointNetが提案されており,高い物体認識
    精度が得られることが示されている.しかし,PointNetは入力点数が固定であるとい
    う制約があり,認識対象物体の点数が大きく変化する場合にそのまま適用することは
    難しい.そこで本論文では,LIDARにより計測された自転車の認識精度の向上を目的
    とし,自転車の点群の分布形状を保持したダウンサンプリングとLIDARの測定精度を
    考慮したアップサンプリングを行うサンプリングモジュールを提案する.ダウンサン
    プリングでは,点群が低密度な部分の計測点が保存されるようサンプリングを行うこ
    とで,自転車の点群の分布形状を保持したサンプリングを可能とする.アップサンプ
    リングでは,LIDARの計測時に生じる誤差を考慮し,対象までの距離に応じて点群に
    摂動を加えることで,点群の分布形状を大きく変化させることなく点群の密度の増加
    を図る.この提案サンプリングモジュールの導入により,PointNetの入力の可変長化
    を行う.KITTIデータセットを用いて評価実験を行い,提案手法によって認識精度が向
    上することを確認した.

    DOI: 10.2493/jjspe.85.1117

  52. Scene-Adaptive Driving Area Prediction based on Automatic Label Acquisition from Driving Information 査読有り

    Takuya Migishima, Haruya Kyutoku, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 5th IAPR Asian Conference on Pattern Recognition (ACPR2019)     2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  53. Semantic Segmentation of Railway Images Considering Temporal Continuity 査読有り

    Yuki Furitsu, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Hiroki Mukoujima, Nozomi Nagamine

    Proceedings of the 5th IAPR Asian Conference on Pattern Recognition (ACPR2019)     2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  54. An Analysis of How Driver Experience Affects Eye-Gaze Behavior for Robotic Wheelchair Operation 査読有り

    Yamato Maekawa, Naoki Akai, Takatsugu Hirayama, Luis Yoichi Morales, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2019 IEEE International Conference on Computer Vision (ICCV) Workshops     頁: 4443 - 4451   2019年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Drivers obtain information on surrounding environment using their eyesights. Experienced eye-gaze behavior is needed when driving at places where multiple risks exist to prepare for and avoid them. In this work, we analyze the change in eye-gaze behavior in such situations while a driver gains experience on the operation of a robotic wheelchair. Accurate distance information in the traffic environment is important to analyze the eye-gaze behavior. However, almost all previous works analyze eye-gaze behavior in a 2D environment, so they could not obtain accurate distance information. For this reason, we analyze eye-gaze behavior in 3D space. Concretely, we developed a novel eye-gaze behavior analysis platform based on a robotic wheelchair and estimated the driver's attention in 3D space. We try to analyze the eye-gaze behavior considering a useful field-of-view in 3D space based on the distance information instead of only the fixation point to investigate the objects that a driver implicitly pays attention to and from where s/he focuses on them. Results show that novice drivers pay attention to a single risk at a time. In contrast, they pay more attention to multiple risks simultaneously as they gain experience. Additionally, we discuss what features are effective to model the eye-gaze behavior based on the results.

    DOI: 10.1109/ICCVW.2019.00545

  55. Exemplar-based Pseudo-Viewpoint Rotation for White-Cane User Recognition from a 2D Human Pose Sequence 査読有り

    Naoki Nishida, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Jun Piao

        2019年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  56. Similar Seasonal-Geo-Region Mining based on Visual Concepts in Social Media Photos 査読有り

    Yasutomo Kawanishi, Ichiro Ide, Chen Lu, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the 5th IEEE Conference on Multimedia BigData     頁: 86 - 93   2019年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  57. Estimation of the attractiveness of food photography based on image features 査読有り

    Kazuma Takahashi, Tatsumi Hattori, Keisuke Doman, Yasutomo Kawanishi, Takatsugu Hirayama, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    IEICE Trans. on Information and Systems   E102-D 巻 ( 8 ) 頁: 1590 - 1593   2019年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1587/transinf.2018EDL8219

  58. Hand Orientation Estimation in Probability Density Form

    Kazuaki Kondo, Daisuke Deguchi, Atsushi Shimada

        2019年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  59. Estimating the Imageability of a sentence for image caption evaluation

    Kazuki Umemura, Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

        2019年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  60. Estimating the visual variety of concepts by referring to Web popularity 査読有り

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    Multimedia Tools and Applications   78 巻 ( 7 ) 頁: 9463 - 9488   2019年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Increasingly sophisticated methods for data processing demand knowledge on the semantic relationship between language and vision. New fields of research like Explainable AI demand to step away from black-boxed approaches and understanding how the underlying semantics of data sets and AI models work. Advancements in Psycholinguistics suggest, that there is a relationship from language perception to how language production and sentence creation work. In this paper, a method to measure the visual variety of concepts is proposed to quantify the semantic gap between vision and language. For this, an image corpus is recomposed using ImageNet and Web data. Web-based metrics for measuring the popularity of sub-concepts are used as a weighting to ensure that the image composition in a dataset is as natural as possible. Using clustering methods, a score describing the visual variety of each concept is determined. A crowd-sourced survey is conducted to create ground-truth values applicable for this research. The evaluations show that the recomposed image corpus largely improves the measured variety compared to previous datasets. The results are promising and give additional knowledge about the relationship of language and vision.

    DOI: 10.1007/s11042-018-6528-x

  61. 他車両からの観測結果を事前知識とした車載カメラ映像中の人物再検出

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    画像電子学会誌   48 巻 ( 2 ) 頁: 273 - 277   2019年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本稿では,過去に別途検出されたことがある人物について,検出した時に得た知識を事前知識として利用することで,その人物を再び検出する際に精度よく検出する「人物再検出」という概念を提案する.また,この概念を車載カメラ映像中の人物検出に適用する方法を示す.本研究では自車がある地点で人物の検出をする際,自車より前にその人物の近くを通過した他車が,先にその場所の近くでその人物を検出している可能性が高いことに着目し,他車による観測を事前知識として人物再検出を行なう.実験により,独自に収集したデータセットを用いた評価において,事前知識を用いることで大きく検出性能が向上することを示す.

  62. Summarization of multiple news videos considering the consistency of audio-visual contents 査読有り

    Ye Zhang, Ryunosuke Tanishige, Ichiro Ide, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    International Journal of Semantic Computing   13 巻 ( 1 ) 頁: 135 - 155   2019年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1142/S1793351X19500016

  63. Hard Negative Mining from in-Vehicle Camera Images based on Multiple Observations of Background Patterns 査読有り

    Masashi Hontani, Haruya Kyutoku, David Robert Wong, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2019   5 巻   頁: 435 - 442   2019年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, the demand for highly accurate pedestrian detectors has increased due to the development of advanced driving support systems.
    For the training of an accurate pedestrian detector, it is important to collect a large number of training samples.
    To support this, this paper proposes a ``hard negative'' mining method to automatically extract background images which tend to be erroneously detected as pedestrians.
    Negative samples are selected based on the assumption that frequent patterns observed multiple times in the same location are most likely parts of the background scene.
    As a result of an evaluation using in-vehicle camera images captured along the same route, we confirmed that the proposed method can automatically collect false positive samples accurately.
    We also confirmed that a highly accurate detector can be constructed using the additional negative samples.

  64. Next Viewpoint Recommendation by Pose Ambiguity Minimization for Accurate Object Pose Estimation 査読有り

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Ayako Amma, Norimasa Kobori

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2019   5 巻   頁: 60 - 67   2019年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    3D object pose estimation by using a depth sensor is one of the important tasks in activities by robots. To reduce the pose ambiguity of an estimated object pose, several methods for multiple viewpoint pose estimation have been proposed. However, these methods need to select the viewpoints carefully to obtain better results. If the pose of the target object is ambiguous from the current observation, we could not decide where we should move the sensor to set as the next viewpoint. In this paper, we propose a best next viewpoint recommendation method by minimizing the pose ambiguity of the object by making use of the current pose estimation result as a latent variable. We evaluated viewpoints recommended by the proposed method and confirmed that it helps us to gain better pose estimation results than several comparative methods on a synthetic dataset.

  65. Pedestrian Intensive Scanning for Active-scan LIDAR 査読有り

    Taiki Yamamoto, Fumito Shinmura, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2019   5 巻   頁: 313 - 320   2019年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, LIDAR is playing an important role as a sensor for understanding environments of a vehicle’s surroundings. Active-scan LIDAR is being actively developed as a LIDAR that can control the laser irradiation direction arbitrary and rapidly. In comparison with conventional uniform-scan LIDAR (e.g. Velodyne HDL-64e), Active-scan LIDAR enables us to densely scan even distant pedestrians. In addition, if appropriately controlled, this sensor has the potential to reduce unnecessary laser irradiations towards non-target objects. Although there are some preliminary studies on pedestrian scanning strategy for Active-scan LIDARs, in the best of our knowledge, an efficient method has not been realized yet. Therefore, this paper proposes a novel pedestrian scanning method based on orientation aware pedestrian likelihood estimation using the orientation-wise pedestrian’s shape models with local distribution of measured points. To evaluate the effectiveness of the proposed method, we conducted experiments by simulating Active-scan LIDAR using point-clouds from the KITTI dataset. Experimental results showed that the proposed method outperforms conventional methods.

  66. Voting-based Hand-Waving Gesture Spotting from a Low-Resolution Far-Infrared Image Sequence 査読有り

    Yasutomo Kawanishi, Chisato Toriyama, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa, Masato Kawade

    Proceedings of 2018 IEEE International Conference on Visual Communications and Image Processing (VCIP2018)     2018年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We propose a temporal spotting method of a hand gesture from a low-resolution far-infrared image sequence captured by a far-infrared sensor array. The sensor array captures the spatial distribution of far-infrared intensity as a thermal image by detecting far-infrared waves emitted from heat sources. It is difficult to spot a hand gesture from a sequence of thermal images captured by the sensor due to its low-resolution, heavy noise, and varying duration of the gesture. Therefore, we introduce a voting-based approach to spot the gesture with template matching-based gesture recognition. We confirm the effectiveness of the proposed temporal spotting method in several settings.

    DOI: 10.1109/VCIP.2018.8698650

  67. Gaze-inspired Learning for Estimating the Attractiveness of a Food Photo 査読有り

    Akinori Sato, Takatsugu Hirayama, Keisuke Doman, Yasutomo Kawanishi, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 20th IEEE Int. Symposium on Multimedia (ISM2018)     頁: 36 - 43   2018年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    The number of food photos posted to the Web has been increasing. Most of the users prefer to post delicious-looking food photos. They, however, do not always look delicious. A previous work proposed a method for estimating the attractiveness of food photos, that is, the degree of how much a food photo looks delicious, as an assistive technology for taking a delicious-looking food photo. This method extracted image features from the entire food photo to evaluate the impression. In our work, we conduct a preference experiment where subjects are asked to compare a pair of food photos and measure their gaze. The proposed method extracts image features from local regions selected based on the gaze information and estimates the attractiveness of a food photo by learning regression parameters. Experimental results showed the effectiveness of extracting image features from outside the gaze regions rather than inside them.

    DOI: 10.1109/ISM.2018.00015

  68. 赤外線センサアレイを用いた畳み込みRNNによる人物行動認識 査読有り

    川島 昂之, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎, 川出 雅人

    精密工学会誌   84 巻 ( 12 ) 頁: 1025 - 1032   2018年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    This paper proposes a Deep Learning-based action recognition method from an extremely low-resolution FIR image sequence. The method recognizes daily actions by humans (e.g. walking, sitting down, standing up, and so on) and abnormal actions (e.g. falling down) without privacy concerns. While privacy concerns can be ignored, it is difficult to compute feature points and to obtain a clear edge of the human body from an extremely low-resolution FIR image. To address these problems, this paper proposes a Deep Learning-based action recognition method whose inputs are the FIR images and their frame differences cropped by the gravity center of human regions.

  69. 低密度LIDAR点群からの歩行者検出 査読有り

    建部 好輝, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    精密工学会誌   84 巻 ( 12 ) 頁: 1017 - 1024   2018年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    In recent years, the demand for pedestrian detection using LIDAR is increasing, as it can be used to prevent traffic accidents involving pedestrians. To avoid traffic accidents, detection of distant pedestrians is very important. However, they are scanned sparsely even if a dense-scan LIDAR is used, and this causes the degradation of the detection accuracy. There-fore, pedestrian detection from sparsely-scanned LIDAR point-clouds is expected to be developed. This paper proposes a LIDAR-based pedestrian detection method using 3DCNN. Since it is difficult to train a 3DCNN directly from sparse point-clouds, the proposed method converts them to a voxel representation using the kernel density estimation based on LIDAR characteristics. To evaluate the performance of the proposed method, an experiment using real-world LIDAR data was conducted. The results showed that the proposed method could detect pedestrians more accurately than detectors trained with other conventional features.

    DOI: 10.2493/jjspe.84.1017

  70. Localizing the Gaze Target of a Crowd of People 査読有り

    Yuki Kodama, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hidehisa Nagano, Kunio Kashino

        2018年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    What target is focused on by many people?
    Analysis of the target is a crucial task, especially in a cinema, a stadium, and so on.
    However, it is very difficult to estimate the gaze of each person in a crowd accurately and simultaneously with existing image-based eye tracking methods, since the image resolution of each person becomes low when we capture the whole crowd with a distant camera.
    Therefore, we introduce a new approach for localizing the gaze target focused on by a crowd of people.
    The proposed framework aggregates the individually estimated results of each person's gaze.
    It enables us to localize the target being focused on by them even though each person's gaze localization from a low-resolution image is inaccurate.
    We analyze the effects of an aggregation method on the localization accuracy using images capturing a crowd of people in a tennis stadium under the assumption that all of the people are focusing on the same target, and also investigate the effect of the number of people involved in the aggregation on the localization accuracy.
    As a result, the proposed method showed the ability to improve the localization accuracy as it is applied to a larger crowd of people.

  71. Analyzing Headlight Flicker Patterns for Improving the Pedestrian Detectability from a Driver 査読有り

    Takashi Maeda, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2018 IEEE 21st International Conference on Intelligent Transportation Systems (ITSC2018)     頁: 3113 - 3118   2018年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we analyze headlight flicker patterns which improve the pedestrian detectability from a driver. Recently, headlights are becoming capable of selectively projecting light on a pedestrian in addition to the normal forward projection. However, it is still not clear how the light should be
    projected to effectively improve the visibility of the pedestrian. We actually analyze nine flicker patterns by controlling duty ratios and durations of lighting time, and conduct experiments in field and laboratory settings. As a result, we reveal that a specific fundamental frequency is effective for improving the pedestrian detectability from a driver. We also conclude that the difference between the two settings are not significant.

  72. Estimating the Scene-wise Reliability of LiDAR Pedestrian Detectors 査読有り

    Haruya Kyutoku, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Kazuki Kato, Hiroshi Murase

    Proceedings of 2018 IEEE 21th International Conference on Intelligent Transportation Systems (ITSC2018)     頁: 3511 - 3516   2018年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Nowadays, development of driving support systems and autonomous driving systems have become active.
    Pedestrian detection from in-vehicle sensors is one of the most important technologies for these systems.
    However, outputs of pedestrian detectors can not be fully trusted in real environments.
    Therefore, we propose an estimation system of pedestrian detector's reliabilities for a given scene.
    This paper proposes a scene-wise reliability calculation method for LiDAR-based detectors, and a construction method for their estimators.
    Here, the problem is how we can define the reliability.
    The proposed method defines the reliability considering oversights as the strictest threshold without oversights.
    Meanwhile, it defines the reliability considering false detections as the loosest threshold without false detections.
    Experimental results showed that the proposed method could properly represent the reliability of a given scene, and estimate their reliability.

  73. Attribute-aware Semantic Segmentation of Road Scenes for Understanding Pedestrian Orientations 査読有り

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Takatsugu Hirayama, Ichiro Ide, Jiang-Yu Zheng, Hiroshi Murase

    Proceedings of 2018 IEEE 21th International Conference on Intelligent Transportation Systems (ITSC2018)     頁: 2698 - 2703   2018年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Semantic segmentation is an interesting task for many deep learning researchers for scene understanding. However, recognizing details about objects’ attributes can be more informative and also helpful for a better scene understanding in intelligent vehicle use cases. This paper introduces a method for simultaneous semantic segmentation and pedestrian attributes recognition. A modified dataset built on top of the Cityscapes dataset is created by adding attribute classes corresponding to pedestrian orientation attributes. The proposed method extends the SegNet model and is trained by using both the original and the attribute-enriched datasets. Based on an experiment, the proposed attribute-aware semantic segmentation approach shows the ability to slightly improve the performance on the Cityscapes dataset, which is capable of expanding its classes in this case through additional data training.

  74. Estimation of Driver's Insight for Safe Passing based on Pedestrian Attributes 査読有り

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Takatsugu Hirayama, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    Proceedings of 2018 IEEE 21th International Conference on Intelligent Transportation Systems (ITSC2018)     頁: 1041 - 1046   2018年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In order to reduce traffic accidents between a vehicle and a pedestrian, recognition of a pedestrian who has a possibility of collision with a vehicle should be helpful. However, since a pedestrian may suddenly change his/her direction and cross the road, it is difficult to predict his/her behavior directly. Here, we focus on the fact that experienced drivers usually pass by a pedestrian while preparing to step on the brake at any moment when they feel danger. If driver assistant systems can estimate such experienced driver’s decisions, they could early detect the pedestrian in danger of collision. Therefore, we classify the driver’s decisions into three types by referring to the accelerator operation of drivers, and propose a method to estimate the type of the driver’s decision. The drivers are considered to decide their actions focusing on various behaviors and states of a pedestrian, namely pedestrian’s attributes. Since the driver’s decisions change along the timeline, the use of a temporal context is considered to be effective. Thus, in this paper, we propose an estimation method using a recurrent neural network architecture with the pedestrian’s attributes as input. We constructed a dataset collected by experienced drivers in control of the vehicle and evaluated the performance, and then confirmed the effectiveness of the use of pedestrian’s attributes.

  75. テレビ会議話者間の視線一致知覚のための目領域合成手法 査読有り

    井上 卓弥, 平山 高嗣, 高橋 友和, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 黒住 隆行, 柏野 邦夫

    電気学会論文誌C   138 巻 ( 11 ) 頁: 1399 - 1409   2018年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    DOI: https://doi.org/10.1541/ieejeiss.138.1399

  76. Epipolar geometry-based ego-localization using an in-vehicle monocular camera

    Haruya Kyutoku, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

        2018年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Nowadays, development of driving support systems and autonomous driving systems have become active.
    Vehicle ego-localization using in-vehicle sensors is one of the most important technologies for these systems.
    Accordingly, various attempts to localize own vehicle from in-vehicle sensors have been made.
    In general, the estimation accuracy of the traveling direction is lower than in the lateral direction.
    Therefore, we propose a highly accurate method for ego-localization of the traveling direction based on epipolar geometry using an in-vehicle monocular camera.
    The proposed method makes correspondences between in-vehicle camera images and database images with location information, and calculates the location using locations annotated to the corresponding database images.
    However, there are many gaps due to the difference of speed and trajectory of vehicles even if the images are obtained along the same road.
    To overcome this problem, the distance between the input image and the database image is calculated by the distance metric based on the epipolar geometry and the local feature method.
    An experiment was conducted using actual images with correct locations, and we confirmed the effectiveness of the proposed method from its results.

  77. Vehicle counting via car parts detection from an in-vehicle camera image

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

        2018年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a method to count vehicles from an in-vehicle camera image by regression based on car parts detection. In the case of an in-vehicle camera image, since vehicles are frequently occluded by other vehicles in traffic congestion, it is difficult to accurately count vehicles. Therefore, we propose a method to count vehicles by regression based on the number of visible car parts. For this, we make an estimator by learning the relation between the number of visible car parts and that of vehicles by Support Vector Regression. We evaluated our method using in-vehicle camera images recorded in an actual environment, where the proposed method performed better than counting detected vehicles.

  78. Camera DropoutとTrajectory Ensembleによる多カメラ間複数人物追跡 査読有り

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J101-D 巻 ( 8 ) 頁: 1079 - 1088   2018年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    複数カメラにわたる多人数追跡は,通常,対応付けの候補を減らすために複数のカメラの隣接関係をカメラネットワークというグラフ構造で表現し,カメラネットワーク上の隣接カメラ間での人物対応付けにより実現される.しかし,カメラ間の照明環境の違いや撮影した人物の向きの違いによって対応付けを誤ることがあり,このような場合に追跡が途切れることがある.この問題に対し,隣接カメラだけでなく,カメラネットワーク上で離れたカメラ間での人物対応付けをすることが考えられるが,必要以上に対応付け候補が増加してしまい,誤対応の原因となる.本論文では,本来のカメラネットワークからカメラを無作為に削除したカメラネットワークを複数作る(Camera Dropout)ことで,一部のカメラについては離れたカメラまで考慮した対応付けを行い,更に各カメラネットワーク上での追跡結果をアンサンブルクラスタリングの考え方で統合し,最終的な追跡結果を得るTrajectory Ensembleという手法を提案する.実験では,公開データセットから仮想的に生成した複数のデータセット上で評価を行い,既存の追跡手法に加えてTrajectory Ensembleを導入することにより,精度良く追跡ができることを確認した.

  79. Visualization of Real World Activity on Group Work

    Daisuke Deguchi, Kazuaki Kondo, Atsushi Shimada

    Proceedings of 20th International Conference on HCI International 2018 (HCII2018)   LNCS 10902 巻   頁: 23 - 37   2018年7月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Group work is widely introduced and practiced as a method to achieve the learning goal efficiently by collaborating group members. However, since most types of group works are carried out in the real environment, it is very difficult to perform formative assessment and real time evaluation without students' feedbacks. Therefore, there is a strong demand to develop a method that supports evaluation of group work. To support evaluation of group work, this paper proposes a method to visualize the real world activity during group work by using first person view cameras and wearable sensors. Here, the proposed method visualizes three scores: (1) individual attention, (2) hand visibility, (3) individual activity. To evaluate the performance and analyze the relationships between scores, we conducted experiments of Marshmallow challenge" that is a collaborative work to construct a tower using marshmallow and spaghetti within a limit of time. Through the experiments, we confirmed that the proposed method has potential to become a evaluation tool for visualizing the activity of the group work."

    DOI: 10.1007/978-3-319-91131-1_2

  80. 音象徴性を利用したオノマトペによる歩容の記述 査読有り

    加藤 大貴, 平山 高嗣, 道満 恵介, 井手 一郎, 川西 康友, 出口 大輔, 村瀬 洋

    人工知能学会論文誌   33 巻 ( 4 ) 頁: 1 - 9   2018年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

  81. Pedestrian Detectability Estimation Considering Visual Adaptation to Drastic Illumination Change 査読有り

    Yuki Imaeda, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEICE Transactions on Information and Systems   E101-D 巻 ( 5 ) 頁: 1457 - 1462   2018年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1587/transinf.2017EDL8215

  82. Development of 'KamiRepo' System with Automatic Student Identification to Handle Handwritten Assignments on LMS 査読有り

    Shunya Seiya, Ryuya Ito, Kosuke Okamoto, Ukyo Tanikawa, Shigeki Ohira, Daisuke Deguchi, Tomoki Toda

    Proceedings of 2018 the IEEE Global Engineering Education Conference (EDUCON2018)     頁: 841 - 848   2018年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    A Learning Management System (LMS) has become a fundamental tool for higher education, and a framework to leverage digital education data in the LMS has attracted attention. On the other hand, there is strong demand to deal with various education data provided not only from electronic media but also non-electronic media, such as a handwritten assignment. To solve this problem, this paper describes the development of 'KamiRepo' system to make it possible to automatically upload handwritten assignments to the LMS. In this system, optical character recognition (OCR) is performed to identify scanned handwritten assignments of individual students and read their scores. Then, their scanned files automatically separated from the entire file of the scanned handwritten assignments are returned to the individual students through LMS together with their corresponding scores. Compared with a conventional system using the dedicated multifunction printer, our developed system is capable of 1) using general-purpose scanners, 2) using a user interface on Web browser, and 3) achieving accurate student identification. We have launched this system in our university in April 2017 and have evaluated its effectiveness. The experimental results using real data collected for 6 months showed that our system achieved 99.7% of success rate in the automatic upload process.

  83. A Preliminary Study on Optimizing Person Re-identification using Stable Marriage Algorithm 査読有り

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

        頁: 6   2018年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Person re-identification gains an increasing interest
    in the surveillance image processing field due to its’ importance
    for security. Most approaches to solve the person re-identification
    problem match persons one-by-one. However, redundant match-
    ing where one of the person is selected for the matching pair
    several times often occurs. It also degrades the overall image
    matching performance. To overcome the issue, in this paper,
    we propose a method which solves the person re-identification
    problem for multiple persons simultaneously. Instead of one-
    by-one matching, we consider person re-identification as an
    instance of the Stable Marriage Problem (SMP). The result of an
    experiment showed that the proposed method outperforms some
    of the existing state-of-the-art methods applied to the VIPeR
    dataset.

  84. Efficient Pedestrian Scanning by Active Scan LIDAR 査読有り

    Taiki Yamamoto, Fumito Shinmura, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of International Workshop on Advanced Image Technology (IWAIT) 2018     頁: 1 - 4   2018年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  85. Pedestrian Detection from Sparse Point-Cloud using 3DCNN 査読有り

    Yoshiki Tatebe, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Utsushi Sakai

    Proceedings of International Workshop on Advanced Image Technology (IWAIT) 2018     頁: 1 - 4   2018年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  86. Automatic selection of Web contents towards automatic authoring of a video biography 査読有り

    Ichiro Ide, Yasutomo Kawanishi, Kyoka Kunishiro, Frank Nack, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 19th IEEE Int. Symposium on Multimedia (ISM2017)     頁: 304 - 307   2017年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ISM.2017.54

  87. Summarization of news videos considering the consistency of auditory and visual contents 査読有り

    Ichiro Ide, Ye Zhang, Ryunosuke Tanishige, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 19th IEEE Int. Symposium on Multimedia (ISM2017)     頁: 193 - 199   2017年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ISM.2017.33

  88. Toward Describing Human Gaits by Onomatopoeias 査読有り

    Hirotaka Kato, Takatsugu Hirayama, Yasutomo Kawanishi, Keisuke Doman, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 2017 IEEE International Conference on Computer Vision (ICCV2017) Workshops     頁: 1573 - 1580   2017年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  89. Driver's Decision Analysis in Terms of Pedestrian Attributes -A Case Study in Passing by a Pedestrian-

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    Proceedings of Workshop on Human Factors in Intelligent Vehicles     頁: 32 - 36   2017年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we report a case study on driver's decision in terms of pedestrian attributes. Among various traffic situations, the situation that a vehicle passes by a pedestrian is one of the major situations. To build a safety driving system that supports a non-experienced driver in such a situation, we analyzed how experienced drivers decide to handle the vehicle in such a situation. Since pedestrian’s behavior can be considered as a key factor for the decision, and also the behavior is different depending on their attributes," such as walking or stopping, noticing the vehicle or not, using a smartphone, etc., we analyzed what pedestrian's attributes affect the driver's decisions. For the analysis, we first built a large-scale dataset of driving data. Using the dataset, we clarified what attributes are dominant for the driver's decision."

  90. Detection of Similar Geo-Regions based on Visual Concepts in Social Photos 査読有り

    Hiroki Takimoto, Magali Philippe, Yasutomo Kawanishi, Ichiro Ide, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

        2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Travel destination recommendation is useful to support travel.Considering the recommendation of regions within the destination area to visit, it could be difficult for the users to explicitly indicate their preference.Therefore, we considered that it would be more intuitive to recommend regions in the destination area that are similar to a region already well-known to the user.Thus, in this paper, we propose a method for the detection of similar geo-regions based on Visual Concepts in social photos.We report experimental results and analyses by applying the proposed method to the YFCC100M dataset.

  91. Proposal of an encoded marker for working robots: An encoded marker easy to detect in various positions and under blur 査読有り

    Norimasa Kobori, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Electronics and Communications in Japan   100 巻 ( 10 ) 頁: 59 - 69   2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1002/ecj.11987

  92. Action Recognition from Extremely Low-Resolution Thermal Image Sequence 査読有り

    Takayuki Kawashima, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa, Masato Kawade

    Proceedings of the 14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS2017)     2017年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a Deep Learning-based action recognition method from an extremely low-resolution thermal image sequence. The method recognizes daily actions by humans (e.g. walking, sitting down, standing up, etc.) and abnormal actions (e.g. falling down) without privacy concerns. While privacy concerns can be ignored, it is difficult to compute feature points and to obtain a clear edge of the human body from an extremely low-resolution thermal image. To address these problems, this paper proposes a Deep Learning-based action recognition method that combines convolution layers and an LSTM layer for learning spatio-temporal representation, whose inputs are the thermal images and their frame differences cropped by the gravity center of human regions. The effectiveness of the proposed method was confirmed through experiments.

    DOI: 10.1109/AVSS.2017.8078497

  93. Estimation of the attractiveness of food photography focusing on main ingredients 査読有り

    Kazuma Takahashi, Keisuke Doman, Yasutomo Kawanishi, Takatsugu Hirayama, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 9th Workshop on Cooking and Eating Activities (CEA2017) in conjunction with IJCAI2017     頁: 1 - 6   2017年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/3106668.3106670

  94. Regression of Feature Scale Tracklets for Decimeter Visual Localization 査読有り

    David Robert Wong, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Image and Vision Computing   68 巻   頁: 53 - 63   2017年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Localization along a route is an everyday necessity for in-vehicle navigation systems, and a vital task for automated driving technologies. Visual ego-localization promises reliable accuracy even in challenging urban environments where Global Positioning Systems (GPSs) can fail. Using cameras for localization against a pre-constructed database requires either the creation of a dense three-dimensional feature point map and pose estimation of a query camera relative to this map, or image matching along a database route to determine the capture position of the query camera based on the most similar database image. While the latter method is potentially less computationally intensive and can provide a more compact database, localization accuracy is limited by the discrete positioning information at database frame capture locations. In this paper we propose an image matching method that makes use of image features which are pre-matched during database construction, allowing linear regression coefficients for the relationship between capture position and feature scale to be calculated. The capture position of matched query features can then be estimated to sub-database spacing resolution. By incorporating the visual localization system into a Bayes estimator, we demonstrate an average monocular vision localization accuracy of 0.33 m in tests on actual vehicle image streams.

    DOI: 10.1016/j.imavis.2017.07.004

  95. Headgear Recognition by Decomposing Human Images in the Thermal Infrared Spectrum 査読有り

    Brahmastro Kresnaraman, Yasutomo Kawanishi, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Proceedings of the 15th International Conference on Quality in Research (QiR2017)     頁: 164 - 168   2017年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Surveillance systems play a critical role in security and surveillance. A surveillance system with cameras that work in the visible spectrum is sufficient for most cases. However, problems may arise during the night, or in areas with less than ideal illumination conditions. Cameras with thermal infrared technology can be a better option in these situations since they do not rely on illumination to observe the environment. Furthermore, in our daily lives, it is common for humans to wear headgears such as glasses, masks, and hats. In surveillance, such headgears can be a hindrance to the identification of a person, and hence pose a certain degree of risk. This is not ideal in areas where the identity of a person is important, for example, in a bank. Therefore, in this paper we propose a headgear recognition method using an innovative decomposition approach on thermal infrared images. The decomposition method is based on Robust Principal Component Analysis, a modification of the popular Principal Component Analysis. The proposed method performs decomposition on a human image and isolates headgears in the image for recognition purposes. Experiments were conducted to evaluate the capability of the proposed method. The results show a positive outcome when compared with other methods.

    DOI: 10.1109/QIR.2017.8168475

  96. Trajectory Ensemble: Multiple Persons Consensus Tracking across Non-overlapping Multiple Cameras over Randomly Dropped Camera Networks 査読有り

    Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

        頁: 1471 - 1477   2017年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Multiple person tracking over a camera network is usually performed by matching person images between adjacent cameras. It easily fails by a temporal appearance change of the persons caused by environmental illumination and observation orientation of a camera. To solve this problem, matching person images across not only adjacent cameras but also cameras multiple hops away in the camera network is effective, but such relaxation of spatiotemporal cues also cause tracking failure due to the increase of matching candidates. To avoid the failure, we introduce Random Camera Drop" to generate different camera networks which relax the spatio-temporal cues partially and randomly. We then, integrate tracking results over the networks to a consensus tracking result by a novel concept "Trajectory Ensemble", an extension of unsupervised ensemble learning for the multiple person tracking over a camera network problem. We evaluated the framework on several virtual datasets generated from a public dataset, "Shinpuhkan 2014 dataset" and confirmed that the proposed method achieves the highest tracking results among several comparative methods."

  97. Monocular Localization within Sparse Voxel Maps 査読有り

    David Robert Wong, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 2017 IEEE Intelligent Vehicles Symposium (IV2017)     頁: 493 - 498   2017年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We introduce a method that uses a single camera to localize a vehicle within a pre-constructed map consisting of a voxel occupancy grid and road-line marker positions. Sophisticated mapping hardware is capable of creating high accuracy 3D maps of road environments, but localizing a vehicle within such maps is one of the challenges at the forefront of automated driving. A solution which is robust to dynamic environments, while using only inexpensive sensors, is a difficult problem. In addition, maps that enable precise localization consume a lot of data which is impractical for the expansive environments encountered in real-world road networks. We show how using the area of edge regions shared between rendered views of a compact voxel map and in-vehicle camera images can be coupled with non-linear optimization methods to determine the camera position and pose.

  98. Proposal of a spectral random dots marker using local feature for posture estimation 査読有り

    Norimasa Kobori, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of IEEE Virtual Reality 2017     頁: 223 - 224   2017年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/VR.2017.7892257

  99. Deep Manifold Embedding for 3D Object Pose Estimation 査読有り

    Hiroshi Ninomiya, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Norimasa Kobori, Yusuke Nakano

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2017   5 巻   頁: 173 - 178   2017年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0006101201730178

  100. Human Wearable Attribute Recognition Using Probability-Map-Based Decomposition of Thermal Infrared Images 査読有り

    Brahmastro Kresnaraman, Yasutomo Kawanishi, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences   E100-A 巻 ( 3 ) 頁: 854 - 864   2017年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    This paper addresses the attribute recognition problem, a
    field of research that is dominated by studies in the visible spectrum. Only
    a few works are available in the thermal spectrum, which is fundamentally
    different from the visible one. This research performs recognition specif-
    ically on wearable attributes, such as glasses and masks. Usually these
    attributes are relatively small in size when compared with the human body,
    on top of a large intra-class variation of the human body itself, therefore
    recognizing them is not an easy task. Our method utilizes a decomposi-
    tion framework based on Robust Principal Component Analysis (RPCA) to
    extract the attribute information for recognition. However, because it is dif-
    ficult to separate the body and the attributes without any prior knowledge,
    noise is also extracted along with attributes, hampering the recognition
    capability. We made use of prior knowledge; namely the location where
    the attribute is likely to be present. The knowledge is referred to as the
    Probability Map, incorporated as a weight in the decomposition by RPCA.
    Using the Probability Map, we achieve an attribute-wise decomposition.
    The results show a significant improvement with this approach compared
    to the baseline, and the proposed method achieved the highest performance
    in average with a 0:83 F-score.

  101. Can We Detect Pedestrians using Low-resolution LIDAR? 査読有り

    Yoshiki Tatebe, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Utsushi Sakai

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2017   5 巻   頁: 157 - 164   2017年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0006100901570164

  102. Wheelchair-user Detection Combined with Parts-based Tracking 査読有り

    Ukyo Tanikawa, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Ryo Kawai

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2017   5 巻   頁: 165 - 172   2017年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0006101101650172

  103. Can a Driver Assistance System Determine if a Driver is Perceiving a Pedestrian? 査読有り

    Yuki Imaeda, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2017   4 巻   頁: 611 - 616   2017年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0006229306110616

  104. Single Camera Vehicle Localization Using Feature Scale Tracklets 査読有り

    David Robert Wong, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences   E100-A 巻 ( 2 ) 頁: 702 - 713   2017年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Advances in intelligent vehicle systems have led to modern automobiles being able to aid drivers with tasks such as lane following and automatic braking. Such automated driving tasks increasingly require reliable ego-localization. Although there is a large number of sensors that can be employed for this purpose, the use of a single camera still remains one of the most appealing, but also one of the most challenging. GPS localization in urban environments may not be reliable enough for automated driving systems, and various combinations of range sensors and inertial navigation systems are often too complex and expensive for a consumer setup. Therefore accurate localization with a single camera is a desirable goal.
    In this paper we propose a method for vehicle localization using images captured from a single vehicle-mounted camera and a pre-constructed database.
    Image feature points are extracted, but the calculation of camera poses is not required---instead we make use of the feature points' scale.
    For image feature-based localization methods, matching of many features against candidate database images is time consuming, and database sizes can become large. Therefore, here we propose a method that constructs a database with pre-matched features of known good scale stability. This limits the number of unused and incorrectly matched features, and allows recording of the database scales into ``tracklets''. These ``Feature scale tracklets'' are used for fast image match voting based on scale comparison with corresponding query image features. This process reduces the number of image-to-image matching iterations that need to be performed while improving the localization stability. We also present an analysis of the system performance using a dataset with high accuracy ground truth. We demonstrate robust vehicle positioning even in challenging lane change and real traffic situations.

    DOI: 10.1587/transfun.E100.A.702

  105. 視線遷移と瞬きの時系列パターンに基づく調理動作識別手法 査読有り

    井上 裕哉, 平山 高嗣, 道満 恵介, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    電子情報通信学会論文誌   J100-A 巻 ( 1 ) 頁: 12 - 23   2017年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本研究では,調理者の視線遷移と瞬きの時系列パターンに基づいて調理動作を識別する手法を提案する.視線情報が人間の行動を理解するうえで重要であることから,頭部に装着した視線計測装置により視線運動データを計測し,調理動作識別に用いる.視線パターンの表現には,視線情報に着目した動作認識において有用とされるN-gramを採用する.従来研究では,前フレームからの相対的な視線遷移のみがN-gramを構成する記号に用いられていた.これに対して本研究では,調理動作には調理対象への注視を持続させる振る舞いが頻繁に表れることから「停留」と,動作に対する集中を考慮するために「瞬き」を表現する記号を加えた.そして,高次元特徴を効率的に学習でき,特徴量のノイズに強いとされるRandom Forestを利用し,視線パターンが各調理動作クラスに属する事後確率を出力する識別器を構築した.実験結果から各調理動作の性質と識別に対する寄与度が高い視線パターンとの関係性を明らかにしたうえで,調理動作識別において従来手法よりも高い識別精度が得られ,提案手法の有効性を確認した.

  106. Misclassification Tolerable Learning for Robust Pedestrian Orientation Classification 査読有り

    Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

        頁: 481 - 486   2016年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we propose a multiclass classifier training method which reduces fatal" misclassifications by cost-relaxation of "tolerable" misclassifications in one-against-all classifiers training, named misclassification tolerable learning. In a binary classifier in the one-against-all classifiers, we introduce a new class group "conceptually similar classes," whose class labels are similar to the positive class. In the case of pedestrian orientation classification, the conceptually similar classes are defined as neighboring orientations to the positive orientation. We consider the misclassification of the conceptually similar classes to the positive class as tolerable misclassification. By relaxing the cost of the tolerable misclassifications, our proposed classification method reduces fatal misclassifications of non-similar classes. We evaluated the cost-relaxation effectiveness on several public datasets and confirmed that the proposed method outperforms the normal SVM on all of the datasets in the soft criterion by achieving 78.63% recognition rate on PDC Dataset."

  107. 誤検出マイニングに基づくシーン適応型歩行者検出 査読有り

    鈴木 悠暉, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    精密工学会誌   82 巻 ( 12 ) 頁: 1085 - 1091   2016年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    In recent years, demands for Advanced Driving Assistance Systems (ADAS) is increasing, and pedestrian detection has become one of the most important and popular technologies in this system. In the case of pedestrian detection using an in-vehicle camera, since the road environment varies widely according to difference in lightning, weather, etc., it is very difficult to handle them with a single classifier, and numerous false positives are detected. To overcome this problem, this paper proposes a novel pedestrian detection method by scene adaptation based on false positive mining. When we observe the appearance of false positives in in-vehicle camera images, those with similar features are found even in different road environments. The proposed method focuses on the appearance of the detected false positives, and considers it as a scene that the classifier is not good at. By analyzing such a false positive tendency in each scene, the proposed method associates the false positive tendency to each scene and then associates them to each training image. Then, classifiers are constructed so that they can cope with false positives observed in each scene. To evaluate the effectiveness of the proposed method, experiments were conducted on the Caltech Pedestrian Detection Benchmark datasets. Its results showed that the proposed method outperforms the method without adaptation.

    DOI: 10.2493/jjspe.82.1085

  108. Recognition of Texting-While-Walking by Joint Features based on Arm and Head Poses 査読有り

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

        2016年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Pedestrians texting-while-walking" increase the risk of traffic accidents, since they are often not paying attention to their surrounding environments and fails to notice approaching vehicles. Thus, the recognition of texting-while-walking from an in-vehicle camera should be helpful for safety driving assistance. In this paper, we propose a method to recognize a pedestrian texting-while-walking from in-vehicle camera images. The proposed approach focuses on the characteristic relationship between the arm and the head poses observed during a texting-while-walking behavior. In this paper, Pose-Dependent Joint HOG feature is proposed as a novel feature, which uses parts locations as prior knowledge and describes the cooccurrence of the arm and the head poses. To show the effectiveness of the proposed method, we constructed a dataset and evaluated it."

  109. Moving camera background-subtraction for obstacle detection on railway tracks 査読有り

    Hiroki Mukoujima, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Masato Ukai, Nozomi Nagamine, Ryuta Nakasone

    Proceedings of 2016 IEEE International Conference on Image Processing (ICIP2016)     頁: 3967 - 3971   2016年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a method for detecting obstacles using train frontal view videos.
    In recent years, obstacles detection using in-vehicle camera is actively developed for satisfying demands from various applications.
    In the field of obstacle detection, most methods employ machine learning approach, and they can detect only trained obstacles, such as pedestrian, bicycle, etc.
    Therefore, they cannot detect untrained general obstacles.
    To overcome this problem, this paper propose a background subtraction method using moving camera.
    The proposed method first computes frame-by-frame correspondences between the present and the database train frontal view image sequences, and detects obstacles by applying image subtraction to corresponding frames.
    To confirm the effectiveness of the proposed method, experiments were conducted by using several image sequences captured at the experimental railroad track.
    The experimental result showed that the proposed method could detect various obstacles accurately and effectively.

    DOI: 10.1109/ICIP.2016.7533104

  110. Subjective Sensing of Real World Activity on Group Study 査読有り

    Daisuke Deguchi, Kazuaki Kondo, Atsushi Shimada

    Proceedings of the 18th International Conference on Collaboration Technologies (CollabTech2016)     頁: 5 - 8   2016年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Collaborative learning is efficient teaching/learning method, and it is widely introduced and practiced in various situations. However, it has a difficulty to perform formative assessment and real time evaluation without students' feedbacks. Therefore, demand for technologies to support formative assessment in collaborative learning is increasing. To tackle this problem, we have started the research project for automatic sensing and visualization of real world activities in collaborative learning. In this paper, we will report details about preliminary group work experiments and its results with visualization tool.

  111. 作業用ロボットのための符号化マーカの提案 査読有り

    小堀 訓成, 出口 大輔, 井手 一郎, 村瀬 洋

    電気学会論文誌C   136 巻 ( 9 ) 頁: 1367 - 1375   2016年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    It is becoming important for working robots to be able to identify and pick objects in various tasks. As in the recent Amazon Picking Challenge, using a marker for the picking task is a more practicable approach. However, a common marker code for working robots does not exist so far. Conventional marker codes as represented by QR code or ARToolKit marker cannot be reliably detected from various viewpoints. Thus in this paper, we propose a new encoded marker which is flexibile to the marker's positions and blur. The proposed marker can be detected by an approach based on the scale space theory independent from such conditions. In addition, the representation of data by M-sequence makes the encoded marker robust to blur. Experimental results showed the effectiveness of the proposed marker compared to the ARToolKit marker. Since the marker is more robust against ground clutter noise, various positions of markers and blur, it is more practicable.

    DOI: 10.1541/ieejeiss.136.1367

  112. Parts Selective DPM for detection of pedestrians possessing an umbrella 査読有り

    Yuto Shimbo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2016 IEEE Intelligent Vehicles Symposium (IV2016)     頁: 1053 - 1058   2016年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, pedestrian detection from an invehicle camera has been attracting attention.However, in the case of a raining situation, the detection accuracy decreases because the head of a pedestrian tends to be occluded by an umbrella. In oder to handle such cases, in this paper, as a variation of the Deformable Part Model (DPM) which is widely used in the field of object recognition, we propose Parts Selective DPM (PS-DPM)" which selectively chooses the original part filters and additional part filters trained independently. In the detection of pedestrians possessing an umbrella, the selection of head and umbrella parts will make pedestrian detection more robust to the occlusion. We conducted experiments to evaluate the performance of the proposed method. As a result, pedestrian detection with the proposed PS-DPM achieved high detection accuracy in rainy weather, compared with the detection by the conventional DPM. Moreover, we confirmed that it did not decrease the pedestrian detection accuracy in fine weather."

  113. Using Super-Pixels and Human Probability Map for Automatic Human Subject Segmentation 査読有り

    Esmaeil Pourjam, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences   E99-A 巻 ( 5 ) 頁: 943 - 953   2016年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    Human body segmentation has many applications in a wide
    variety of image processing tasks, from intelligent vehicles to entertainment.
    A substantial amount of research has been done in the field of segmentation
    and it is still one of the active research areas, resulting in introduction of
    many innovative methods in literature. Still, until today, a method that can
    overcome the human segmentation problems and adapt itself to different
    kinds of situations, has not been introduced. Many of methods today try to
    use the graph-cut framework to solve the segmentation problem. Although
    powerful, these methods rely on a distance penalty term (intensity difference
    or RGB color distance). This term does not always lead to a good separation
    between two regions. For example, if two regions are close in color, even
    if they belong to two different objects, they will be grouped together, which
    is not acceptable. Also, if one object has multiple parts with different
    colors, e.g. humans wear various clothes with different colors and patterns,
    each part will be segmented separately. Although this can be overcome
    by multiple inputs from user, the inherent problem would not be solved.
    In this paper, we have considered solving the problem by making use of a
    human probability map, super-pixels and Grab-cut framework. Using this
    map relives us from the need for matching the model to the actual body,
    thus helps to improve the segmentation accuracy. As a result, not only the
    accuracy has improved, it also became comparable to the state-of-the-art
    interactive methods.

    DOI: 10.1587/transfun.E99.A.943

  114. A study on estimating the attractiveness of food photography 査読有り

    Kazuma Takahashi, Keisuke Doman, Yasutomo Kawanishi, Takatsugu Hirayama, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 2016 IEEE Second International Conference on Multimedia Big Data     頁: 444 - 449   2016年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a method for estimating the attractiveness of food photos in order to assist a user to shoot them attractively.
    The proposed method extracts both color and shape features from input food images, and then integrates them according to a regression scheme.
    By this way, the proposed method estimates the attractiveness of an unknown food photo.
    We also created a food image dataset taken from various 3D-angles for each food category, and set target values of their attractiveness through subjective experiments.
    Then, we evaluated the performance of the proposed method in two different ways of constructing the attractiveness estimator: One that constructs it for each food category, and the other that constructs a common attractiveness estimator for all food categories.
    Experimental results showed the effectiveness of the proposed method in addition to the necessity for adaptively selecting the estimator depending on the appearance of foods for further performance improvement.

  115. Reconstructing Face Image from the Thermal Infrared Spectrum to the Visible Spetrum 査読有り

    Brahmastro Kresnaraman, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Sensors, special issue on "Infrared and THz Sensing and Imaging"   16 巻 ( 4 ) 頁: 1 - 16   2016年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    During the night or in poorly lit areas, thermal cameras are a better choice instead of normal cameras for security surveillance because they do not rely on illumination. A thermal camera is able to detect a person within its view, but identification from only thermal information is not an easy task. The purpose of this paper is to reconstruct the face image of a person from the thermal spectrum to the visible spectrum. After the reconstruction, further image processing can be employed, including identification/recognition. Concretely, we propose a two-step thermal-to-visible-spectrum reconstruction method based on Canonical Correlation Analysis (CCA). The reconstruction is done by utilizing the relationship between images in both thermal infrared and visible spectra obtained by CCA. The whole image is processed in the first step while the second step processes patches in an image. Results show that the proposed method gives satisfying results with the two-step approach and outperforms comparative methods in both quality and recognition evaluations.

    DOI: 10.3390/s16040568

  116. 拡張Census Transformを用いた道路面の経時差分による車載カメラ映像からの不特定障害物検出 査読有り

    久徳 遙矢, 出口 大輔, 高橋 友和, 目加田 慶人, 井手 一郎, 村瀬 洋

    電気学会論文誌C   136 巻 ( 4 ) 頁: 588 - 589   2016年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    This paper proposes a method for detecting general obstacles on a road by subtracting a present in-vehicle camera image sequence from its corresponding past image sequences using an illumination insensitive feature.
    We conducted experiments using several image sequences captured under various illumination conditions, and confirmed the effectiveness of the proposed method.

    DOI: 10.1541/ieejeiss.136.588

  117. A classification method of cooking operations based on eye movement patterns 査読有り

    Hiroya Inoue, Takatsugu Hirayama, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of Ninth Biennial ACM Symposium on Eye Tracking Research and Applications (ETRA2016)     頁: 205 - 208   2016年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/2857491.2857500

  118. HandWaving Gesture Detection Using a Far-Infrared Sensor Array with Thermo-Spatial Region of Interest 査読有り

    Chisato Toriyama, Yasutomo Kawanishi, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa, Masato Kawade

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2016     頁: 545 - 551   2016年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0005718105450551

  119. Image transformation of eye areas for synthesizing eye-contacts in video conferencing 査読有り

    Takuya Inoue, Tomokazu Takahashi, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Takayuki Kurozumi, Kunio Kashino

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2016   3 巻   頁: 273 - 279   2016年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.5220/0005668702730279

  120. Human Wearable Attribute Recognition using Decomposition of Thermal Infrared Images 査読有り

    Brahmastro Kresnaraman, Yasutomo Kawanishi, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Proceedings of the 22th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2016)     頁: 123 - 127   2016年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper addresses an attribute recognition problem in thermal images, specifically on worn objects such as hat and glasses. Although attribute recognition is a growing research field, there are not much work done in thermal infrared spectrum. In this spectrum, since illumination is not a problem, it could be a better option to be used in nighttime or poorly lit areas. The proposed method uses only the attribute information and excludes the unnecessary information for the recognition. To achieve this, we propose attribute recognition based on feature decomposition using Robust Principal Component Analysis (RPCA). An experiment to evaluate the capability of the proposed method was conducted on the dataset created for this research. The results show that the proposed method outperformed the method without decomposition by 14% in average with a maximum of 27% increase in a specific attribute.

  121. Human Body Segmentation Using Texture Aware Grab-cut and Statistical Shape Models 査読有り

    Esmaeil Pourjam, Yasutomo Kawanishi, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the 22th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2016)     頁: 28 - 33   2016年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Segmentation is one of active areas in computer vision field with application in many areas from entertainment to intelligent vehicles (IVs). Among the objects, humans themselves have always been among the most interested subjects because of
    their special features. Since human body has an articulated structure, modeling and recognizing different variations in the body has proved to be very difficult. Wearing various kinds of clothes in different situations which can have a completely dissimilar appearance based on the clothing type, makes the modeling much more difficult. Add to this, the common problems of vision like illumination changes, blurring due to camera movements, etc. make the problem even more difficult. Thus having a system that can segment human subjects accurately can be useful in many applications. In this paper, we propose a system for segmenting human subjects using Statistical Shapes Models (SSM) feedback and a texture aware version of Grab-cut which incorporates texture feature for improving the segmentation accuracy. Our experiments show that the proposed system has an acceptable accuracy compared to the state-of-the art interactive methods and much better than the conventional ones.

  122. 赤外線センサアレイを用いた人体追跡 査読有り

    細野 峻司, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎, 川出 雅人

    電子情報通信学会論文誌   J99-D 巻 ( 1 ) 頁: 119 - 129   2016年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.14923/transinfj.2015JDP7031

  123. 運転時の人間の視野特性を考慮した歩行者の見落としやすさ推定手法 査読有り

    谷繁 龍之介, 道満 恵介, 出口 大輔, 目加田 慶人, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J99-D 巻 ( 1 ) 頁: 56 - 66   2016年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.14923/transinfj.2015HAP0015

  124. Position Interpolation using Feature Point Scale for Decimeter Visual Localization 査読有り

    David Robert Wong, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2015 IEEE International Conference on Computer Vision (ICCV2015) Workshops     頁: 1 - 8   2015年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Vehicle ego-localization is a critical task not only for in-car navigation systems, but also for emerging intelligent and autonomous vehicle technologies. Visual localization methods that determine current location by performing image matching against a pre-constructed database have an accuracy limited by the spatial distance between database images. In this paper we propose a method that uses the scale of feature points to interpolate the position of the query image between two database images. We show how this simple contribution offers an appreciable improvement in localization accuracy with an extremely minimal increase in processing time, especially when used in conjunction with image matching methods that already monitor feature scale. Our experiments showed an increase of up to 33\% in average localization accuracy when compared to a method without any interpolation.

  125. Detector Ensemble based on False Positive Mining for Pedestrian Detection 査読有り

    Yuki Suzuki, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 3rd IAPR Asian Conference on Pattern Recognition (ACPR2015)     2015年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  126. Generation of a video summary on a news topic based on SNS responses to news stories 査読有り

    Kosuke Kato, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proc. 4th Int Workshop on Crowdsourcing for Multimedia (CrowdMM'15) in conjunction with ACMMM2015     頁: 21 - 26   2015年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/2810188.2810189

  127. 他車による観測結果を用いた遠方人物検出 査読有り

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 藤吉 弘亘

    Proceedings of 2015 IEEE Conference on Intelligent Transportation Systems (ITSC2015)     頁: 1215 - 1220   2015年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ITSC.2015.200

  128. Tastes and textures estimation of foods based on the analysis of its ingredients list and image 査読有り

    Hiroki Matsunaga, Keisuke Doman, Takatsugu Hirayama, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

      9281 巻   頁: 326 - 333   2015年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Recently, the number of cooking recipes on the Web is increasing.
    However, it is difficult to search them by tastes or textures although
    they are actually important considering the nature of the contents.
    Therefore, we propose a method for estimating the tastes and the
    textures of a cooking recipe by analyzing them.
    Concretely, the proposed method refers to an ingredients feature from
    the ``ingredients list'' and image features from the ``food image'' in
    a cooking recipe.
    We confirmed the effectiveness of the proposed method through an
    experiment.

  129. 人物領域分割のための統計的形状フィードバック 査読有り

    Esmaeil Pourjam, 出口 大輔, 井手 一郎, 村瀬 洋

    電気学会論文誌C   135-C 巻 ( 8 ) 頁: 1000 - 1008   2015年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1541/ieejeiss.135.1000

  130. Typicality analysis of the combination of ingredients in a cooking recipe for assisting the arrangement of ingredients 査読有り

    Satoshi Yokoi, Keisuke Doman, Takatsugu Hirayama, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 2015 IEEE International Conference on Multimedia and Expo (ICME2012)     頁: 1 - 6   2015年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    As the number of cooking recipes posted on the Web increases, it becomes difficult to find a cooking recipe that a user needs. Moreover, even if it can be done, it is still difficult for users to arrange the cooking recipe, for example, by replacing ingredients with different ones. To deal with such problems, we propose a framework for typicality analysis of the combination of ngredients. The framework calculates a typicality value for each combination of ingredients. The list of ingredients can be arranged by adjusting the typicality value by adding or removing ingredients iteratively. The effectiveness of the proposed framework was confirmed through subjective experiments.

  131. (単板式RGB-TOFカメラを用いた歩行者の向き分類) 査読有り

    新村 文郷, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 藤吉 弘亘

    Proceedings of Workshop on Environment Perception for Automated On-road Vehicles in conjunction with 2015 IEEE Intelligent Vehicles Symposium (IV2015)     頁: 7 - 11   2015年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  132. Translating Apereo Software: A Case Study using Sakai and Transifex

    Yuji Tokiwa, Daisuke Deguchi, Juan Jose Merono Sanchez, Jose Mariano Lujan Gonzalez, Diego del Blanco Orobitg

        2015年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Web based translation support systems such as Crowdin and Transifex make it easy for regional Sakai communities to collaborate globally in translation. In the fall and winter of 2014, Spanish Sakai community and Japanese Sakai community are collaborating in translation of Sakai 10 using Transifex as a common translation platform. This collaboration brought a lot of things to two communities. For instance, to develop a tool to import resource bundle files to Transifex in a specific manner, we can have an ease of use platform to translate modular designed software such as Sakai. And this platform will be extended for every regional community and for every project in Apereo community.
    During this session we will talk about followings;
    (1) Overview
    (2) Benefits for Apereo community
    (3) Context dependent translation by gettext Portable Object
    (4) Community translation strategy in Sakai Spanish Users (S2U)
    (5) Automatized process by Jenkins

  133. Multi-modal scene duplicate detection from news videos focusing on human faces 査読有り

    Haruka Kumagai, Keisuke Doman, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    International Journal of Semantic Computing   9 巻 ( 2 ) 頁: 215 - 237   2015年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    In this paper, as a tool for structuring a large volume of archived news videos according to their semantic contents, we propose a method that effectively detects scene duplicates, assuming the presence of a person speaking in the videos. A scene duplicate is defined here as a pair of video segments taken at the same event from different viewpoints. When considering scenes where a subject is speaking in news videos, referring to the audio channel could be effective to detect scene duplicates regardless of viewpoints. However, it cannot be relied on when external audio sources overlap the original one or when the subject is actually not speaking. In contrast, the image channel can be useful in most cases. However, significant difference in viewpoints could prevent accurate detection. Therefore, we propose a method that combines the results obtained from both audio and image channels in order to improve the accuracy of scene duplicate detection from news videos. The proposed method was evaluated through an experiment with actual broadcast news videos by comparing it with a conventional method. As a result, we confirmed that the detection accuracy significantly improved by the proposed method in both recall and precision.

    DOI: 10.1142/S1793351X15400048

  134. 教育用オープンソースソフトウェア群のローカライゼーションと共通翻訳メモリの開発 査読有り

    常盤 祐司, 出口 大輔, 宮崎 誠, 平岡 斉士, 喜多 敏博, 梶田 将司

    情報処理学会デジタルプラクティス   6 巻 ( 2 ) 頁: 79 - 88   2015年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    大学教育で利用されているオープンソースソフトウェアの多くは英語圏で開発されているため日本語への翻訳が必要となる.今後大学では複数のシステムにより教育支援のためのIT環境を構築することが予想されるが,システム間で用語が異なっているとユーザに違和感を抱かせる.この課題に対して,大学教育で頻出する用語および用例を包含する大規模な共通翻訳メモリを作成することによって一貫性のある翻訳が実現できると考えた.また,翻訳メモリによる翻訳では実現できないコンテキスト依存の翻訳を可能とするgettext形式のPOファイルを併用することにより,Javaで実装されたSakaiとPHPで実装されたMoodleおよびMaharaをクラウドベースの翻訳支援システムであるTransifexを用いて同一のプロセスで翻訳した.本稿では大学教育用オープンソースソフトウェアに対して一貫性のある翻訳を目指して行ったプロジェクトについて述べる.

  135. Adaptive Reference Image Selection for Temporal Object Removal from Frontal In-vehicle Camera Image Sequences 査読有り

    Toru Kotsuka, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2015     頁: 233 - 239   2015年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, image inpainting is widely used to remove undesired objects from an image. Especially, the removal of temporal objects, such as pedestrians and vehicles, in street-view databases such as Google Street View has many applications in Intelligent Transportation Systems (ITS). To remove temporal objects, Uchiyama et al. proposed a method that combined multiple image sequences captured along the same route. However, when spatial alignment inside an image group does not work well, the quality of the output image of this method is often affected. For example, large temporal objects existing in only one image create regions that do not correspond to other images in the group, and the image created from aligned images becomes distorted. One solution to this problem is to select adaptively the reference image containing only small temporal objects for spatial alignment. Therefore, this paper proposes a method to remove temporal objects by integration of multiple image sequences with an adaptive reference image selection mechanism.

    DOI: 10.5220/0005357102330239

  136. Estimation of Human Orientation using Coaxial RGB-Depth Images 査読有り

    Fumito Shinmura, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2015     頁: 113 - 120   2015年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Estimation of human orientation contributes to improving the accuracy of human behavior recognition. However,
    estimation of human orientation is a challenging task because of the variable appearance of the human
    body. The wide variety of poses, sizes and clothes combined with a complicated background degrades the
    estimation accuracy. Therefore, we propose a method for estimating human orientation using coaxial RGBDepth
    images. This paper proposes Depth Weighted Histogram of Oriented Gradients (DWHOG) feature
    calculated from RGB and depth images. By using a depth image, the outline of a human body and the texture
    of a background can be easily distinguished. In the proposed method, a region having a large depth gradient
    is given a large weight. Therefore, features at the outline of the human body are enhanced, allowing robust
    estimation even with complex backgrounds. In order to combine RGB and depth images, we utilize a newly
    available single-chip RGB-ToF camera, which can capture both RGB and depth images taken along the same
    optical axis. We experimentally confirmed that the proposed method can estimate human orientation robustly
    to complex backgrounds, compared to a method using conventional HOG features.

    DOI: 10.5220/0005305301130120

  137. Scene duplicate detection from news videos using image-audio matching focusing on human faces 査読有り

    Haruka Kumagai, Keisuke Doman, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the 16th IEEE International Symposium on Multimedia (ISM2014)     頁: 71 - 77   2014年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ISM.2014.43

  138. Event detection based on twitter enthusiasm degree for generating a sports highlight video 査読有り

    道満 恵介, 富田 大志, 井手 一郎, 出口 大輔, 村瀬 洋

        頁: 949 - 952   2014年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  139. Human Tracking using a Far-Infrared Sensor Array and a Thermo-Spatial Sensitive Histogram

    細野 峻司, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎, 川出 雅人

    Proceedings of 2nd Workshop on User-Centred Computer Vision     2014年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  140. Prediction of Driver's Pedestrian Detectability by Image Processing Adaptive to Visual Fields of View 査読有り

    Ryunosuke Tanishige, Daisuke Deguchi, Keisuke Doman, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Proceedings of 2014 IEEE Conference on Intelligent Transportation Systems (ITSC2014)     頁: 1388 - 1393   2014年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  141. Vision-based Vehicle Localization using a Visual Street Map with Embedded SURF Scale 査読有り

    David Robert Wong, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of Computer Vision in Vehicle Technology with Special Session on Micro Aerial Vehicles (CVVT2014)     2014年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Accurate vehicle positioning is important not only for in-car navigation systems but is also a requirement for emerging autonomous driving methods. Consumer level GPS are inaccurate in a number of driving environments such as in tunnels or areas where tall buildings cause satellite shadowing. Current vision-based methods typically rely on the integration of multiple sensors or fundamental matrix calculation which can be unstable when the baseline is small.

    In this paper we present a novel visual localization method which uses a visual street map and extracted SURF image features. By monitoring the difference in scale of features matched between input images and the visual street map within a Dynamic Time Warping framework, stable localization in the direction of motion is achieved without calculation of the fundamental or essential matrices.

    We present the system performance in real traffic environments. By comparing localization results with a high accuracy GPS ground truth, we demonstrate that accurate vehicle positioning is achieved.

  142. Spatial People Density Estimation from Multiple Viewpoints by Memory Based Regression 査読有り

    Yoshimune Tabuchi, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Takayuki Kurozumi, Kunio Kashino

    Proceedings of the 22nd IAPR International Conference on Pattern Recognition (ICPR2014)     頁: 2209 - 2214   2014年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Crowd analysis using cameras has attracted much attention for public safety and marketing. Among techniques of the crowd analysis, we focus on spatial people density estimation which estimates the number of people for each small area in a floor region. However, spatial people density cannot be estimated accurately for an area far from the camera because of the occlusion by people in a closer area. Therefore, we propose a method using a memory based regression method with images captured from cameras from multiple viewpoints. This method is realized by looking up a table that consists of correspondences between people density maps and crowd appearances. Since the crowd appearances include situations where various occlusions occur, an estimation robust to occlusion should be realized. In an experiment, we examined the effectiveness of the proposed method.

  143. Single Camera Vehicle Localization Using SURF Scale and Dynamic Time Warping 査読有り

    David Robert Wong, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2014 the IEEE Intelligent Vehicles Symposium (IV2014)     頁: 681 - 686   2014年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Vehicle ego-localization is an essential process for many driver assistance and autonomous driving systems. The traditional solution of GPS localization is often unreliable in urban environments where tall buildings can cause shadowing of the satellite signal and multipath propagation. Typical visual feature based localization methods rely on calculation of the fundamental matrix which can be unstable when the baseline is small.
    In this paper we propose a novel method which uses the scale of matched SURF image features and Dynamic Time Warping to perform stable localization. By comparing SURF feature scales between input images and a pre-constructed database, stable localization is achieved without the need to calculate the fundamental matrix. In addition, 3D information is added to the database feature points in order to perform lateral localization, and therefore lane recognition.
    From experimental data captured from real traffic environments, we show how the proposed system can provide high localization accuracy relative to an image database, and can also perform lateral localization to recognize the vehicle's current lane.

  144. Estimation of Traffic Sign Visibility Considering Local and Global Features in a Driving Environment 査読有り

    Keisuke Doman, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase, Utsushi Sakai

    Proceedings of 2014 IEEE Intelligent Vehicles Symposium (IV2014)     頁: 202 - 207   2014年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a camera-based visibility estimation method for a traffic sign.
    The visibility here indicates how a visual target is easy to be detected and recognized by a human driver (not a machine).
    This research aims at realizing a nuisance-free driver assistance system which sorts out information depending on the visibility of a visual target, in order to prevent driver distraction.
    Our previous study on estimating the visibility of a traffic sign considered only the effect of the local region around a target, assuming the situation that a driver's gaze is around it.
    The proposed method integrates both the local features and global features in a driving environment without such an assumption.
    The global features evaluate the positional relationships between traffic signs and the appearance around the fixation point of a driver's gaze, which considers the effect of the driver's entire field of view.
    Experimental results showed the effectiveness of incorporating the global features for estimating the visibility of a traffic sign.

  145. カメラ間の位置関係に基づく画像間距離系列を用いた車載カメラ映像データベース検索による自車位置推定 査読有り

    久徳 遙矢, 出口 大輔, 高橋 友和, 目加田 慶人, 井手 一郎, 村瀬 洋

    電気学会論文誌C   134 巻 ( 5 ) 頁: 702 - 710   2014年5月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    We propose an accurate ego-localization method by searching a streetview database composed of single front-view in-vehicle camera images. Previously, we proposed an image distance metric reflecting the positional relation of two cameras based on epipolar geometry analysis, and used it for ego-localization. However, since the method employed a dynamic time warping strategy to avoid the effect from outliers, both input and database images needed to be image sequences. To overcome this problem, the method proposed in this paper reformulates the previous image distance metric to a novel image distance that requires only a single in-vehicle camera image as an input, which is realized by considering the sequential property of the images in the database. We conducted experiments using multiple image sequences captured under various conditions by using an in-vehicle camera mounted on the windshield of a car. The experimental results showed that the proposed method could achieve an accuracy of 89%, and we confirmed its effectiveness.

    DOI: 10.1541/ieejeiss.134.702

  146. Estimation of the Representative Story Transition in a Chronological Semantic Structure of News Topics 査読有り

    Kosuke Kato, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the 4th International Conference on Multimedia Retrieval (ICMR2014)     頁: 487 - 491   2014年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    It is important to track the flow of topics to thoroughly understand the contents. Accordingly, a method that structures the chronological semantic relations between news stories, namely a 'topic thread structure' has been proposed.It allows the comprehensive understanding of a topic by chronologically tracking stories one by one from the initial story. However, this task imposes a user to watch many stories when it contains various sub-topics. Thus, we propose method that estimates the representative story transition in a topic thread structure. In the proposed method, features obtained from a story and those from the topic thread structure are used for the estimation. We confirmed the effectiveness of the proposed method by comparing the results obtained from the proposed method to the ground truth obtained from votes in a subjective experiment. However, this task imposes a user to watch many stories when it contains various sub-topics. Thus, we propose method that estimates the representative story transition in a topic thread structure. In the proposed method, features obtained from a story and those from the topic thread structure are used for the estimation. We confirmed the effectiveness of the proposed method by comparing the results obtained from the proposed method to the ground truth obtained from votes in a subjective experiment

  147. Can a Human be a Sensor? 査読有り

    Atsushi Shimada, Daisuke Deguchi, Kazuaki Kondo, Takuya Funatomi

    Proceedings of the 20th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2014)     頁: 242 - 245   2014年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper discusses a novel sensing strategy to retrieve real-world information. Instead of using sensor devices such as cameras, microphones and so on, the proposed approach involves people in real-world sensing to acquire requested information as accurately and quickly as possible. We call the proposed sensing strategy as Human Cloud Sensing (HCS)". In this paper, we introduce the concept of HCS and report some experimental results which were conducted to investigate the feasibility of "Can a human be a sensor?"."

  148. Environment adaptive pedestrian detection using in-vehicle camera and GPS 査読有り

    Daichi Suzuo, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hiroyuki Ishida, Yoshiko Kojima

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2014     頁: 354 - 361   2014年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, accurate pedestrian detection from in-vehicle camera images is focused to develop a safety driving assistance system. Currently, successful methods are based on statistical learning. However, in such methods, it is necessary to prepare a large amount of training images. Thus, the decrease in the number of training images degrades the detection accuracy. That is, in driving environments with few or no training images, it is difficult to detect pedestrians accurately. Therefore, we propose an approach that collects training images automatically to build classifiers for various driving environments. This is expected to realize highly accurate pedestrian detection by using an appropriate classifier corresponding to the current location. The proposed method consists of three steps; Classification of driving scenes, collection of non-pedestrian images and training of classifiers for each scene class, and associating a scene-class-specific classifier with GPS location information. Through experiments, we confirmed the effectiveness of the method compared to baseline methods.

    DOI: 10.5220/0004677003540361

  149. Exemplar-Based Human Body Super-Resolution for Surveillance Camera Systems 査読有り

    Kento Nishibori, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2014     頁: 115 - 121   2014年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In this paper, we propose an exemplar-based super-resolution method applied to a human body in a surveillance video. Since persons are usually captured as low-resolution images by a video surveillance system, it is sometimes necessary to perform detection and identification of persons from not only a human face but also from the human body appearance. The super-resolution for a human body image is difficult because the appearances of person images vary according to the color of clothing and the posture of persons. Thus, we focus on the high-frequency components that could restore the lost high-frequency components of the low-resolution image regardless to the variation of the clothing. Therefore, the purpose of the work presented in this paper is to apply the exemplar-based super-resolution using high-frequency components for a low-resolution human body image to generate a high-resolution human body image so that both computer systems and humans can identify persons more accurately. As a result of experiments, we confirmed the effectiveness of the proposed super-resolution method.

    DOI: 10.5220/0004686101150121

  150. Scene dependent classifiers for pedestrian detection

    Hidefumi Yoshida, Daichi Suzuo, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

        2013年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  151. Automatic authoring of a domestic cooking video based on the description of cooking instructions 査読有り

    Yasuhiro Hayashi, Keisuke Doman, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 5th International Workshop on Multimedia for Cooking and Eating Activities (CEA'13)     頁: 21 - 26   2013年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1145/2506023.2506028

  152. Blur-invariant Traffic Sign Recognition Using Compact Local Phase Quantization 査読有り

    Saleh Aly, Daisuke Deguchi, Hiroshi Murase

    Proceedings of 2013 IEEE Conference on Intelligent Transportation Systems (ITSC2013)     頁: 821 - 827   2013年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  153. Construction of a traffic sign detector based on voting type co-training 査読有り

    Yuji Kojima, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2013 IEEE Conference on Intelligent Transportation Systems (ITSC2013)     頁: 1137 - 1142   2013年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  154. Prediction of Pedestrian Detectability for Drivers by Image Processing and its Driver Adaptation 査読有り

    Ryunosuke Tanishige, Daisuke Deguchi, Keisuke Doman, Yoshito Mekada, Ichiro Ide, Hiroshi Murase, Naoki Nitanda

    Proceedings of the 6th Biennial Workshop on Digital Signal Processing for In-Vehicle Systems (DSP2013)     頁: 1 - 4   2013年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In recent years, advances in pedestrian detection technology have resulted in the development of driving assistance systems that notify the drivers of the presence of pedestrians. However, warning of all of the presence of pedestrians would confuse the driver. Therefore, the driver should only be notified of the less detectable pedestrians to avoid confusion. To achieve this, it is necessary to develop a method to predict the driver’s perception performance of pedestrian detectability. This paper proposes a method that predicts the pedestrian detectability considering the difference between individual drivers. The proposed method constructs a predictor specific to each driver, in order to predict the pedestrian detectability precisely. To obtain the ground truth of the pedestrian detectability, we conducted an experiment by human subjects using images from an in-vehicle camera including pedestrians. From the comparison between the output of the proposed method and the actual detectability, we confirmed that the proposed method significantly reduces the prediction error in comparison with the existing methods.

  155. Pedestrian Detection by Scene Dependent Classifiers with Generative Learning 査読有り

    Hidefumi Yoshida, Daichi Suzuo, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Takashi Machida, Yoshiko Kojima

    Proceedings of 2013 IEEE Intelligent Vehicles Symposium (IV2013)     頁: 654 - 659   2013年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Recently, pedestrian detection from in-vehicle camera images is becoming an crucial technology for Intelligent Transportation Systems (ITS). However, it is difficult to detect pedestrians accurately in various scenes by obtaining training samples. To tackle this problem, we propose a method to construct scene dependent classifiers to improve the accuracy of pedestrian detection. The proposed method selects an appropriate classifier based on the scene information that is a category of appearance associated with location information. To construct scene dependent classifiers, the proposed method introduces generative learning for synthesizing scene dependent training samples. Experimental results showed that the detection accuracy of the proposed method outperformed the comparative method, and we confirmed that scene dependent classifiers improved the accuracy of pedestrian detection.

  156. Segmentation of Human Instances Using Grab-cut and Active Shape Model Feedback 査読有り

    Esmaeil Pourjam, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    Proceedings of IAPR Conference on Machine Vision Applications (MVA) 2013     頁: 77 - 80   2013年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  157. 異なる顔向きの顔認識 査読有り

    李 析, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋

    IEICE Transaction on Information and Systems, Special Section on Face Perception and Recognition   E96-D 巻 ( 3 ) 頁: 531 - 537   2013年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

  158. 低解像度QRコード認識のための2値グリッド拘束付き2段階超解像 査読有り

    加藤 祐二, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J96-D 巻 ( 2 ) 頁: 328 - 337   2013年2月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    QRコードは二次元コードの一種で,小面積に印刷するだけで様々な媒体に情報を付加することができ,製造における発注システムなどで利用されている.しかし,カメラとQRコードが離れるほどQRコード画像は相対的に低解像度となるため,認識が困難になる.そこで本論文では,低解像度のQRコード画像の認識性能の向上を目的として,QRコードの特徴を利用した複数フレーム超解像手法を提案する.本手法では,QRコードの認識が検出とデコードの2段階の処理からなることを利用して,それぞれの精度向上を行うために2段階の超解像処理を導入する.また,QRコードが2値のグリッド状のパターンで構成されることを利用し,これを超解像処理の拘束として用いる.更に,全てのQRコードが共通してもつパターンを利用して,ぼけを表す点拡がり関数(PSF:Point Spread Function)の推定を行う.実動画像を利用した認識実験の結果,撮影動画像そのままでは認識できないほど低解像度のQRコード画像に対して,提案手法は高い認識率を示した.このことから,提案手法の有効性を確認した.

  159. Detection of Biased Broadcast Sports Video Highlights by Attribute-Based Tweets Analysis 査読有り

    Takashi Kobayashi, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Lecture Note in Computer Science   7733 巻   頁: 364 - 373   2013年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We propose a method for detecting biased-highlights in a broadcast sports video according to viewers’ attributes obtained from a large number of tweets. Recently, Twitter is widely used to make real-time play-by-play comments on TV programs, especially on sports games. This trend enables us to effectively acquire the viewers’ interests in a large mass. In order to make use of such tweets for highlight detection in broadcast sports video, the proposed method first performs an attribute analysis on the set of tweets issued by each user to classify which team he/she supports. It then detects biased-highlights by referring to the number of tweets made by viewers with a specific attribute.

    DOI: 10.1007/978-3-642-35728-2_35

  160. A Study of Gaze Estimation Using Head and Body Pose Information 査読有り

    Nobuhiro Funatsu, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of International Workshop on Advanced Image Technology (IWAIT) 2013     頁: 231 - 235   2013年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Gaze estimation from an image is an important technique for tasks such as driver monitoring and measuring of advertising effectiveness. For this, most existing methods require a high quality image of eyes. However, It is difficult to obtain the eye images when eye occlusion occurs due to sunglasses or face rotation. Another approach approximates head directions to gaze directions. However, the gaze direction is affected not only by the head direction but also by the body direction. Thus, we are studying a method that estimates the gaze direction accurately using information on both head and body pose directions. Experimental result showed that the proposed method could estimate gaze directions more accurately than by using the information on only head directions.

  161. Estimation of the human performance for pedestrian detectability based on visual search and motion features 査読有り

    Masashi Wakayama, Daisuke Deguchi, Keisuke Doman, Ichiro Ide, Hiroshi Murase, Yukimasa Tamatsu

    Proceedings of the 21st IAPR International Conference on Pattern Recognition (ICPR2012)     頁: 1940 - 1943   2012年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a method for estimating the human performance of pedestrian detectability from in-vehicle camera images in order to warn a driver of the positions of pedestrians in an appropriate timing. By introducing features related to visual search and motion of the target, the proposed method estimates the detectability of pedestrians accurately. Support Vector Regression (SVR) is used to estimate the detectability. Here, SVR is trained using features calculated by the proposed method with the ground truth obtained through experiments with human subjects. From experiments using in-vehicle camera images, we confirmed that the proposed features were effective to estimate the detectability of pedestrians.

  162. Virtual View Generation using Clustering based Local View Transition Model 査読有り

    Xi Li, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of ACCV Workshop on Face Analysis: The Intersection of Computer Vision and Human Perception     2012年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper presents an approach for realistic virtual view generation using appearance clustering based local view transition model, with its target application on cross-pose face recognition. Previously, the traditional global pattern based view transition model (VTM) method was extended to its local version called LVTM, which learns the linear transformation of pixel values between frontal and non-frontal image pairs using partial image in a small region for each location, rather than transforming the entire image pattern. In this paper, we show that the accuracy of the appearance transition model and the recognition rate can be further improved by better exploiting the inherent linear relationship between frontal-nonfrontal face image patch pairs. For each specific location, instead of learning a common transformation as in the LVTM, the corresponding local patches are first clustered based on appearance similarity distance metric and then the transition models are learned separately for each cluster. In the testing stage, each local patch for the input non-frontal probe image is transformed using the learned local view transition model corresponding to the most visually similar cluster. The experimental results on a real-world face dataset demonstrated the superiority of the proposed method in terms of recognition rate.

  163. 自車位置推定のための車載カメラ映像と市街地映像データベースの位置ずれや遮蔽に頑健なフレーム対応付け 査読有り

    久徳 遙矢, 出口 大輔, 高橋 友和, 目加田 慶人, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J95-D 巻 ( 11 ) 頁: 1973 - 1982   2012年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,自車前方を撮影した車載カメラ映像を用いた高精度な自車位置推定手法を提案する.提案手法では,車載カメラ映像と位置情報付き市街地映像データベースのフレーム対応付けを行い,対応づけられたデータベース中のフレームがもつ位置情報を参照することで自車位置推定を行う.同じ道路で撮られた映像同士であっても,走行速度や軌跡は異なるため,単純な画像照合による対応付けは困難である.そこで,画像特徴による照合ではなく,カメラ間の位置関係を反映したフレーム間の距離尺度を用いることで,フレーム対応付け精度の改善を図る.まず車載カメラ映像とデータベースのフレーム間で対応点を求め,それらからフレーム間の基礎行列を求める.次に,基礎行列から算出されるエピポールの位置を用いてカメラ間の距離を算出する.そして,これを距離尺度とするDPマッチングにより,フレーム同士を対応づける.実際の車載カメラ映像を用いた評価実験の結果,提案手法の有効性を確認した.

  164. Subtraction-Based Forward Obstacle Detection Using Illumination Insensitive Feature for Driving-Support 査読有り

    Haruya Kyutoku, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Proceedings of Computer Vision in Vehicle Technology: From Earth to Mars (CVVT2012)   Part II 巻 ( LNCS 7584 ) 頁: 515 - 525   2012年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a method for detecting general obstacles on a road by subtracting present and past in-vehicle camera images.
    The image-subtraction-based object detection approach can be applied to detect any kind of obstacles although the existing learning-based methods detect only specific obstacles.
    To detect general obstacles, the proposed method first computes a frame-by-frame correspondence between the present and the past in-vehicle camera image sequences, and then registrates road surfaces between the frames.
    Finally, obstacles are detected by applying image subtraction to the registrated road surface regions with an illumination insensitive feature for robust detection.
    Experiments were conducted by using several image sequences captured by an actual in-vehicle camera to confirm the effectiveness of the proposed method.
    The experimental results shows that the proposed method can detect general obstacles accurately at a distance enough to avoid them safely even in situations with different illuminations.

    DOI: 10.1007/978-3-642-33868-7_51

  165. Visibility Estimation of Traffic Signals under Rainy Weather Conditions for Smart Driving Support 査読有り

    Ryuhei Sato, Keisuke Doman, Daisuke Deguchi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase, Yukimasa Tamatsu

    Proceedings of 2012 IEEE Conference on Intelligent Transportation Systems (ITSC2012)     頁: 1321 - 1326   2012年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    The aim of this work is to support a driver by
    notifying the information of traffic signals in accordance with
    their visibility. To avoid traffic accidents, the driver should
    detect and recognize surrounding objects, especially traffic
    signals. However, when driving a vehicle under rainy weather
    conditions, it is difficult for drivers to detect or to recognize
    objects existing in the road environment in comparison with fine
    weather conditions. Therefore, this paper proposes a method
    for estimating the visibility of traffic signals for drivers under
    rainy weather conditions by image processing. The proposed
    method is based on the concept of visual noise known in the
    field of cognitive science, and extracts two types of visual noise
    features which ware considered that they affect the visibility of
    traffic signals. We expect to improve the accuracy of visibility
    estimation by combining the visual noise features with the
    texture feature introduced in a previous work. Experimental
    results showed that the proposed method could estimate the
    visibility of traffic signals more accurately under rainy weather
    conditions.

    DOI: 10.1109/ITSC.2012.6338838

  166. Detection and classification of repetitious human motions combining shift variant and invariant features 査読有り

    Ichiro Ide, Taku Kuhara, Daisuke Deguchi, Tomokazu Takahashi, Hiroshi Murase

    Proceedings of the 3rd International Conference on Emerging Security Technologies (EST2012)     頁: 86 - 89   2012年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/EST.2012.7

  167. Robust Face Super-Resolution Using Free-Form Deformations For Low-Quality Surveillance Video 査読有り

    Tomonari Yoshida, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2012 IEEE International Conference on Multimedia and Expo (ICME2012)     頁: 368 - 373   2012年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ICME.2012.162

  168. 放送ニュース映像からの発話ショットの抽出 査読有り

    熊谷 章吾, 道満 恵介, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋

    International Journal of Semantic Computing   6 巻 ( 2 ) 頁: 179 - 204   2012年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1142/S1793351X12400077

  169. 磁気式位置センサを用いた気管支鏡ナビゲーションシステムのためのマーカが不要な実時間位置合わせ手法: 人体模型による評価 査読有り

    出口 大輔, フォイヤーシュタイン マルコ, 北坂 孝幸, 末永 康仁, 井手 一郎, 村瀬 洋, 今泉 和良, 長谷川 好規, 森 健策

    International Journal of Computer Assisted Radiology and Surgery   7 巻 ( 3 ) 頁: 359 - 369   2012年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1007/s11548-011-0626-9

  170. Construction of a local attraction map according to social visual attention 査読有り

    Ichiro Ide, Jiani Wang, Masafumi Noda, Tomokazu Takahashi, Daisuke Deguchi, Hiroshi Murase

    Proceedings of the 5th International Conference on Intelligent Interactive Multimedia Systems and Services (IIMSS2012)     頁: 153 - 162   2012年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-642-29934-6_15

  171. 気管支鏡ナビゲーションシステムのためのハイブリッド位置追跡手法の開発と比較 査読有り

    羅 雄彪, フォイヤーシュタイン マルコ, 出口 大輔, 北坂 孝幸, 高畠 博嗣, 森 健策

    Medical Image Analysis   16 巻 ( 3 ) 頁: 577 - 596   2012年4月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1016/j.media.2010.11.001

  172. Integration of generative learning and multiple pose classifiers for pedestrian detection 査読有り

    Hidefumi Yoshida, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Kunihiro Goto, Yoshikatsu Kimura, Takashi Naito

    Proceedings of the International Conference on Computer Vision Theory and Applications (VISAPP) 2012   1 巻   頁: 567 - 572   2012年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Recently, pedestrian detection from in-vehicle camera images is becoming an important technology in ITS (Intelligent Transportation System).
    However, it is difficult to detect pedestrians stably due to the variety of their poses and their backgrounds.
    To tackle this problem, we propose a method to detect various pedestrians from in-vehicle camera images by using multiple classifiers corresponding to various pedestrian pose classes.
    Since pedestrians’ pose varies widely, it is difficult to construct a single classifier that can detect pedestrians with various poses stably.
    Therefore, this paper constructs multiple classifiers optimized for variously posed pedestrians by classifying pedestrian images into multiple pose classes.
    Also, to reduce the bias and the cost for preparing numerous pedestrian images for each pose class for learning, the proposed method employs a generative learning method.
    Finally, the proposed method constructs multiple classifiers by using the synthesized pedestrian images.
    Experimental results showed that the detection accuracy of the proposed method outperformed comparative methods, and we confirmed that the proposed method could detect variously posed pedestrians stably.

    DOI: 10.5220/0003817305670572

  173. 遡及型追跡に基づく標識画像の自動収集を用いた標識検出器の高精度化 査読有り

    出口 大輔, 道満 恵介, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J95-D 巻 ( 1 ) 頁: 76 - 84   2012年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,車載カメラ映像から多様な変化を含む標識画像を自動収集することにより,高精度な標識検出器を低コストで構築する手法を提案する.さまざまな環境で精度良く標識を検出するためには,多様な変化を含む標識画像を大量に収集し,それらを学習サンプルとして標識検出器を構築する必要がある.しかしながら,そのような標識の学習サンプルをさまざまな環境で網羅的に収集することは不可能である.また,遠く離れた標識の画像中のサイズは小さく,それらを自動もしくは半自動で大量に収集することは困難である.一方,ある時点では遠くの標識であったとしても,自車の走行に伴って遠くの標識も徐々に近づき,最終的には大きく撮影されるという特徴がある.このような大きく撮影された標識は自動検出可能であり,また,標識の時間方向への追跡も比較的容易である.そこで本論文では,まず近くで大きく撮影された標識を検出し,一時的に記憶しておいた過去の映像から遡及的に時間を遡りながら標識を追跡することによって,遠く離れた位置の低品質の標識を切り出して収集し,学習サンプルとして標識検出器を構築する手法を提案する.これにより,多様な変化を含む標識画像を自動で収集し,高精度な標識検出器をわずかな手作業で構築可能な手法を実現する.提案手法をさまざまな環境で撮影した車載カメラ映像に適用した結果,わずかな手作業でF値が約0.957の標識検出器が構築可能であることを確認した.

  174. 空撮画像と車載カメラ画像からの特徴点の時系列対応付けによる自車位置推定の高精度化 査読有り

    野田 雅文, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋, 小島 祥子, 内藤 貴志

    電子情報通信学会論文誌   J95-D 巻 ( 1 ) 頁: 111 - 121   2012年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    近年,高機能カーナビゲーションなどへの応用を目的とし,空撮画像と車載カメラ画像に共通して撮影されている道路面を対応づけることで高精度に自車位置を推定する手法が提案されている.従来は,道路面に印字されている路面標示の重心を特徴点として対応付けに用いていたが,このような特徴点は路面標示の欠損や遮へいに影響を受けやすいため,自車位置推定精度が十分ではなかった.そこで,本論文では,特徴点が十分に得られない場合においても,高精度,かつ頑健な自車位置推定手法を提案する.提案手法のアプローチは,(1)路面標示のコーナを特徴点とした空撮画像と車載カメラ画像の対応付け,(2)複数時刻の車載カメラ画像から得られる時系列の特徴点の対応付け,の二つである.実験の結果,前方車両が存在することにより路面標示が遮へいされるような実際の走行環境下において,提案手法による自車位置推定精度が従来手法に対して改善したことを確認した.

  175. コントラスト特徴とアピアランス特徴の統合による道路標識の視認性推定 査読有り

    道満 恵介, 出口 大輔, 高橋 友和, 目加田 慶人, 井手 一郎, 村瀬 洋, 玉津 幸政

    電子情報通信学会論文誌   J95-D 巻 ( 1 ) 頁: 122 - 130   2012年1月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,背景とのコントラストおよび道路標識の見えに基づく画像特徴の統合利用による道路標識の視認性推定手法を提案する.
    近年,様々な運転支援システムが自動車に搭載されるようになってきているが,過度の情報提供はドライバの注意散漫の原因となる.
    そこで本研究では,道路交通において重要な情報源となる道路標識を対象とし,道路標識の視認性に応じてドライバへ情報を提供する不快感のない運転支援システムの実現を目指す.
    提案手法では,道路標識の視認性に大きく影響する要因として,背景との明るさ,色,複雑さのコントラストに基づく画像特徴,および,道路標識自体の明るさ,色に基づく画像特徴を車載カメラ画像から抽出する.
    そして,認知科学的な知見に基づいてこれらの画像特徴を統合し,道路標識の視認性を定量化する.
    評価実験の結果,提案手法により高精度な視認性推定ができることを確認した.
    また,提案手法で利用する複数の画像特徴およびそれらの統合モデルの有効性を確認した.

  176. 大規模放送映像アーカイブにおける出現パターンによる準同一映像区間の分類 査読有り

    社本 裕司, 井手 一郎, 出口 大輔, 高橋 友和, 村瀬 洋

    情報処理学会論文誌   52 巻 ( 12 ) 頁: 3593 - 3598   2011年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    我々は,日々増え続ける大量の放送映像からなるアーカイブを効果的かつ効率的に利用するために,映像内容に基づく構造化に取り組んでいる.本稿では,共通の枠組みの中で,様々な種類の放送映像を対象とした構造化を実現するための手段として,準同一(near-duplicate)映像の出現パターンに基づく分類を検討した結果を報告する.実際に,1,000 時間規模の放送映像に対する実験により,約360 万対の準同一映像区間を検出し,それを約4 万個のクラスタにまとめた後,6 種類の準同一映像クラスに分類した結果について分析することで,提案手法の効果と課題を明らかにする.

  177. Web上の大量の写真に対する画像分類による観光マップの作成 査読有り

    王 佳妮, 野田 雅文, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋

    情報処理学会論文誌   52 巻 ( 12 ) 頁: 3588 - 3592   2011年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    近年Web上には大量のジオタグ(撮影時のGPS情報)付き写真がアップロードされており,旅行を計画中のユーザは,旅行先の雰囲気を事前に視覚的に知ることができる.しかしながら,既存の写真共有サービスなどは単純に写真を地図上に配置するだけであるため,旅行先に関する土地勘がないユーザが必要とする情報を直感的に得ることは難しい.そこで,我々は大量の写真を風景によって分類し,多くの人が注
    目した風景の写真を,旅行を計画するユーザに対して直感的に分かりやすく表現した地図である「観光マップ」を提案する.本稿では,観光マップ作成手法およびその有効性に関する初期的な検討結果について報告する.

  178. Detection of Inconsistency between Subject and Speaker based on the Co-occurrence of Lip Motion and Voice Towards Speech Scene Extraction from News Videos 査読有り

    Shogo Kumagai, Keisuke Doman, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2011 IEEE International Symposium on Multimedia (ISM2011)     頁: 311 - 318   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We propose a method to detect the inconsistency between a subject and the speaker for extracting speech scenes from news videos.
    Speech scenes in news videos contain a wealth of multimedia information, and are valuable as archived material.
    In order to extract speech scenes from news videos, there is an approach that uses the position and size of a face region.
    However, it is difficult to extract them with only such approach, since news videos contain non-speech scenes where the speaker is not the subject, such as narrated scenes.
    To solve this problem, we propose a method to discriminate between speech scenes and narrated scenes based on the co-occurrence between a subject's lip motion and the speaker's voice.
    The proposed method uses lip shape and degree of lip opening as visual features representing a subject's lip motion, and uses voice volume and phoneme as audio feature representing a speaker's voice.
    Then, the proposed method discriminates between speech scenes and narrated scenes based on the correlations of these features.
    We report the results of experiments on videos captured in a laboratory condition and also on actual broadcast news videos.
    Their results showed the effectiveness of our method and the feasibility of our research goal.

  179. 調理映像中の繰返し調理動作の検出 査読有り

    久原 卓, 出口 大輔, 高橋 友和, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J94-D 巻 ( 12 ) 頁: 1983 - 1985   2011年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,調理映像中の「切る」や「混ぜる」といった繰返し動作を検出する手法について検討した結果を報告する.繰返し動作の検出には,映像フレーム中の動作位置に依存しない特徴(CHLAC特徴)と依存する特徴(2値特徴)を用いる.これにより,繰返し動作領域の位置が大きく移動する動作及び一定である動作の両方に対応する.実際の料理番組映像に本手法を適用した結果,F値0.86の精度で検出できることを確認した.

  180. 複数画像系列の部分画像選択に基づく移動物体を含まない車載カメラ映像の生成 査読有り

    内山 寛之, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J94-D 巻 ( 12 ) 頁: 2093 - 2104   2011年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    近年,市街地映像を利用した運転支援システムが注目されている.また,“Googleストリートビュー”のような,市街地映像をインターネット上で閲覧できるサービスも提供されている.しかし,画像中に車両や歩行者などの移動物体が映り込むことが,遮へいやプライバシー保護の点で問題となっている.そこで本論文では,複数の車載全方位カメラ映像の部分画像を選択して貼り合わせることにより,移動物体を含まない映像を生成する手法を提案する.まず,カメラを搭載した車両が同じ経路を複数回走行することで,異なる時刻の複数の映像を収集する.そして,これらの映像間の時間方向と空間方向のレジストレーションを行う.次に,画像の同位置において移動物体が映っている頻度は少ないという仮定のもと,定義した評価関数を最小化することで,背景らしい部分画像を選択する.最後に,選択された部分画像を張り合わせることにより,移動物体を含まない市街地映像を作成する.市街地を撮影した実際の全方位カメラ映像を用いた実験により,移動物体の領域の96.5 %を除去した映像を生成することに成功した.

  181. Scene Segmentation of Wedding Party Videos by Scenario-based Matching with Example Videos 査読有り

    Kazuki Sawai, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 19th ACM International Multimedia Conference (ACM-MM2011)     頁: 1545 - 1548   2011年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  182. MEMSジャイロセンサと単眼カメラを利用した高精度で頑健な姿勢推定 査読有り

    小堀 訓成, 出口 大輔, 高橋 友和, 井手 一郎, 村瀬 洋

    計測自動制御学会論文集   47 巻 ( 10 ) 頁: 442 - 449   2011年10月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    In order to estimate accurate rotations of mobile robots and vehicle, we propose a hybrid system which combines a low-cost monocular camera with gyro sensors. Gyro sensors have drift errors that accumulate over time. On the other hand, a camera cannot obtain the rotation continuously in the case where feature points cannot be extracted from images, although the accuracy is better than gyro sensors. To solve these problems we propose a method for combining these sensors based on Extended Kalman Filter. The errors of the gyro sensors are corrected by referring to the rotations obtained from the camera. In addition, by using the reliability judgment of camera rotations and devising the state value of the Extended Kalman Filter, even when the rotation is not continuously observable from the camera, the proposed method shows a good performance. Experimental results showed the effectiveness of the proposed method.

  183. Low resolution QR-code recognition by applying super-resolution using the property of QR-codes 査読有り

    Yuji Kato, Daisuke Deguchi, Tomokazu Takahashi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 11th International Conference on Document Analysis and Recognition (ICDAR2011)     頁: 992 - 996   2011年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes a method for low resolution QR-code recognition. A QR-code is a two-dimensional binary symbol that can embed various information such as characters and numbers. To recognize a QR-code correctly and stably,the resolution of an input image should be high. In practice,however, recognition of a QR-code is usually difficult due to
    low resolution when it is captured from a distance. In this paper, we propose a method to improve the performance of low resolution QR-code recognition by using the super-resolution technique that generates a high resolution image from multiple low-resolution images. Although a QR-code is a binary pattern, it is observed as a grayscale image due to the degradation through the capturing process. Especially the pixels around the borders between white and black regions become ambiguous. To overcome this problem, the proposed method introduces a binary pattern constraint to generate super-resolved images appropriate for recognition. Experimental results showed that a recognition rate of 98% an be achieved by the proposed method, which is a 15.7% improvement in comparison with a method using a conventional super-resolution method.

  184. Power-efficient hardware architecture of K-Means clustering with Bayesian-Information-Criterion processor for multimedia processing applications 査読有り

    Tse-Wei Chen, Chih-Hao Sun, Hsiao-Hang Su, Shao-Yi Chien, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEEE Journal on Emerging and Selected Topics in Circuits and Systems   1 巻 ( 3 ) 頁: 357 - 368   2011年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    A power-efficient K-Means hardware architecture that can automatically estimate the number of clusters in the clustering process is proposed. The contributions of this work include two main aspects. The first is the integration of the hierarchical data sampling in the hardware to accelerate the clustering speed. The second is the development of the Bayesian-Information-Criterion (BIC) Processor" to estimate the number of clusters of K-Means. The architecture of the "BIC Processor" is designed based on the simplification of the BIC computations, and the precision of the logarithm function is also analyzed. The experiments show that the proposed architecture can be employed in different multimedia applications, such as motion segmentation and edge-adaptive noise reduction. Besides, the gate count of the hardware is 51 K with the 90-nm complimentary metal-oxide-semiconductor technology. It is also shown that this work can achieve high efficiency compared with a GPU, and the power consumption scales well with the number of clusters and the number of dimensions. The power consumption ranges between 10.72 and 12.95 mW in different modes when the operating frequency is 233 MHz."

    DOI: 10.1109/JETCAS.2011.2165231

  185. マルチメディア情報の補足による初心者向け料理レシピの作成へ向けて 査読有り

    志土地 由香, 井手 一郎, 中村 裕一, 出口 大輔, 高橋 友和, 村瀬 洋

    電子情報通信学会論文誌   J94-A 巻 ( 7 ) 頁: 544 - 547   2011年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    既存のテキスト料理レシピから初心者に分かりにくい表現を検出した後,大量の料理レシピから抽出した情報に基づいてテキストを,調理動作の種類に応じて画像・映像を補足することで,分かりやすいマルチメディア料理レシピを作る方法を検討した.

  186. On-road Obstacle Detection by Comparing Present and Past In-vehicle Camera Images 査読有り

    Haruya Kyutoku, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Proceedings of IAPR Conference on Machine Vision Applications (MVA) 2011     頁: 357 - 360   2011年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  187. Estimation of Traffic Sign Visibility Considering Temporal Environmental Changes for Smart Driver Assistance 査読有り

    Keisuke Doman, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase, Yukimasa Tamatsu

    Proceedings of 2011 IEEE Intelligent Vehicles Symposium (IV2011)     頁: 667 - 672   2011年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    We propose a visibility estimation method for traffic signs considering temporal environmental changes, as a part of work for the realization of nuisance-free driver assistance systems. Recently, the number of driver assistance systems in a vehicle is increasing. Accordingly, it is becoming important to sort out appropriate information provided from them, because providing too much information may cause driver distraction. To solve such a problem, we focus on a visibility estimation method for controlling the information according to the visibility of a traffic sign. The proposed method sequentially captures a traffic sign by an in-vehicle camera, and estimates its accumulative visibility by integrating a series of instantaneous visibility. By this way, even if the environmental conditions may change temporally and complicatedly, we can still accurately estimate the visibility that the driver perceives in an actual traffic scene. We also investigate the performance of the proposed method and show its effectiveness.

  188. Road Image Update using In-vehicle Camera Images and Aerial Image 査読有り

    Masafumi Noda, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Yoshiko Kojima, Takashi Naito

    Proceedings of 2011 IEEE Intelligent Vehicles Symposium (IV2011)     頁: 460 - 465   2011年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Road image is becoming important for several
    applications such as car navigation systems, traffic environment
    research, city modeling. Usually, a road image can be obtained
    from an aerial image but the resolution of the aerial image is
    often low, or it contains occlusions by obstacles. Therefore, the
    update of road image is required. In this paper, we propose a
    road image mosaicing method using in-vehicle camera images
    and an aerial image. We first perform image registration of road
    regions between these images, and then, we generate a large road
    image by performing image mosaicing of road regions in invehicle
    camera images. In an experiment, we achieved resolution
    improvement and occlusions removal, and also succeeded in
    update of a large road image.

  189. 3-D Line Segment Reconstruction Using an In-Vehicle Camera for Free Space Detection 査読有り

    Hiroyuki Uchiyama, Daisuke Deguchi, Tomokazu Takahashi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2011 IEEE Intelligent Vehicles Symposium (IV2011)     頁: 290 - 295   2011年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    Free space detection is very important for vehicle navigation and safe driving. 3-D line segment reconstruction
    of a street is important for the free space detection because a street-view includes many line segments. For the free space
    detection, we propose a method for reconstructing 3-D line segments in a streetscape using a monocular in-vehicle camera.
    The 3-D reconstruction of the line segments is achieved by using each three images from an image sequence. Once accurate
    camera poses of these images are obtained, one of the remaining crucial problems is to match the line segments between the
    images correctly. A strategy for finding correspondence of the line segments is as follows: First, the correspondences of line
    segment candidates are searched by using a two-view constraint. However, the two-view constraint has difficulty on determining
    an unique correspondence geometrically. Therefore, the candidates of the line segment correspondences are reduced using
    a three-view constraint. In order to improve the accuracy, the proposed method exploits a color feature of the line segment
    and a preliminary knowledge of the vehicle motion. Finally, the line segments are reconstructed using the correspondences.
    From an experimental result, we confirmed the effectiveness of the proposed method. Application to the free space detection
    demonstrated the usefulness of the reconstructed line segments.

  190. Intelligent Traffic Sign Detector: Adaptive Learning Based on Online Gathering of Training Samples 査読有り

    Daisuke Deguchi, Mitsunori Shirasuna, Keisuke Doman, Ichiro Ide, Hiroshi Murase

    Proceedings of 2011 IEEE Intelligent Vehicles Symposium (IV2011)     頁: 72 - 77   2011年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper proposes an intelligent traffic sign detector using adaptive learning based on online gathering of training samples from in-vehicle camera image sequences. To detect traffic signs accurately from in-vehicle camera images, various training samples of traffic signs are needed. In addition, to reduce false alarms, various background images should also be prepared before constructing the detector. However, since their appearances vary widely, it is difficult to obtain them exhaustively by manual intervention. Therefore, the proposed method simultaneously obtains both traffic sign images and background images from in-vehicle camera images. Especially, to reduce false alarms, the proposed method gathers background images that were easily mis-detected by a previously constructed traffic sign detector, and re-trains the detector by using them as negative samples. By using retrospectively tracked traffic sign images and background images as positive and negative training samples, respectively, the proposed method constructs a highly accurate traffic sign detector automatically. Experimental results showed the effectiveness of the proposed method.

  191. 位置依存型識別器を用いた車載カメラ画像からの路面標示検出 査読有り

    野田 雅文, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋, 小島 祥子, 内藤 貴志

    電気学会論文誌D   131 巻 ( 4 ) 頁: 466 - 474   2011年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    In this study, we propose a method for detecting road markings recorded in an image captured by an in-vehicle camera by using a position-dependent classifier. Road markings are symbols painted on the road surface that help in preventing traffic accidents and in ensuring traffic smooth. Therefore, driver support systems for detecting road markings, such as a system that provides warning in the case when traffic signs are overlooked, and supporting the stopping of a vehicle are required. It is difficult to detect road markings because their appearance changes with the actual traffic conditions, e. g. the shape and resolution change. The variation in these appearances depend on the positional relation between the vehicle and the road markings, and on the vehicle posture. Although these variations are quite large in an entire image, they are relatively small in a local area of the image. Therefore, we try to improve the detection performance by taking into account the local variations in these appearances. We propose a method in which a position-dependent classifier is used to detect road markings recorded in images captured by an in-vehicle camera. Further, to train the classifier efficiently, we propose a generative learning method that takes into consideration the positional relation between the vehicle and road markings, and also the vehicle posture. Experimental results showed that the detection performance when the proposed method was used was better than when a method involving a single classifier was used.

    DOI: 10.1541/ieejias.131.466

  192. Accurate and Robust Attitude Estimation of a Moving Vehicle Using MEMS Gyroscopes and a Monocular Camera 査読有り

    Norimasa Kobori, Daisuke Deguchi, Tomokazu Takahashi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2010 Workshop on Picture Coding and Image Processing (WPCIP 2010)     2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    In order to estimate accurate attitude of mobile robots and vehicles, we propose a hybrid system which combines a lowcost monocular camera with a gyro sensor. A gyro sensor has drift errors that accumulate over time. On the other hand, a camera cannot obtain the rotation continuously in the case where feature points cannot be extracted from images, although the accuracy is better than a gyro sensor. To solve these problems, we propose a method for combining these sensors based on an Extended Kalman Filter.

  193. 拡張DPマッチングを用いた視野角の異なるカメラ映像間の時空間対応付けによる自車位置推定 査読有り

    内山 寛之, 出口 大輔, 高橋 友和, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J93-D 巻 ( 12 ) 頁: 2659 - 2665   2010年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,データベース作成時に全方位カメラ,位置推定時に通常カメラを使用するアピアランスベースの自車位置推定手法を提案する.従来のアピアランスベースの自車位置推定では,データベース作成時と位置推定時で同一種類のカメラが使用されることが多い.しかし,位置推定精度やカメラの設置位置の制約などの点で問題となることがある.提案手法では,通常カメラ映像のフレームに対応する全方位カメラ映像のフレームと,そのフレーム中の領域を探索する.しかし,市街地では類似する物体が多く存在し,単一フレーム照合では正確な照合が難しい.そのため,複数フレーム照合を用いることで精度の向上を図る必要がある.これを実現するため,フレームと領域を考慮した映像間の照合コストを定式化する.そして,動的計画法によりこれを最小化するためのアルゴリズムを導入し,このアルゴリズムを用いて映像全体で最適に対応づける.データベース内のフレームには位置情報が付加されており,これにより自車位置を得る.実際に市街地で撮影した映像を用いた評価実験の結果,自車位置推定誤差が2m以下の割合が,領域の対応付けを行わない手法で77%,提案手
    法で90%であり,提案手法の有効性を確認した.

  194. Multimedia supplementation to a cooking recipe text for facilitating its understanding to inexperienced users 査読有り

    Ichiro Ide, Yuka Shidochi, Yuichi Nakamura, Daisuke Deguchi, Tomokazu Takahashi, Hiroshi Murase

    Proceedings of the 2nd Workshop on Cooking and Eating Activities (CEA2010)     頁: 242 - 247   2010年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  195. Frontal Face Generation from Multiple Low-Resolution Non-Frontal Faces for Face Recognition 査読有り

    Yuki Kono, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 10th International Workshop on Visual Surveillance 2010     2010年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  196. Improvement of a traffic sign detector by retrospective gathering of training samples from in-vehicle camera image sequences 査読有り

    Daisuke Deguchi, Keisuke Doman, Ichiro Ide, Hiroshi Murase

    Proceedings of Computer Vision in Vehicle Technology: From Earth to Mars (CVVT2010)     2010年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  197. Vehicle Ego-localization by Matching In-vehicle Camera Images to an Aerial Image 査読有り

    Masafumi Noda, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Yoshiko Kojima, Takashi Naito

    Proceedings of Computer Vision in Vehicle Technology: From Earth to Mars (CVVT2010)     2010年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  198. Marker-Free Registration for Electromagnetic Navigation Bronchoscopy under Respiratory Motion

    Marco Feuerstein, Takamasa Sugiura, Daisuke Deguchi, Tobias Reichl, Takayuki Kitasaka, Kensaku Mori

    Proceedings of the 5th International Workshop on Medical Imaging and Augmented Reality (MIAR2010)   LNCS 6326 巻   頁: 237 - 246   2010年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  199. 色変動を考慮した生成型学習法による道路標識検出器の構築 査読有り

    道満 恵介, 出口 大輔, 高橋 友和, 目加田 慶人, 井手 一郎, 村瀬 洋

    電子情報通信学会論文誌   J93-D 巻 ( 8 ) 頁: 1375 - 1385   2010年8月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    環境変化に対してロバストかつ高速な物体検出を可能とする識別器として,Violaらが提案したカスケード型識別器がある.これを用いて様々な環境下に存在する道路標識を高精度に検出するためには,多様な見えの変動を含んだ大量の標識画像を用いて識別器の学習を行う必要がある.しかしながら,多様な見えの変動をバランスよく含んだ大量の標識画像を手作業で収集するには多大なコストがかかる.そのため,本研究では生成型学習を用いてカスケード型識別器を構築することを考える.これまでにも生成型学習を用いて識別器を構築
    する手法は提案されているが,形状やテクスチャの変動のみが考慮されており,色の変動は考慮されていない.
    そこで本論文では,形状やテクスチャの変動に加えて色の変動も考慮し,より高い検出性能をもったカスケード型識別器を構築する手法を提案する.車載カメラ映像を用いた道路標識の検出実験の結果,本論文で提案する色の変動を考慮する生成型学習により,従来よりも高い検出性能をもつカスケード型識別器が構築できることを確認した.

  200. Removal of Moving Objects from a Street-View Image by Fusing Multiple Image Sequences 査読有り

    Hiroyuki Uchiyama, Daisuke Deguchi, Tomokazu Takahashi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 20th IAPR International Conference on Pattern Recognition (ICPR2010)     頁: 3456 - 3459   2010年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ICPR.2010.844

  201. Classification of near-duplicate video segments based on their appearance patterns 査読有り

    Ichiro Ide, Yuji Shamoto, Daisuke Deguchi, Tomokazu Takahashi, Hiroshi Murase

    Proceedings of the 20th IAPR International Conference on Pattern Recognition (ICPR2010)     頁: 3129 - 3133   2010年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ICPR.2010.766

  202. Estimation of Traffic Sign Visibility Toward Smart Driver Assistance 査読有り

    Keisuke Doman, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase, Yukimasa Tamatsu

    Proceedings of 2010 IEEE Intelligent Vehicles Symposium (IV2010)     頁: 45 - 50   2010年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/IVS.2010.5548137

  203. Construction of cascaded traffic sign detector using generative learning 査読有り

    Keisuke Doman, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    Proceedings of the 4th International Conference on Innovative Computing, Information and Control (ICICIC2009)     2009年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  204. Labeling News Topic Threads with Wikipedia Entries 査読有り

    Tomoki Okuoka, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Proceedings of the 1st International Workshop on Content-Based Audio/Video Analysis for Novel TV Services (CBTV2009)     頁: 501 - 504   2009年12月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ISM.2009.67

  205. Automated Anatomical Labeling of Bronchial Branches Extracted from CT Datasets Based on Machine Learning and Combination Optimization and Its Application to Bronchoscope Guidance 査読有り

    Kensaku Mori, Shunsuke Ota, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Shingo Iwano, Yoshinori Hasegawa, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 12th International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI2009)   LNCS 5762, Part II 巻   頁: 707 - 714   2009年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    This paper presents a method for the automated anatomical labeling of bronchial branches extracted from 3D CT images based on machine learning and combination optimization. We also show applications of anatomical labeling on a bronchoscopy guidance system. This paper performs automated labeling by using machine learning and combination optimization. The actual procedure consists of four steps: (a) extraction of tree structures of the bronchus regions extracted from CT images, (b) construction of AdaBoost classifiers, (c) computation of candidate names for all branches by using the classifiers, (d) selection of best combination of anatomical names. We applied the proposed method to 90 cases of 3D CT datasets. The experimental results showed that the proposed method can assign correct anatomical names to 86.9% of the bronchial branches up to the sub-segmental lobe branches. Also, we overlaid the anatomical names of bronchial branches on real bronchoscopic views to guide real bronchoscopy.

    DOI: 10.1007/978-3-642-04271-3_86

  206. Low-resolution Character Recognition by Video-based Super-resolution 査読有り

    大倉 直, 出口 大輔, 高橋 友和, 井手 一郎, 村瀬 洋

    Proceedings of the 10th International Conference on Document Analysis and Recognition (ICDAR2009)     頁: 191 - 195   2009年7月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/ICDAR.2009.168

  207. 画像位置合わせに基づく気管支鏡追跡のための選択的な画像間類似度計算手法 査読有り

    出口 大輔, 森 健策, フォイヤーシュタイン マルコ, 北坂 孝幸, Calvin R. Maurer Jr., 末永 康仁, 高畠 博嗣, 森 雅樹, 名取 博

    Medical Image Analysis   13 巻 ( 4 ) 頁: 621 - 633   2009年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1016/j.media.2009.06.001

  208. An improved method for automated recognition of bronchial tree structure by optimizing combinations of candidate anatomical names 査読有り

    Takayuki Kitasaka, Shunsuke Ota, Daisuke Deguchi, Kensaku Mori, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi, Shingo Iwano, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    International Journal of Computer Assisted Radiology and Surgery   4 巻   頁: 327 - 328   2009年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  209. Ego-localization using Streetscape Image Sequences from In-vehicle Cameras 査読有り

    Hiroyuki Uchiyama, Daisuke Deguchi, Tomokazu Takahashi, Ichiro Ide, Hiroshi Murase

    Proceedings of 2009 IEEE Intelligent Vehicles Symposium (IV2009)     頁: 185 - 190   2009年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/IVS.2009.5164275

  210. Automatic Calibration of an In-vehicle Gaze Tracking System Using Driver's Typical Gaze Behavior 査読有り

    Kenji Yamashiro, Daisuke Deguchi, Tomokazu Takahashi, Ichiro Ide, Hiroshi Murase, Kazunori Higuchi, Takashi Naito

    Proceedings of 2009 IEEE Intelligent Vehicles Symposium (IV2009)     頁: 998 - 1003   2009年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1109/IVS.2009.5164417

  211. Recognition of Road Markings from In-Vehicle Camera Images by a Generative Learning Method 査読有り

    Masafumi Noda, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Yoshiko Kojima, Takashi Naito

    Proceedings of IAPR Conference on Machine Vision Applications (MVA) 2009     頁: 514 - 517   2009年5月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  212. A method for accelerating bronchoscope tracking based on image registration by using GPU 査読有り

    Takamasa Sugiura, Daisuke Deguchi, Marco Feuerstein, Takayuki Kitasaka, Yasuhito Suenaga, Kensaku Mori

    Proceedings of SPIE Medical Imaging 2009   7261 巻   頁: 726108 - 1   2009年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  213. Automatic mediastinal lymph node detection in chest CT 査読有り

    Marco Feuerstein, Daisuke Deguchi, Takayuki Kitasaka, Shingo Iwano, Kazuyoshi Imaizumi, Yoshinori Hasegawa, Yasuhito Suenaga, Kensaku Mori

    Proceedings of SPIE Medical Imaging 2009   7260 巻   頁: 1 - 11   2009年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  214. 計算機支援医用画像診断のための共通基盤システムの開発 査読有り

    二村 幸孝, 出口 大輔, 北坂 孝幸, 末永 康仁, 森 健策

    Medical Imaging Technology   26 巻 ( 5 ) 頁: 327 - 337   2008年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本稿では,臓器・疾病横断型の診断支援を実現するための共通基盤システムについて述べる.医用画像に含まれる多量の情報を最大限に活用することが可能な臓器・疾病横断型の診断支援は,医師の負担軽減,診断の質的向上を実現する上で,今後,必要不可欠なると考えられる.我々は,この次世代の診断支援を実現するために共通基盤システムを開発している.この共通基盤システムは,診断支援機能を統合化するための仕組みを備えており,臓器・疾病横断型の診断支援や医師の診断ワークフローに沿う診断支援を実現することができる.本稿では,この共通基盤システムおよびその構成技術について詳述し,既存の医用画像処理ソフトウェアと比較実験を行い,本共通基盤システムが,多臓器・多疾病を対象とする計算機支援医用画像診断システムを実現するための優れた拡張性を有していることを

  215. PLUTO: A Common CAD Platform for Multiorgan Multidisease CAD (MoMd-CAD) 査読有り

    Yukitaka Nimura, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga

    RSNA (Radiological Society of North America) Scientific Assembly and Annual Meeting Program 2008     頁: 904   2008年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  216. A Method for Accelerating Bronchoscope Tracking Based on Image Registration by GPGPU 査読有り

    Takamasa Sugiura, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga

    Proceedings of International Workshop on Augmented environments for Medical Imaging and Computer-aided Surgery (AMI-ARCS) 2008     頁: 130 - 139   2008年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  217. Improvement of Accuracy of Marker-Free Bronchoscope Tracking Using Electromagnetic Tracker Based on Bronchial Branch Information 査読有り

    Kensaku Mori, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi, Hirotsugu Takabatake

    Proceedings of the 11th International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI2008)   LNCS 5242, Part II 巻   頁: 535 - 542   2008年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  218. Augmented display of anatomical names of bronchial branches for bronchoscopy assistance 査読有り

    Shunsuke Ota, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 4th International Workshop on Medical Imaging and Augmented Reality (MIAR2008)   LNCS 5128 巻   頁: 377 - 384   2008年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  219. An improved method for bronchoscope tracking using an electromagnetic tracker without fiducial markers 査読有り

    Daisuke Deguchi, Kazuyoshi Ishitani, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi

    Proceedings of the 22st International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2008)   3 巻   頁: S301   2008年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  220. Automated anatomical labeling of bronchaial branches using multiple classifiers and its application to bronchoscopy guidance 査読有り

    Shunsuke Ota, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 22st International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2008)   3 巻   頁: S269   2008年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  221. Fiducial-free bronchoscope tracking using ultra-tiny electromagnetic tracker based on non-rigid transformation technique 査読有り

    Kensaku Mori, Kazuyoshi Ishitani, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi

    Proceedings of the 22st International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2008)   3 巻   頁: S105   2008年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  222. Automated anatomical labeling of bronchial branches using multiple classifiers and its application to bronchoscopy guidance based on fusion of virtual and real bronchoscopy 査読有り

    Shunsuke Ota, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2008   6916 巻   頁: 1 - 12   2008年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  223. Bronchoscope Tracking Without Fiducial Markers Using Ultra-tiny Electromagnetic Tracking System and Its Evaluation in Different Environments 査読有り

    Kensaku Mori, Daisuke Deguchi, Kazuyoshi Ishitani, Takayuki Kitasaka, Yasuhito Suenaga, Yoshinori Hasegawa, Kazuyoshi Imaizumi, Hirotsugu Takabatake

    Proceedings of the 10th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2007)   LNCS 4792, Part II 巻   頁: 644 - 651   2007年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  224. A method for bronchoscope tracking using position sensor without fiducial markers 査読有り

    Daisuke Deguchi, Kazuyoshi Ishitani, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Yoshinori Hasegawa, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 21st International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2007)   2 巻   頁: S11-S13   2007年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  225. A method for bronchoscope tracking using position sensor without fiducial markers 査読有り

    Daisuke Deguchi, Kazuyoshi Ishitani, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2007   6511 巻   頁: 1 - 0   2007年2月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  226. Easy and stable bronchoscope camera calibration technique for bronchoscope navigation system 査読有り

    Kazuyoshi Ishitani, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2007   6509 巻   頁: 1 - 1   2007年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  227. Compensation of Electromagnetic trackintg system using an optical tracker and its application to bronchoscopy navigation system 査読有り

    Kensaku Mori, Kazuyoshi Ishitani, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2007   6509 巻   頁: 1 - 0   2007年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  228. 3次元前立腺モデルに対する仮想針生検システムを用いた前立腺がん検出のための針生検手法の評価 査読有り

    野口 正典, 出口 大輔, 鳥脇 純一郎, 森 健策, 目加田 慶人, 松岡 啓

    International Journal of Urology   13 巻 ( 10 ) 頁: 1296 - 1303   2006年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1111/j.1442-2042.2006.01561.x

  229. A preliminary study on introduction of a magnetic tracking sensor for bronchoscope navigation system 査読有り

    Kazuyoshi Ishitani, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of International Workshop on Augmented environments for Medical Imaging and Computer-aided Surgery (AMI-ARCS) 2006     2006年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  230. Bronchoscope Tracking Based on Image Registration Using Multiple Initial Starting Points Estimated by Motion Prediction 査読有り

    Kensaku Mori, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori, Calvin R. Maurer Jr.

    Proceedings of the 9th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2006)   LNCS 4191, Part II 巻   頁: 645 - 652   2006年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  231. Detection of liver cancer regions from dynamic CT images 査読有り

    Yuichiro Hayashi, Daisuke Deguchi, Takayuki Kitasaka, Kensaku Mori, Yoshito Mekada, Yasuhito Suenaga

    Proceedings of the 20th International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2006)   1 巻   頁: 524 - 525   2006年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  232. Image-based bronchoscope tracking using motion predication and multiple searches 査読有り

    Kensaku Mori, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 20th International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2006)   1 巻   頁: 178 - 181   2006年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  233. 位置センサと画像位置合わせの統合による気管支鏡追跡手法 査読有り

    出口 大輔, 秋山 健太, 森 健策, 北坂 孝幸, 末永 康仁, Calvin R. Maurer Jr., 高畠 博嗣, 森 雅樹, 名取 博

    Computer Aided Surgery   11 巻 ( 3 ) 頁: 109 - 117   2006年5月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

  234. Branch identification method for CT-guided bronchoscopy based on eigenspace image matching between real and virtual bronchoscopic images 査読有り

    Riyoko Shinohara, Kensaku Mori, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2006   6143 巻   頁: 14 - 1   2006年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  235. 多時相CT像からのCT値の確率分布推定に基づく肝臓領域抽出 査読有り

    出口 大輔, 林 雄一郎, 北坂 孝幸, 森 健策, 目加田 慶人, 末永 康仁, 長谷川 純一, 鳥脇 純一郎

    コンピュータ支援画像診断学会論文誌   9 巻 ( 4 ) 頁: 36 - 48   2006年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,造影3次元腹部X線CT像からCT値の確率分布を解析することにより,肝臓領域を自動抽出する手法について述べる.肝臓のCT値分布は隣接する脾臓や筋肉のCT値分布と非常に類似しているため,単一時相からしきい値処理を用いて肝臓領域を抽出することは困難である.本論文では,早期相と晩期相の2次元ヒストグラムから肝臓,脾臓,筋肉に対応するCT値分布を推定し,肝臓領域抽出に用いるしきい値を自動的に決定する.具体的には,各臓器のCT値分布を正規分布と仮定し,EMアルゴリズムを用いてそれぞれの分布を推定する.推定された分布を用いて,肝臓領域,肝細胞がん領域を抽出することで,肝細胞がんを含む肝臓領域を抽出する.また,肝臓外領域を抽出することで肝臓に隣接する筋肉等への過抽出を抑制し,最後に輪郭を補正し肝臓領域を得る.本手法を早期相,晩期相の3次元腹部X線CT像26例に適用した結果,24例で良好に肝臓領域を抽出することが可能であった.

  236. Development of a Virtual Needle Biopsy Simulation System for the Virtual Prostate 査読有り

    Daisuke Deguchi, Kensaku Mori, Yoshito Mekada, Jun-ichi Hasegawa, Junichiro Toriwaki, Masanori Noguchi

    Systems and Computers in Japan   37 巻 ( 1 ) 頁: 93 - 104   2006年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    This paper discusses the virtual prostate needle biopsy system and the construction of the virtual prostate model, considering the actual distribution of prostate abnormalities. A needle biopsy simulation is performed for the constructed virtual prostate, and the actual biopsy procedure in the clinical situation is evaluated. The prostate needle biopsy is a histologic diagnosis procedure in which a sample is acquired from the prostate tissue by needle biopsy and is inspected under a microscope. In order to achieve reliable prostate needle biopsy, it is necessary to consider systematically and numerically the number of needles required, and their locations and insertion angles.
    For such a purpose, a system is developed in which a virtual prostate is constructed on a computer and the biopsy procedure is evaluated quantitatively by performing virtually the prostate needle biopsy. Furthermore, two different models are constructed, for the prostate with and without hypertrophy, based on the actual statistical distribution data for
    prostate abnormalities. Each model is partitioned into the peripheral zone and the transition zone. The constructed
    virtual prostate is input into the virtual needle biopsy simulation system, and three different systematic biopsy procedures actually used at clinical sites, and four different needle biopsy procedures, are experimentally evaluated.
    The experiments show that the insertion angle that maximizes the hit probability is not always the same as the
    insertion angle that maximizes cancer sample acquisition. It is evident that the proposed method can indicate a biopsy
    procedure which realizes a high hit probability with a small number of needles.

    DOI: 10.1002/scj.20181

  237. Hybrid Bronchoscope Tracking Using a Magnetic Tracking Sensor and Image Registration 査読有り

    Kensaku Mori, Daisuke Deguchi, Kenta Akiyama, Takayuki Kitasaka, Calvin R. Maurer Jr., Yasuhito Suenaga, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 8th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2005)   LNCS 3750, Part II 巻   頁: 543 - 550   2005年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  238. A method for bronchoscope tracking by combining a position sensor and image registration 査読有り

    Daisuke Deguchi, Kenta Akiyama, Takayuki Kitasaka, Kensaku Mori, Yasuhito Suenaga, Jun-ichi Hasegawa, Junichiro Toriwaki, Hirotsugu Takabatake, Masaki Mori, Hiroshi Natori

    Proceedings of the 19th International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2005)   1281 巻   頁: 630 - 635   2005年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1016/j.ics.2005.03.282

  239. 造影3次元腹部X線CT像からの肝臓領域自動抽出手法の開発 査読有り

    林 雄一郎, 出口 大輔, 森 健策, 目加田 慶人, 末永 康仁, 鳥脇 純一郎

    コンピュータ支援画像診断学会論文誌   8 巻 ( 1_3 ) 頁: 18 - 30   2004年11月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本稿では,造影3次元腹部X線CT像から肝臓領域を自動抽出する手法について述べる.肝臓の診断では複数の時相のCT画像を用いるため,肝臓を対象としたコンピュータ支援診断システムにおいては,複数の時相から肝臓領域を抽出することは非常に重要である.本稿では特に肝細胞がんの診断に重要とされる早期相,晩期相からの肝臓領域抽出を行う.まず,晩期相においてCT値ヒストグラムを解析し,肝臓に対応するCT値の範囲を自動決定し,しきい値処理によりおおまかな肝臓領域を抽出する.次に,ユークリッド距離に基づく図形分割・統合処理により肝臓に接している他臓器を除去し,最後に輪郭を補正し肝臓領域を得る.早期相に対しては,晩期相から抽出した肝臓領域を早期相のCT像にマッピングし,輪郭領域を修正することで肝臓領域を得る.本手法を早期相,晩期相の3次元腹部X線CT像19症例に適用した結果,ほぼ良好に肝臓領域を抽出することが可能であった.

  240. Fast and Accurate Bronchoscope Tracking using Image Registration and Motion Prediction 査読有り

    Jiro Nagao, Kensaku Mori, Tsutomu Enjoji, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Jun-ichi Hasegawa, Junichiro Toriwaki, Hirotsugu Takabatake, Hiroshi Natori

    Proceedings of the 7th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2004)   LNCS 3217, Part II 巻   頁: 551 - 558   2004年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  241. Improved camera-tracking method by combining motion prediction and image registration for bronchoscope navigation system 査読有り

    Kensaku Mori, Tsutomu Enjoji, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Junichiro Toriwaki, Hiroshi Natori, Hirotsugu Takabatake

    Proceedings of the 18th International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2004)   1268 巻   頁: 1261   2004年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  242. New image similarity measures for bronchoscope tracking based on image registration between virtual and real bronchoscopic images 査読有り

    Kensaku Mori, Tsutomu Enjoji, Daisuke Deguchi, Takayuki Kitasaka, Yasuhito Suenaga, Junichiro Toriwaki, Hirotsugu Takabatake, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2004   5639 巻   頁: 165 - 176   2004年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  243. 仮想前立腺に対する針生検シミュレーションシステムの開発 査読有り

    出口 大輔, 森 健策, 目加田 慶人, 長谷川 純一, 鳥脇 純一郎, 野口 正典

    電子情報通信学会論文誌   J87-D-II 巻 ( 1 ) 頁: 281 - 289   2004年1月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    本論文では,前立腺針生検シミュレーションシステムと実際の前立腺病変分布を考慮した仮想前立腺モデルの作成について述べる.また,作成した仮想前立腺に対する針生検シミュレーションを行い,実際の臨床で用いられている生検手法の評価を行う.前立腺針生検とは,前立腺内の組織を生検針により採取し,顕微鏡で検査する組織診断方法である.確実な前立腺針生検を行うには,針の本数,配置法,挿入角度等を組織的かつ数値的に検討する必要がある.そこで,計算機上に仮想的な前立腺を作成し,仮想的な前立腺針生検を行うことで生検手法を定量的に評価するシステムを開発した.また,実際の前立腺における病変分布の統計的なデータをもとに,肥大症の前立腺とそうでない前立腺の2種類のモデルを作成し,それぞれのモデルに対し辺縁領域(peripheral zone),移行領域(transition zone)への分類を行った.作成した仮想前立腺を仮想針生検シミュレーションシステムに入力し,臨床で用いられている系統的分割生検3種類と別の4種類の生検手法に対する評価実験を行った.実験の結果,ヒット確率を最大にする穿刺角度とがんの採取量を最大にする穿刺角度は必ずしも一致せず,少ない針の本数で高いヒット確率を得る生検手法の存在を,本システムを用いて採すことが可能であることを確認した.

  244. New Image Similarity Measure for Bronchoscope Tracking Based on Image Registration 査読有り

    Daisuke Deguchi, Kensaku Mori, Yasuhito Suenaga, Jun-ichi Hasegawa, Junichiro Toriwaki, Hirotsugu Takabatake, Hiroshi Natori

    Proceedings of the 6th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI2003)   LNCS 2878 巻   頁: 399 - 406   2003年11月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    DOI: 10.1007/978-3-540-39899-8_50

  245. New calculation method of image similarity for endoscope tracking based on image registration in endoscope navigation 査読有り

    Daisuke Deguchi, Kensaku Mori, Yasuhito Suenaga, Jun-ichi Hasegawa, Junichiro Toriwaki, Hiroshi Natori, Hirotsugu Takabatake

    Proceedings of the 17th International Congress and Exhibition on Computer Assisted Radiology and Surgery (CARS2003)   1256 巻   頁: 460 - 466   2003年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  246. 実気管支鏡と仮想化気管支鏡の画像間位置合わせとエピポーラ幾何解析に基づく気管支鏡カメラの追跡 査読有り

    森 健策, 出口 大輔, 杉山 淳, 末永 康仁, 鳥脇 純一郎, Calvin R. Maurer Jr., 高畠 博嗣, 名取 博

    Medical Image Analysis   6 巻   頁: 321 - 336   2002年9月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: 10.1016/S1361-8415(02)00089-0

  247. Camera motion tracking of real bronchoscope using epipolar geometry analysis and CT derived bronchoscopic images 査読有り

    Daisuke Deguchi, Kensaku Mori, Jun-ichi Hasegawa, Junichiro Toriwaki, Hirotsugu Takabatake, Hiroshi Natori

    Proceedings of SPIE Medical Imaging 2002   4683 巻   頁: 30 - 41   2002年2月

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  248. A method for tracking the camera motion of real endoscope by epipolar geometry analysis and virtual endoscopy system 査読有り

    Kensaku Mori, Daisuke Deguchi, Jun-ichi Hasegawa, Yasuhito Suenaga, Junichiro Toriwaki, Hirotsugu Takabatake, Hiroshi Natori

    Proceedings of the 4th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI) 2001   LNCS 2208 巻   頁: 1 - 8   2001年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

▼全件表示

書籍等出版物 3

  1. モビリティイノベーションシリーズ⑤ 自動運転

    村瀬 洋, 出口 大輔, 新村 文郷, 平山 高嗣, 川西 康友, 久徳 遙矢, 他( 担当: 共著 ,  範囲: 4章 認知:外界センサによる草稿環境認識)

    オーム社  2021年1月 

     詳細を見る

    記述言語:日本語

  2. 統計的学習の基礎 -データマイニング・推論・予測-

    杉山将, 井手剛, 神嶌敏弘, 栗田 多喜夫, 前田 英作, 他( 担当: 共訳)

    共立出版  2014年6月 

     詳細を見る

    記述言語:日本語

  3. 医用画像解析ハンドブック

    藤田広志, 石田隆行, 桂川茂彦, 他( 担当: 共著)

    オーム社  2012年11月 

     詳細を見る

    記述言語:日本語

MISC 13

  1. 画像解析の最前線

    出口 大輔, 村瀬 洋  

    日本AEM学会誌31 巻 ( 1 ) 頁: 1 - 1   2023年3月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語  

    This paper presents history and evolution of object detection technologies in recent years. Since the introduction of face detection technology by P. Viola and M. Jones in the early 2000s, various object detection methods have been pro-posed. In particular, deep learning technology has been attracted much attention at IMAGENET Large Scale Visual Recognition Challenge 2012, many excellent object detection methods using deep learning have been proposed. Therefore, this paper focuses on object detection technologies and explains how they have evolved from the past to the present.

  2. 車載カメラを用いた周囲環境認識技術

    出口 大輔  

    車載テクノロジー6 巻 ( 8 ) 頁: 9 - 9   2019年5月

     詳細を見る

    記述言語:日本語  

  3. 自動運転のための運転知能と今後の展開

    鈴木 達也, 赤井 直紀, 出口 大輔  

    人工知能34 巻 ( 2 ) 頁: 206 - 206   2019年3月

     詳細を見る

    記述言語:日本語  

  4. 視線情報の時系列パターンに基づく行動の識別~視線遷移と瞬きを手がかりとした調理作業の識別~

    井手 一郎, 平山 高嗣, 井上 裕哉, 道満 恵介, 川西 康友, 出口 大輔, 村瀬 洋  

    画像ラボ29 巻 ( 6 ) 頁: 14 - 14   2018年6月

     詳細を見る

    記述言語:日本語  

  5. 深層学習を活用した環境理解技術

    出口 大輔, 川西 康友, 村瀬 洋  

    光学47 巻 ( 3 ) 頁: 106 - 106   2018年3月

     詳細を見る

    記述言語:日本語  

    In recent years, the demand for autonomous vehicles and advanced driving support systems has been increasing. Understanding of the surrounding environment is a fundamental and indispensable function for realizing these systems. Therefore, environment recognition using in-vehicle cameras has attracted attention. In the fields of image recognition and computer vision, object detection and scene understanding are being actively developed, and state-of-the-art methods based on deep learning are showing potential for accurate results with less computation time. In addition, developments in hardware such as GPUs provide the potential to accelerate deep learning computations, and it will become possible to equip consumer vehicles with this technology. With this background, this paper surveys the state-of-the-art methods for environment recognition, focusing on pedestrian detection and semantic segmentation.

  6. 複数方向から撮影された人物の手荷物所持判定に関する検討

    川西 康友, 浅井 康博, 西堀 研人, 出口 大輔, 井手 一郎, 村瀬 洋, 高橋 友和  

    画像ラボ27 巻 ( 3 ) 頁: 19 - 19   2016年3月

     詳細を見る

    記述言語:日本語  

    警察の捜査では,大量の監視カメラ映像の中から対象の人物を探すことが,膨大な人的コストをかけて人手で行われている.これを画像処理によって監視カメラ映像を絞り混むことで支援する技術が求められている.そこで我々は監視カメラ映像中から検出された人物画像から手荷物所持の有無を判定することにより,人物絞り込みの支援を行うことを目的として研究している.人物絞り込みは,漏れをいかに減らすかが重要であるが,1枚の画像から手荷物所持の有無を判定する場合,体により手荷物が隠れてしまい正しく判定できない場合がある.そこで,本稿では我々が提案した,複数方向から撮影された人物画像を利用した手荷物所持判定手法について解説する.

  7. 空間的な人数分布推定のための記憶型回帰

    田渕 義宗, 出口 大輔, 井手 一郎, 村瀬 洋, 高橋 友和, 黒住 隆行, 柏野 邦夫  

    画像ラボ25 巻 ( 12 ) 頁: 55 - 55   2014年12月

     詳細を見る

    記述言語:日本語  

    カメラを用いた群集解析は公共の安全やマーケテイングなどに需要がある。我々は群集解析の中でも、小領域毎の人数を求める空間的な人数分布推定の実現を目指している。 しかし、カメラから離れた場所では人物閣の遮蔽が発生するため、空間的な人数分布を正しく推定することは困難である。そこで本稿では、複数視点、のカメラから撮影された画像を用いて記憶型回帰により人数分布を推定する手法を紹介する。本手法は、人数分布と群集の見えの対応表を用いるものであり、予め群集の見えに遮蔽が含まれているため、遮蔽に頑健な人数分布推定手法が実現される。

  8. 空撮画像と車載カメラ画像の対応付けによる自車位置推定

    野田 雅文, 高橋 友和, 出口 大輔, 井手 一郎, 村瀬 洋, 小島 祥子, 内藤 貴志  

    O plus E34 巻 ( 6 ) 頁: 522 - 522   2012年6月

     詳細を見る

    記述言語:日本語  

    本稿では、空撮画像と車載カメラ画像の対応付けにより自車の位置を推定する手法について述べた.提案手法は、複数時刻の車載カメラ画像を利用することで、自車位置の推定性能の向上を図ったものである.実験により、推定性能の向上を確認し、提案手法の有効性を確認する.

  9. 画像認識とGPU

    出口 大輔, 井手 一郎, 村瀬 洋  

    日本ロボット学会誌28 巻 ( 3 ) 頁: 28 - 28   2010年4月

     詳細を見る

    記述言語:日本語  

    我々が普段使用しているPCには,モニターへの映像出力や3D描画処理において重要な役割を担うGPU(Graph-ics Processing Unit)が必ずといってよいほど搭載されている.また,PlayStation 3やXbox 360等のゲーム機にも高性能なGPUが搭載されるようになっており,その性能を活かした臨場感あふれるゲームを体験できるようになった.特に,ここ数年のGPUの性能向上は著しく,その演算性能が1TFLOPS(FLoating point Operations Per Second)を超える製品も発売されるようになっている.従来,GPUは2Dや3Dの描画処理を担当する演算装置であったが,近年の高性能化に伴い,GPUを描画処理以外に利用しようという試みが注目を集めている.これはGPGPU(General-Purposecomputation on GPU)と呼ばれており,物理シミュレーション,数値計算,信号解析,画像処理・認識,などの様々な分野で広く利用されるようになってきている.

  10. PLUTO: 医用画像診断支援共通プラットフォーム

    二村 幸孝, 出口 大輔, 北坂 孝幸, 森 健策, 末永 康仁  

    Medical Imaging Technology26 巻 ( 3 ) 頁: 187 - 187   2008年5月

     詳細を見る

    記述言語:日本語  

  11. CAD最前線2007 III 統合化システム 多臓器・多疾病医用画像診断支援システム「PLUTO」

    二村 幸孝, 出口 大輔, 北坂 孝幸, 森 健策  

    INNERVISIONインナービション22 巻 ( 12 ) 頁: 45 - 45   2007年12月

     詳細を見る

    記述言語:日本語  

  12. 学会参加だより「MICCAI2006」

    出口 大輔  

    CADM News Letter ( 49 ) 頁: 14 - 14   2007年1月

     詳細を見る

    記述言語:日本語  

  13. 学会参加だより MICCAI2006

    出口 大輔  

    Medical Imaging Technology24 巻 ( 5 ) 頁: 433 - 433   2006年11月

     詳細を見る

    記述言語:日本語  

▼全件表示

講演・口頭発表等 705

  1. モノクロ画像を入力とした カラー化 NeRF の検討

    水上皓太, 出口 大輔, 村瀬 洋

    情報処理学会第86回全国大会  2024年3月17日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:口頭発表(一般)  

    近赤外線カメラなどでのNeRFを見据え、モノクロ画像を利用したNeRFについて研究した。モノクロ画像をカラー化してNeRFに入力する従来手法では、3次元的な色の一貫性が考慮されておらず、視点の移動により不自然に色が変化する3Dモデルが生成された。その問題を解決するために、NeRFに新たな損失を導入することで視点の移動による色の変化を抑制した。

  2. A Study on Fixed Orthogonal Prototype Classifier for Semantic Segmentation

    Jialei Chen, Daisuke Deguchi, Chenkai Zhang, Xu Zheng, Hiroshi Murase

    Pattern Recognition and Media Understanding (PRMU)  2024年1月26日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Keio University  

  3. エンドツーエンド運転モデルの説明性向上のための事前学習に関する予備研究

    張 琛凱, 出口 大輔, 陳 嘉雷, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2024年1月26日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Keio University  

  4. Pedestrian's Gaze Object Detection in Traffic Scene 国際会議

    Hiroto Murakami, Jialei Chen, Daisuke Deguchi, Takatsugu Hirayama, Yasutomo Kawanishi, Hiroshi Murase

    19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP) 2024  2024年2月27日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Rome, Italy  

    In this paper, we present a new task of detecting an object that a target pedestrian is gazing at in a traffic scene called PEdestrian's Gaze Object (PEGO). We argue that the detection of gaze object can provide important information for pedestrian's behavior prediction and can contribute to the realization of automated vehicles. For this task, we construct a dataset of in-vehicle camera images with annotations of the objects that pedestrians are gazing at. Also, we propose a Transformer-based method called PEGO Transformer to solve the PEGO detection task. The PEGO Transformer directly performs gaze object detection with the utilization of whole-body features without a high-resolution head image and a gaze heatmap which the traditional methods rely on. Experimental results showed that the proposed method could estimate pedestrian's gaze object accurately even if various objects exist in the scene.

  5. Comprehensive Evaluation of End-to-End Driving Model Explanations for Autonomous Vehicles 国際会議

    Chenkai Zhang, Daisuke Deguchi, Jialei Chen, Hiroshi Murase

    19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP) 2024  2024年2月27日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Precise House Mantegna Roma  

    Deep learning technology has rapidly advanced, leading to the development of End-to-End driving models (E2EDMs) for autonomous vehicles with high prediction accuracy. To comprehend the prediction results of these E2EDMs, one of the most representative explanation methods is attribution-based. There are two kinds of attribution-based explanation methods: pixel-level and object-level. Usually, the heatmaps illustrate the importance of pixels and objects in the prediction results, serving as explanations for E2EDMs. Since there are many attribution-based explanation methods, evaluation methods are proposed to determine which one is better at improving the explainability of E2EDMs.
    Fidelity measures the explanation's faithfulness to the model's prediction method, which is a bottommost property. However, no evaluation method could measure the fidelity difference between object-level and pixel-level explanations, making the current evaluation incomplete. In addition, without considering fidelity, previous evaluation methods may advertise manipulative explanations that solely seek human satisfaction (persuasibility). Therefore, we propose an evaluation method that further considers fidelity, our method enables a comprehensive evaluation that proves the object-level explanations genuinely outperform pixel-level explanations in fidelity and persuasibility, thus could better improve the explainability of the E2EDMs.

  6. 交通シーン画像からの歩行者の注視対象物推定

    村上 大斗, 陳 嘉雷, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    動的画像処理実利用化ワークショップ(DIA)  2024年3月4日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:別府国際コンベンションセンター ビーコンプラザ  

    注視対象物推定は,自動運転車両の実現において不可欠な歩行者の行動予測のための重要な要素である.本発表では,交通シーンで歩行者が注視している物体(PEdestrians' Gaze Object: PEGO)を推定するPEGO Transformer V2を提案する.従来手法の多くは,高解像度の頭部画像と視線ヒートマップを用いて歩行者の注視対象物を推定している.しかしながら,遠方にいる歩行者に対して,高解像度の頭部画像を得られないため推定精度が低いという問題があった.そこでPEGO Transformer V2は,歩行者全身の特徴に加え,歩行者位置情報も活用することで性能改善を図る.実験の結果,提案手法であるPEGO Transformer V2は,シーン中の歩行者ごとにそれぞれ正しい注視対象物を推定できることを確認した.

  7. 拡散モデルを用いた後ろ姿からの正面画像生成の検討

    松雄なずな, 出口 大輔, 村瀬 洋

    情報処理学会第86回全国大会  2024年3月17日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:口頭発表(一般)  

    本発表では,人物の背面画像を入力として正面画像を生成する技術の実現を目的とする.この技術は,監視カメラ映像等に映る人物を人が確認する際の支援などに応用が期待できる.従来の研究では,人物の前向き画像から横向きや後ろ向きの画像を生成する際の精度に比べて,後ろ向き画像からそれ以外の方向を向いた画像を生成した時の精度が劣っていた. この問題を解決するために,本発表では拡散モデルを用いることで背面画像からより精度の高い正面画像を生成する手法を検討した.

  8. Distill from CLIP by Token Alignment for Inductive Zero-shot Semantic Segmentation

    Jialei Chen, Daisuke Deguchi, Chenkai Zhang, Zhenzhen Quan, Hiroshi Murase

    2024年9月9日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:熊本城ホール(熊本県熊本市中央区桜町3番40号)  

  9. A Decoupled Knowledge Distillation Approach for RGB-to-Infrared Video Action Recognition

    Zhenzhen Quan, Jialei Chen, Chenkai Zhang, Daisuke Deguchi, Hiroshi Murase

    27th Meeting on Image Recognition and Understanding (MIRU2024)  2024年8月9日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:ポスター発表  

  10. 学習活動ログを用いたAt-risk 学生の早期検出:学習活動 予測ネットワークの活用

    尾﨑 優也, 出口 大輔, 久徳 遙矢, 村瀬 洋

    第27回画像の認識・理解シンポジウム(MIRU2024)  2024年8月9日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:熊本城ホール(熊本県熊本市中央区桜町3番40号)  

  11. Enhancing Explainability of End-to-End Autonomous Driving Models through additional fine-tuning

    Chenkai Zhang, Daisuke Deguchi, Jialei Chen, Hiroshi Murase

    27th Meeting on Image Recognition and Understanding (MIRU2024)  2024年8月9日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:ポスター発表  

    開催地:熊本城ホール(熊本県熊本市中央区桜町3番40号)  

    In autonomous driving, end-to-end driving models (E2EDMs) have become increasingly popular due to their exceptional predictive performance. This performance stems from leveraging a backbone that is pre-trained on large datasets and then fine-tuned for driving tasks. However, the opaque nature of these E2EDMs presents a challenge to explainability, thus visual explanations are created to shed light on the decision-making process of E2EDMs. Currently, these E2EDMs have been made more explainable by fine-tuning the driving tasks along with a side task designed for explainability. This side task for explainability requires complex structures with auxiliary data, such as the location of objects.
    In this paper, we argue that a more effective approach to enhancing the explainability of E2EDMs is to design a fine-tuning specifically focused on explainability. We propose CROp-based COntrastive DIscriminative LEarning (CROCODILE) to enhance a backbone’s capability to accurately identify object features during this additional fine-tuning for explainability. By adopting CROCODILE, we can develop more explainable E2EDMs without relying on auxiliary data or complex structures in the fine-tuning for driving tasks. Our experimental results confirm that our approach enhances the explainability of E2EDMs.

  12. Centroid Module for Shaping Feature Space in Semantic Segmentation 国際会議

    Jialei Chen, Daisuke Deguchi, Chenkai Zhang, Hiroshi Murase

    3rd Asia Conference on Cloud Computing, Computer Vision and Image Processing (3CVIP 2024)  2024年3月23日 

     詳細を見る

    開催年月日: 2024年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Shanghai, China  

  13. モノクロ画像を入力としたカラー化 NeRF の構築

    水上 皓太, 出口 大輔, 村瀬 洋

    第27回画像の認識・理解シンポジウム(MIRU2024)  2024年8月6日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:口頭発表(一般)  

  14. 拡散モデルを用いた人物の後ろ姿からの正面服装画像生成

    松雄 なずな, 出口 大輔, 村瀬 洋

    第27回画像の認識・理解シンポジウム(MIRU2024)  2024年8月9日 

     詳細を見る

    開催年月日: 2024年

    記述言語:日本語   会議種別:口頭発表(一般)  

  15. 体格を考慮した歩き方からの手荷物の主観的重さ推定の検討

    水野 雅也, 藤田 倫弘, 川西 康友, 出口 大輔, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2023年3月2日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:公立はこだて未来大学  

  16. End-to-End gaze grounding from a person pictured from behind 国際会議

    Hayato Yumiya, Daisuke Deguchi, Yasutomo Kawanishi, Hiroshi Murase

    18th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications  2023年2月21日 

     詳細を見る

    開催年月日: 2023年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Lisbon, Portugal  

  17. Subjective Baggage-Weight Estimation from Gait: Can You Estimate How Heavy the Person Feels? 国際会議

    Masaya Mizuno, Tomohiro Fujita, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISAPP) 2023  2023年2月20日 

     詳細を見る

    開催年月日: 2023年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Lisbon, Portugal  

  18. A Preliminary Study on View Independent Panoptic Scene Change Detection 国際会議

    Jiaxin Li, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    International Workshop on Advanced Image Technology (IWAIT) 2023  2023年1月16日 

     詳細を見る

    開催年月日: 2023年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Maison Glad JEJU hotel, Jeju, Korea  

  19. NeRFモデルを用いた初期値非依存なカメラポーズ推定

    尾﨑 優也, 出口 大輔, 川西 康友, 村瀬 洋

    研究報告コンピュータビジョンとイメージメディア(CVIM)  2023年3月3日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:公立はこだて未来大学  

  20. 歩行者の注視対象データセットの構築

    村上 大斗, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    コンピュータビジョンとイメージメディア研究会(CVIM)  2023年3月3日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:公立はこだて未来大学  

  21. Eye-contact Transformer: 骨格系列とシーン特徴による遠方歩行者のアイコンタクト検出

    畑 隆聖, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2023年3月3日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:公立はこだて未来大学  

  22. Unknown Object Segmentation by View Independent Scene Change Detection

    Jiaxin Li, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    IEICE Technical Report (PRMU)  2023年3月3日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(一般)  

  23. 画像からの人物行動認識

    出口 大輔

    IoTとAIによる運転・健康モニタリング研究会  2023年1月24日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

  24. 交通シーンにおける歩行者の注視対象物推定の検討

    村上 大斗, 陳 嘉雷, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    第26回画像の認識・理解シンポジウム(MIRU2023)  2023年7月26日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:アクトシティ浜松  

  25. Refined Objectification for Improving End-to-End Driving Model Explanation Persuasibility 国際会議

    Chenkai Zhang, Daisuke Deguchi, Hiroshi Murase

    2023 IEEE Intelligent Vehicles Symposium (IV2023)  2023年6月5日 

     詳細を見る

    開催年月日: 2023年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Anchorage, AK, USA  

    DOI: 10.1109/IV55152.2023.10186742

  26. Explainability Enhancement module for End-to-End Driving Models by Focusing on the important objects

    Chenkai Zhang, Daisuke Deguchi, Hiroshi Murase

    26th Meeting on Image Recognition & Understanding (MIRU2023)  2023年7月26日 

     詳細を見る

    開催年月日: 2023年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:アクトシティ浜松  

  27. 少量の学習ログからの成績予測モデル構築に関する予備的検討

    尾﨑 優也, 出口 大輔, 村瀬 洋, 川西 康友, 久徳 遙矢

    第172回コンピュータと教育・第41回教育学習支援情報システム合同研究発表会  2023年12月3日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄国際大学  

  28. Explainability Enhancement module for End-to-End Driving Models by Focusing on the important objects

    Chenkai Zhang, Daisuke Deguchi, Hiroshi Murase

    26th Meeting on Image Recognition & Understanding (MIRU2023)  2023年7月26日 

     詳細を見る

    開催年月日: 2023年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:アクトシティ浜松  

  29. 交通シーンにおける歩行者の注視対象物推定の検討

    村上 大斗, 陳 嘉雷, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    第26回画像の認識・理解シンポジウム(MIRU2023)  2023年7月26日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:アクトシティ浜松  

  30. 先進ビークル研究 ―カメラを用いた自車位置推定等ー

    出口 大輔

    革新的製品創出サロン  2023年9月29日 

     詳細を見る

    開催年月日: 2023年

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

    開催地:中部生産性本部 セミナールーム  

  31. 人物姿勢と注視対象配置制約を使用した後ろ向き人物の注視領域推定

    弓矢 隼大, 出口 大輔, 川西 康友, 村瀬 洋

    情報処理学会全国大会 第84回  2022年3月5日 

     詳細を見る

    開催年月日: 2022年

    記述言語:日本語   会議種別:口頭発表(一般)  

  32. Active Learning for Human Pose Estimation based on Temporal Pose Continuity 国際会議

    Taro Mori, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Tetsuo Inoshita

    International Workshop on Advanced Image Technology (IWAIT) 2022  2022年1月6日 

     詳細を見る

    開催年月日: 2022年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Hybrid (The Hong Kong Polytechnic University and online)  

  33. 歩容からの身体特徴と動作特徴の分離による 手荷物の物理的・主観的重さ推定

    水野 雅也, 川西 康友, 出口 大輔, 村瀬 洋

    第25回画像の認識・理解シンポジウム(MIRU2022)  2022年7月27日 

     詳細を見る

    開催年月日: 2022年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:姫路市文化コンベンションセンター アクリエひめじ  

  34. Intuitive Gait Modeling using Mimetic-Words for Gait Description and Generation 国際会議

    Hirotaka Kato, Takatsugu Hirayama, Keisuke Doman, Ichiro Ide, Yasutomo Kawanishi, Takahiro Komamizu, Daisuke Deguchi, Hiroshi Murase

    2022 IEEE 5th International Conference on Multimedia Information Processing and Retrieval (MIPR)  2022年8月3日 

     詳細を見る

    開催年月日: 2022年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Online  

    DOI: 10.1109/MIPR54900.2022.00050

  35. サムネイル画像への見出しレイアウト生成

    成川 喬朗, 出口 大輔, 川西 康友, 村瀬 洋

    第25回画像の認識・理解シンポジウム(MIRU2022)  2022年7月28日 

     詳細を見る

    開催年月日: 2022年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:姫路市文化コンベンションセンター アクリエひめじ  

  36. 時空間骨格情報を用いた遠方歩行者のアイコンタクト検出

    畑 隆聖, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    第25回画像の認識・理解シンポジウム(MIRU2022) 論文集  2022年7月27日 

     詳細を見る

    開催年月日: 2022年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:姫路市文化コンベンションセンター アクリエひめじ  

  37. Detection of distant eye-contact using spatio-temporal pedestrian skeletons 国際会議

    Ryusei Hata, Daisuke Deguchi, Takatsugu Hirayama, Yasutomo Kawanishi, Hiroshi Murase

    The 25th IEEE International Conference on Intelligent Transportation Systems (IEEE ITSC 2022)  2022年9月26日 

     詳細を見る

    開催年月日: 2022年

    記述言語:英語   会議種別:口頭発表(一般)  

  38. Analysis of Gaze while Viewing Videos at Various Playback Speeds 国際会議

    Hideaki Takahira, Yasutomo Kawanishi, Takatsugu Hirayama, Hiroshi Murase, Daisuke Deguchi

    International Display Workshops  2022年12月15日 

     詳細を見る

    開催年月日: 2022年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Fukuoka International Congress Center  

    We analyze gaze while viewing videos at various playback speeds.
    The aims of this paper are to evaluate the comprehension and viewability of videos.
    In our experiment, we used 0.75x to 3.0x speed, and measured gaze.
    We report differences in gaze behavior among different playback speeds in viewing same video.

  39. Detection of Birds in a 3D Environment Referring to Audio-Visual Information 国際会議

    Yasutomo Kawanishi, Ichiro Ide, Baidong Chu, Chihaya Matsuhira, Marc A. Kastner, Takahiro Komamizu, Daisuke Deguchi

    18th IEEE International Conference on Advanced Video and Signal-Based Surveillance  2022年11月29日 

     詳細を見る

    開催年月日: 2022年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Universidad Autónoma de Madrid (Hybrid)  

    We propose a method to detect birds in a 3D environment referring to both audio information observed from a microphone array and visual information observed from a panorama camera. In general, in panorama images, birds appear relatively too small to be detected accurately even with the state-of-the-art deep learning models. Thus, the proposed method takes a two step approach where the birds are first roughly located referring to audio information by Sound Source Localization (SSL), and then image detection is applied within its vicinity. Through evaluation on a dataset annotated with bounding boxes surrounding the birds, we show that the proposed method improves detection performance of birds that appear in relatively small sizes in the image, in both accuracy and processing speed.

    DOI: 10.1109/AVSS56176.2022.9959510

  40. 人物姿勢に着目した後ろ向き人物の注視領域推定

    弓矢 隼大, 出口 大輔, 川西 康友, 村瀬 洋

    コンピュータビジョンとイメージメディア研究会(CVIM)  2022年11月19日 

     詳細を見る

    開催年月日: 2022年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:熊本大学工学部黒髪キャンパス  

  41. 歩行者を含む実写映像からの4Dシーンモデリングの初期検討

    田中 来樹, 川西 康友, 出口 大輔, 村瀬 洋

    電子情報通信学会総合大会  2021年3月12日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

  42. LFIR2Pose: Pose Estimation from an Extremely Low-Resolution FIR Image Sequence 国際会議

    Saki Iwata, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa

    25th International Conference on Pattern Recognition  2021年1月13日 

     詳細を見る

    開催年月日: 2021年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Milan, Italy (Virtual)  

    In this paper, we propose a method for human pose estimation from a Low-resolution Far-InfraRed (LFIR) image sequence captured by a 16 × 16 FIR sensor array. Human body estimation from such a single LFIR image is a hard task. For training the estimation model, annotation of the human pose to the images is also a difficult task for human. Thus, we propose the LFIR2Pose model which accepts a sequence of LFIR images and outputs the human pose of the last frame, and also propose an automatic annotation system for the model training. Additionally, considering that the scale of human body motion is largely different among body parts, we also propose a loss function focusing on the difference. Through an experiment, we evaluated the human pose estimation accuracy using an original data set, and confirmed that human pose can be estimated accurately from an LFIR image sequence.

  43. Median-Shape Representation Learning for Category-Level Object Pose Estimation in Cluttered Environments 国際会議

    Hiroki Tatemichi, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Ayako Amma, Hiroshi Murase

    25th International Conference on Pattern Recognition  2021年1月13日 

     詳細を見る

    開催年月日: 2021年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Milan, Italy (Virtual)  

    In this paper, we propose an occlusion-robust pose
    estimation method of an unknown object instance in an
    object category from a depth image. In a cluttered
    environment, objects are often occluded mutually. For
    estimating the pose of an object in such a situation, a
    method that de-occludes the unobservable area of the object
    would be effective. However, there are two difficulties;
    occlusion causes offset between the actual object center
    and the center of its observable area, and different
    instances in a category may have different shapes. To cope
    with these difficulties, we propose a two-stage
    Encoder-Decoder model to extract features with objects
    whose centers are aligned to the image center. In the
    model, we also propose the Median-shape Reconstructor as
    the second stage to absorb shape variations in a category.
    By evaluating the method with both a large-scale virtual
    dataset and a real dataset, we confirmed the proposed
    method achieves good performance on pose estimation of an
    occluded object from a depth image.

  44. OMEga-GAN: Object Manifold Embedding GAN for Image Generation by Disentangling Parameters into Pose and Shape Manifolds 国際会議

    Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    25th International Conference on Pattern Recognition  2021年1月13日 

     詳細を見る

    開催年月日: 2021年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Milan, Italy (Virtual)  

    In this paper, we propose Object Manifold Embedding GAN (Ω-GAN) to generate images of variously shaped and arbitrarily posed objects from a noise variable sampled from a distribution defined over the pose and the shape manifolds in a vector space. We introduce Parametric Manifold Sampling to sample noise variables from a distribution over the pose manifold to conditionally generate object images in arbitrary poses by tuning the pose parameter. We also introduce Object Identity Loss for clearly disentangling the pose and shape parameters, which allows us to maintain the shape of the object instance when only the pose parameter is changed. Through evaluation, we confirmed that the proposed Ω-GAN could generate variously shaped object images in arbitrary poses by changing the pose and shape parameters independently. We also introduce an application of the proposed method for object pose estimation, through which we confirmed that the object poses in the generated images are accurate.

  45. 顧客の属性を考慮した商品画像の印象推定法の検討

    中本 麻友, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 中澤 満, チェ ヨンナム, シュテンガー ビヨン

    電子情報通信学会総合大会  2021年3月10日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    ECサイトでの商品検索には,商品名や説明文中のキーワードが用いられる.しかし,検索エンジン最適化(SEO)対策として,商品との関連性が低いキーワードが付与されている場合,検索結果の信頼性が低く,直感的な検索もできない.そこで本研究では,商品画像から受ける印象に基づく,直感的な商品検索の実現を目指している.商品画像の印象は商品を検索する顧客の属性により異なることが想定されるため,本発表では,検索者の年代や性別などの属性に応じた商品画像の印象推定法を検討した.属性を考慮しないベースライン手法と,属性を考慮する提案手法を比較した結果,属性を考慮することで,商品画像の印象をより正確に推定できることを確認した.

  46. 歩き方の特徴に着目した所持物・重さ認識の初期検討

    水野 雅也, 川西 康友, 出口 大輔, 村瀬 洋, 井下哲夫

    電子情報通信学会総合大会  2021年3月11日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    近年,不審物検出の需要が高まっている.不審物は重いものが多いため,所持物の重さ認識は不審物検出の重要な手掛かりになりうる.
    人の歩き方は所持物の重さによって違いがあるため,人の歩き方の特徴に着目した所持物・重さ認識手法を検討する.
    本研究では,人物骨格の歩行1周期分の系列を入力とし,所持物・重さを表すクラスを出力とする.
    学習段階では,RTWのランダム選択により,歩行1周期分の系列から複数の固定長部分系列を作成し,元の系列と同じラベルを付与する.
    次に各固定長部分系列を用いて,ST-GCNに基づく所持物・重さ認識器を学習する.
    認識段階では,歩行1周期分の系列から複数の固定長部分空間を選択し,それぞれを学習済みの所持物・重さ認識器に入力する.出力の多数決を行い,最も数の多い所持物・重さを出力する.
    所持物のみの認識と所持物と重さの認識を行った.
    所持物のみの認識は高精度だが,所持物と重さの認識では依然低精度なため,さらなる改良が必要である.

  47. 車載カメラを用いた遠方歩行者からのアイコンタクトの検出に関する初期検討

    畑 隆聖, 出口 大輔, 平山 高嗣, 川西 康友, 村瀬 洋

    電子情報通信学会総合大会  2021年3月11日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    車両の運転において, 歩行者が車両に気づいているか否かを知る上で, アイコンタクトは重要な判断材料となる. 従来の手法では, 直接的な視線推定技術を用いており, 至近距離で撮影した画像にのみ対応しており, カメラから離れた位置にいる歩行者については対応していないという問題がある. 一方, 我々は視線が取れない遠方の歩行者に対しても, 全身の情報を用いてアイコンタクトの有無を区別できる. これに倣い, 本発表では, 視線推定が困難な遠方歩行者からのアイコンタクトの有無を顔や体の情報を複合的に用いて検出する手法を検討する.
    PIEデータセットを用いた実験によって, 85%の正解率で検出が可能であることを確認した.

  48. 個人差を考慮した歩き方からの手荷物の重さ推定の検討

    水野 雅也, 川西 康友, 出口 大輔, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2021年12月17日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

  49. 人物姿勢と注視対象配置制約に基づく後ろ向き人物の注視領域推定

    弓矢 隼大, 川西 康友, 出口 大輔, 村瀬 洋, 細野 峻司

    第24回画像の認識・理解シンポジウム(MIRU)  2021年7月30日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:Online  

  50. 情報エントロピーにもとづく車両歩行者インタラクションモデルの検討

    新村 文郷, 赤井 直紀, 川西 康友, 平山 高嗣, 劉 海龍, 出口 大輔, 村瀬 洋

    第22回計測自動制御学会システムインテグレーション部門講演会  2021年12月16日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

  51. 観衆の顔向きの時空間統合によるステージ上の注目対象及び注目度の推定

    武田 一馬, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 柏野 邦夫

    パターン認識・メディア理解研究会(PRMU)  2021年12月17日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

  52. 人物姿勢と注視対象配置制約に基づく後ろ向き人物の注視領域推定

    弓矢 隼大, 川西 康友, 出口 大輔, 村瀬 洋, 細野 峻司

    コンピュータビジョンとイメージメディア研究会(CVIM)  2021年5月21日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:Online  

  53. 人物姿勢と注視対象配置制約に基づく後ろ向き人物の注視領域推定

    弓矢 隼大, 川西 康友, 出口 大輔, 村瀬 洋, 細野 峻司

    第24回画像の認識・理解シンポジウム(MIRU)  2021年7月30日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:Online  

  54. 歩き方の特徴に着目した所持物の種類・重さ認識の検討

    水野 雅也, 川西 康友, 出口 大輔, 村瀬 洋, 井下 哲夫

    第24回画像の認識・理解シンポジウム(MIRU)  2021年7月29日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:Online  

  55. Pointedness of an Image: Measuring How Pointy an Image is Perceived 国際会議

    Chihaya Matsuhira, Marc A. Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    HCII 2021  2021年7月29日 

     詳細を見る

    開催年月日: 2021年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Virtual  

    For computers to understand human perception, metrics that can capture human perception well are important. However, there are few metrics that characterize the visual perception of humans towards images. Therefore, in this paper, we propose a novel concept and a metric of pointedness of an image, which describes how pointy an image is perceived. The algorithm is inspired by the Features from Accelerated Segment Test (FAST) algorithm for corner detection which looks on the number of continuous neighboring darker pixels surrounding each pixel. We assume that this number would be proportional to the perceived pointedness in the region around the pixel. We evaluated our method towards how well it could capture the human perception of images. To compare the method with similar metrics that describe shapes, we prepared silhouette images of both artificial shapes and natural objects. The results showed that the proposed method gave nearly equivalent perceptual performance to other metrics and also worked in a larger variety of images.

    DOI: https://doi.org/10.1007/978-3-030-78635-9_20

  56. 姿勢変化の連続性に着目した人物姿勢推定器の能動学習

    森 太郎, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋, 井下 哲夫

    第24回画像の認識・理解シンポジウム(MIRU)  2021年7月28日 

     詳細を見る

    開催年月日: 2021年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:online  

  57. Tell as you imagine: Sentence imageability-aware image captioning 国際会議

    Kazuki Umemura, Marc A. Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    27th Int. Conf. on Multimedia Modeling (MMM2021)  2021年6月24日 

     詳細を見る

    開催年月日: 2021年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Online  

    DOI: 10.1007/978-3-030-67835-7_6

  58. Imageability Estimation using Visual and Language Features 国際会議

    Chihaya Matsuhira, Marc A. Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    2020 International Conference on Multimedia Retrieval  2020年10月28日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Dublin, Ireland (Virtual)  

    Imageability is a concept from Psycholinguistics quantizing the human perception of words. However, existing datasets are created through subjective experiments and are thus very small. Therefore, methods to automatically estimate the imageability can be helpful. For an accurate automatic imageability estimation, we extend the idea of a psychological hypothesis called Dual-Coding Theory, that discusses the connection of our perception towards visual information
    and language information, and also focus on the relationship between the pronunciation of a word and its imageability. In this research, we propose a method to estimate imageability of words
    using both visual and language features extracted from corresponding data. For the estimation, we use visual features extracted from low- and high-level image features, and language features extracted from textual features and phonetic features of words. Evaluations how that our proposed method can estimate imageability more accurately than comparative methods, implying the contribution of each feature to the imageability.

    DOI: 10.1145/3372278.3390731

  59. 心像性に基づく画像キャプショニングの検討

    梅村 和紀, カストナー マークアウレル, 井手 一郎, 川西 康友, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2020年3月5日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    様々な場面や用途に応じた画像キャプショニングを目指し,文の心像性に基づく画像キャプショニング手法を提案する.まず,既存の画像キャプションデータセットを拡張して,様々な抽象度のキャプションをもつ画像キャプションデータセットを構築する.そして,そのデータセット中のキャプションに対して心像性を算出することで,心像性スコア付きキャプションデータセットを構築する.それを用いてキャプショニングモデルを学習し,指定した心像性をもつ画像キャプションを生成する枠組みを構築する.評価実験では,画像キャプションデータセットの拡張の有効性と提案手法による画像キャプショニング実現の可能性を確認した.

  60. 料理の種類に応じた盛り付けに関する典型度評価

    中村 真務, 川西 康友, 道満 恵介, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2020年3月5日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    本報告では,料理レシピ検索支援を目的として,料理の種類に応じて盛り付けの典型度を評価する手法を提案する.典型的な盛り付けとは,その料理の種類において頻出する特徴を備えている盛りつけである.そこで本研究では,典型的な盛り付けは出現頻度が高いことと,同一の盛り付け同士では似た画像特徴をもつことを考慮して定量的に典型度を推定する.提案手法ではまず,料理写真の背景領域を除去し,色特徴とテクスチャ特徴を抽出する.次に,特徴量を正規化し,カーネル密度推定によって密度分布を生成する.そして,ある料理写真が与えられたとき,その料理写真の特徴量と密度分布から典型度を計算する.評価実験ではカーネル密度推定を用いた典型度評価手法により,色特徴の有効性を確認した.

  61. 弱教師あり学習を活用したCyclist検出器の精度向上に関する初期検討

    森 太郎, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2020年3月3日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島大学  

  62. 同期した注視点の動きに基づく複数対象の注目度推定法の検討

    武田 一馬, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 永野 秀尚, 柏野 邦夫

    電子情報通信学会総合大会  2020年3月3日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語  

  63. 複数走行映像を活用した自車位置推定に関する初期検討

    後藤 優太, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2020年3月3日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語  

  64. SOANets: Encoder-Decoder based Skeleton Orientation Alignment Network for White Cane User Recognition from 2D Human Skeleton Sequence 国際会議

    Naoki Nishida, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Jun Piao

    International Conference on Computer Vision Theory and Applications (VISAPP) 2020  2020年2月27日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Grand Hotel Excelsior Malta  

    In recent years, various facilities have been deployed to support visually impaired people. However, accidents caused by visual disabilities still occur. In this paper, to support the visually impaired people in public areas, we aim to identify whether a pedestrian image sequence obtained by a surveillance camera indicates the presence of a white cane user by analyzing the temporal transition of a human skeleton represented as 2D coordinates. Our previously proposed method aligns the orientation of the human skeletons to various orientations and identifies a white cane user from the corresponding sequences, relying on multiple classifiers related to each orientation. The method employs an exemplar-based approach to perform the alignment. However, it heavily depends on the number of exemplars and consumes excessive memory. In this paper, we propose a method to align 2D human skeleton representation sequence to various orientations using the proposed Skeleton Orientation Alignment Networks (SOANets) based on an encoder-decoder model. Using SOANets, we can obtain 2D skeleton representation sequences aligned to various orientations, extract richer skeleton features, and recognize white cane users accurately. We conducted an experiment to confirm that the
    proposed method improves the recognition rate by 16%, compared to the method that does not use the skeleton
    orientation alignment.

  65. Occlusion-Aware Skeleton Trajectory Representation for Abnormal Behavior Detection 国際会議

    Onur Temuroglu, Yasutomo Kawanishi, Daisuke Deguchi, Takatsugu Hirayama, Ichiro Ide, Hiroshi Murase, Mayuu Iwasaki, Atsushi Tsukada

    The International Workshop on Frontiers of Computer Vision (IW-FCV)  2020年2月20日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:指宿ふれあいプラザなのはな館  

    Surveillance cameras are expected to play a large role in the development of ITS technologies. They can be used to detect abnormally behaving individuals which can then be reported to drivers nearby. There are multiple works that tackle the problem of abnormal behavior detection. However, most of these works make use of appearance features which have redundant information and are susceptible to noise. While there are also works that make use of pose skeleton representation, they do not consider well how to handle cases with occlusions, which can occur due to the simple reason of pedestrian orientation preventing some joints from appearing in the frame clearly. In this paper, we propose a skeleton trajectory representation that enables handling of occlusions. We also propose a framework for pedestrian abnormal behavior detection that uses the proposed representation and detect relatively hard-to-notice anomalies such as drunk walking. The experiments we conducted show that our method outperforms other representation methods.

  66. Browsing Visual Sentiment Datasets Using Psycholinguistic Groundings 国際会議

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    Lecture Note in Computer Science  2020年1月4日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語  

    開催地:Deajeon Convention Center, Daejeon, Korea  

    Recent multimedia applications commonly use text and imagery from Social Media for tasks related to sentiment research. As such, there are various image datasets for sentiment research for popular classification tasks. However, there has been little research regarding the relationship between the sentiment of images and its annotations from a multi-modal standpoint. In this demonstration, we built a tool to visualize psycholinguistic groundings for a sentiment dataset. For each image, individual psycholinguistic ratings are computed from the image's metadata. A sentiment-psycholinguistic spatial embedding is computed to show a clustering of images across different classes close to human perception. Our interactive browsing tool can visualize the data in various ways, highlighting different psycholinguistic groundings with heatmaps.

    DOI: 10.3758/s13428-018-1099-3

  67. More-Natural Mimetic Words Generation for Fine-Grained Gait Description 国際会議

    Hirotaka Kato, Takatsugu Hirayama, Ichiro Ide, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    Lecture Note in Computer Science  2020年1月4日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Deajeon Convention Center, Daejeon, Korea  

    A mimetic word is used to verbally express the manner of a phenomenon intuitively. The Japanese language is known to have a greater number of mimetic words in its vocabulary than most other languages. Especially, since human gaits are one of the most commonly represented behavior by mimetic words in the language, we consider that it should be suitable for labels of fine-grained gait recognition. In addition, Japanese mimetic words have a more decomposable structure than these in other languages such as English. So it is said that they have sound-symbolism and their phonemes are strongly related to the impressions of various phenomena. Thanks to this, native Japanese speakers can express their impressions on them briefly and intuitively using various mimetic words. Our previous work proposed a framework to convert the body-parts movements to an arbitrary mimetic word by a regression model. The framework introduced a phonetic space" based on sound-symbolism, and it enabled fine-grained gait description using the generated mimetic words consisting of an arbitrary combination of phonemes. However, this method did not consider the "naturalness" of the description. Thus, in this paper, we propose an improved mimetic word generation module considering its naturalness, and update the description framework. Here, we define the co-occurrence frequency of phonemes composing a mimetic word as the naturalness. To investigate the co-occurrence frequency, we collected many mimetic words through a subjective experiment. As a result of evaluation experiments, we confirmed that the proposed module could describe gaits with more natural mimetic words while maintaining the description accuracy."

    DOI: 10.1007/978-3-030-37734-2_18

  68. 視覚特徴と言語特徴を用いた単語の心像性推定の検討

    松平 茅隼, カストナー マークアウレル, 井手 一郎, 川西 康友, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    言語処理学会 第26回年次大会  2020年3月9日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:オンライン  

  69. Modeling Eye-Gaze Behavior of Electric Wheelchair Drivers via Inverse Reinforcement Learning 国際会議

    Yamato Maekawa, Naoki Akai, Takatsugu Hirayama, Luis Yoichi Morales, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    2020 IEEE International Conference on Intelligent Transportation Systems  2020年9月21日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Rhodes, Greece (Virtual)  

    It is intuitively obvious that eye-gaze behaviors of experienced drivers are different from those of novice drivers. However, it is not easy to understand the difference in their behavior quantitatively. In this work, we present an explainable eye-gaze behavior modeling method for electric wheelchair drivers based on Inverse Reinforcement Learning (IRL). We first create feature maps that represent risk factors during driving. These feature maps are able to represent not only to what but also from where drivers pay attention. IRL uses the feature maps to learn the reward representing the eye-gaze behaviors and allows us to see important features via the automatic acquisition of the reward. Through analysis of the learned model, we show quantitative evidence that eye-gaze behaviors of experienced drivers are better-balanced by paying attention to multiple risks.

    DOI: 10.1109/ITSC45102.2020.9294255

  70. 俯瞰支援のための文書彩色方法の検討

    松平 茅隼, カストナー マークアウレル, 井手 一郎, 川西 康友, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2020年9月9日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    本報告では,小説などの書籍を対象とし,ページ単位でその文書内容に応じた彩色を行なう手法を検討する.このような彩色を施すことにより,書籍をわざわざ開かずとも,読者がその内容の変遷を俯瞰的に知ることができるようになると期待される.提案手法では,文書中に出現する各単語に対して「人間が単語から連想する色」に関する知見を用いて色を割り当てる.そして,各ページにおいて出現確率が高いk色の積み上げ棒グラフを作成し,それらをページ順に並べて表示することで,文書内容の可視化を試みる.最後に,実在する小説を対象にして本手法を適用して定性的な分析を行ない,実際の文書内容に対応付けて本手法の彩色結果を説明できることを確認した.

  71. ソフト順序制約付きラベル境界緩和法に基づく 列車前方映像のセマンティックセグメンテーション

    振津 勇紀, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    第23回画像の認識・理解シンポジウム(MIRU)  2020年8月5日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:Online  

  72. 移動する複数物体への群衆からの4次元注目度ヒートマップ生成の初期検討

    武田 一馬, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 永野 秀尚, 柏野 邦夫

    第23回画像の認識・理解シンポジウム (MIRU2020)  2020年8月5日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:オンライン  

  73. 複数画像系列の重み付き統合による自車位置推定

    後藤 優太, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    第23回画像の認識・理解シンポジウム(MIRU)  2020年8月5日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:Online  

  74. 物体の同一性を評価する誤差関数の導入による姿勢・形状変化を独立に扱える GAN の提案

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    第23回画像の認識・理解シンポジウム(MIRU)  2020年8月4日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:Online  

  75. 物体追跡を活用したCenterNetの弱教師あり学習

    森 太郎, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2020年8月4日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:Online  

  76. Performance Boost of Attribute-aware Semantic Segmentation via Data Augmentation for Driver Assistance 国際会議

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Takatsugu Hirayama, Hiroshi Murase

    The 8th IEEE International Conference on Information and Communication Technology  2020年6月24日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:口頭発表(一般)  

    This paper is an extension of our work in developing an attribute-aware semantic segmentation method which focuses on pedestrian understanding in a traffic scene. Recently, the trending topic of semantic segmentation has been expanded to be able to collaborate with the object’s attributes recognition task; Here, it refers to recognizing a pedestrian’s body orientation. The attribute-aware semantic segmentation can be more beneficial for driver assistance compared to the conventional semantic segmentation because it can provide a more informative output to the system. In this paper, we conduct a study of the data augmentation usage as an effort to enhance the performance of the attribute-aware semantic segmentation task. The experiments show that the proposed method in augmenting the training data is able to improve the model’s performance. We also demonstrate some of qualitative results and discuss the benefits to a driver assistance system.

    DOI: 10.1109/ICoICT49345.2020.9166219

  77. 注視点と注視対象の動きの類似性に着目した 複数物体への注目度推定法の初期検討

    武田 一馬, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 永野 秀尚, 柏野 邦夫

    コンピュータビジョンとイメージメディア研究会(CVIM)  2020年5月15日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン  

    アイドル等の公演では,観客の注目を引き付けるため様々な演出が行なわれており,観客が公演中
    に注目している対象の定量的分析は演出の構成を考える上で重要な課題である.そこで本研究では,注視
    点と注視対象の動きの類似性を用いて観客の注視対象を判定し,注目度を推定する手法について述べる.
    注視対象を判定する手法として,注視点と注視対象の距離で判定する手法が考えられる.しかし,本報告
    では群衆を対象とするため,個々の顔画像の解像度は低く,視線推定誤差が大きい.このため,注視対象
    間の距離が小さい場合に判定を誤りやすいと考えられる.この問題に対し,動きの類似性を用いて判定す
    る手法を提案する.注視対象の判定基準に動きを加えることで,注視対象間の距離によらない判定が可能
    になると考えられる.

  78. On the quantification of the mental image of visual concepts for multi-modal applications

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    2020年5月7日 

     詳細を見る

    開催年月日: 2020年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Online  

  79. 頭向き推定に基づく歩行者の交差点内道路横断予測

    高木 俊平, 梅村 充一, 牛田 勝憲, 川西 康友, 出口 大輔, 村瀬 洋

    電子情報通信学会総合大会  2020年3月19日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

  80. 超低解像度FIR画像内での人物位置と動作の違いに着目した骨格推定法の検討

    岩田 紗希, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎

    動的画像処理実利用化ワークショップ(DIA)  2020年3月10日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:国立沖縄工業高等専門学校  

    近年,高齢化の進展により,独居高齢者に向けた見守りシステムが注目されている.しかし,見守りシステムにはプライバシーの問題が存在する.そこで我々はプライバシーの問題を軽減でき,さらに暗闇での撮影にも強い赤外線センサアレイを用いて撮影した超低解像度FIR画像系列から人物の骨格を推定する手法を提案してきた.本発表では特に超低解像度FIR画像内での人物位置と動作の違いに着目した骨格推定法について検討する.具体的には,超低解像度FIR画像内で人物位置に依存しない特徴を抽出するため,低解像度画像において影響が大きいと考えられる中間層でのPoolingをせずに,特徴抽出の最後にGlobalMaxPoolingを導入する.さらに動作の種類に合わせて,時系列情報と空間的情報を有効活用できるネットワークを提案する.実験では,赤外線センサアレイの画角内の様々な位置で人物を撮影したデータセットを用いて,従来手法と提案手法で特定の人物位置で学習を行ない,未学習位置で骨格推定精度を評価した.その結果,人物の動作を滑らかに推定でき,定量的にも精度が向上することを確認した.

  81. 車両の進路情報を条件とした cGAN による走路推定

    右島 琢也, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    動的画像処理実利用化ワークショップ(DIA)  2020年3月10日 

     詳細を見る

    開催年月日: 2020年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:国立沖縄工業高等専門学校  

    近年,自動運転に関する研究開発が活発になされており,限定された環境下ではあるものの公道での走行実験等も進められている.しかし,交差点は事故の危険性が高く,交差点を含む一般道を状況に応じて安全に走 行するための課題は多い.このような背景から,車載カメラを用いて詳細に周囲環境を認識し,周囲の状況を考慮 して安全に走行できる道路上の領域(走路)を推定する技術が求められている.そこで本発表では,車載カメラ画像と,目的地までの経路から得られる車両の進路情報を条件(Condition)とした,conditional GANの枠組みを利用して走行すべき走路を推定する手法を提案する.実走行データから構築したデータセットを用いた評価実験により,画像のみを入力とする比較手法に比べて,提案手法では走路推定精度が15.0%向上することを確認した.

  82. 距離画像からの姿勢推定のための遮蔽に頑健な姿勢表現の学習

    立道 大樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 安間 絢子

    パターン認識・メディア理解研究会(PRMU)  2019年12月20日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大分大学  

    ロボットが物体を持ち運ぶためには,物体の姿勢を推定する必要があるが,物体が他の物体に遮蔽される場合,観測値の欠損と,観測できた部分を囲む矩形で切り出した距離画像中での物体中心の位置ずれが生じ,姿勢推定が困難である.本発表では,欠損を復元できるよう学習したAutoEncoderにより,位置ずれの補正と欠損の復元をすることで得られる姿勢表現を用いた,遮蔽に頑健な姿勢推定を提案する.

  83. LIDARから得られる3D点群を用いた自転車認識

    山本 大貴, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 加藤 一樹, 村瀬 洋

    動的画像処理実利用化ワークショップ(DIA)  2019年3月8日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:北九州国際会議場  

  84. 事例ベースの姿勢正規化による白杖利用者認識に向けた検討

    西田 尚樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 朴 君

    動的画像処理実利用化ワークショップ(DIA)  2019年3月7日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:北九州国際会議場  

    本研究では,視覚障害者を支援するために,人物の姿勢変化から歩行者系列が白杖利用者か否か分類す
    ることを目的とする.しかし,人物の向きによって画像上の人物姿勢は大きく異なるため,分類しなければなら
    ない姿勢パターンが多くなり,分類が困難となる.そこで本発表では,事例ベースで様々な向きの姿勢をある1つ
    の向きの姿勢に正規化する手法を提案する.分類する姿勢のパターンが限定されることにより,高精度の分類が
    可能となる.評価実験において,提案手法により認識率が 5% 向上することを確認した.

  85. 運転者による歩行者の見つけやすさ向上のためのヘッドライトシステム

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    動的画像処理実利用化ワークショップ(DIA)  2019年3月7日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:北九州国際会議場  

    夜間における歩行者の交通死亡事故が多発しており,その原因として運転者による歩行者の視認が困難であることが挙げられる.近年,通常の前方照射に加えて選択的照射が可能なヘッドライトが開発されており,その技術を活かして歩行者に選択的に光を照射することで歩行者の見つけやすさを向上させることが考えられる.我々はこれまでに点滅に着目して効果的な照射法を検討し,特定の周波数において点滅光の照射が効果的であることを確認しているが, 1 つの固定された周辺光条件しか想定していなかった.そこで本研究では,周辺光条件ごとに効果的な点滅照射を分析する.具体的には,運転環境を模擬した臨場感のある仮想環境において 6 種類の周辺光条件を設定し,通常のロービーム照射,ハイビーム照射および 7 種類の点滅周波数を用いて実験を行なった.実験結果から,点滅照射が見つけやすさ向上に有効であることや,異なる周辺光条件では効果的な周波数が異なることを確認した.

  86. SNS投稿写真のVisual Conceptに基づく時空間類似地域マイニング

    陳 璐, 川西 康友, 井手 一郎, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    データ工学と情報マネジメントに関するフォーラム(DEIM)  2019年3月4日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:ホテルオークラJRハウステンボス  

    旅行を計画する際,満足のいく計画を立てるためには,旅先の雰囲気を予め把握することが重要である.ある地域の訪問予定時の雰囲気が,既に知っている地域のある時期の雰囲気と似ていることが分かれば,その地域の訪問時の雰囲気を直感的に把握することできる.これを実現するため,我々は旅行者の体験を反映した大量のSNS投稿写真に着目した.具体的には,写真に付随する時空間情報を用いて写真をクラスタリングし「時期情報付き地域」を獲得し,写真のVisual Conceptに基づいて時空間類似地域をマイニングすることで,時期を考慮した類似地域の組を獲得する手法を提案する.手法の有用性を示すため,Flickr に投稿された写真を用いて時空間類似地域マイニング実験を行った.また,被験者実験を通して,提案手法の妥当性を確認した.

  87. 画像付き料理レシピの地域属性推定の検討

    伊藤 耀一朗, 道満 恵介, 川西 康友, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    データ工学と情報マネジメントに関するフォーラム(DEIM)  2019年3月4日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:ホテルオークラJRハウステンボス  

    近年,投稿型料理レシピポータルサイトが普及している.ウェブ上には膨大な数の料理レシピが存在し,
    掲載されている料理の種類は多岐にわたる.しかし,それに伴い,サイト利用者が検索の際に目的とする料理レシピ
    件数を絞りこむことが難しくなりつつある.そこで本研究では,地域属性(スペイン料理,中華料理など)ごとに料
    理の味や見た目が大きく異なることに着目し,料理レシピがもつ多様な情報から,機械学習を用いて作成される料理
    の地域属性を推定する手法を提案する.学習には,料理の完成画像から得られた画像特徴,素材一覧から得られた素
    材特徴,調理手順文の動詞から得られた手順特徴の 3 つを組み合わせて用いる.結果として,これら 3 つの全特徴を
    用いた手法で 8 割近い推定精度が得られることを確認した.

  88. Hard Negative Mining from in-Vehicle Camera Images based on Multiple Observations of Background Patterns 国際会議

    Masashi Hontani, Haruya Kyutoku, David Robert Wong, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    International Conference on Computer Vision Theory and Applications (VISAPP) 2019  2019年2月26日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Vienna House Diplomat Prague, Prague, Czech Republic  

    In recent years, the demand for highly accurate pedestrian detectors has increased due to the development of advanced driving support systems.
    For the training of an accurate pedestrian detector, it is important to collect a large number of training samples.
    To support this, this paper proposes a ``hard negative'' mining method to automatically extract background images which tend to be erroneously detected as pedestrians.
    Negative samples are selected based on the assumption that frequent patterns observed multiple times in the same location are most likely parts of the background scene.
    As a result of an evaluation using in-vehicle camera images captured along the same route, we confirmed that the proposed method can automatically collect false positive samples accurately.
    We also confirmed that a highly accurate detector can be constructed using the additional negative samples.

  89. Next Viewpoint Recommendation by Pose Ambiguity Minimization for Accurate Object Pose Estimation 国際会議

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Ayako Amma, Norimasa Kobori

    International Conference on Computer Vision Theory and Applications (VISAPP) 2019  2019年2月25日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Vienna House Diplomat Prague, Prague, Czech Republic  

    3D object pose estimation by using a depth sensor is one of the important tasks in activities by robots. To reduce the pose ambiguity of an estimated object pose, several methods for multiple viewpoint pose estimation have been proposed. However, these methods need to select the viewpoints carefully to obtain better results. If the pose of the target object is ambiguous from the current observation, we could not decide where we should move the sensor to set as the next viewpoint. In this paper, we propose a best next viewpoint recommendation method by minimizing the pose ambiguity of the object by making use of the current pose estimation result as a latent variable. We evaluated viewpoints recommended by the proposed method and confirmed that it helps us to gain better pose estimation results than several comparative methods on a synthetic dataset.

  90. Pedestrian Intensive Scanning for Active-scan LIDAR 国際会議

    Taiki Yamamoto, Fumito Shinmura, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    International Conference on Computer Vision Theory and Applications (VISAPP) 2019  2019年2月25日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Vienna House Diplomat Prague, Prague, Czech Republic  

    In recent years, LIDAR is playing an important role as a sensor for understanding environments of a vehicle’s surroundings. Active-scan LIDAR is being actively developed as a LIDAR that can control the laser irradiation direction arbitrary and rapidly. In comparison with conventional uniform-scan LIDAR (e.g. Velodyne HDL-64e), Active-scan LIDAR enables us to densely scan even distant pedestrians. In addition, if appropriately controlled, this sensor has the potential to reduce unnecessary laser irradiations towards non-target objects. Although there are some preliminary studies on pedestrian scanning strategy for Active-scan LIDARs, in the best of our knowledge, an efficient method has not been realized yet. Therefore, this paper proposes a novel pedestrian scanning method based on orientation aware pedestrian likelihood estimation using the orientation-wise pedestrian’s shape models with local distribution of measured points. To evaluate the effectiveness of the proposed method, we conducted experiments by simulating Active-scan LIDAR using point-clouds from the KITTI dataset. Experimental results showed that the proposed method outperforms conventional methods.

  91. 電動車いす運転の熟達に伴う視行動変化の分析

    前川 大和, 赤井 直紀, モラレス ルイス 洋一, 平山 高嗣, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2019年8月1日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:グランキューブ大阪(大阪府立国際会議場)  

    近年,先進国を中心に高齢化が進んでおり,電動車いすの需要が高まっている.しかし,電動車いすの利便性は高い一方で,事故が多発している.自動車の事故は視覚的な認知ミスが原因であることが多く,電動車いすも自動車と同様に運転者の視覚的な認知を支援することが事故防止に有効であると考えられる.また,熟練運転者と非熟練運転者の視行動に差異があることが知られており,熟練者の視行動に基づいて,運転者の視覚的な認知の支援をすることができると考えられる.本研究では,電動車いす運転における熟練者の視行動のモデル化を目指し,リスクが複数存在する箇所である死角あり狭路で運転する場合を想定して,熟達に伴う視行動の変化を3次元空間上で分析した.その結果,熟達するほど複数のリスクに対してバランスよく注意を払うことを確認した.

  92. 複数手法の統合によるセマンティックセグメンテーションのクラス拡張

    汪 邱晟, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    HCGシンポジウム  2019年12月12日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島県情報プラザ  

  93. 環境認識に関する基礎と最近の動向

    出口 大輔

    日本機械学会東海支部講習会  2019年12月5日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

    開催地:名古屋大学  

  94. Scene-Adaptive Driving Area Prediction based on Automatic Label Acquisition from Driving Information 国際会議

    Takuya Migishima, Haruya Kyutoku, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    5th IAPR Asian Conference on Pattern Recognition (ACPR2019)  2019年11月28日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Aotea Centre (Auckland, New Zealand)  

  95. Semantic Segmentation of Railway Images Considering Temporal Continuity 国際会議

    Yuki Furitsu, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Hiroki Mukoujima, Nozomi Nagamine

    5th IAPR Asian Conference on Pattern Recognition (ACPR2019)  2019年11月27日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Aotea Centre (Auckland, New Zealand)  

  96. An Analysis of How Driver Experience Affects Eye-Gaze Behavior for Robotic Wheelchair Operation 国際会議

    Yamato Maekawa, Naoki Akai, Takatsugu Hirayama, Luis Yoichi Morales, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    2019 IEEE International Conference on Computer Vision (ICCV) Workshops  2019年11月2日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:COEX Convention Center, Seoul, Korea  

    Drivers obtain information on surrounding environment using their eyesights. Experienced eye-gaze behavior is needed when driving at places where multiple risks exist to prepare for and avoid them. In this work, we analyze the change in eye-gaze behavior in such situations while a driver gains experience on the operation of a robotic wheelchair. Accurate distance information in the traffic environment is important to analyze the eye-gaze behavior. However, almost all previous works analyze eye-gaze behavior in a 2D environment, so they could not obtain accurate distance information. For this reason, we analyze eye-gaze behavior in 3D space. Concretely, we developed a novel eye-gaze behavior analysis platform based on a robotic wheelchair and estimated the driver's attention in 3D space. We try to analyze the eye-gaze behavior considering a useful field-of-view in 3D space based on the distance information instead of only the fixation point to investigate the objects that a driver implicitly pays attention to and from where s/he focuses on them. Results show that novice drivers pay attention to a single risk at a time. In contrast, they pay more attention to multiple risks simultaneously as they gain experience. Additionally, we discuss what features are effective to model the eye-gaze behavior based on the results.

    DOI: 10.1109/ICCVW.2019.00545

  97. Exemplar-based Pseudo-Viewpoint Rotation for White-Cane User Recognition from a 2D Human Pose Sequence 国際会議

    Naoki Nishida, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Jun Piao

    The 16-th IEEE International Conference on Advanced Video and Signal-based Surveillance (AVSS)  2019年9月20日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:University of Taipei  

  98. Similar Seasonal-Geo-Region Mining based on Visual Concepts in Social Media Photos 国際会議

    Yasutomo Kawanishi, Ichiro Ide, Chen Lu, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    5th IEEE Conference on Multimedia BigData  2019年9月11日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Kent Ridge Guild House, National University of Singapore  

  99. 歩行者の姿勢ヒートマップを用いた監視カメラ映像からの異常行動検出に関する初期検討

    Onur Temuroglu, 川西 康友, 出口 大輔, 平山 高嗣, 井手 一郎, 村瀬 洋, 岩崎 麻友, 塚田 篤

    電気・電子・情報関係学会東海支部連合大会  2019年9月10日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:大同大学  

  100. 任意視点からの白杖利用者認識のための人物骨格に対する視点変換の検討

    西田 尚樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 朴 君

    電気・電子・情報関係学会東海支部連合大会  2019年9月10日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大同大学  

  101. 見守りシステムに向けた超低解像度FIR画像からの人物骨格推定の検討

    岩田 紗希, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎

    電気・電子・情報関係学会東海支部連合大会  2019年9月10日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大同大学  

  102. An Analysis of Simultaneous Image Matching on Various Datasets for Person Re-identification

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Tokai-Section Joint Conference on Electrical, Electronics, Information, and Related Engineering  2019年9月10日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:大同大学  

    Person re-identification is becoming a focus topic in many discussions recently. It becomes a vital role in public surveillance for identifying people across the street, inside supermarkets, and airports. Person re-identification aims to match person images captured at several non-overlapping camera views. For this reason, many advanced types of research had been competing to cope with the best solution for identifying multiple persons. Due to the redundant and mismatching which occurred in the traditional individual image matching scheme, the simultaneous image matching [1, 2] provides a solution which could avoid this downside. In this study, we analyze the performance of the simultaneous image matching on various datasets. We also evaluate a new image mask for feature extraction of SDALF.

  103. 視対象との3次元位置関係に着目した電動車いす運転者の視行動分析

    前川 大和, 赤井 直紀, 平山 高嗣, モラレス ルイス 洋一, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2019年9月10日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大同大学  

  104. CityWalks: An Extended Dataset for Attribute-aware Semantic Segmentation

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Takatsugu Hirayama, Hiroshi Murase

    Tokai-Section Joint Conference on Electrical, Electronics, Information, and Related Engineering  2019年9月9日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:大同大学  

  105. 見えに基づく同一料理カテゴリの料理に関する典型度分析

    中村 真務, 川西 康友, 道満 恵介, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2019年8月29日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学 ベンチャー・ビジネス・ラボラトリー  

  106. 3つの学習特徴に基づく料理レシピの地域属性推定

    伊藤 耀一朗, 道満 恵介, 川西 康友, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    電子情報通信学会魅力工学研究会シンポジウム2019  2019年8月28日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:名古屋大東山校舎  

  107. 見えに基づく同一料理カテゴリの料理に関する典型度分析

    中村 真務, 川西 康友, 道満 恵介, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    電子情報通信学会魅力工学研究会シンポジウム2019  2019年8月28日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:名古屋大東山校舎  

  108. 欠損復元AutoEncoderによる遮蔽に頑健な物体姿勢推定の検討

    立道 大樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 安間 絢子

    画像の認識・理解シンポジウム(MIRU)  2019年8月1日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:グランキューブ大阪(大阪府立国際会議場)  

    近年,日常生活の支援のために家庭環境にロボットが導入されつつある.ロボットが物体を持ち運ぶためには,物体の姿勢を推定する必要があるが,物体が密集して存在する場合,他の物体に遮蔽されることで観測値に欠損が生じ,姿勢推定が困難である.欠損を復元するようにAutoEncoderを学習し,Encoder部分から得られる特徴ベクトルを姿勢推定に用いる手法があるが,この手法は欠損による物体中心の位置ずれを考慮していないため,欠損が大きいほど精度が低い.本発表では,欠損を復元できるように学習したAutoEncoderを,位置ずれの補正をしながら2回適用することで,観測値の欠損と位置ずれに対処した姿勢推定手法を提案する.また,パラメトリック固有空間法を拡張し,複数物体の姿勢変化からなる多様体上で姿勢補間することにより,同一クラスに属する未知形状の物体の未知姿勢であっても姿勢推定ができる手法を提案する.

  109. 走行履歴情報からの状況適応型走路の自動獲得

    右島 琢也, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2019年8月1日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:グランキューブ大阪(大阪府立国際会議場)  

    近年,自動運転技術が注目を集めており,その実現に向けた研究開発が盛んである.自動運転の実現のため,安全に走行可能な道路領域を推定する走路推定技術が求められている.走路の推定には周囲環境認識技術が不可欠であり,セマンティックセグメンテーションがその中で重要な役割を担うと期待されている.これまでに,セマンティックセグメンテーションを走路推定に用いる試みは行われているが,道路上に存在する他の車両や歩行者との接触は考慮されていない.我々は接触を回避した走路を得るために,車速の変化に着目して自車両の減速行動を学習し,複数フレームを用いて他物体の動きを学習することにした.本発表では,自車速を用いて車両の走行履歴情報を画像上に投影することで,多数のラベル画像を自動的に獲得し,他物体との接触がない走路(状況適応型走路)を推定する手法を提案する.名古屋駅周辺の走行履歴情報を用いて提案手法の評価を行なった結果,自動獲得した画像から走路推定器を構築できることを確認した.

  110. A preliminary study on estimating word imageability labels using Web image data mining

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    2019年3月14日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  111. On Visualizing Psycholinguistic Groundings for Sentiment Image Datasets

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    Meeting on Image Recognition & Understanding  2019年8月1日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語  

    開催地:グランキューブ大阪(大阪府立国際会議場)  

    Recent multimedia applications commonly use text and imagery from Social Media for tasks related to sentiment research. As such, there are various image datasets for sentiment research for popular classification tasks. However, there has been little research regarding the relationship between the sentiment of images and its annotations from a multi-modal standpoint. In this research, we built a tool to visualize psycholinguistic groundings for a sentiment dataset. For each image, individual psycholinguistic ratings are computed from the image's metadata. A sentiment-psycholinguistic spatial embedding is computed to show a clustering of images across different classes close to human perception. Our interactive browsing tool can visualize the data in various ways, highlighting different psycholinguistic groundings with heatmaps.

  112. Viewpoint Recommendation for Object Pose Estimation via Pose Ambiguity Minimization

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    The 22nd Meeting on Image Recognition and Understanding (MIRU)  2019年8月1日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Osaka International Convention Center  

    Recently, helper robots become popular in our social life, especially for helping the elderly and the disabled people to perform their daily tasks at home. To handling objects, object pose estimation from a depth image is an essential task of the helper robots. However, an object’s pose is often ambiguous from an observation from only a single viewpoint. If we can observe the object from additional viewpoints, the pose estimation result will be better. Thus, we propose a next viewpoint recommendation method based on pose ambiguity minimization. We confirmed and showed the proposed method outperformed other comparative methods on synthetic object images.

  113. 実世界活動センシングを通したグループワークの可視化

    出口 大輔

    学術情報メディアセンターセミナー  2019年6月26日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

    開催地:京都大学  

    共通の課題に対して複数人で取り組むグループワークは、考え方や能力の異なる他者と協力して問題に取り組む力を育むことから、多くの教育機関で導入・実践が進められている。グループワークにおいては、成果物やテストを通した総括的評価に加え、学習の経過を対象とした形成的評価が重要となる。本発表では、実世界をフィールドとする実世界グループ学習を対象とし、映像・加速度センサ等の複数のデバイスを用いて参加者のグループワーク活動を計測し、それらの可視化を通してグループ学習を分析する取り組みについて紹介する。

  114. Hand Orientation Estimation in Probability Density Form 国際会議

    Kazuaki Kondo, Daisuke Deguchi, Atsushi Shimada

    The Fourth International Workshop on Egocentric Perception, Interaction and Computing  2019年6月17日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Long Beach Convention Center, Long Beach, CA USA  

  115. 超低解像度遠赤外線画像からの人物骨格推定の検討

    岩田 紗希, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎

    画像センシングシンポジウム(SSII)  2019年6月13日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:パシフィコ横浜アネックスホール  

    近年,高齢化社会の進展が問題となっており、高齢者の健康の暮らしのためには身体機能の維持が必須である.そのためには日常的に,身体の動きを把握する必要があるが,センサ装着が必要な方法や可視光カメラを用いる方法ではセンサの装着忘れやプライバシの問題がある.
    そこで,超低解像度遠赤外線画像を用いた骨格推定法を提案する.現在,高解像度な可視光画像からの骨格推定は可能であるため,本手法では可視光カメラと赤外線カメラで同時に撮影をするシステムを構築し,学習データを収集する.それを用いて,ニューラルネットワークを学習し,超低解像度遠赤外線画像から直接骨格を推定する.

  116. 車両周辺環境に応じたカメラとLiDARによる歩行者検出の統合に関する初期検討

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2019年5月30日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:国立オリンピック記念青少年総合センター  

    車載センサを用いた歩行者検出結果は,実環境において,依然として検出精度に改善の余地がある.
    そこで我々は,未検出や誤検出が存在する可能性を,検出器から見たその環境に対する「信頼度」として推定するシステムを提案してきた.
    この信頼度を用いることで,各センサの得手・不得手を補った統合検出結果を得ることができると考えられる.
    本稿では,各センサにおける入力データから環境を表現する特徴を抽出し,各センサの検出しきい値を出力する複数センサ情報統合器の構築手法について初期検討した結果について報告する.

  117. A Study on Human Pose Estimation from an Extremely Low-Resolutiohn FIR image Sequence

    Saki Iwata, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa

    Japan-Taiwan Joint Workshop on Multimedia and HCI  2019年4月14日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:國立成功大學(臺灣,臺南)  

  118. A Study on Occlusion-Robust Object Pose Estimation with a De-occluding AutoEncoder

    Hiroki Tatemichi, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Ayako Amma

    Japan-Taiwan Joint Workshop on Multimedia and HCI  2019年4月14日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:國立成功大學(臺灣,臺南)  

  119. Estimating the Imageability of a sentence for image caption evaluation 国際会議

    Kazuki Umemura, Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    Japan-Taiwan Joint Workshop on Multimedia and HCI  2019年4月13日 

     詳細を見る

    開催年月日: 2019年

    記述言語:英語   会議種別:ポスター発表  

    開催地:國立成功大學(臺灣,臺南)  

  120. 'KamiRepo' System with Automatic Student Identification to Handle Handwritten Assignments on LMS

    Daisuke Deguchi

    2019年3月25日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:法政大学 市ケ谷キャンパス  

  121. 時系列平滑化を用いた列車前方映像に対するセマンティックセグメンテーション手法の検討

    振津 勇紀, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋, 向嶋 宏記, 長峯 望

    電子情報通信学会総合大会  2019年3月20日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:早稲田大学 西早稲田キャンパス  

  122. 畳み込みの多段階分解によるSemantic Segmentationの高速化

    野田 紘司, 久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2019年3月20日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:早稲田大学 西早稲田キャンパス  

    近年,Semantic Segmentationは自動運転や高度運転支援の要素技術として注目を集めている.しかし,高精度なSemantic Segmentation手法の計算コストは高く,実時間処理は困難である.従って,精度を維持したまま,より高速に計算する手法が求められている.Semantic Segmentationの処理は,畳み込み演算の計算時間が大部分を占める.提案手法では,XceptionモジュールのDepthwise convolutionを垂直・水平方向に分解することで畳み込み演算のさらなる高速化を試みる.実験により,mIoUの低下を抑えつつ,パラメータ数と実行時間を削減可能なことを確認した.

  123. 欠損復元AutoEncoderによる欠損を含む物体の姿勢推定の検討

    立道 大樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 安間 絢子

    電子情報通信学会総合大会  2019年3月20日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:早稲田大学 西早稲田キャンパス  

    近年,日常生活の支援のために家庭環境にロボットが導入されつつある.ロボットが物体を持ち運ぶためには,物体の姿勢を推定する必要があるが,物体が密集して存在する場合,他の物体に遮蔽されることで物体画像に欠損が生じ,姿勢推定が困難である.欠損物体を対象とした手法として,欠損を復元するAutoEncoderを学習し,Encoder部分から得られる特徴ベクトルを姿勢推定に用いる手法があるが,この手法は欠損による物体中心の位置ずれを考慮していないため,欠損が大きいほど精度が低い.そこで本発表では,欠損を復元できるように学習したAutoEncoderを用い,欠損復元と位置ずれの修正をしつつ姿勢推定をする手法を提案する.

  124. 電動車いす運転の習熟に伴う視行動変化の分析

    前川 大和, 赤井 直紀, モラレス ルイス 洋一, 平山 高嗣, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2019年3月20日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:早稲田大学 西早稲田キャンパス  

    熟練・非熟練ドライバの視行動を比較すると,両者に違いが存在することが知られており,適切な視行動と安全運転には強い相関があると考えられている.これまでに視行動をモデル化する試みは多く行われているが,周囲の幾何的な情報を明示的に考慮した視行動の解析とはなっていない.また,熟練度や経験,また環境変化などに応じて視行動がどのようにモデル化されるかについては,いまだに明らかでない部分が多い.本発表では,潜在的な危険が存在する地点での視行動の形式化の初期検討として,自動車運転のモデル化に向けて,電動車いすを死角あり狭路で操作した場合の視行動を分析した.その結果,習熟するにつれて視線が上昇することを確認した.

  125. 超低解像度遠赤外線画像からの人物姿勢推定の初期検討

    岩田 紗希, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎

    情報処理学会全国大会  2019年3月15日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:福岡大学七隈キャンパス  

    近年,高齢化社会の進展が問題となっており、高齢者の健康の暮らしのためには身体機能の維持が必須である.そのためには日常的に,身体の動きを把握する必要があるが,センサ装着が必要な方法や可視光カメラを用いる方法ではセンサの装着忘れやプライバシの問題がある.
    そこで,超低解像度遠赤外線画像を用いた姿勢推定法を提案する.現在,高解像度な可視光画像からの骨格推定は可能であるため,本手法では可視光カメラと赤外線カメラで同時に撮影をするシステムを構築し,学習データを収集する.それを用いて,ニューラルネットワークを学習し,超低解像度遠赤外線画像から直接姿勢を推定する.

  126. 画像キャプションの質的評価に向けた文の心像性推定手法の検討

    梅村 和紀, カストナー マークアウレル, 井手 一郎, 川西 康友, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    言語処理学会年次大会  2019年3月14日 

     詳細を見る

    開催年月日: 2019年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  127. 個人視点映像内の手領域出現に基づくグループ協同作業特徴量の提案

    近藤 一晃, 島田 敬士, 出口 大輔

    HCGシンポジウム  2018年12月13日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:シンフォニアテクノロジー響ホール伊勢  

    グループワークでは主体性や協同といったタスクに対する姿勢・グループ内における参加者の関わり方が重要であり,それらを客観的・定量的に分析することができれば様々な用途に用いることができる.本研究では参加者視点の映像に出現する手の量に基づいたグループワーク特徴量およびその自動抽出手法を提案する.手の検出には深層学習ベースの識別器を用い,手の出現位置・大きさに加えて腕の伸びる方向を併用しすることで自己手他者手の識別を行う.推定結果から手の出現面積に基づいた特徴量を導出したところ,グループワークにおける作業の進め方・協同スタイル・役割分担・グループに対する貢献などとうまく対応付けられることが確認された.

  128. 白杖固有の形状と存在範囲に着目した白杖利用者検出

    西田 尚樹, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2018年3月2日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋工業大学  

    駅などの危険な事故が起こりうる環境で白杖利用者を発見することは, 視覚障害者に対して人手の支援をするために重要である.
    しかし, 入力画像全体を探索して検出を行なうと, 背景から白杖以外を誤検出する可能性があり, 精度の高い白杖検出は困難となる.
    そこで我々は, 形状特徴を用いて白杖候補を検出した後,白杖が存在し得る範囲から白杖候補を絞り込むことで, 白杖を高精度に検出する手法を提案する.

  129. 運転者の運転行動情報を利用した信号機検出用学習データの収集

    右島 琢也, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2018年3月2日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋工業大学  

    交通死亡事故は交差点内で最も多く発生しており,交差点内の交通事故を防止するための有効な対策手段が求められている.
    交差点での事故を防止するため,信号機中で点灯している信号灯の色(以下現示色と呼ぶ)に応じ,運転者に詳細な指示を与える運転補助技術が開発されている.
    現示色までを含めて検出・認識する信号機検出器を構築する場合,色カテゴリ毎に位置ラベルを付与した多数の学習データを用意する必要がある.
    しかし,学習データの獲得を人手で行なう場合,大きな労力が必要となる.
    本研究では,信号機がある交差点を通過する際に,信号機の現示色によって運転挙動が異なることに着目することで,現示色を自動的に推定する手法を提案する.
    具体的には,物体検出・追跡の技術を利用して位置ラベルを付与するとともに,運転行動情報を利用して色カテゴリを付与することで,自動的にアノテーションする手法を提案する.

  130. Web画像の分布に基づく単語概念の視覚的な多様性の推定

    カストナー マークアウレル, 井手 一郎, 川西 康友, 平山 高嗣, 出口 大輔, 村瀬 洋

    コンピュータビジョンとイメージメディア研究会(CVIM)  2018年3月1日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:立命館大学  

    近年,画像処理の発展に伴い,自然言語と画像をつなぐ知識が必要になりつつある.概念辞書のようなデータベースは視覚性や画像特徴を考慮していないため,画像から自然な説明文を自動生成する際に障害になっている.そこで本発表では,単語概念の視覚的な多様性を推定する手法を提案する.提案手法では,まず,従来のデータセットに,Web画像の分布で測定した重みを使い,理想に近づくようにデータセットを再構成する.そしてMean-Shift法によって画像特徴のクラスタ数から視覚的な多様性を推定する.クラウドソーシングによる被験者実験を行い,決定した真値を用いた評価では,18語の名詞について従来のデータセットを用いた場合よりも正確に視覚性な多様性を推定できた.

  131. サーバ型紙レポート・LMS連携システム「かみレポ」の開発

    出口 大輔

    JaSakai/AXIES/IMS合同カンファレンス2018  2018年2月28日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  132. A Preliminary Study on Optimizing Person Re-identification using Stable Marriage Algorithm 国際会議

    Nik Mohd Zarifie Hashim, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    The International Workshop on Frontiers of Computer Vision (IW-FCV) 2018  2018年2月22日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Future University Hakodate  

    Person re-identification gains an increasing interest
    in the surveillance image processing field due to its’ importance
    for security. Most approaches to solve the person re-identification
    problem match persons one-by-one. However, redundant match-
    ing where one of the person is selected for the matching pair
    several times often occurs. It also degrades the overall image
    matching performance. To overcome the issue, in this paper,
    we propose a method which solves the person re-identification
    problem for multiple persons simultaneously. Instead of one-
    by-one matching, we consider person re-identification as an
    instance of the Stable Marriage Problem (SMP). The result of an
    experiment showed that the proposed method outperforms some
    of the existing state-of-the-art methods applied to the VIPeR
    dataset.

  133. 複数フレームの統合による混雑環境での車椅子利用者検出に関する検討

    谷川 右京, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 秋山 達勇

    パターン認識・メディア理解研究会(PRMU)  2018年1月18日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大阪府立大学  

    近年,車椅子利用者を支援するため,監視カメラ映像から車椅子利用者を検出するシステムが求められている.
    しかし,車椅子利用者の周囲に多数の歩行者が存在する可能性が高く,歩行者に遮蔽された車椅子利用者を,各フレームから独立に検出することは困難であり,未検出が生じやすい.
    また,車椅子利用者の見えは歩行者と類似しているため誤検出も生じやすい.
    本報告では,混雑環境において映像中から高精度に車椅子利用者を検出する手法について検討した結果を報告する.
    提案手法では,複数フレームにおける車椅子利用者候補の特徴を統合することで,単一フレームのみから車椅子利用者のみを検出することが困難な場合でも正確な検出を目指す.
    評価実験を行った結果,提案手法は混雑環境において比較手法より高精度に車椅子利用者を検出できることを確認した.

  134. Efficient Pedestrian Scanning by Active Scan LIDAR 国際会議

    Taiki Yamamoto, Fumito Shinmura, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase

    International Workshop on Advanced Image Technology (IWAIT) 2018  2018年1月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Chiang Mai  

  135. Pedestrian Detection from Sparse Point-Cloud using 3DCNN 国際会議

    Yoshiki Tatebe, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Utsushi Sakai

    International Workshop on Advanced Image Technology (IWAIT) 2018  2018年1月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Chiang Mai  

  136. 地域・時期ごとのSNS投稿写真に基づく類似地域マイニング

    陳 璐, 川西 康友, 井手 一郎, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2018年8月7日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

    知らない土地に旅行する際,その土地での旅行計画を円滑に進めるためには,行き先の地域別の雰囲気を理解することが重要である.ある地域が,既に知っている地域の雰囲気と似ていることが分かれば,その地域の雰囲気を直感的に把握できる.従来研究は,地域ごとのSNS 投稿写真を用いて地域間の類似性を計算することにより,雰囲気が似ている場所をマイニングしている.我々はこの研究を発展させ,各写真の撮影時期を考慮し,時期毎の類似地域をマイニングする手法を提案する.

  137. Voting-based Hand-Waving Gesture Spotting from a Low-Resolution Far-Infrared Image Sequence 国際会議

    Yasutomo Kawanishi, Chisato Toriyama, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa, Masato Kawade

    2018 IEEE International Conference on Visual Communications and Image Processing (VCIP2018)  2018年12月11日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:永豐棧酒店臺中(臺中,臺灣)  

    We propose a temporal spotting method of a hand gesture from a low-resolution far-infrared image sequence captured by a far-infrared sensor array. The sensor array captures the spatial distribution of far-infrared intensity as a thermal image by detecting far-infrared waves emitted from heat sources. It is difficult to spot a hand gesture from a sequence of thermal images captured by the sensor due to its low-resolution, heavy noise, and varying duration of the gesture. Therefore, we introduce a voting-based approach to spot the gesture with template matching-based gesture recognition. We confirm the effectiveness of the proposed temporal spotting method in several settings.

    DOI: 10.1109/VCIP.2018.8698650

  138. Gaze-inspired Learning for Estimating the Attractiveness of a Food Photo 国際会議

    Akinori Sato, Takatsugu Hirayama, Keisuke Doman, Yasutomo Kawanishi, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    20th IEEE Int. Symposium on Multimedia (ISM2018)  2018年12月10日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:臺中金典酒店(臺中,臺灣)  

    The number of food photos posted to the Web has been increasing. Most of the users prefer to post delicious-looking food photos. They, however, do not always look delicious. A previous work proposed a method for estimating the attractiveness of food photos, that is, the degree of how much a food photo looks delicious, as an assistive technology for taking a delicious-looking food photo. This method extracted image features from the entire food photo to evaluate the impression. In our work, we conduct a preference experiment where subjects are asked to compare a pair of food photos and measure their gaze. The proposed method extracts image features from local regions selected based on the gaze information and estimates the attractiveness of a food photo by learning regression parameters. Experimental results showed the effectiveness of extracting image features from outside the gaze regions rather than inside them.

    DOI: 10.1109/ISM.2018.00015

  139. Localizing the Gaze Target of a Crowd of People 国際会議

    Yuki Kodama, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hidehisa Nagano, Kunio Kashino

    International Workshop on Attention/Intention Understanding  2018年12月3日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Perth Convention and Exhibition Centre 21 Mounts Bay Rd Perth WA 6000 Australia  

    What target is focused on by many people?
    Analysis of the target is a crucial task, especially in a cinema, a stadium, and so on.
    However, it is very difficult to estimate the gaze of each person in a crowd accurately and simultaneously with existing image-based eye tracking methods, since the image resolution of each person becomes low when we capture the whole crowd with a distant camera.
    Therefore, we introduce a new approach for localizing the gaze target focused on by a crowd of people.
    The proposed framework aggregates the individually estimated results of each person's gaze.
    It enables us to localize the target being focused on by them even though each person's gaze localization from a low-resolution image is inaccurate.
    We analyze the effects of an aggregation method on the localization accuracy using images capturing a crowd of people in a tennis stadium under the assumption that all of the people are focusing on the same target, and also investigate the effect of the number of people involved in the aggregation on the localization accuracy.
    As a result, the proposed method showed the ability to improve the localization accuracy as it is applied to a larger crowd of people.

  140. 手書きレポートとLMSの連携を実現する名大版紙レポシステムの全学運用

    出口 大輔, 清谷 竣也, 大平 茂輝, 戸田 智基

    大学ICT推進協議会(AXIES)  2018年11月19日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    高等教育における学習支援システム(LMS: Learning Management System)の重要性は年々高まってきており,授業での効果的な利用方法等さまざまな取り組みがなされてきている.しかしながら,数学や製図といった紙媒体を主体とした演習や試験も依然として広く実施されており,これらとLMSとの連携が強く求められている.このような背景から,名古屋大学では2016年度よりサーバー型紙レポート連携システム「名大版かみレポ」の開発と評価を開始し,2017年度後期より全学展開に移行した.本発表では,全学展開を通して得られた「名大版かみレポ」の課題と今後の展望についてまとめる.

  141. Analyzing Headlight Flicker Patterns for Improving the Pedestrian Detectability from a Driver 国際会議

    Takashi Maeda, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    2018 IEEE 21st International Conference on Intelligent Transportation Systems (ITSC2018)  2018年11月7日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Maui, Hawaii, USA  

    In this paper, we analyze headlight flicker patterns which improve the pedestrian detectability from a driver. Recently, headlights are becoming capable of selectively projecting light on a pedestrian in addition to the normal forward projection. However, it is still not clear how the light should be
    projected to effectively improve the visibility of the pedestrian. We actually analyze nine flicker patterns by controlling duty ratios and durations of lighting time, and conduct experiments in field and laboratory settings. As a result, we reveal that a specific fundamental frequency is effective for improving the pedestrian detectability from a driver. We also conclude that the difference between the two settings are not significant.

  142. Attribute-aware Semantic Segmentation of Road Scenes for Understanding Pedestrian Orientations 国際会議

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Takatsugu Hirayama, Ichiro Ide, Jiang-Yu Zheng, Hiroshi Murase

    2018 IEEE 21th International Conference on Intelligent Transportation Systems (ITSC2018)  2018年11月7日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Maui, Hawaii, USA  

    Semantic segmentation is an interesting task for many deep learning researchers for scene understanding. However, recognizing details about objects’ attributes can be more informative and also helpful for a better scene understanding in intelligent vehicle use cases. This paper introduces a method for simultaneous semantic segmentation and pedestrian attributes recognition. A modified dataset built on top of the Cityscapes dataset is created by adding attribute classes corresponding to pedestrian orientation attributes. The proposed method extends the SegNet model and is trained by using both the original and the attribute-enriched datasets. Based on an experiment, the proposed attribute-aware semantic segmentation approach shows the ability to slightly improve the performance on the Cityscapes dataset, which is capable of expanding its classes in this case through additional data training.

  143. Estimating the Scene-wise Reliability of LiDAR Pedestrian Detectors 国際会議

    Haruya Kyutoku, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Kazuki Kato, Hiroshi Murase

    2018 IEEE 21th International Conference on Intelligent Transportation Systems (ITSC2018)  2018年11月7日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Maui, Hawaii, USA  

    Nowadays, development of driving support systems and autonomous driving systems have become active.
    Pedestrian detection from in-vehicle sensors is one of the most important technologies for these systems.
    However, outputs of pedestrian detectors can not be fully trusted in real environments.
    Therefore, we propose an estimation system of pedestrian detector's reliabilities for a given scene.
    This paper proposes a scene-wise reliability calculation method for LiDAR-based detectors, and a construction method for their estimators.
    Here, the problem is how we can define the reliability.
    The proposed method defines the reliability considering oversights as the strictest threshold without oversights.
    Meanwhile, it defines the reliability considering false detections as the loosest threshold without false detections.
    Experimental results showed that the proposed method could properly represent the reliability of a given scene, and estimate their reliability.

  144. Estimation of Driver's Insight for Safe Passing based on Pedestrian Attributes 国際会議

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Takatsugu Hirayama, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    2018 IEEE 21th International Conference on Intelligent Transportation Systems (ITSC2018)  2018年11月6日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Maui, Hawaii, USA  

    In order to reduce traffic accidents between a vehicle and a pedestrian, recognition of a pedestrian who has a possibility of collision with a vehicle should be helpful. However, since a pedestrian may suddenly change his/her direction and cross the road, it is difficult to predict his/her behavior directly. Here, we focus on the fact that experienced drivers usually pass by a pedestrian while preparing to step on the brake at any moment when they feel danger. If driver assistant systems can estimate such experienced driver’s decisions, they could early detect the pedestrian in danger of collision. Therefore, we classify the driver’s decisions into three types by referring to the accelerator operation of drivers, and propose a method to estimate the type of the driver’s decision. The drivers are considered to decide their actions focusing on various behaviors and states of a pedestrian, namely pedestrian’s attributes. Since the driver’s decisions change along the timeline, the use of a temporal context is considered to be effective. Thus, in this paper, we propose an estimation method using a recurrent neural network architecture with the pedestrian’s attributes as input. We constructed a dataset collected by experienced drivers in control of the vehicle and evaluated the performance, and then confirmed the effectiveness of the use of pedestrian’s attributes.

  145. 自動運転車両の実現に向けた車載カメラに よる環境理解

    出口 大輔

    日本光学会年次学術講演会  2018年11月2日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(招待・特別)  

    開催地:筑波大学東京キャンパス文京校舎  

  146. SNS投稿写真の時空間クラスタリングに基づく類似地域マイニングの検討

    陳 璐, 川西 康友, 井手 一郎, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2018年10月26日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:北海道大学(札幌)  

  147. 歩行者脇通過時における歩行者属性に基づく運転行動の推定

    新村 文郷, 川西 康友, 出口 大輔, 平山 高嗣, 井手 一郎, 村瀬 洋, 藤吉 弘亘

    自動車技術会秋季大会  2018年10月17日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋国際会議場  

    When passing by a pedestrian, a driver predicts the pedestrian’s intention by observing his/her behavior and decides whether the vehicle can safely pass by or not. Estimation of the driver’s decisions and behaviors would be helpful to assist safe driving. In this presentation, we propose a method to estimate driver’s behavior when passing by a pedestrian based on his/her attributes. We consider that the process of a driver deciding his/her behaviors according to the pedestrian's state and behavior is similar to a conversation. Therefore, the proposed method makes use of the sequence to sequence model which is based on the recurrent neural networks and is usually used for a conversational model. We evaluate the performance of the proposed method using actual driving data collected by experienced drivers in control of the vehicle.

  148. LiDARを用いた歩行者検出器の車両周辺環境に応じた信頼度推定

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    自動車技術会秋季大会  2018年10月17日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋国際会議場  

    Pedestrian detection results from a LiDAR data cannot be fully trusted in real environments.
    Therefore, it is necessary to consider whether the detector can be trusted in the environment of the input data.
    So we have been proposing an estimation system of pedestrian detectors' reliability adaptive to vehicle surrounding environments.
    This paper presents the construction method of reliability estimators.
    The proposed method defines and uses two types of reliability for oversights and false detections.
    Moreover, the proposed method constructs estimators for each reliability with global features and pedestrian-like, artifacts-like features.
    The experimental results showed that the proposed method could estimate the reliabilities.

  149. Epipolar geometry-based ego-localization using an in-vehicle monocular camera 国際会議

    Haruya Kyutoku, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Workshop on Digital Signal Processing for In-Vehicle Systems  2018年10月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Nagoya University, Japan  

    Nowadays, development of driving support systems and autonomous driving systems have become active.
    Vehicle ego-localization using in-vehicle sensors is one of the most important technologies for these systems.
    Accordingly, various attempts to localize own vehicle from in-vehicle sensors have been made.
    In general, the estimation accuracy of the traveling direction is lower than in the lateral direction.
    Therefore, we propose a highly accurate method for ego-localization of the traveling direction based on epipolar geometry using an in-vehicle monocular camera.
    The proposed method makes correspondences between in-vehicle camera images and database images with location information, and calculates the location using locations annotated to the corresponding database images.
    However, there are many gaps due to the difference of speed and trajectory of vehicles even if the images are obtained along the same road.
    To overcome this problem, the distance between the input image and the database image is calculated by the distance metric based on the epipolar geometry and the local feature method.
    An experiment was conducted using actual images with correct locations, and we confirmed the effectiveness of the proposed method from its results.

  150. Vehicle counting via car parts detection from an in-vehicle camera image 国際会議

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Workshop on Digital Signal Processing for In-Vehicle Systems  2018年10月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Nagoya University, Japan  

    This paper proposes a method to count vehicles from an in-vehicle camera image by regression based on car parts detection. In the case of an in-vehicle camera image, since vehicles are frequently occluded by other vehicles in traffic congestion, it is difficult to accurately count vehicles. Therefore, we propose a method to count vehicles by regression based on the number of visible car parts. For this, we make an estimator by learning the relation between the number of visible car parts and that of vehicles by Support Vector Regression. We evaluated our method using in-vehicle camera images recorded in an actual environment, where the proposed method performed better than counting detected vehicles.

  151. HOYO:オノマトペを付与した歩容データセット

    加藤 大貴, 平山 高嗣, 道満 恵介, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2018年9月7日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大阪工業大学  

  152. 地域・時期ごとのSNS投稿写真に基づく類似地域マイニング

    陳 璐, 川西 康友, 井手 一郎, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    電子情報通信学会 魅力工学研究会シンポジウム 2018  2018年9月5日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:大阪工業大学 梅田キャンパス  

  153. 視線情報を利用した料理写真の魅力度推定手法

    佐藤 陽昇, 平山 高嗣, 道満 恵介, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    電子情報通信学会 魅力工学研究会シンポジウム 2018  2018年9月5日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:大阪工業大学 梅田キャンパス  

  154. 人物の姿勢に着目した白杖利用者検出に向けた検討

    西田 尚樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 朴 君

    電気・電子・情報関係学会東海支部連合大会  2018年9月4日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学  

  155. 運転行動に基づく学習データ収集による信号機検出器の構築に関する検討

    右島 琢也, 久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2018年9月3日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学  

  156. オノマトペによる歩容の記述の高精度化に向けた データセットの構築

    加藤 大貴, 平山 高嗣, 道満 恵介, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2018年8月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

  157. 同一経路走行映像群からのネガティブサンプル自動抽出による人物検出器の高精度化

    本谷 真志, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2018年8月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

  158. On Understanding Visual Relationships of Concepts by Visualizing Bag-of-Visual-Words Models

    Marc Aurel Kastner, Ichiro Ide, Yasutomo Kawanishi, Takatsugu Hirayama, Daisuke Deguchi, Hiroshi Murase

    Meeting on Image Recognition & Understanding  2018年8月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

    Recent applications in image processing often use a multimodal approach using both text and imagery. This is prone to semantic gap issues when converting between image and language. There has been few research quantifiying visual differences when assessing semantic relationships. In this research, we analyze datasets composed of logically related concepts. By visualizing a Bag-of-Visual-Words (BoVW) model spatially, visual semantics of logically related sub-concepts are shown. To find hidden semantics of related concepts, the most common visual words of an image in relation to its neighbors are highlighted. This provides additional semantic knowledge on how sub-ordinate concepts visually relate to another. It is thought to give an insight on the human perception of these concepts, and can be used in future research to estimate psycholinguistic ratings.

  159. Active Scan LIDARによる歩行者の向きを考慮した効率的な歩行者スキャン手法

    山本 大貴, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2018年8月7日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

    近年,LASER 光の照射方向を瞬時かつ任意方向に制御可能な Active Scan LIDAR が開発中であり,局所的にスキャン密度を高めることにより遠距離の歩行者を検出可能になると期待されている.しかし,歩行者を効率的にスキャンする方法は実現されていない.そこで本発表では,歩行者の向き毎に構築した歩行者形状モデルと存在確率に基づいた歩行者尤度推定によるActive Scan LIDAR のための効率的な歩行者スキャン手法を提案する.

  160. フロントガラスへの映り込みを考慮した歩行者視認性推定

    森 優介, 出口 大輔, 川西 康友, 平山 高嗣, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2018年3月2日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋工業大学  

    車載カメラなどを用いた歩行者検出によって歩行者の存在を運転者に警告することで,認知誤りによる事故を減らすことができると期待される.しかし,検出した歩行者全てを運転者に警告することは,運転者の集中力低下や苛立ちの原因になる.
    そのため,歩行者の視認性を推定し,視認が困難である歩行者のみを警告する方法が考えられる.
    歩行者の視認性を推定する研究の多くは,入力として鮮明な車載カメラ画像を前提としているが,例えばダッシュボード上の物体がフロントガラスに映り込むことにより視野が妨害されることがある.このような視野への妨害は歩行者の視認性に悪影響を与えると考えられる.
    そこで本研究では,フロントガラスへの映り込みを考慮した歩行者の視認性に着目し,その推定手法を提案する.

  161. 姿勢を表現する多様体に基づくGANsを用いた特定クラス物体姿勢推定の検討

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2018年8月6日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

    Generative Adversarial Nets(GANs)は,ある事前分布から画像などのデータを生成可能なネットワークであり,乱数から様々なデータを生成可能である.本研究では,物体の姿勢変化は潜在的には多様体で表現可能であることに着目し,多様体上に定義した確率分布から画像を生成するGANs の枠組みと,それを用いて学習画像を補間しつつ姿勢推定器を学習する手法を提案する.実験では,提案手法により,同一クラスに属する,学習データに含まれない物体の姿勢が補間できることを確認し,また,生成した画像を用いて姿勢推定器を学習することにより,高精度な姿勢推定ができることを示す.

  162. 車両周辺環境の違いに応じた歩行者検出信頼度の推定

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2018年8月6日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:札幌コンベンションセンター  

    車載カメラを用いた歩行者検出結果は,実環境下において依然として改善の余地がある.
    そこで我々はこれまでに,ある検出器の出力に未検出や誤検出が含まれない可能性を,検出器の出力とは独立に検出器の信頼度として出力するシステムを提案してきた.
    その中で,カメラから得た各画像の走行環境に応じた未検出と誤検出に関する信頼度について定義した.
    本稿では,これらを入力画像から直接推定する信頼度推定器を構築し,実走行データを用いて推定精度を評価した

  163. 車載カメラを用いた自己位置推定と地図構築

    出口 大輔

    第88回産研テクノサロン  2018年8月3日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大阪富国生命ビル  

    近年、自動運転車両や高度運転支援システムの研究開発が盛んであり、その中でも車載カメラを用いた周囲環境理解技術は大きな注目を集めている。自動運転等の応用を考えた場合、正確な自車位置の把握は欠くことのできない最も重要機能の一つである。本講演では、車載カメラを用いた自己位置推定に焦点を当て、車の特徴を活かした系列間照合によって位置推定を高精度に行う手法やそれらの地図構築への応用について紹介する。

  164. Visualization of Real World Activity on Group Work 国際会議

    Daisuke Deguchi, Kazuaki Kondo, Atsushi Shimada

    20th International Conference on HCI International 2018 (HCII2018)  2018年7月20日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Las Vegas, NV, USA  

    Group work is widely introduced and practiced as a method to achieve the learning goal efficiently by collaborating group members. However, since most types of group works are carried out in the real environment, it is very difficult to perform formative assessment and real time evaluation without students' feedbacks. Therefore, there is a strong demand to develop a method that supports evaluation of group work. To support evaluation of group work, this paper proposes a method to visualize the real world activity during group work by using first person view cameras and wearable sensors. Here, the proposed method visualizes three scores: (1) individual attention, (2) hand visibility, (3) individual activity. To evaluate the performance and analyze the relationships between scores, we conducted experiments of Marshmallow challenge" that is a collaborative work to construct a tower using marshmallow and spaghetti within a limit of time. Through the experiments, we confirmed that the proposed method has potential to become a evaluation tool for visualizing the activity of the group work."

    DOI: 10.1007/978-3-319-91131-1_2

  165. 惣菜属性に着目した弁当内配置の魅力度推定

    中村 真務, 道満 恵介, 川西 康友, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    第22回香り・味と生体情報研究会  2018年6月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:国民宿舎 ボルベリアダグリ  

  166. フロントガラスへの映り込みが発生した際の歩行者視認性推定

    森 優介, 平山 高嗣, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2018年5月18日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岐阜大学サテライトキャンパス  

  167. Development of 'KamiRepo' System with Automatic Student Identification to Handle Handwritten Assignments on LMS 国際会議

    Shunya Seiya, Ryuya Ito, Kosuke Okamoto, Ukyo Tanikawa, Shigeki Ohira, Daisuke Deguchi, Tomoki Toda

    2018 the IEEE Global Engineering Education Conference (EDUCON2018)  2018年4月20日 

     詳細を見る

    開催年月日: 2018年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Santa Cruz de Tenerife, Canary Islands, Spain  

    A Learning Management System (LMS) has become a fundamental tool for higher education, and a framework to leverage digital education data in the LMS has attracted attention. On the other hand, there is strong demand to deal with various education data provided not only from electronic media but also non-electronic media, such as a handwritten assignment. To solve this problem, this paper describes the development of 'KamiRepo' system to make it possible to automatically upload handwritten assignments to the LMS. In this system, optical character recognition (OCR) is performed to identify scanned handwritten assignments of individual students and read their scores. Then, their scanned files automatically separated from the entire file of the scanned handwritten assignments are returned to the individual students through LMS together with their corresponding scores. Compared with a conventional system using the dedicated multifunction printer, our developed system is capable of 1) using general-purpose scanners, 2) using a user interface on Web browser, and 3) achieving accurate student identification. We have launched this system in our university in April 2017 and have evaluated its effectiveness. The experimental results using real data collected for 6 months showed that our system achieved 99.7% of success rate in the automatic upload process.

  168. 白杖の性質に着目した白杖利用者検出に向けた検討

    西田 尚樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 谷内田 尚司

    電子情報通信学会総合大会  2018年3月22日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京電機大学 東京千住キャンパス  

    駅などの危険な事故が起こりうる環境で白杖利用者を発見することは, 視覚障害者に対して人手の支援をするために重要である.
    しかし, 入力画像全体を探索して検出を行なうと, 白杖以外を誤検出する可能性が高くなり, 精度の高い白杖検出は困難となる.
    そこで我々は, 人物の向きと白杖の形状, 白杖を振り得る範囲から白杖を探索する範囲を絞り込むことで, 白杖を効率的かつ高精度に検出する手法について検討した結果について報告する.

  169. 走行情報を活用したラベル付与による信号機検出用学習データの自動獲得に関する検討

    右島 琢也, 久徳 遙矢, 出口 大輔, 川西 康友, 平山 高嗣, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2018年3月22日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京電機大学 東京千住キャンパス  

    近年,自動運転や高度運転支援を目的とした車両の周囲環境認識技術の重要性が高まっている.赤信号時の停止支援などを考えると,信号機検出は必要不可欠な技術である.しかし,走行環境に存在する信号機の見えは多様であり,現示されている色の判別までを含めた検出器を構築するためには大量の学習データが必要である.
    そこで本発表では,運転中に得られる走行情報を活用することで,信号機に現示されている色情報までを含めた学習データを自動的に獲得する手法を提案する.

  170. LiDARで計測した車両周辺環境の違いに応じた歩行者検出難易度の推定に関する初期検討

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2018年3月18日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:青山学院大学 青山キャンパス  

    車載センサを用いた歩行者検出結果は,実環境において,依然として検出精度に改善の余地がある.
    そこで我々は,未検出や誤検出が存在する可能性を,検出器から見たその環境に対する「難易度」として推定するシステムを提案する.
    本稿ではその初期検討として,LiDARから得た点群データ及び点群用歩行者検出器を用い,様々な環境における難易度の算出手法について検討した結果を述べる.

  171. SNS投稿写真の視覚的内容に基づく類似地域マイニング

    滝本 広樹, 川西 康友, 井手 一郎, 平山 高嗣, 道満 恵介, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2018年3月9日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄産業支援センター  

    旅行者が過去に訪れ,そこで体験できる内容や雰囲気について知っている場所との共通点や相違点に基づいて新たな旅行先を探せるサービスがあれば,旅行者が次の旅行先を決定する際に有用である.このようなサービスを実現するため,我々はSNSに投稿された写真の視覚的な内容に基づいて類似した地域を検出する手法を検討してきた.本報告では,写真共有サイトFlickr上に投稿された約1億件の写真を含むデータセットYFCC100Mを用いて実際に類似地域を検出し,また,被験者実験を通して得られた人間の感覚に基づく地域間の類似度との比較評価により,提案手法の有効性を確認した結果を報告する.

  172. ライトフィールド情報を活用した局所平面角度の推定とSIFT 特徴対応付けへの応用

    清水 政行, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    動的画像処理実利用化ワークショップ(DIA)  2018年3月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:中京大学  

    近年,ライトフィールドカメラが一般に市販されるようになり,ライトフィールド情報を容易に取得する
    ことが可能になった.ライトフィールド情報は空間中の光線情報を記録したものであり,撮影後の後処理によって任意の位置に合焦した画像を生成できるという特徴を有する.本発表では,このライトフィールド情報を活用することによって,画像中の任意の位置における最適な焦点距離と局所平面角度を同時に推定する手法を提案する.具体的には,ライトフィールドカメラの部分開口画像から算出されるSSD(Sum of Squared Difference)が合焦位置で最小になり,かつ,その隣接画素における最適な焦点距離が連続的に変化するというという2 つの性質に着目し,焦点距離と局所平面角度の同時推定手法を提案する.提案手法の有効性を確認するため,実環境において撮影した評価画像を用いて精度の検証を行った.その結果,テクスチャ情報が豊富な領域において良好な推定結果が得られることを確認した.

  173. 画像付き料理レシピからの味推定の改良

    伊藤 耀一朗, 道満 恵介, 川西 康友, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    メディアエクスペリエンス・バーチャル環境基礎研究会(MVE)  2018年3月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄産業支援センター  

    本報告では,画像特徴,素材特徴を使用していた従来研究を改良し,「煮る」,「焼く」などの調理手順に現れる手順動詞に関する特徴も合わせて学習することにより,画像付き料理レシピの完成品の味推定精度の向上について報告する.実験により,甘味以外の味推定において,手順特徴を使用することの有効性を確認した.

  174. ヘッドライトを用いた点滅光照射による視認性向上の検討

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会メディアエクスペリエンス・バーチャル環境基礎研究会  2018年3月8日 

     詳細を見る

    開催年月日: 2018年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:沖縄産業支援センター  

    様々なADAS(先進運転支援システム)が開発されている一方で,依然として対歩行者死亡事故が多発しており,その多くは夜間に発生している.近年の前照灯は,通常の前方照射に加え,歩行者に選択的に光を照射することが可能になりつつある.しかし,歩行者の視認性を効果的に向上させるような照射方法についてはいまだ明らかになっていない.我々はこれまでに実験室環境において,視認性向上に有効な点滅光照射パターンについて検討してきた.本報告では,視認性向上に有効な点滅光照射パターンについて実環境で行なった結果について報告し,実験環境の違いが結果に与える影響について検討する.

  175. 名古屋大学におけるサーバ型紙レポート・LMS 連携システムの開発

    清谷 竣也, 伊藤 瑠哉, 岡本 康佑, 谷川 右京, 大平 茂輝, 出口 大輔, 戸田 智基

    大学ICT推進協議会(AXIES)  2017年12月15日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島国際会議場  

  176. Active Scan LIDARを用いた歩行者検出のための効率的スキャン法

    山本 大貴, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2017年3月3日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    遠方の歩行者においても局所的にスキャンの密度を高めることが可能なActive Scan LIDARが開発中である.
    本研究では,歩行者の形状や存在確率を用いることで,Active Scan LIDARを用いた歩行者検出のための歩行者に対する効率的なスキャン法を提案する.

  177. インテリジェントヘッドライトのための点滅光照射法の検討

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2017年3月3日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    運転者の歩行者視認を支援するために周辺の環境に応じて最適な光を照射する「インテリジェントヘッドライト」を提案する.その実現に向けて,点滅光照射法を検討し,有効な点滅パターンについて分析する.

  178. 人物検出器の高精度化に向けた走行映像群からのネガティブ学習サンプルの抽出手法

    本谷 真志, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2017年3月3日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    歩行者検出器の高精度化において重要な要素である学習サンプルの質と量の改善に焦点を当て,
    同じ経路を走行した複数の走行映像から歩行者検出器の学習に必要となるネガティブサンプルを自動抽出する手法を提案する.

  179. 撮影支援に向けた料理写真の魅力度推定手法の改良

    佐藤 陽昇, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2017年3月3日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    本研究では,料理を魅力的に撮影するための支援を目的として,被験者に料理画像選好課題を課して視線情報を計測し,その分析に基づき設定した局所領域からの画像特徴抽出による料理写真の魅力度推定手法を提案した.

  180. Deep Manifold Embedding for 3D Object Pose Estimation 国際会議

    Hiroshi Ninomiya, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Norimasa Kobori, Yusuke Nakano

    International Conference on Computer Vision Theory and Applications (VISAPP) 2017  2017年3月1日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    DOI: 10.5220/0006101201730178

  181. Can We Detect Pedestrians using Low-resolution LIDAR? 国際会議

    Yoshiki Tatebe, Daisuke Deguchi, Yasutomo Kawanishi, Ichiro Ide, Hiroshi Murase, Utsushi Sakai

    International Conference on Computer Vision Theory and Applications (VISAPP) 2017  2017年2月28日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Porto  

    DOI: 10.5220/0006100901570164

  182. Wheelchair-user Detection Combined with Parts-based Tracking 国際会議

    Ukyo Tanikawa, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Ryo Kawai

    International Conference on Computer Vision Theory and Applications (VISAPP) 2017  2017年2月28日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    DOI: 10.5220/0006101101650172

  183. Can a Driver Assistance System Determine if a Driver is Perceiving a Pedestrian? 国際会議

    Yuki Imaeda, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    International Conference on Computer Vision Theory and Applications (VISAPP) 2017  2017年2月27日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    DOI: 10.5220/0006229306110616

  184. 歩行者の視認性向上に有効な追加照射光の点滅周波数の検討

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    平成29年度電気・電子・情報関係学会東海支部連合大会講演予稿集  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  185. Automatic selection of Web contents towards automatic authoring of a video biography 国際会議

    Ichiro Ide, Yasutomo Kawanishi, Kyoka Kunishiro, Frank Nack, Daisuke Deguchi, Hiroshi Murase

    19th IEEE Int. Symposium on Multimedia (ISM2017)  2017年12月13日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:臺中金典酒店(臺中,臺灣)  

    DOI: 10.1109/ISM.2017.54

  186. OSSを利用した学内ファイル共有サービスのマイグレーション

    松岡 孝, 田島 尚徳, 関 七夏海, 出口 大輔, 長谷川 皓一

    大学ICT推進協議会(AXIES)  2017年12月13日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島国際会議場  

  187. 学内ファイル共有サービスに対する利用者の意識調査

    田島 尚徳, 松岡 孝, 関 七夏海, 出口 大輔, 長谷川 皓一

    大学ICT推進協議会(AXIES)  2017年12月13日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島国際会議場  

  188. Summarization of news videos considering the consistency of auditory and visual contents 国際会議

    Ichiro Ide, Ye Zhang, Ryunosuke Tanishige, Keisuke Doman, Yasutomo Kawanishi, Daisuke Deguchi, Hiroshi Murase

    19th IEEE Int. Symposium on Multimedia (ISM2017)  2017年12月12日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:臺中金典酒店(臺中,臺灣)  

    DOI: 10.1109/ISM.2017.33

  189. Open Apereo 2017 Conference 参加報告

    常盤 祐司, 藤井 聡一朗, 出口 大輔, 梶田 将司

    教育学習支援情報システム研究会(CLE)  2017年12月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:松山大学  

  190. 姿勢情報の利用による歩行者属性の認識に関する検討

    新村 文郷, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 藤吉 弘亘

    ビジョン技術の実利用ワークショップ(ViEW)  2017年12月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:パシフィコ横浜  

    歩行者の行動を予測する上で,カメラ映像から歩行者の状態や挙動(歩行者属性)を認識することは重要である.歩行者は体向きや行動によって姿勢が変化するため,姿勢情報は非常に有効と考えられる.そこで本発表では,姿勢情報をもとに様々な歩行者属性を認識する手法を提案する.RAP datasetを用いた実験により,12種類の歩行者属性の認識について評価を行い,提案手法の有効性を検証した.

  191. 車載カメラを用いた環境理解

    出口 大輔

    経済情報学会主催セミナー  2017年12月6日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:岐阜聖徳学園大学  

    近年,自動運転に関するニュースを報道で目にする機会が増え,その実現に対する期待も日に日に高まってきている.自動運転の実現には,車が今どこを走行しているかを正確に把握する技術が非常に重要となる.しかしながら,現在広く用いられているGPSのみでは,都市部等で十分な精度での位置計測ができないという問題がある.この問題の解決手段の一つとして,車載カメラを用いた自車位置推定技術が注目を集めている.そこで本講演では,カメラを用いた自車位置推定に焦点を当てるとともに,その関連技術についても紹介する.

  192. Toward Describing Human Gaits by Onomatopoeias 国際会議

    Hirotaka Kato, Takatsugu Hirayama, Yasutomo Kawanishi, Keisuke Doman, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    2017 IEEE International Conference on Computer Vision (ICCV2017) Workshops  2017年10月28日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Venice Convention Center, Venice, Italy  

  193. 畳み込みニューラルネットワークを用いた料理写真の魅力度推定

    佐藤 陽昇, 道満 恵介, 平山 高嗣, 井手 一郎, 川西 康友, 出口 大輔, 村瀬 洋

    電子情報通信学会メディアエクスペリエンス・バーチャル環境基礎研究会  2017年10月20日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    我々は,料理を美味しそうに撮影するための支援技術として,料理が美味しそうに見える度合い「魅力度」を推定する手法を提案してきた.この手法では,魅力度付きの料理画像群から画像特徴を抽出し,回帰の枠組みにより未知の料理写真に対して魅力度を推定する.本報告では,新たなアプローチとして畳み込みニューラルネットワーク(CNN)を用いて魅力度推定器を構築した結果を述べる.具体的には,VGG16,ResNet50,Inception-v3の学習済みモデルをそれぞれ転移学習したCNNを構築し,これを魅力度推定器として利用する.従来手法と比較した結果から,VGG16の事前学習モデルに基づいた魅力度推定器が有効であることを確認した.

  194. Driver's Decision Analysis in Terms of Pedestrian Attributes -A Case Study in Passing by a Pedestrian- 国際会議

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    Workshop on Human Factors in Intelligent Vehicles  2017年10月16日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Mielparque Yokohama, Kanagawa, Japan  

    In this paper, we report a case study on driver's decision in terms of pedestrian attributes. Among various traffic situations, the situation that a vehicle passes by a pedestrian is one of the major situations. To build a safety driving system that supports a non-experienced driver in such a situation, we analyzed how experienced drivers decide to handle the vehicle in such a situation. Since pedestrian’s behavior can be considered as a key factor for the decision, and also the behavior is different depending on their attributes," such as walking or stopping, noticing the vehicle or not, using a smartphone, etc., we analyzed what pedestrian's attributes affect the driver's decisions. For the analysis, we first built a large-scale dataset of driving data. Using the dataset, we clarified what attributes are dominant for the driver's decision."

  195. 姿勢を表現する多様体に基づくGANsを用いた物体姿勢推定の検討

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2017年10月13日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:熊本大学  

    Generative Adversarial Nets(GANs)は,ある事前分布から画像などのデータを生成可能なネットワークであり,乱数から様々なデータを生成可能である.本研究では,物体の姿勢変化は潜在的には多様体で表現可能であることに着目し,多様体上に定義した確率分布から画像を生成するGANsの枠組みと,それを用いて学習画像を補間しつつ姿勢推定器を学習する手法を提案する.実験では,全周を撮影した複数の物体に対し,提案手法により学習データに含まれない姿勢が補間できることを確認した.また,姿勢推定を同時に学習し,学習データに含まれない姿勢に対する姿勢推定の可能性を評価し,学習画像の枚数が少ない場合でも姿勢推定精度が大幅には低下しないことを確認した.

  196. 低解像度顔画像群からの集団の注目位置推定法の検討

    児玉 祐樹, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 永野 秀尚, 柏野 邦夫

    パターン認識・メディア理解研究会(PRMU)  2017年10月13日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:熊本大学  

    複数の人物が同時に注目している対象を知ることは重要である.しかし,複数人を同時に観測すると各人物画像の解像度は低くなるため,各人物の注目位置の高精度な取得は困難である.そこで我々は,複数人が同一の対象を同時に注視する状況を想定し,画像中の各人物の注目位置の低精度な推定結果を統合することで,集団の注目位置を高精度に推定する手法を考え,様々な統合方法について検討した.また,実験により,推定結果の様々な統計量を用いた統合や統合に用いる人数が集団の注目位置の推定精度に与える影響を分析した.

  197. 歩行者検出器の信頼度推定に関する初期検討

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    自動車技術会2017年秋季大会  2017年10月11日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:グランキューブ大阪  

    Results of pedestrian detectors using in-vehicle sensors can not be trusted perfectly in real environments. Therefore, we propose an estimation system of pedestrian detector's reliability (e.g., probability of oversight and misdetection) for environments. This paper presents preliminary study for reliability calculation of detectors in an environment, and construction method of estimator for the reliability. The proposed method defines a reliability of true detection as recall and a maximum threshold without oversight. Additionally, it defies a reliability of false detection as precision and a minimum threshold without misdetection. Moreover, the proposed method constructs a estimator for the reliability using brightness-based features.

  198. 歩行者脇通過時における歩行者属性と運転行動の関係に関する分析

    新村 文郷, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 藤吉 弘亘

    自動車技術会2017年秋季大会  2017年10月11日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:グランキューブ大阪  

    When passing by a pedestrian, a driver decides the behavior that his/her own vehicle can safely pass by. In this presentation, through analysis using experienced drivers' driving data, we clarify the factors that are important for a driver's behavior decision. For the analysis, we classified the driver’s behaviors into three states based on the operation of the acceleration and brake pedals. We estimate these driver's behaviors from the pedestrian's attributes by a machine learning-based method. We conducted experiments to estimate the driver's behaviors from various attributes, and analyzed effective attributes for the estimation. From the results of the analysis, we clarified that the pedestrian's orientation is more important for the driver's behavior decision than other attributes.

  199. Detection of Similar Geo-Regions based on Visual Concepts in Social Photos 国際会議

    Hiroki Takimoto, Magali Philippe, Yasutomo Kawanishi, Ichiro Ide, Takatsugu Hirayama, Keisuke Doman, Daisuke Deguchi, Hiroshi Murase

    Pacific-Rim Conference on Multimedia (PCM)  2017年9月28日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    Travel destination recommendation is useful to support travel.Considering the recommendation of regions within the destination area to visit, it could be difficult for the users to explicitly indicate their preference.Therefore, we considered that it would be more intuitive to recommend regions in the destination area that are similar to a region already well-known to the user.Thus, in this paper, we propose a method for the detection of similar geo-regions based on Visual Concepts in social photos.We report experimental results and analyses by applying the proposed method to the YFCC100M dataset.

  200. 視点に応じた魅力度が付与された料理画像データセット

    井手 一郎, 髙橋 和馬, 道満 恵介, 川西 康友, 平山 高嗣, 出口 大輔, 村瀬 洋

    電子情報通信学会魅力工学研究会発足記念シンポジウム  2017年9月20日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:千葉大西千葉校舎  

  201. 名古屋大学の事例紹介

    出口 大輔, 宮島 千代美, 武田 一哉

    情報科学技術フォーラム(FIT)  2017年9月12日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東京大学  

  202. 歩行者検出器における車両周辺環境に応じた信頼度推定に関する初期検討

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    車載センサを用いた歩行者検出結果は,実環境下において絶対的なものとは言えない.
    例えば,白飛びや黒潰れの生じた画像が入力された場合,検出器は歩行者を見落としやすくなる.
    しかし実際には,歩行者が存在しないわけではなく,「検出できなかったが,存在する可能性がある」が正しい出力であると言える.
    そこで我々は,未検出や誤検出が存在する可能性を,そのシーンに対する各検出器の信頼度として推定するシステムを提案する.
    本発表では,各シーンに対する信頼度の算出手法,および信頼度推定器の構築手法について初期的な検討を行なった結果を報告する.
    提案手法では,未検出が発生するしきい値をそのシーンに対する検出器の信頼度として用い,画像の輝度特徴を用いた信頼度推定器を構築する.
    実験の結果,平均誤差22.3,標準偏差22.5で信頼度を推定できた.

  203. 双方向RNN を用いた画像に対する感想コメント生成に関する検討

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  204. 深層学習を活用した低解像度LIDARによる歩行者検出の検討

    建部 好輝, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋, 酒井 映

    電気・電子・情報関係学会東海支部連合大会  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  205. チャンネル統計量を用いたACF歩行者検出器の性能改善に関する検討

    出口 大輔, 久徳 遙矢, 新村 文郷, 川西 康友, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    近年,自動運転技術に代表される高度運転支援システムが注目を集めており,その中でも対歩行者事故低減に欠かせない歩行者検出技術への期待が高まっている.
    ここ数年は深層学習を利用した歩行者検出技術に注目が集まっているものの,実時間動作を考えた場合はチャンネル系特徴量を利用したACFやLDCFといった歩行者検出技術と併用するのが一般的である.
    ACFやLDCFでは,LUV色特徴,正規化輝度勾配強度,輝度勾配ヒストグラム,などのプリミティブな特徴量が用いられる.
    しかしながら,これらの特徴量の組み合わせについては十分な検討がなされていない.
    そこで本発表では,輝度勾配ヒストグラムから統計量を抽出し,ACFの新しいチャンネルとして加えることで性能改善が得られるかどうかを検討した結果について報告する.

  206. 歩行者の姿勢と顔向きに注目した歩きスマホ認識の検討

    新村 文郷, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 藤吉 弘亘

    電気・電子・情報関係学会東海支部連合大会  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

    本稿は,肘や肩の角度情報を含む姿勢情報に加え.顔向きの情報を用いた歩きスマホ認識手法を提案する.

  207. 人物検出器の高精度化に向けた同一経路走行映像群からのネガティブサンプルの自動抽出手法

    本谷 真志, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  208. Preliminary Study of Attribute-aware Semantic Segmentation for Pedestrian Understanding

    Mahmud Dwi Sulistiyo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    Tokai-Section Joint Conference on Electrical, Electronics, Information, and Related Engineering 2017  2017年9月8日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  209. Faster R-CNNを用いた車椅子利用者の検出に関する予備的検討

    谷川 右京, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  210. 主食材の見えの考慮による料理写真の魅力度推定手法の改良

    髙橋 和馬, 道満 恵介, 川西 康友, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    マルチメディア・仮想環境基礎研究会(MVE)  2017年3月6日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:九州大学 大橋キャンパス  

    従来研究では,料理を美味しそうに撮影するための支援技術として,料理が美味しそうに見える度合い「魅力度」を推定する手法を提案してきた.
    この手法では,魅力度付きの料理画像群から画像特徴を抽出し,回帰の枠組みにより任意の料理画像に対して魅力度を推定する.
    本報告では,主食材の見えを考慮した画像特徴を新たに導入し,従来から提案してきた画像全体の印象を考慮した特徴量と統合利用する方法について検討した結果を述べる.
    具体的には,皿に占める主食材の割合や重心の座標差,勾配方向ヒストグラム,勾配方向ヒストグラムの第1次~第4次モーメントを利用する.
    情景写真や動物写真を対象とした一般的な写真の審美性評価手法と比較した結果から,料理の色合いや立体感,食材の向きや配置を考慮する提案手法の有効性を確認した.
    また,各画像特徴量を単体で利用した手法と比較した結果から,画像特徴量を統合利用することの有効性を確認した.

  211. 人物紹介映像の自動編集に向けたWebコンテンツの自動選択

    國代 京花, ナックフランク, 井手 一郎, 川西 康友, 出口 大輔, 村瀬 洋

    マルチメディア・仮想環境基礎研究会(MVE)  2017年3月6日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:九州大学 大橋キャンパス  

    従来では人物紹介映像の自動編集工程において,特に画像選択の際にクエリの特性を考慮せずに画像選択を行っていた.
    今回は,この点を改善し,クエリのみの画像検索結果から収集できる画像の特性に合わせた画像特徴の抽出を行い,これに基づくモデルを生成する手法を提案した.
    その結果,クエリの分野によって収集される画像特性を考慮したほうが良い結果を得られることを確認し,手法の有効性を示した.

  212. 名古屋大学における紙レポートシステムの試験導入と課題

    戸田 智基, 田上 奈緒, 中務 孝広, 松岡 孝, 大平 茂輝, 後藤 明史, 出口 大輔

    Ja Sakai カンファレンス  2017年3月20日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:京都大学学術情報メディアセンター  

  213. Proposal of a spectral random dots marker using local feature for posture estimation 国際会議

    Norimasa Kobori, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    IEEE Virtual Reality 2017  2017年3月20日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Manhattan Beach Marriott Hotel, Manhattan Beach, CA, USA  

    DOI: 10.1109/VR.2017.7892257

  214. 傘による遮蔽に頑健なパーツ参照型歩行者検出

    新保 祐人, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    動的画像処理実利用化ワークショップ(DIA)  2017年3月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:島根県立産業交流会館  くにびきメッセ  

    近年,自動運転の実現に向けて自動車の周囲環境認識に関する研究が盛んに行なわれている.
    その中でも,見落としが重大な事故につながる歩行者の検出は重要な課題である.しかし,傘を差した
    歩行者は,傘によって頭部が遮蔽されるため検出が困難な対象として知られている.そこで本発表で
    は,傘差し歩行者検出の高精度化を目的とし,パーツ参照型歩行者検出手法であるParts Driven Faster
    RCNN を提案する.具体的には,Faster RCNN の候補領域抽出部において,傘と歩行者の関係性を学
    習して傘の候補領域から歩行者の候補領域を推定することにより,頭部が遮蔽された歩行者でも候補領
    域として抽出できるようにする.提案手法の有効性を確認するため,雨天時に撮影した車載カメラ画像
    系列を用いて評価実験を行ない,傘差し歩行者に対して検出精度が向上することを確認した.

  215. 同一経路走行映像群からのネガティブ学習サンプル自動抽出に関する初期検討

    本谷 真志, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2017年3月23日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学 天白キャンパス  

  216. チャンネル特徴量を用いた歩行者検出技術

    出口 大輔

    技術情報協会セミナー「歩行者検出における画像認識・LIDARの適用技術と自動運転への応用」  2017年1月11日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:日幸五反田ビル  

  217. Active Scan LIDARを用いた効率的な歩行者スキャン手法の検討

    山本 大貴, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  218. 視点に応じた魅力度が付与された料理画像データセット

    井手 一郎, 髙橋 和馬, 道満 恵介, 川西 康友, 平山 高嗣, 出口 大輔, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:名古屋大学  

  219. 超低解像度温度画像系列からの深層学習に基づく人物行動認識に関する分析

    川島 昂之, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:名古屋大学  

  220. 選好実験時の視線情報に基づく料理写真の魅力度推定手法の改良

    佐藤 陽昇, 平山 高嗣, 道満 恵介, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  221. 音韻と人体部位の動きの関係に着目したオノマトペによる歩容のzero-shot記述に向けた検討

    加藤 大貴, 平山 高嗣, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    電気・電子・情報関係学会東海支部連合大会  2017年9月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名古屋大学  

  222. Action Recognition from Extremely Low-Resolution Thermal Image Sequence 国際会議

    Takayuki Kawashima, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa, Masato Kawade

    14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS2017)  2017年9月1日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Carlo V Castle, Lecce, Italy  

    This paper proposes a Deep Learning-based action recognition method from an extremely low-resolution thermal image sequence. The method recognizes daily actions by humans (e.g. walking, sitting down, standing up, etc.) and abnormal actions (e.g. falling down) without privacy concerns. While privacy concerns can be ignored, it is difficult to compute feature points and to obtain a clear edge of the human body from an extremely low-resolution thermal image. To address these problems, this paper proposes a Deep Learning-based action recognition method that combines convolution layers and an LSTM layer for learning spatio-temporal representation, whose inputs are the thermal images and their frame differences cropped by the gravity center of human regions. The effectiveness of the proposed method was confirmed through experiments.

    DOI: 10.1109/AVSS.2017.8078497

  223. Transifexを利用したコミュニティ翻訳

    出口 大輔

    JTF 翻訳支援ツール説明会  2017年8月21日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:セルリアンタワー  

  224. Estimation of the attractiveness of food photography focusing on main ingredients 国際会議

    Kazuma Takahashi, Keisuke Doman, Yasutomo Kawanishi, Takatsugu Hirayama, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    9th Workshop on Cooking and Eating Activities (CEA2017) in conjunction with IJCAI2017  2017年8月20日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:RMIT Univ. (Melbourne, VIC, Australia)  

    DOI: 10.1145/3106668.3106670

  225. Trajectory Ensemble: カメラネットワーク上での一時的な見えの変化に頑健な多人数追跡

    川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2017年8月10日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:広島国際会議場  

  226. 車両周辺環境の違いに対する歩行者検出器の信頼度推定に関する初期検討

    久徳 遙矢, 川西 康友, 出口 大輔, 井手 一郎, 加藤 一樹, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2017年8月10日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:広島国際会議場  

  227. 3DCNNを用いた低解像度点群からの歩行者検出

    建部 好輝, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋, 酒井 映

    画像の認識・理解シンポジウム(MIRU)  2017年8月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:広島国際会議場  

  228. 低解像度顔画像群からの集団の注目位置推定に向けて

    児玉 祐樹, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 永野 秀尚, 柏野 邦夫

    画像の認識・理解シンポジウム(MIRU)  2017年8月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:広島国際会議場  

  229. 超低解像度温度画像系列を用いた家庭内人物行動認識に関する検討

    川島 昂之, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎, 川出 雅人

    画像の認識・理解シンポジウム(MIRU)  2017年8月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:広島国際会議場  

  230. 医用画像処理からの巣立ち

    出口 大輔

    第36回日本医用画像工学会大会(JAMIT2017)  2017年7月29日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    本講演では,医用画像処理に軸足を置いた研究から私自身経験の無いITS研究分野に挑戦したこれまでの経験を紹介するとともに,そこで感じた研究分野を変えることの難しさ,新しいことへの挑戦の楽しさ,人との繋がりの大切さ,などについてまとめる.私自身は,名古屋大学工学部の4年生として鳥脇研究室の門をくぐり,博士号取得まで一貫して医用画像処理,特に気管支内視鏡ナビゲーションシステムの開発と関連するセグメンテーション技術の開発に取り組んできた.その後,縁あってコンピュータービジョン・パターン認識などの研究に軸足を移し,現在ではITSに関連する研究にも取り組んでいる.その間,研究分野を変えることの難しさや,新しいことに挑戦する楽しさを再認識することができた.特に,新しい人との繋がりは自身を大きく成長させてくれたと考えている.このような私自身のこれまでの経験が,今後新しい研究分野に挑戦する研究者の皆様の助けになれば幸いである.

  231. Headgear Recognition by Decomposing Human Images in the Thermal Infrared Spectrum 国際会議

    Brahmastro Kresnaraman, Yasutomo Kawanishi, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    15th International Conference on Quality in Research (QiR2017)  2017年7月26日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Bali, Indonesia  

    Surveillance systems play a critical role in security and surveillance. A surveillance system with cameras that work in the visible spectrum is sufficient for most cases. However, problems may arise during the night, or in areas with less than ideal illumination conditions. Cameras with thermal infrared technology can be a better option in these situations since they do not rely on illumination to observe the environment. Furthermore, in our daily lives, it is common for humans to wear headgears such as glasses, masks, and hats. In surveillance, such headgears can be a hindrance to the identification of a person, and hence pose a certain degree of risk. This is not ideal in areas where the identity of a person is important, for example, in a bank. Therefore, in this paper we propose a headgear recognition method using an innovative decomposition approach on thermal infrared images. The decomposition method is based on Robust Principal Component Analysis, a modification of the popular Principal Component Analysis. The proposed method performs decomposition on a human image and isolates headgears in the image for recognition purposes. Experiments were conducted to evaluate the capability of the proposed method. The results show a positive outcome when compared with other methods.

    DOI: 10.1109/QIR.2017.8168475

  232. Trajectory Ensemble: Multiple Persons Consensus Tracking across Non-overlapping Multiple Cameras over Randomly Dropped Camera Networks 国際会議

    Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    1st Workshop on Target Re-Identification and Multi-Target Multi-Camera Tracking  2017年7月21日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Hawaii Convention Center  

    Multiple person tracking over a camera network is usually performed by matching person images between adjacent cameras. It easily fails by a temporal appearance change of the persons caused by environmental illumination and observation orientation of a camera. To solve this problem, matching person images across not only adjacent cameras but also cameras multiple hops away in the camera network is effective, but such relaxation of spatiotemporal cues also cause tracking failure due to the increase of matching candidates. To avoid the failure, we introduce Random Camera Drop" to generate different camera networks which relax the spatio-temporal cues partially and randomly. We then, integrate tracking results over the networks to a consensus tracking result by a novel concept "Trajectory Ensemble", an extension of unsupervised ensemble learning for the multiple person tracking over a camera network problem. We evaluated the framework on several virtual datasets generated from a public dataset, "Shinpuhkan 2014 dataset" and confirmed that the proposed method achieves the highest tracking results among several comparative methods."

  233. ライトフィールド情報を活用した特徴点の対応付けに関する検討

    清水 政行, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2017年6月23日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東北大学  

    近年, ライトフィールドカメラが市場に導入されてライトフィールド情報を容易に得ることができるよう
    になった. ライトフィールド情報からは, 注目画素の鮮鋭度を算出しピントが最も合う焦点距離を推定することができる. 本論文ではSIFT 特徴量の対応付け問題において, 焦点距離を活用して信頼度の低い特徴点を削除し対応付け精度を向上させる手法を提案する. 本手法により, 誤対応の原因となる, テクスチャが少ない特徴点を削除することができると考えられる. 提案手法の有効性を確認するために対応付けの精度を確認した. その結果, 対応付けの総数, 正対応付け数, Precision のいずれも向上することを示した.

  234. 音韻と人体部位の動きの関係に着目したオノマトペによる歩容の記述に向けて

    加藤 大貴, 平山 高嗣, 川西 康友, 道満 恵介, 井手 一郎, 出口 大輔, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2017年6月22日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:東北大学  

  235. Monocular Localization within Sparse Voxel Maps 国際会議

    David Robert Wong, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    2017 IEEE Intelligent Vehicles Symposium (IV2017)  2017年6月12日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Redondo Beach, California, USA  

    We introduce a method that uses a single camera to localize a vehicle within a pre-constructed map consisting of a voxel occupancy grid and road-line marker positions. Sophisticated mapping hardware is capable of creating high accuracy 3D maps of road environments, but localizing a vehicle within such maps is one of the challenges at the forefront of automated driving. A solution which is robust to dynamic environments, while using only inexpensive sensors, is a difficult problem. In addition, maps that enable precise localization consume a lot of data which is impractical for the expansive environments encountered in real-world road networks. We show how using the area of edge regions shared between rendered views of a compact voxel map and in-vehicle camera images can be coupled with non-linear optimization methods to determine the camera position and pose.

  236. Active Scan LIDARを用いた歩行者検出のための効率的スキャン手法

    山本 大貴, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像センシングシンポジウム(SSII)  2017年6月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:パシフィコ横浜アネックスホール  

    LIDAR は,対象までの距離や反射特性を測る環境認識センサであり,対象の 3 次元形状を分析できるため,これを用いた歩行者検出の研究が行われている.近年,LASER 光の照射方向を瞬時に制御可能な Active Scan LIDAR の開発が進められている.本研究では, Active Scan LIDAR を用いて歩行者から効率よく距離データを得るためのスキャン手法の開発を目的とする.
    Active Scan LIDAR を用いた歩行者検出の実現に向けて,歩行者の形状による歩行者尤度推定,及び歩行者存在確率に基づく効率的なスキャン手法を提案する.
    Active Scan LIDARを模擬した評価実験を行ったところ,全体を一定にスキャンする比較手法にくらべ,的中率,領域重なり率,歩行者抽出率すべての向上を確認でき,歩行者を効率的にスキャンできていることを確認した.

  237. Sharing i18n Practices and Issues

    Daisuke Deguchi, Soichiro Fujii, Shoji Kajita, Takahiro Sanada, Yuji Tokiwa

    Open Apereo 2017  2017年6月7日 

     詳細を見る

    開催年月日: 2017年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Sheraton Society Hill Hotel in Philadelphia, PA  

    Apereo software are mostly developed in English-speaking countries. Therefore, users and developers rarely face issues caused by i18n and l10n. However, we, living in the non-English-speaking countries, are sometimes in trouble functionally caused by i18n and l10n. And we are continuously translating source code into our own language.

    In this session, three topics will be presented.

    At first, practices to apply IMS LTI and Caliper to existing tools on the Sakai based learning environment will be introduced. we are now encountering several issues caused by the lack of consideration of i18n in the specification. Points to solve these issues will be proposed.
    Next, short stories will be shared to customize and localize Apereo tools to fit a typical usage of Japanese universities. Ideas to eliminate issues in the source codes fundamentally will be described.
    Finally, a translation platform using a Web based translation support system such as Transifex will be explained in detail for those who will begin to translate Apereo software into your own language. In this platform, source code will be cloned from GitHub every night and one thing you should do is only to translate source code using Transifex.

  238. ヘッドライトを用いた歩行者視認性向上のための点滅光照射パターンの検討

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    コンピュータビジョンとイメージメディア研究会(CVIM)  2017年5月11日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:名古屋大学  

    薄暮時から夜間にかけての対歩行者死亡事故が多発しており,運転者の歩行者視認を支援するシステムへの需要が高まっている.我々はそのシステムとして,視認性が低い歩行者に周辺環境を考慮した最適な光を照射する「インテリジェントヘッドライト」を提案する.本研究ではその実現に向けて,点滅光照射法を検討した.具体的には,連続点灯時間およびデューティ比(1回の点滅における連続点灯時間の割合)を変化させたときの歩行者の視認性の違いを被験者実験により明らかにし,有効な点滅パターンについて分析した.その結果,瞬間的な照射かつ高速な点滅が効果的であり,2Hzの基本周波数を含む点滅において視認性が高くなる傾向が得られた.

  239. 料理写真の魅力度推定手法の改良

    佐藤 陽昇, 平山 高嗣, 髙橋 和馬, 道満 恵介, 川西 康友, 井手 一郎, 出口 大輔, 村瀬 洋

    コンピュータビジョンとイメージメディア研究会(CVIM)  2017年5月11日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:名古屋大学  

    近年,料理レシピサイトやSNSの普及によりWeb上への料理写真の投稿が増加している.Web上に投稿される料理写真は美味しそうに撮影されていることが望ましいが,その撮影は必ずしも容易ではない.従来研究では,料理を美味しそうに撮影するための支援技術として,料理写真の魅力度,つまり撮影された料理が美味しそうに見える度合いを推定する手法が提案されている.この手法では,魅力度付きの料理画像群から画像特徴を抽出し,回帰の枠組みにより任意の料理画像に対して魅力度を推定する.本研究では,閲覧者が一般的に注目する領域を分析し,それに基づいて画像特徴を抽出する領域を選択することにより,料理写真の魅力度推定手法を改良した.まず,画像の選好を評価する被験者実験を行い,魅力度を判断する際の視線情報を計測した.次に,視線の停留状態が続いた領域,すなわち注視領域を分析し,それに基づいて画像特徴の抽出領域を選択した.そして,画像全体から特徴抽出する従来手法と比較した結果から,注視領域外から特徴抽出することが有効であることが確認された.

  240. 人物検出器の高精度化に向けた走行映像群からのネガティブ学習サンプルの自動抽出に基づく人物検出器の追加学習

    本谷 真志, 久徳 遙矢, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    画像センシングシンポジウム(SSII)  2017年5月9日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:パシフィコ横浜アネックスホール  

    近年,運転支援を目的とした車載カメラ映像からの人物検出技術が広く研究されている.一般に,検出器が誤って人物と判定した背景画像(ネガティブ学習サンプル)を追加学習することで,検出器の精度を改善できることが知られている.そこで本発表では,人物検出器の追加学習を行なうために,検出器が誤って人物と判定した背景画像をネガティブ学習サンプルとして自動抽出する手法を提案する.提案手法では,同一地点を長時間観測しても背景領域は大きく変化しないという性質を利用し,同一経路を走行した映像群を比較することでネガティブ学習サンプルを抽出する.そして,抽出したネガティブ学習サンプルを追加学習することにより,検出器の精度向上を図る.提案手法の有効性を確認するため,同一経路を 4 回走行して撮影した映像を用いて提案手法の評価を行なった.その結果,誤って人物を抽出することなくネガティブ学習サンプルの自動収集が可能であり,また得られたサンプルを用いた追加学習により精度が高い検出器を再構築できることを確認した.

  241. 低解像度顔画像群を用いた集団の注目位置推定に関する予備的検討

    児玉 祐樹, 川西 康友, 平山 高嗣, 出口 大輔, 井手 一郎, 村瀬 洋, 永野 秀尚, 柏野 邦夫

    電子情報通信学会総合大会  2017年3月23日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学 天白キャンパス  

    人々が見ている場所を知ることは,様々な用途で有用である.
    特に,集団全体としての傾向を分析したい場合には,複数の人物が同時に注目している対象を知ることが重要である.
    しかし,複数人を同時に観測するには広範囲の映像を撮影する必要があり,各人物画像の解像度は低くなるため,各人物の高精度な視線情報の取得は困難である.
    そこで我々は,複数人が同一の対象を同時に注視する状況を想定し,画像中の各人物の注目対象位置を推定した低精度な推定結果を統合することで,集団の注目対象の位置を高精度に推定する手法を提案する.
    実験により,統合人数の増加にともなう集団の注目対象位置の推定精度の向上が確認された.

  242. 視認性向上のための歩行者への点滅光照射の初期検討

    前田 高志, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2017年3月23日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学 天白キャンパス  

    薄暮時から夜間にかけての対歩行者死亡事故が多発しており,運転者の歩行者認知を支援するシステムへの需要が高まっている.
    我々はこれまでに,交通状況に応じて照射範囲や強度を制御できるアダプティブヘッドライトを使用した歩行者の視認性向上を目的として,輝度変化の立上り速度を速くすることで歩行者の見つけやすさが向上することを報告している.
    本発表では,この先行研究で取り扱わなかった点滅光に着目し,その連続点灯時間およびデューティ比(1回の点滅における連続点灯時間の割合)を変化させて歩行者領域を点滅させ,歩行者の視認性の違いを被験者実験により調査した結果を報告する.

  243. Active Scan LIDARを用いた歩行者検出のための効率的スキャン法の予備検討

    山本 大貴, 新村 文郷, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会総合大会  2017年3月23日 

     詳細を見る

    開催年月日: 2017年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:名城大学 天白キャンパス  

    近年,車両の周囲環境認識のためのセンサとしてLIDARが普及してきている.
    LIDARは距離情報により対象の3次元形状が分析できるため,これを用いた歩行者検出の研究が行われている.
    しかし従来のLIDARは,その周囲に一定間隔でLASER光を照射する方式のため,遠方の歩行者の解像度が低下するという問題がある.
    近年,LASER光の照射方向を任意に変更可能なActive Scan LIDARの開発が進められており,これを用いることで遠方の歩行者に対しても,局所的に高密度な点群スキャンが可能になることが期待される.
    本発表では,Active Scan LIDARを用いた効率的な歩行者検出を目的として,形状特徴を用いた歩行者尤度推定による効率的なスキャン法を提案する.

  244. 高等教育におけるデジタル教科書の利活用についてのアンケート調査

    出口 大輔, 山里 敬也, 大平 茂輝, 戸田 智基, 中島 英博, 重田 勝介, 岡田 義広, 山地 一禎

    大学ICT推進協議会(AXIES)  2016年12月15日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:国立京都国際会館  

    デジタル教科書は,従来の紙媒体に比べて,動画など視覚効果の高いコンテンツを提供できることに加えて,内容の改訂や情報共有を柔軟に実施できる.近年,初等教育においてはデジタル教科書の普及が進みつつあるものの,大学教育においては未だ積極的な利活用は少ないのが現状である.そこで情報基盤センター長会議において「大学のデジタル教科書の共同制作と流通検討部会」を設置し,デジタル教科書の利活用について議論を重ねてきた.本報告では,同部会が名古屋大学,北海道大学,九州大学,国立情報学研究所の教員,学生に対して実施したアンケート調査結果についてまとめる.

  245. オノマトペ表現に対応した歩容映像の識別に関する検討

    加藤 大貴, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:愛知県立大学  

  246. 地域別SNS投稿写真の画像内容に基づく特徴が類似する地域の検出に関する検討

    滝本 広樹, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:愛知県立大学  

  247. 複数フレーム特徴量を用いた低解像度LIDARによる歩行者検出

    建部 好輝, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:愛知県立大学  

  248. 赤外線センサアレイを用いた人物行動認識に関する検討

    川島 昂之, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:愛知県立大学  

  249. 輝度明滅による歩行者の強調が見つけやすさに与える影響の分析

    日比 雅仁, 平山 高嗣, 出口 大輔, 川西 康友, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

  250. 高階調カメラ画像からの特定物体検出に関する検討

    小松 美穂, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:愛知県立大学  

  251. HandWaving Gesture Detection Using a Far-Infrared Sensor Array with Thermo-Spatial Region of Interest 国際会議

    Chisato Toriyama, Yasutomo Kawanishi, Tomokazu Takahashi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Tomoyoshi Aizawa, Masato Kawade

    International Conference on Computer Vision Theory and Applications (VISAPP) 2016  2016年2月29日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Roma  

    DOI: 10.5220/0005718105450551

  252. Image transformation of eye areas for synthesizing eye-contacts in video conferencing 国際会議

    Takuya Inoue, Tomokazu Takahashi, Takatsugu Hirayama, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Takayuki Kurozumi, Kunio Kashino

    International Conference on Computer Vision Theory and Applications (VISAPP) 2016  2016年2月29日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Roma  

    DOI: 10.5220/0005668702730279

  253. Human Wearable Attribute Recognition using Decomposition of Thermal Infrared Images 国際会議

    Brahmastro Kresnaraman, Yasutomo Kawanishi, Daisuke Deguchi, Tomokazu Takahashi, Yoshito Mekada, Ichiro Ide, Hiroshi Murase

    22th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2016)  2016年2月19日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Takayama, Gifu Prefecture  

    This paper addresses an attribute recognition problem in thermal images, specifically on worn objects such as hat and glasses. Although attribute recognition is a growing research field, there are not much work done in thermal infrared spectrum. In this spectrum, since illumination is not a problem, it could be a better option to be used in nighttime or poorly lit areas. The proposed method uses only the attribute information and excludes the unnecessary information for the recognition. To achieve this, we propose attribute recognition based on feature decomposition using Robust Principal Component Analysis (RPCA). An experiment to evaluate the capability of the proposed method was conducted on the dataset created for this research. The results show that the proposed method outperformed the method without decomposition by 14% in average with a maximum of 27% increase in a specific attribute.

  254. Human Body Segmentation Using Texture Aware Grab-cut and Statistical Shape Models 国際会議

    Esmaeil Pourjam, Yasutomo Kawanishi, Ichiro Ide, Daisuke Deguchi, Hiroshi Murase

    22th Korea-Japan Joint Workshop on Frontiers of Computer Vision (FCV2016)  2016年2月17日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Takayama, Gifu Prefecture  

    Segmentation is one of active areas in computer vision field with application in many areas from entertainment to intelligent vehicles (IVs). Among the objects, humans themselves have always been among the most interested subjects because of
    their special features. Since human body has an articulated structure, modeling and recognizing different variations in the body has proved to be very difficult. Wearing various kinds of clothes in different situations which can have a completely dissimilar appearance based on the clothing type, makes the modeling much more difficult. Add to this, the common problems of vision like illumination changes, blurring due to camera movements, etc. make the problem even more difficult. Thus having a system that can segment human subjects accurately can be useful in many applications. In this paper, we propose a system for segmenting human subjects using Statistical Shapes Models (SSM) feedback and a texture aware version of Grab-cut which incorporates texture feature for improving the segmentation accuracy. Our experiments show that the proposed system has an acceptable accuracy compared to the state-of-the art interactive methods and much better than the conventional ones.

  255. パーツ選択型DPMを用いた傘差し歩行者検出手法の検討

    新保 祐人, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2016年1月22日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大阪大学 銀杏会館  

    近年,車載カメラ画像を用いた歩行者検出技術が注目されている.しかし,雨天環境においては,傘によっ
    て歩行者の頭部が隠蔽されるため傘差し歩行者の検出精度が低下してしまう問題がある.本報告では,物体認識の分
    野で広く用いられているDeformable Part Models(DPM)をベースとし,DPM の本来のパートフィルタと別途学習
    したパートフィルタとを検出時に選択的に使用するパーツ選択型DPM を提案する.傘差し歩行者の検出において,
    頭部に相当するパートフィルタと,別途学習した傘に相当するパートフィルタとを選択的に利用することにより,傘
    による頭部の隠蔽に頑健な検出が可能であると考えられる.実験により,パーツ選択型DPM による歩行者検出は,
    通常のDPM による検出と比べて雨天環境において高い精度が得られること,またパートフィルタの選択により晴天
    時の歩行者検出精度には影響を及ぼさないことを確認した.

  256. テレビ会議話者間の視線一致知覚範囲を考慮した目領域画像合成型視線補正法

    井上 卓弥, 高橋 友和, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 黒住 隆行, 柏野 邦夫

    パターン認識・メディア理解研究会(PRMU)  2016年1月21日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:大阪大学 銀杏会館  

    近年,ウェブカメラなどの普及により,テレビ会議を容易に行なうことができるようになった.
    しかし,一般的にカメラはディスプレイの外部に設置されており,ユーザはディスプレイ上の相手のユーザを見るため,視線が一致しないという問題が発生する.
    この問題を解決するために,様々な手法が提案されているが,それらの手法の多くは特定のセンサを必要とする.
    そのため,提案手法では,単一のカメラのみを用いて,対話相手が視線一致を知覚する範囲(視線一致知覚範囲)をユーザが注視している場合にのみ,ユーザの目領域をカメラを直視している画像に変換することで視線の一致した画像を生成する.

  257. 先読み運転を可能にするスーパーバイザ型運転支援の提案と実車実証

    二宮 芳樹, 竹内 栄二朗, 山口 拓真, 新村 文郷, 吉原 佑器, 赤木 康宏, 川西 康友, 出口 大輔, 早川 聡一郎, 鈴木 達也, 村瀬 洋, 松林 翔太, 三輪 和久

    自動車技術会秋季大会  2016年10月19日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    This paper presents a supervisory driver assistance system for proactive driving which projects future potential collisions. There are two major points in our approach, one is vehicle's driving intelligence modeling driver instructor's proactive driving and the other is assistance method modeling driver instructor's coaching. An experimental vehicle has implemented to confirm real-time performance of this driver assistance system. Evaluation results show understandabiity and effectiveness of this system.

  258. ファイル共有サービスの運用状況

    松岡 孝, 田島 尚徳, 出口 大輔, 森 健策

    大学ICT推進協議会(AXIES)  2016年12月14日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:国立京都国際会館  

    近年,教育研究活動に関連する様々なデータを適切に管理することが強く求められている.この問題の解決を目指し,名古屋大学では教育研究に関わるデータの保存場所を組織的に整備する取り組みを行っている.平成27年4月より本運用を開始した本サービスの内容,システム構成,運用状況等について報告する.

  259. Webコンテンツを用いた人物紹介映像の自動編集に向けて

    國代 京花, ナックフランク, 井手 一郎, 川西 康友, 出口 大輔, 村瀬 洋

    HCGシンポジウム  2016年12月8日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:高知市文化プラザかるぽーと  

  260. オノマトペにより歩容を記述するための音韻空間と人体部位の動きの関係性

    加藤 大貴, 平山 高嗣, 川西 康友, 道満 恵介, 井手 一郎, 出口 大輔, 村瀬 洋

    HCGシンポジウム  2016年12月7日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:高知市文化プラザかるぽーと  

  261. Misclassification Tolerable Learning for Robust Pedestrian Orientation Classification 国際会議

    Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    International Conference on Pattern Recognition (ICPR)  2016年12月5日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Cancun, Mexico  

    In this paper, we propose a multiclass classifier training method which reduces fatal" misclassifications by cost-relaxation of "tolerable" misclassifications in one-against-all classifiers training, named misclassification tolerable learning. In a binary classifier in the one-against-all classifiers, we introduce a new class group "conceptually similar classes," whose class labels are similar to the positive class. In the case of pedestrian orientation classification, the conceptually similar classes are defined as neighboring orientations to the positive orientation. We consider the misclassification of the conceptually similar classes to the positive class as tolerable misclassification. By relaxing the cost of the tolerable misclassifications, our proposed classification method reduces fatal misclassifications of non-similar classes. We evaluated the cost-relaxation effectiveness on several public datasets and confirmed that the proposed method outperforms the normal SVM on all of the datasets in the soft criterion by achieving 78.63% recognition rate on PDC Dataset."

  262. Recognition of Texting-While-Walking by Joint Features based on Arm and Head Poses 国際会議

    Fumito Shinmura, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase, Hironobu Fujiyoshi

    2016年11月20日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Taipei, Taiwan  

    Pedestrians texting-while-walking" increase the risk of traffic accidents, since they are often not paying attention to their surrounding environments and fails to notice approaching vehicles. Thus, the recognition of texting-while-walking from an in-vehicle camera should be helpful for safety driving assistance. In this paper, we propose a method to recognize a pedestrian texting-while-walking from in-vehicle camera images. The proposed approach focuses on the characteristic relationship between the arm and the head poses observed during a texting-while-walking behavior. In this paper, Pose-Dependent Joint HOG feature is proposed as a novel feature, which uses parts locations as prior knowledge and describes the cooccurrence of the arm and the head poses. To show the effectiveness of the proposed method, we constructed a dataset and evaluated it."

  263. 環境光の急変による視覚特性変化を考慮した歩行者の視認性推定に関する予備検討

    今枝 祐綺, 平山 高嗣, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    パターン認識・メディア理解研究会(PRMU)  2016年10月21日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:宮崎大学  

    本報告では,環境光の急変時における歩行者の視認性推定手法を提案する.
    先進運転支援システム(ADAS)の構築に向けて,運転者から見た歩行者の視認性を推定する研究が注目を集めている.
    しかしながら,これまでの研究では運転者の知覚能力の低下を招く環境光の急変については考慮されていない.
    ひとたび環境光が急変すると順応時間に応じて運転者の視覚特性は変化する.
    そこで,順応時間に応じて異なる視認性推定器を利用する手法を提案する.
    提案手法の有効性を確かめるため,まず環境光の急変を再現した被験者実験を行ない,環境光の急変後の順応時間毎の歩行者の視認性の取得を行なった.
    その後,提案手法による歩行者の視認性推定を行ない,その有効性を確認した.

  264. 先読み運転支援を可能とするための歩行者認識

    新村 文郷, 久徳 遙矢, 川西 康友, 出口 大輔, 福井 宏, 山内 悠嗣, 山下 隆義, 藤吉 弘亘, 村瀬 洋

    自動車技術会秋季大会  2016年10月19日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:札幌コンベンションセンター  

    Pedestrian behavior prediction is one of fundamental technique for proactive driving support system. For their behavior prediction, not only pedestrian detection but also their attribute recognition is important key. In our COI project, we have developed those techniques and implemented them on a vehicle. This paper presents our recognition system including detection of pedestrians and recognition of their attributes for behavior prediction. To show the performance of our system, we evaluated the system on practical environments.

  265. Deformable Part Modelsとパーツ追跡の統合による車椅子利用者の検出に関する検討

    谷川 右京, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    電子情報通信学会東海支部卒業研究発表会  2016年3月4日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:愛知県立大学  

  266. 列車前方映像を用いた障害物検出

    向嶋 宏記, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 鵜飼 正人, 長峯 望, 中曽根 隆太

    画像の認識・理解シンポジウム(MIRU)  2016年8月3日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:アクトシティ浜松  

    踏切事故やホーム転落事故など,鉄道における事故が後を絶たない.このような事故の対策として,列車前方に設置した車載カメラを用いた障害物検出システムの実現へ期待が高まっている.そこで本研究では,車載カメラを用いて列車前方に存在する障害物を検出することを目的とする.車載カメラを用いた障害物検出の多くは,歩行者など特定の検出対象に特化した学習によるものである.学習による手法では障害物となり得る物体をすべて学習することは不可能であるため,不特定の障害物を検出できない.そこで本発表では,現在の車載カメラ映像と障害物が存在しない車載カメラ映像間の差分によって,列車前方の不特定障害物を検出する手法を提案する.また,評価実験により提案手法の有効性を確認した.

  267. 車載カメラ画像からの傘差し歩行者検出に関する検討

    新保 祐人, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2016年8月2日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:アクトシティ浜松  

  268. 料理撮影支援へ向けた料理写真の魅力度推定手法の検討

    髙橋 和馬, 道満 恵介, 川西 康友, 平山 高嗣, 井手 一郎, 出口 大輔, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2016年8月2日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:ポスター発表  

    開催地:アクトシティ浜松  

    魅力的な料理写真を撮影するための支援を目的として,料理写真の魅力度を推定する手法について検討した.

  269. Webコンテンツを用いた 訃報映像の自動編集に向けた物体認識による画像選択法

    國代 京花, ナックフランク, 井手 一郎, 川西 康友, 出口 大輔, 村瀬 洋

    画像の認識・理解シンポジウム(MIRU)  2016年8月2日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語  

    開催地:アクトシティ浜松  

    訃報に伴う追悼映像の自動編集手法について,提案手法のデモプログラムを紹介した.

  270. Parts Selective DPM for detection of pedestrians possessing an umbrella 国際会議

    Yuto Shimbo, Yasutomo Kawanishi, Daisuke Deguchi, Ichiro Ide, Hiroshi Murase

    2016 IEEE Intelligent Vehicles Symposium (IV2016)  2016年6月19日 

     詳細を見る

    開催年月日: 2016年

    記述言語:英語   会議種別:ポスター発表  

    開催地:Gothenburg, Sweden  

    In recent years, pedestrian detection from an invehicle camera has been attracting attention.However, in the case of a raining situation, the detection accuracy decreases because the head of a pedestrian tends to be occluded by an umbrella. In oder to handle such cases, in this paper, as a variation of the Deformable Part Model (DPM) which is widely used in the field of object recognition, we propose Parts Selective DPM (PS-DPM)" which selectively chooses the original part filters and additional part filters trained independently. In the detection of pedestrians possessing an umbrella, the selection of head and umbrella parts will make pedestrian detection more robust to the occlusion. We conducted experiments to evaluate the performance of the proposed method. As a result, pedestrian detection with the proposed PS-DPM achieved high detection accuracy in rainy weather, compared with the detection by the conventional DPM. Moreover, we confirmed that it did not decrease the pedestrian detection accuracy in fine weather."

  271. 赤外線センサアレイから得られる温度分布の時間変化に基づく行動認識に関する検討

    川島 昂之, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 相澤 知禎, 川出 雅人

    パターン認識・メディア理解研究会(PRMU)  2016年6月14日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:NTT武蔵野研究開発センタ  

    近年,高齢化社会の進展に伴い,独居高齢者の数が増加している.
    そのため,その日常生活を見守り,歩行や着席・起立といった日常行動や転倒といった異常行動など様々な行動認識を行なうシステムへの関心が高まっている.
    また,高齢者の生活を見守るために,プライバシーに配慮したセンサが注目されている.
    本報告では,低解像度な赤外線センサアレイから得られる温度分布画像から行動認識を行なう手法を提案する.
    従来手法では,着席と起立のように動作の継続時間が近い行動を区別できないという問題があった.
    そこで,温度分布画像から背景差分により人体領域を抽出し,抽出された人体領域の軌跡・形状・温度に関する特徴を用いることで,それらの行動も認識できるようにする手法を提案する.

  272. 部位追跡を併用した車椅子利用者の検出に関する検討

    谷川 右京, 川西 康友, 出口 大輔, 井手 一郎, 村瀬 洋, 川合 諒, 関谷 俊一

    パターン認識・メディア理解研究会(PRMU)  2016年6月14日 

     詳細を見る

    開催年月日: 2016年

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:NTT武蔵野研究開発センタ  

    近年,車椅子利用者の自立を支援するため,監視カメラ映像を用いた車椅子利用者の自動検知への需要が高まっている.
    しかし,周囲に多数の歩行者が存在する混雑環境下では,車椅子利用者が歩行者によって遮蔽されるため,その検出は容易ではない.
    本報告では,遮蔽に頑健な車椅子利用者の検出手法の検討結果について報告する.
    提案手法では,検出器では車椅子利用者を検出できない場合に,部位間の位置関係と位置の変化に基づいた部位追跡を併用することで,部分的な遮蔽に頑健な車椅子利用者の位置推定を行なう.
    これにより,混雑環境における車椅子利用者の検出精度を向上させる.
    実験の結果,提案手法による車椅子利用者検出は,混雑環境において比較手法より高い精度が得られることを確認した.

  273. 深層学習を用いた多様体構築による3次元物体の姿勢推定に関する予備検討

    二宮 宏史, 川西