2025/04/02 更新

写真a

ムクノキ ダイチ
椋木 大地
MUKUNOKI Daichi
所属
情報基盤センター 情報基盤デザイン開発部門 助教
職名
助教
連絡先
メールアドレス
ホームページ
外部リンク

学位 3

  1. 博士(工学) ( 2013年11月   筑波大学 ) 

  2. 修士(工学) ( 2011年3月   筑波大学 ) 

  3. 学士(図書館情報学) ( 2009年3月   筑波大学 ) 

研究キーワード 7

  1. 高性能計算

  2. 自動チューニング

  3. 数値計算

  4. 再現可能な計算

  5. 並列計算

  6. GPUコンピューティング

  7. 高精度計算

研究分野 2

  1. 情報通信 / 高性能計算

  2. 情報通信 / 計算機システム

経歴 18

  1. 名古屋大学   情報基盤センター 情報基盤デザイン開発部門   助教

    2025年4月 - 現在

      詳細を見る

    国名:日本国

  2. 名古屋大学   情報基盤センター   特任助教

    2024年12月 - 2025年3月

      詳細を見る

    国名:日本国

    researchmap

  3. 芝浦工業大学   システム理工学部 数理科学科   臨時技術職員

    2024年4月 - 2024年10月

      詳細を見る

    国名:日本国

    researchmap

  4. 株式会社 ソニー・インタラクティブエンタテインメント   基盤システム・エクスペリエンス設計本部 G部門 2部 7課

    2023年11月 - 2024年2月

      詳細を見る

    国名:日本国

    researchmap

  5. 東京大学 情報基盤センター   客員研究員

    2021年11月 - 2023年3月

      詳細を見る

    国名:日本国

    researchmap

▼全件表示

学歴 4

  1. 筑波大学   システム情報工学研究科

    2011年4月 - 2013年11月

      詳細を見る

    国名: 日本国

    備考: 博士後期課程

    researchmap

  2. 筑波大学   システム情報工学研究科

    2009年4月 - 2011年3月

      詳細を見る

    国名: 日本国

    備考: 博士前期課程

    researchmap

  3. 筑波大学   図書館情報専門学群

    2006年4月 - 2009年3月

      詳細を見る

    国名: 日本国

    researchmap

  4. 岐阜工業高等専門学校   電子制御工学科

    2001年4月 - 2006年3月

      詳細を見る

    国名: 日本国

    researchmap

所属学協会 2

  1. 情報処理学会

    2008年 - 現在

      詳細を見る

  2. 自動チューニング研究会

      詳細を見る

委員歴 34

  1. The 15th International Conference on Parallel Processing & Applied Mathematics (PPAM 2024)   Program Committee Member  

    2024年   

      詳細を見る

  2. Mini Symposium: Exploring Arithmetic and Data Representation Beyond the Standard in HPC (at ICIAM 2023)   Mini-Symposium Organizer  

    2023年   

      詳細を見る

  3. The 24th IEEE International Workshop on Parallel and Distributed Scientific and Engineering Computing (PDSEC 2023) (in conjunction with IPDPS 2023)   Program Committee Member  

    2023年   

      詳細を見る

  4. 2023 IEEE 16th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC-2023)   Program Committee Member  

    2023年   

      詳細を見る

  5. Special Session: Performance Optimization and Auto-Tuning of Software on Multicore/Manycore Systems (POAT 2023) (in conjunction with MCSoC-2023)   Program Chair  

    2023年   

      詳細を見る

    団体区分:学協会

    researchmap

▼全件表示

受賞 9

  1. Best Paper Award

    2023年12月   6th IEEE International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC 2023)   Sparse Matrix-Vector Multiplication with Reduced-Precision Memory Accessor

    Daichi Mukunoki, Masatoshi Kawai, Toshiyuki Imamura

     詳細を見る

    受賞区分:国際学会・会議・シンポジウム等の賞 

    researchmap

  2. Research Poster Award 2nd Place Winner

    2022年6月   ISC High Performance 2022   A Fast Infinite Precision Inner Product using Ozaki Scheme and Dot2, and Its Application to Reproducible Conjugate Gradient Solvers

    Daichi Mukunoki, Katsuhisa Ozaki, Takeshi Ogita, Toshiyuki Imamura

     詳細を見る

  3. 2021年度理化学研究所桜舞賞

    2022年3月   理化学研究所   Precision-awareな数値演算手法の研究

     詳細を見る

  4. Research Poster Award

    2021年6月   ISC High Performance 2021   Accurate Matrix Multiplication on Binary128 using Ozaki Scheme

    Daichi Mukunoki, Katsuhisa Ozaki, Takeshi Ogita, Toshiyuki Imamura

     詳細を見る

  5. Best Research Poster Award

    2019年9月   Russian Supercomputing Days   Accurate and Reproducible Linear Algebra Operations for Many-core Architectures

    Daichi Mukunoki, Takeshi Ogita, Katsuhisa Ozaki

     詳細を見る

▼全件表示

 

論文 57

  1. Performance Evaluation of Loop Body Splitting for Fast Modal Filtering in SCALE-DG on A64FX 査読有り

    Xuanzhengbo Ren, Yuta Kawai, Hirofumi Tomita, Seiya Nishizawa, Takahiro Katagiri, Tetsuya Hoshino, Daichi Mukunoki, Masatoshi Kawai, Toru Nagai

    International Workshop on Arm-based HPC: Practice and Experience (IWAHPCE-2025)     2025年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

    researchmap

  2. Performance evaluation and modelling of single-precision matrix multiplication on Cerebras CS-2 査読有り

    Ryunosuke Matsuzaki, Daichi Mukunoki, Takaaki Miyajima

    SC24-W: Workshops of the International Conference for High Performance Computing, Networking, Storage and Analysis     頁: 727 - 731   2024年11月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE  

    DOI: 10.1109/scw63240.2024.00101

    researchmap

  3. Extension of accurate numerical algorithms for matrix multiplication based on error-free transformation 査読有り

    Katsuhisa Ozaki, Daichi Mukunoki, Takeshi Ogita

    Japan Journal of Industrial and Applied Mathematics   42 巻 ( 1 ) 頁: 1 - 20   2024年10月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Springer Science and Business Media LLC  

    DOI: 10.1007/s13160-024-00677-z

    researchmap

    その他リンク: https://link.springer.com/article/10.1007/s13160-024-00677-z/fulltext.html

  4. Reduced-Precision and Reduced-Exponent Formats for Accelerating Adaptive Precision Sparse Matrix–Vector Product 査読有り

    Stef Graillat, Fabienne Jézéquel, Theo Mary, Roméo Molina, Daichi Mukunoki

    Lecture Notes in Computer Science   14803 巻   頁: 17 - 30   2024年8月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer Nature Switzerland  

    DOI: 10.1007/978-3-031-69583-4_2

    researchmap

  5. Mixed-precision conjugate gradient algorithm using the groupwise update strategy 査読有り

    Kensuke Aihara, Katsuhisa Ozaki, Daichi Mukunoki

    Japan Journal of Industrial and Applied Mathematics     2024年2月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Springer Science and Business Media LLC  

    DOI: 10.1007/s13160-024-00644-8

    researchmap

    その他リンク: https://link.springer.com/article/10.1007/s13160-024-00644-8/fulltext.html

▼全件表示

科研費 6

  1. 次世代計算機のための高精度かつ精度検証可能な行列計算法の開発

    研究課題/研究課題番号:20KK0259  2022年4月 - 2023年10月

    日本学術振興会  科学研究費助成事業 国際共同研究加速基金(国際共同研究強化(A))  国際共同研究加速基金(国際共同研究強化(A))

    椋木 大地

      詳細を見る

    担当区分:研究代表者 

    配分額:9230000円 ( 直接経費:7100000円 、 間接経費:2130000円 )

    researchmap

  2. 超並列計算環境のための高精度かつ再現性のある行列計算ライブラリの開発

    研究課題/研究課題番号:19K20286  2019年4月 - 2022年3月

    日本学術振興会  科学研究費助成事業 若手研究  若手研究

    椋木 大地

      詳細を見る

    本研究の目的は数値計算における計算の高精度化および再現性の保証を実現し,かつ最先端の超並列計算機アーキテクチャにおいて高性能を実現できるBLASライブラリの開発を行うことである.本研究では4つの手法:(1)尾崎スキーム,(2)ExBLASスキーム,(3)DotKスキーム,(4)CADNAスキームに着目し,このうち(1)を主たる手法として検討する.
    2019年度は主として(1)(4)に関する進捗が得られた.(1)に関してはCPU・GPU向けのBLASの基本ルーチンを開発し,オープンソースソフトウェアとして公開した.またこれらに関する査読付き論文を国際学会(PPAM2019)において発表した.さらにその応用として,疎行列反復解法(CG法)への適用,FP16の活用に関する研究を前倒しして実施した(これらは当初2021年度の実施を予定していた).このうち後者については,FP16/32の混合精度ハードウェアであるTensor Coresを活用して高速に高精度・再現性のある実装を行う方法を開発し,査読付き論文が国際学会(ISC2020)に採択された.また(4)CADNAスキームについては,その開発元であり共同研究を進めているソルボンヌ大学側で新しい手法が考案され,共著者として参加した論文を国際学会に投稿した(プレプリント公開済み,現在査読中).
    一方,計算結果の精度を担保しながら数値計算に用いられる演算精度を最適化して計算の高速化,省電力化を実現する方法の研究を開始した.本科研費課題で取り組む上記(1)-(4)の手法はその要素技術となりうるため,本研究の応用として位置付けられる.これに関しては本年度は国際会議(SC19)での査読付きポスター発表を行った.

    researchmap

  3. 高性能・省電力な計算のための短尺浮動小数点表現の検討

    研究課題/研究課題番号:16K16062  2016年4月 - 2019年3月

    日本学術振興会  科学研究費助成事業 若手研究(B)  若手研究(B)

    椋木 大地

      詳細を見る

    本研究では数値計算において広く用いられている32/64ビットのIEEE浮動小数点フォーマットに対して,ビット長が短い短尺フォーマットを導入することにより,計算の高速化と省電力化が可能であるかを検討した.ソフトウェアによる軽量な実装方法を検討するとともに,主にGPUをターゲットとして,数値計算に用いられる基本的な線形計算カーネルで性能がデータアクセス律速となるものにおいて,計算速度と電力性能の両面での有効性を示した.

    researchmap

  4. GPUスパコンのための3倍・4倍精度線形演算ライブラリの開発に関する研究

    研究課題/研究課題番号:13J01290  2013年4月 - 2015年3月

    日本学術振興会  科学研究費助成事業 特別研究員奨励費  特別研究員奨励費

    椋木 大地

      詳細を見る

    本研究の目的は,GPUスパコンにおける3倍・4倍精度演算の実用化を目的として,GPUにおける高性能な3倍・4倍精度線形計算ライブラリの実現に向けた基礎研究を行うことであった.本年度は主として,GPUにおける複数の演算精度に対応した線形計算ライブラリの効率的な実装手法に関する研究を行った,その結果として,複数のNVIDIA GPUアーキテクチャに対応した高速な行列ベクトル積ルーチン(GEMV)の実装手法を開発した.本実装ではGPUにおけるプログラムの実行メカニズムをモデル化し,実行効率が最大となるようなスレッドブロックサイズを自動的に決定するオンライン自動チューニングを採用する.これにより既存の実装と比べ,実行環境や問題サイズに依存して生じる性能の変動を防ぎ,常に高い性能を維持できる.本手法は,ある線形計算を行うプログラム(例えばBLASルーチンなど)において演算精度が異なる複数バージョンを実装・最適化する上で有効であると考えられる.またこの他に,4倍精度演算手法の応用として,倍精度演算性能が単精度演算性能の1/32であるNVIDIA社の最新GPUにおいて,ソフトウェアエミュレーションによる疑似倍精度演算を実装し,倍精度行列積ルーチン(DGEMM)においてハードウェア処理による実装を上回る性能が得られることを示した.本年度に開発したGPU向けソフトウェアの一部は,オープンソースのライブラリとしてウェブ上で公開しており,今後も開発を継続する予定である.

    researchmap

  5. エクサ時代の非同期タスクを応用した高性能高次元数値線形代数の研究

    研究課題/研究課題番号:19H04127  2019年4月 - 2022年3月

    日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

    今村 俊幸, 工藤 周平, 廣田 悠輔, 鈴木 智博, 椋木 大地, 鈴木 厚

      詳細を見る

    担当区分:研究分担者 

    本年度は、研究計画の初年度として本基盤研究が目指す数値計算アルゴリズム由来の難スケジューリングについて調査とプロトタイプ実装による効果と問題点の絞りだしを行った。問題点は今後整理し、スケジューラプロトタイプの主要機能として実装を進める。数値計算アルゴリズム由来のスケジューリング調査について、まず、バッチスケジュール方式を中心とした、内部での細粒度パイプライン処理方式の開発と実問題でのテストを行い、スケジューリング方式の予備調査として中間結果を国際会議に発表している(高次FFTと粗密混合精度行列計算)。非同期ならびに優先度付きスケジューリングについては、本研究の中核をなす新規提案であり十分な予備調査と試験実装が行われた。特に, 既存言語であるOpenMPのtask構文とpriority句などの優先順位付けのアルゴリズムと我々が所望する数値アルゴリズムとの整合性(機能実現性・親和性・表現能力も含めて)研究を実施し国内外の研究会で報告をしている。行列分解アルゴリズムをCPU/GPUハイブリッド環境上に実装し、同実装においてpriority句によるタスクの優先順位付けにより、並列実行可能なタスクを部分的に増加できることが分かったが、その効果はさほど大きくないなどの結果を得ている。既存スケジューラの機能調査として, INRIAが開発をしているStarPUを調査し、 その内部機能や基本性能を確認した。実情は我々がDissectionで構成しているタスクスケジューラよりもオーバーヘッドが大きく定量的に20~30%の性能低下が見込まれれた. さらに既存スケジューラで活用されているDAGの表現能力についても調査し, LDU分解の限られた範囲であるが数値計算アルゴリズムにDAGの記述能力が問題にならないなど、次年度に展開する良好な調査結果を得ることができた。

    researchmap

▼全件表示

 

担当経験のある科目 (本学以外) 1

  1. 情報処理技法(リテラシ)II

    2018年9月 - 2019年1月 東京女子大学)

     詳細を見る