2021/10/26 更新

写真a

オオシマ サトシ
大島 聡史
OHSHIMA Satoshi
所属
情報基盤センター 大規模計算支援環境研究部門 准教授
大学院担当
大学院情報学研究科
職名
准教授
外部リンク

学位 3

  1. 博士(工学) ( 2009年3月   電気通信大学 ) 

  2. 修士(工学) ( 2006年3月   電気通信大学 ) 

  3. 学士(工学) ( 2004年3月   電気通信大学 ) 

研究キーワード 5

  1. 高性能計算

  2. プログラミング環境

  3. 並列計算

  4. 数値計算

  5. ソフトウェア自動チューニング

研究分野 5

  1. 情報通信 / 高性能計算

  2. 情報通信 / ソフトウェア

  3. 情報通信 / 計算機システム

  4. その他 / その他  / ソフトウェア自動チューニング

  5. 情報通信 / 計算科学

現在の研究課題とSDGs 3

  1. 高性能計算ハードウェアに適した計算アルゴリズムと実装に関する研究

  2. スーパーコンピュータを用いた機械学習とその応用に関する研究

  3. ハードウェアレイトレーシング機能を持つGPUを汎用演算に活用する研究

経歴 4

  1. 名古屋大学   情報基盤センター   准教授

    2019年7月 - 現在

      詳細を見る

    国名:日本国

  2. 九州大学   情報基盤研究開発センター   助教

    2017年4月 - 2019年6月

      詳細を見る

    国名:日本国

  3. 東京大学   情報基盤センター   助教

    2009年10月 - 2017年3月

      詳細を見る

    国名:日本国

  4. 電気通信大学   情報システム学研究科   研究員

    2009年4月 - 2009年9月

      詳細を見る

    国名:日本国

学歴 3

  1. 電気通信大学   情報システム学研究科   情報ネットワーク学専攻

    2006年4月 - 2009年3月

  2. 電気通信大学   情報システム学研究科   情報ネットワーク学専攻

    2004年4月 - 2006年3月

  3. 電気通信大学   電気通信大学   電機通信学部

    2000年4月 - 2004年3月

所属学協会 7

  1. 情報処理学会

    2004年1月 - 現在

  2. オープンCAE学会

    2010年7月 - 現在

  3. Society for Industrial and Applied Mathematics (SIAM)

    2010年5月 - 現在

  4. Association for Computing Machinery (ACM)

    2010年5月 - 現在

  5. 日本応用数理学会

    2010年4月 - 現在

  6. 自動チューニング研究会

    2010年3月 - 現在

  7. GPUコンピューティング研究会

    2009年9月 - 現在

▼全件表示

委員歴 6

  1. 文部科学省研究振興局 HPCI計画推進委員会   将来のHPCIの在り方に関する検討ワーキンググループ委員  

    2017年6月 - 2019年6月   

      詳細を見る

    団体区分:政府

  2. 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会   幹事  

    2017年4月 - 2021年3月   

      詳細を見る

    団体区分:学協会

  3. 情報処理学会 HPC研究会   運営委員  

    2016年4月 - 2020年3月   

  4. 自動チューニング研究会   運営委員会・総務  

    2015年5月 - 2019年5月   

      詳細を見る

    団体区分:学協会

  5. 日本応用数理学会「行列・固有値問題の解法とその応用」研究部会   運営委員  

    2013年4月 - 現在   

      詳細を見る

    団体区分:学協会

  6. オープンCAE学会   理事  

    2011年5月 - 現在   

      詳細を見る

    団体区分:学協会

▼全件表示

 

論文 56

  1. An Auto-tuning with Adaptation of A64 Scalable Vector Extension for SPIRAL

    Kitai Naruya, Takahashi Daisuke, Franchetti Franz, Katagiri Takahiro, Ohshima Satoshi, Nagai Toru

    2021 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW)     頁: 789 - 797   2021年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)   出版者・発行元:2021 IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2021 - In conjunction with IEEE IPDPS 2021  

    In this paper, we propose an auto-tuning (AT) system by adapting the A64 Scalable Vector Extension for SPIRAL to generate discrete Fourier transform (DFT) implementations. The performance of our method is evaluated using the Supercomputer "Flow"at Nagoya University. The A64 scalable vector extension applied DFT codes are up to 1.98 times faster than scalar DFT codes and up to 3.63 times higher in terms of the SIMD instruction rate. In addition, we obtain a factor of maximum speedup 2.32 by adapting proposed AT system for loop unrolling.

    DOI: 10.1109/IPDPSW52791.2021.00117

    Web of Science

    Scopus

  2. Parallelization of GKV benchmark using OpenACC

    Morishita Makoto, Ohshima Satoshi, Katagiri Takahiro, Nagai Toru

    2021 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW)     頁: 723 - 729   2021年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)   出版者・発行元:2021 IEEE International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2021 - In conjunction with IEEE IPDPS 2021  

    The computing power of the Graphics Processing Unit (GPU) has received great attention in recent years, as 140 supercomputers with NVIDIA GPUs were ranked in the TOP500 for November 2020 [1]. However, CUDA, which is widely used in GPU programming, needs to be written at a low level and often requires the specialized knowledge of the GPU memory hierarchy and execution models. In this study, we used OpenACC [2], which semi-automatically generates kernel code by inserting directives into a program to speed up the application. The target application was benchmark program based on the plasma turbulence analysis code, gyrokinetic Vlasov code (GKV). With our implementation of OpenACC, kernel2, kernel3, and kernel4 of the benchmark were 31.43, 7.08, and 10.74 times faster, respectively, compared to CPU sequential execution. Thus, we succeeded in increasing the applications' speed. In the future, we will port the rest of the code to the GPU environment to run the entire GKV on GPUs.

    DOI: 10.1109/IPDPSW52791.2021.00109

    Web of Science

    Scopus

  3. スーパーコンピュータ「不老」の性能評価

    大島聡史, 永井亨, 片桐孝洋

    情報処理学会 研究報告(HPC-175)   2020 巻 ( HPC-175 ) 頁: 1 - 10   2020年7月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  4. Performance evaluation of the MODYLAS application on modern multi-core and many-core environments 査読有り 国際誌

    Ohshima Satoshi, Suzuki Soichiro, Sakashita Tatsuya, Ogino Masao, Katagiri Takahiro, Andoh Yoshimichi

    2019 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW)     頁: 787 - 796   2019年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Proceedings - 2019 IEEE 33rd International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2019  

    Molecular dynamics (MD) simulations are an essential tool for various fields of science. To broaden the range of applications of MD simulations, faster and more large-scale simulations that achieve the same accuracy are required. Authors have developed an MD application named MODYLAS over several years. In our previous work, we focused on the pairwise additive calculation of potentials and forces, which is one of the hot spots in MD simulations. We have proposed new thread-level algorithms and evaluated the performance using the FX100 supercomputer system. In this study, we measure the performance of the above algorithms on Skylake-SP and Knights Landing processors and compare the results with FX100. Using the obtained results, we discuss the application performance on this hardware and the potential performance improvement by using the auto-tuning technique.

    DOI: 10.1109/IPDPSW.2019.00129

    Web of Science

    Scopus

  5. Amplifyを用いたCMOSアニーリングマシンの特性の分析

    森下誠, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 研究報告(HPC-181)     2021年9月

  6. 高精度行列-行列積ライブラリの実装選択パラメタの特徴量解析

    片桐孝洋, 青木将太, 大島聡史, 永井亨

    日本応用数理学会2021年年会     2021年9月

  7. プログラム上の箇所指定による演算精度を考慮した自動チューニング方式

    山梨祥平, 八代尚, 片桐孝洋, 永井亨, 大島聡史

    第26回計算工学講演会     2021年5月

  8. Ampere Altraの性能評価

    大島聡史, 永井亨, 片桐孝洋

    情報処理学会 研究報告(HPC-179)     2021年5月

  9. 量子アニーリングマシンにおける組み合わせ最適化問題の適用可能性の調査

    大山基樹, 森下誠, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 第83回全国大会     頁: 1 - 2   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  10. 高精度行列-行列積における疎行列演算実装選択の自動チューニングの検討

    青木将太, 片桐孝洋, 大島聡史, 永井亨

    情報処理学会 第83回全国大会     頁: 1 - 2   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  11. マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(2)

    藤家空太郎, 多部田敏樹, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 第83回全国大会     頁: 1 - 2   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  12. マルチGPU環境における機械学習ハイパーパラメータの自動チューニング(1)

    多部田敏樹, 藤家空太郎, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 第83回全国大会     頁: 1 - 2   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  13. RTコアによるハードウェアレイトレーシングの性能評価

    枦木慎也, 大島聡史, 片桐孝洋, 永井亨

    情報処理学会 第83回全国大会     頁: 1 - 2   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  14. GPUクラスタを用いて並列化した自動チューニングの機械学習プログラムへの適用と安定性の検証

    藤家空太郎, 多部田敏樹, 藤井昭宏, 田中輝雄, 加藤由花, 大島聡史, 片桐孝洋

    情報処理学会 研究報告(HPC-178)     頁: 1 - 8   2021年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  15. Adaptation of A64 Scalable Vector Extension for Spiral 招待有り 査読有り 国際共著

    Naruya Kitai, Daisuke Takahasi, Franz Franchetti, Takahiro Katagiri, Satoshi Ohshima, Toru Nagai

    情報処理学会 研究報告(HPC-178)     頁: 1 - 6   2021年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  16. Adaptation of A64 Scalable Vector Extension for Spiral 国際共著

    Naruya Kitai, Daisuke Takahasi, Franz Franchetti, Takahiro Katagiri, Satoshi Ohshima, Toru Nagai

    情報処理学会 研究報告(HPC-178)     頁: 1 - 6   2021年3月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  17. スーパーコンピュータ「不老」のシステム構成と性能

    大島聡史, 永井亨, 片桐孝洋

    大学ICT推進協議会 2020年度 年次大会     頁: 1 - 8   2020年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  18. スーパーコンピュータ「不老」における光ディスクライブラリを用いたコールドストレージシステムの構築

    高橋一郎, 大島聡史, 片桐孝洋

    大学ICT推進協議会 2020年度 年次大会     頁: 1 - 6   2020年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  19. スーパーコンピュータ「不老」のサービスとエコシステム

    田島嘉則, 山田一成, 高橋一郎, 毛利晃大, 片桐孝洋, 大島聡史, 永井亨

    大学ICT推進協議会 2020年度 年次大会     頁: 1 - 4   2020年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  20. スーパーコンピュータ「不老」におけるOpenFOAMの性能評価

    大島聡史, 今野雅

    オープンCAE・FrontISTR合同シンポジウム2020     頁: 1 - 10   2020年12月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  21. カスタムキャビテーションモデルを用いたNACA0015水中翼周りの数値解析

    池田拓士, 秋山善克, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020     頁: 1 - 2   2020年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:オープンCAE学会  

  22. OpenFOAMへのカスタムキャビテーションモデルの実装

    秋山善克, 池田拓士, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020     頁: 1 - 3   2020年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:オープンCAE学会  

  23. LNGタンク内の異密度LNGの混合流動解析

    田村守淑, 今野雅, 大島聡史

    オープンCAE・FrontISTR合同シンポジウム2020     頁: 1 - 7   2020年12月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:オープンCAE学会  

  24. Performance Evaluation of Accurate Matrix-Matrix Multiplication on GPU Using Sparse Matrix Multiplications 査読有り 国際誌

    Ishiguro F., Katagiri T., Ohshima S., Nagai T.

    Proceedings - 2020 8th International Symposium on Computing and Networking Workshops, CANDARW 2020     頁: 178 - 184   2020年11月

     詳細を見る

    担当区分:責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Proceedings - 2020 8th International Symposium on Computing and Networking Workshops, CANDARW 2020  

    Basic Linear Algebra Subprograms (BLAS) is a frequently used numerical library for linear algebra computations. However, it places little emphasis on computational accuracy, especially with respect to the accuracy assurance of the results. Consequently, a high-precision matrix-matrix multiplications algorithm that assures the precision by double precision operation is proposed. In this study, we proposed to calculate sub-matrix computations generated by accurate matrix-matrix multiplication on GPU. We contribute the following two points: (1) We evaluate the performance of sparse matrix - dense matrix multiplication (SpMM) using sparse matrix - vector multiplications on GPU with the property of allowing dense matrices to be transformed into sparse matrices during the accurate matrix - matrix multiplication algorithm; (2) We evaluate above SpMM using sparse matrix - sparse matrix multiplications (SpMxSpM) on GPU. Results on the Reedbush-H supercomputer system at The University of Tokyo indicate that (1) The implementation of SpMM in the CRS format achieves a 3.24-times speedup on GPU compared with a CPU and (2) The implementation of SpMxSpM achieves a 8.44-times speedup compared with SpMM.

    DOI: 10.1109/CANDARW51189.2020.00044

    Scopus

  25. 自動チューニング言語ppOpen-ATによる混合精度演算の最適化機能について

    片桐孝洋, 山梨祥平, 八代尚, 大島聡史, 永井亨

    日本応用数理学会 2020年 年会   2020 巻   頁: 66 - 67   2020年9月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  26. Parareal法における低精度演算・混合精度演算の活用

    大島聡史, 飯塚幹夫, 小野謙二

    日本応用数理学会 2020年 年会   2020 巻   頁: 64 - 65   2020年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  27. 名古屋大学スーパーコンピュータ「不老」における医用画像処理

    大島聡史, 小田昌宏, 片桐孝洋, 森健策

    電子情報通信学会 技報 MI2020-32(2020-09)   120 巻 ( 156(MI2020 17-32) ) 頁: 69 - 74   2020年9月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  28. 医用画像処理におけるLDDMMのマルチGPU高速化

    杉浦拓未, 大島聡史, 片桐孝洋, 横田達也, 本谷秀堅, 永井亨

    情報処理学会 研究報告(HPC-175)   2020 巻 ( HPC-175 ) 頁: 1 - 7   2020年7月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:情報処理学会  

    J-GLOBAL

  29. Parareal法における低精度計算・混合精度計算の活用について

    大島聡史, 飯塚幹夫, 小野謙二

    第25回計算工学講演会   25 巻   頁: 1 - 2   2020年6月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  30. Scalable Direct-Iterative Hybrid Solver for Sparse Matrices on Multi-Core and Vector Architectures 査読有り 国際誌

    Ono Kenji, Kato Toshihiro, Ohshima Satoshi, Nanri Takeshi

    PROCEEDINGS OF INTERNATIONAL CONFERENCE ON HIGH PERFORMANCE COMPUTING IN ASIA-PACIFIC REGION (HPC ASIA 2020)     頁: 11 - 21   2020年1月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:ACM International Conference Proceeding Series  

    In the present paper, we propose an efficient direct-iterative hybrid solver for sparse matrices that can derive the scalability of the latest multi-core, many-core, and vector architectures and examine the execution performance of the proposed SLOR-PCR method. We also present an efficient implementation of the PCR algorithm for SIMD and vector architectures so that it is easy to output instructions optimized by the compiler. The proposed hybrid method has high cache reusability, which is favorable for modern low B/F architecture because efficient use of the cache can mitigate the memory bandwidth limitation. The measured performance revealed that the SLOR-PCR solver showed excellent scalability up to 352 cores on the cc-NUMA environment, and the achieved performance was higher than that of the conventional Jacobi and Red-Black ordering method by a factor of 3.6 to 8.3 on the SIMD architecture. In addition, the maximum speedup in computation time was observed to be a factor of 6.3 on the cc-NUMA architecture with 352 cores.

    DOI: 10.1145/3368474.3368484

    Web of Science

    Scopus

  31. Performance evaluation of the MODYLAS application on modern multi-core and many-core environments 査読有り 国際誌

    Satoshi Ohshima, Soichiro Suzuki, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Yoshimichi Andoh

    IPDPSW2019     2019年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  32. Optimization of Numerous Small Dense-Matrix-Vector Multiplications in H-matrix Arithmetic on GPU 査読有り 国際共著 国際誌

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    2019 IEEE 13th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC)     頁: 9 - 16   2019年

     詳細を見る

    担当区分:筆頭著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  33. GPUによる階層型行列計算法の高速化に向けた多数の小密行列ベクトル積計算の最適化 国際共著

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    日本応用数理学会年会講演予稿集(CD-ROM)   2019 巻   頁: 180‐181   2019年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  34. 3次元医用画像データの再構成処理の並列化

    中島大地, 大島聡史, 五嶋優詞, 横田達也, 片桐孝洋, 本谷秀堅, 永井亨, 岩本千佳, 大内田研宙, 橋爪誠

    情報処理学会研究報告(Web)   2019 巻 ( HPC-172 ) 頁: 1 - 7   2019年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  35. Optimization of Numerous Small Dense-Matrix-Vector Multiplications in H-matrix Arithmetic on GPU 査読有り

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    2019 IEEE 13th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC)     頁: 9-16   2019年

     詳細を見る

    記述言語:英語  

    DOI: 10.1109/MCSoC.2019.00009

  36. A thread-level parallelization of pairwise additive potential and force calculations suitable for current many-core architectures 査読有り 国際誌

    Andoh Yoshimichi, Suzuki Soichiro, Ohshima Satoshi, Sakashita Tatsuya, Ogino Masao, Katagiri Takahiro, Yoshii Noriyuki, Okazaki Susumu

    JOURNAL OF SUPERCOMPUTING   74 巻 ( 6 ) 頁: 2449 - 2469   2018年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(学術雑誌)   出版者・発行元:Journal of Supercomputing  

    In molecular dynamics (MD) simulations, calculations of potentials and their derivatives by coordinate, i.e., forces, in a pairwise additive manner such as the Lennard–Jones interactions and a short-range part of the Coulombic interactions form the main part of arithmetic operations. It is essential to achieve high thread-level parallelization efficiency of these pairwise additive calculations of potentials and forces to use current supercomputers with many-core architectures effectively. In this paper, we propose four new thread-level parallelization algorithms for the pairwise additive potential and force calculations. We implement the four codes in a MD calculation code based on the fast multipole method. Performance benchmarks were taken on the FX100 supercomputer and Intel Xeon Phi coprocessor. The code succeeds in achieving high thread-level parallelization efficiency with 32 threads on the FX100 and up to 60 threads on the Xeon Phi.

    DOI: 10.1007/s11227-018-2272-2

    Web of Science

    Scopus

  37. 高精度行列-行列積アルゴリズムにおけるBatched BLASの適用

    石黒史也, 片桐孝洋, 大島聡史, 永井亨, 荻野正雄

    情報処理学会全国大会講演論文集   80th 巻 ( 1 ) 頁: 1.49‐1.50   2018年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  38. 階層型行列計算におけるソフトウェア自動チューニング 国際共著

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    計算工学講演会論文集(CD-ROM)   23 巻   頁: ROMBUNNO.D‐05‐03   2018年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(大学,研究機関等紀要)  

    J-GLOBAL

  39. 高精度行列-行列積のためのBatched BLASおよび疎行列演算を用いた実装方式のGPU環境での性能評価

    石黒史也, 片桐孝洋, 大島聡史, 永井亨, 荻野正雄

    日本応用数理学会年会講演予稿集(CD-ROM)   2018 巻   頁: 147‐148   2018年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  40. マルチコア・メニーコア計算機環境におけるChebyshev基底通信削減CG法の性能評価

    大島聡史, 藤井昭宏, 田中輝雄, 深谷猛, 須田礼仁

    日本応用数理学会年会講演予稿集(CD-ROM)   2018 巻   頁: 471‐472   2018年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  41. Performance of Hierarchical-matrix BiCGStab Solver on GPU Clusters. 査読有り 国際共著 国際誌

    Ichitaro Yamazaki, Ahmad Abdelfattah, Akihiro Ida, Satoshi Ohshima, Stanimire Tomov, Rio Yokota, Jack J. Dongarra

    2018 IEEE International Parallel and Distributed Processing Symposium, IPDPS 2018, Vancouver, BC, Canada, May 21-25, 2018     頁: 930 - 939   2018年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:IEEE Computer Society  

    DOI: 10.1109/IPDPS.2018.00102

  42. Optimization of hierarchical matrix computation on GPU 査読有り 国際共著 国際誌

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)   10776 巻   頁: 274 - 292   2018年

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Springer Verlag  

    The demand for dense matrix computation in large scale and complex simulations is increasing
    however, the memory capacity of current computer system is insufficient for such simulations. Hierarchical matrix method (H -matrices) is attracting attention as a computational method that can reduce the memory requirements of dense matrix computations. However, the computation of H -matrices is more complex than that of dense and sparse matrices
    thus, accelerating the H -matrices is required. We focus on H -matrix - vector multiplication (HMVM) on a single NVIDIA Tesla P100 GPU. We implement five GPU kernels and compare execution times among various processors (the Broadwell-EP, Skylake-SP, and Knights Landing) by OpenMP. The results show that, although an HMVM kernel can compute many small GEMV kernels, merging such kernels to a single GPU kernel was the most effective implementation. Moreover, the performance of BATCHED BLAS in the MAGMA library was comparable to that of the manually tuned GPU kernel.

    DOI: 10.1007/978-3-319-69953-0_16

    Scopus

  43. Mellanox社のスイッチ装置への集団通信オフロード機能による集団通信隠蔽効果の調査

    南里豪志, 大島聡史, 小野謙二

    情報処理学会研究報告(Web)   2018 巻 ( HPC-165 ) 頁: Vol.2018‐HPC‐165,No.12,1‐10 (WEB ONLY)   2018年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  44. GPGPUによる高精度行列-行列積アルゴリズムのためのBatched BLASを用いた実装方式の提案

    石黒史也, 片桐孝洋, 大島聡史, 永井亨, 荻野正雄

    情報処理学会研究報告(Web)   2018 巻 ( HPC-165 ) 頁: Vol.2018‐HPC‐165,No.32,1‐8 (WEB ONLY)   2018年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    J-GLOBAL

  45. 512bit SIMD環境における分子動力学アプリケーションMODYLASの性能評価

    大島聡史, 鈴木惣一朗, 坂下逹哉, 荻野正雄, 片桐孝洋, 安藤嘉倫

    情報処理学会研究報告(Web)   2018 巻 ( HPC-166 ) 頁: Vol.2018‐HPC‐166,No.14,1‐9 (WEB ONLY)   2018年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    J-GLOBAL

  46. Chebyshev基底通信削減CG法のマルチコア・メニーコア計算環境における性能評価

    大島聡史, 藤井昭宏, 田中輝雄, 深谷猛, 須田礼仁

    情報処理学会研究報告(Web)   2018 巻 ( HPC-165 ) 頁: Vol.2018‐HPC‐165,No.17,1‐9 (WEB ONLY)   2018年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(学術雑誌)  

    J-GLOBAL

  47. GPUクラスタ上における階層型行列計算の最適化 国際共著

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    情報処理学会研究報告(Web)   2017 巻 ( HPC-160 ) 頁: Vol.2017‐HPC‐160,No.14,1‐8 (WEB ONLY)   2017年7月

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  48. Auto-Tuning on NUMA and Many-Core Environments with an FDM Code 査読有り 国際誌

    Katagiri Takahiro, Ohshima Satoshi, Matsumoto Masaharu

    2017 IEEE INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS (IPDPSW)     頁: 1399 - 1407   2017年6月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)   出版者・発行元:Proceedings - 2017 IEEE 31st International Parallel and Distributed Processing Symposium Workshops, IPDPSW 2017  

    In this paper, we focus on auto-tuning (AT) performance on nonuniform memory access (NUMA) and many-core architectures. Code from the finite difference method (FDM) is selected to evaluate AT performance, and results on the Xeon Phi (Knights Landing, KNL) for four kinds of memory (FLAT and CACHE) and cluster modes (QUADRANT and SNC4) yielded the following findings: (1) The KNL memory mode did not affectoverall performance, except FLAT-SNC4. The difference ofexecution time for the CACHE mode to the FLAT mode was only 0.99%. (2) Hyper-threading (HT) technology worked well, and yielded 1.86x (baseline) and 1.50x (with AT). (3) Varying hybrid MPI/OpenMP execution was very effective for KNL. Themaximum factors of speedups were 2.16x in the baseline and2.91x with AT. (4) AT with code selection persisted as a powerful tool, even in KNL. We obtained speedups by AT for a maximum of 1.64x. Moreover, we had room to speedup by a further 1.31x by adapting AT for the fastest execution.

    DOI: 10.1109/IPDPSW.2017.27

    Web of Science

    Scopus

  49. ポストムーア時代における有限差分法コードの自動チューニング技法の一考察

    片桐 孝洋, 大島 聡史, 松本 正晴

    計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science   22 巻   頁: ROMBUNNO.C‐01‐1   2017年5月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)   出版者・発行元:日本計算工学会  

    CiNii Article

    J-GLOBAL

  50. GPU搭載スーパーコンピュータReedbush‐Hの性能評価

    塙敏博, 星野哲也, 中島研吾, 大島聡史, 伊田明弘

    情報処理学会研究報告(Web)   2017 巻 ( HPC-159 ) 頁: Vol.2017‐HPC‐159,No.9,1‐6 (WEB ONLY)   2017年4月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  51. Xeon Phi+OmniPath環境におけるOpenMP,MPI性能最適化

    塙敏博, 星野哲也, 中島研吾, 大島聡史, 伊田明弘

    情報処理学会研究報告(Web)   2017 巻 ( HPC-158 ) 頁: Vol.2017‐HPC‐158,No.21,1‐8 (WEB ONLY)   2017年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  52. OpenACCを用いたICCG法ソルバーのPascal GPUにおける性能評価

    星野哲也, 大島聡史, 塙敏博, 中島研吾, 伊田明宏

    情報処理学会研究報告(Web)   2017 巻 ( HPC-158 ) 頁: Vol.2017‐HPC‐158,No.18,1‐9 (WEB ONLY)   2017年3月

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  53. 非ブロッキング集団通信の通信隠蔽効果に関する調査

    南里豪志, 大島聡史, 小野謙二

    情報処理学会研究報告(Web)   2017 巻 ( HPC-162 ) 頁: Vol.2017‐HPC‐162,No.17,1‐11 (WEB ONLY)   2017年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  54. 階層型行列計算のGPU向け最適化 国際共著

    大島聡史, 山崎市太郎, 伊田明弘, 横田理央

    日本応用数理学会年会講演予稿集(CD-ROM)   2017 巻   頁: 151‐152   2017年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  55. スーパーコンピュータシステムITOの性能評価

    大島聡史, 南里豪志, 渡部善隆, 天野浩文, 小野謙二

    情報処理学会研究報告(Web)   2017 巻 ( HPC-162 ) 頁: Vol.2017‐HPC‐162,No.7,1‐9 (WEB ONLY)   2017年

     詳細を見る

    担当区分:筆頭著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

  56. スーパーコンピュータ上でのDeep Learning学習環境の初期構築

    野村行弘, 佐藤一誠, 佐藤一誠, 佐藤一誠, 塙敏博, 花岡昇平, 中尾貴祐, 竹永智美, 佐藤大介, 星野哲也, 関谷勇司, 大島聡史, 林直人, 阿部修

    電子情報通信学会技術研究報告   117 巻 ( 281(MI2017 47-62) ) 頁: 1‐2   2017年

     詳細を見る

    記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

    J-GLOBAL

▼全件表示

MISC 1

  1. 3.基礎物理シミュレーション研究と可視化技術の進展 3.2 可視化技術

    大谷寛明, 大谷寛明, 石黒静児, 石黒静児, 宮澤順一, 宮澤順一, 大野暢亮, 陰山聡, 三浦英昭, 森高外征雄, 森高外征雄, 田村祐一, 北澤修太, 片桐孝洋, 大島聡史, 永井亨, 沼波政倫, 沼波政倫, 名倉成輝, 川原慎太郎, HU Kunqi, 小山田耕二, 後藤拓也, 嘉無木昇, 高丸尚教, PETROSKY Tomio, 田中智  

    プラズマ・核融合学会誌96 巻 ( 10 )   2020年

     詳細を見る

    掲載種別:記事・総説・解説・論説等(学術雑誌)  

    J-GLOBAL

講演・口頭発表等 14

  1. Ampere Altraと各種HPC向けCPUとの性能比較

    大島聡史

    Arm HPCプラットフォーム・ワークショップ  2021年8月26日 

     詳細を見る

    開催年月日: 2021年8月

    会議種別:口頭発表(一般)  

    開催地:オンライン  

  2. ArmベースプロセッサのHPCおよびサーバー戦略と期待

    大島聡史

    Arm HPCプラットフォーム・ワークショップ  2021年8月26日 

     詳細を見る

    開催年月日: 2021年8月

    会議種別:シンポジウム・ワークショップ パネル(指名)  

    開催地:オンライン  

  3. Effectiveness of Low-/Mixed-Precision Computation on Parareal Method 国際会議

    Satoshi Ohshima

    ATAT in HPSC 2021 (2021 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing)  2021年3月19日 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:英語   会議種別:口頭発表(一般)  

  4. パネルディスカッション「スーパーコンピュータの産業利用と今後の産学共創のあり方」(パネリスト)

    大島聡史

    Cyber HPC Symposium 2021  2021年3月16日 

     詳細を見る

    開催年月日: 2021年3月

    記述言語:日本語   会議種別:シンポジウム・ワークショップ パネル(指名)  

    開催地:オンライン  

  5. ジャイロ運動論シミュレーションにおける位相空間上の分布関数構造の可視化および自動類似度判定システムの開発に向けて

    北澤修太, 沼波政倫, 大谷寛明, 片桐孝洋, 大島聡史, 永井亨

    先進的描画技術を用いた可視化情報の研究会(VR2020)  2020年12月18日 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

  6. ジャイロ運動論シミュレーションにおける位相空間上の分布関数構造の可視化と類似度判定

    北澤修太, 沼波政倫, 大谷寛明, 片桐孝洋, 大島聡史, 永井亨

    閉じ込め・輸送研究会2020  2020年12月10日 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

  7. Large-scale numerical simulation of fluid-rigid body interactions simulation based on a stabilized ISPH method with Chebyshev basis CG solver 国際会議

    Bowen Liu, Masao Ogino, Mitsuteru Asai, Takahiro Katagiri, Satoshi Ohshima

    COMPSAFE 2020  2020年12月8日 

     詳細を見る

    開催年月日: 2020年12月

    記述言語:英語   会議種別:口頭発表(一般)  

  8. GPUが支えるDX 変革の今、この先を考える- GPUスパコンとOpenACC ー(パネリスト)

    大島聡史

    GPU Computing Workshop 2020  2020年11月26日 

     詳細を見る

    開催年月日: 2020年11月

    記述言語:英語   会議種別:シンポジウム・ワークショップ パネル(指名)  

  9. ユーザプログラム利用状況の紹介

    大島聡史

    第1回 スーパーコンピュータ「不老」 ユーザ会  2020年8月31日 

     詳細を見る

    開催年月日: 2020年8月

    記述言語:日本語   会議種別:口頭発表(一般)  

  10. 「不老」の特徴的な機能とベンチマーク結果の紹介

    大島聡史

    第1回 スーパーコンピュータ「不老」 ユーザ会  2020年8月31日 

     詳細を見る

    開催年月日: 2020年8月

    記述言語:日本語   会議種別:口頭発表(一般)  

  11. Optimization of Numerous Small Dense-Matrix-Vector Multiplications in H-matrix Arithmetic on GPU 国際会議

    Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota

    IEEE MCSoC19, Special Session: Auto-Tuning for Multicore and GPU (ATMG-19) 

     詳細を見る

    開催年月日: 2019年10月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Nanyang Executive Center, Nanyang Technological University, Singapore   国名:シンガポール共和国  

  12. Performance evaluation of the MODYLAS application on modern multi-core and many-core environments 国際会議

    Satoshi Ohshima, Soichiro Suzuki, Tatsuya Sakashita, Masao Ogino, Takahiro Katagiri, Yoshimichi Andoh

    The Fourteenth International Workshop on Automatic Performance Tuning (iWAPT2019, IPDPS2019 Workshop) 

     詳細を見る

    開催年月日: 2019年5月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Hilton Copacabana, Rio de Janeiro, Brazil   国名:ブラジル連邦共和国  

  13. Trying to accelerate many small BLAS calculations on GPU 国際会議

    Satoshi Ohshima

    ATAT in HPSC (2019 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing) 

     詳細を見る

    開催年月日: 2019年2月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:National Sun Yat-sen University, Kaohsiung, Taiwan   国名:台湾  

  14. Auto-Tuning of Hierarchical Computations with ppOpen-AT 国際会議

    Takahiro Katagiri, Masaharu Matsumoto, Satoshi Ohshima

    SIAM Conference on Parallel Processing for Scientific Computing (PP16), MS55 Auto-Tuning for the Post Moore's Era - Part I of II  2016年4月14日 

     詳細を見る

    開催年月日: 2016年4月

    記述言語:英語   会議種別:口頭発表(一般)  

▼全件表示

共同研究・競争的資金等の研究課題 15

  1. 大規模分散医用画像処理に向けた医用画像処理アプリケーションの最適化

    研究課題番号:jh210030-DAH  2021年4月 - 2022年3月

    JHPCN共同研究 

      詳細を見る

    担当区分:研究代表者  資金種別:その他

  2. 分散機械学習技術を用いた大規模医用画像処理の実現に向けた研究

    研究課題番号:jh200046-DAH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

      詳細を見る

    担当区分:研究代表者 

  3. 気液界面と個体球の干渉に伴う界面変形プロセスの高解像度大規模シミュレーション

    2020年7月 - 2021年3月

    名古屋大学情報基盤センター・宇宙地球環境研究所  名古屋大学HPC計算科学連携研究プロジェクト 

    高牟礼 幸太郎

      詳細を見る

    担当区分:研究分担者 

  4. 機械学習ソフトウェアへのソフトウェア自動チューニング技術の適用

    2020年7月 - 2021年3月

    名古屋大学情報基盤センター・宇宙地球環境研究所  名古屋大学HPC計算科学連携研究プロジェクト 

    田中 輝雄

      詳細を見る

    担当区分:研究分担者 

  5. Developing Accuracy Assured High Performance Numerical Libraries for Eigenproblems

    研究課題番号:jh200008-NAH  2020年4月 - 2021年3月

    JHPCN  JHPCN joint research 

      詳細を見る

    担当区分:研究分担者 

  6. Hierarchical low-rank approximation methods on distributed memory and GPUs

    研究課題番号:jh200023-NAHI  2020年4月 - 2021年3月

    JHPCN  JHPCN joint research 

      詳細を見る

    担当区分:研究分担者 

  7. 粒子法の基盤理論整備とマルチフィジックスシミュレータへの展開

    研究課題番号:jh200034-NAH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

    荻野正雄

      詳細を見る

    担当区分:研究分担者 

  8. 高性能・変動精度・高信頼性数値解析手法とその応用

    研究課題番号:jh200037-NAH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

    中島研吾

      詳細を見る

    担当区分:研究分担者 

  9. HPCと高速通信技術の融合による大規模データの拠点間転送技術開発と実データを用いたシステム実証試験

    研究課題番号:jh200038-MDH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

    村田健史

      詳細を見る

    担当区分:研究分担者 

  10. Innovative Multigrid Methods II

    研究課題番号:jh200041-NAH  2020年4月 - 2021年3月

    JHPCN  JHPCN joint research 

      詳細を見る

    担当区分:研究分担者 

  11. Scalable Multigrid Poisson solver for AMR-based CFD applications in Nuclear Engineering

    研究課題番号:jh200051-NAHI  2020年4月 - 2021年3月

    JHPCN  JHPCN joint research 

      詳細を見る

    担当区分:研究分担者 

  12. 機械学習を用いた風環境予測精度の向上と防災技術への応用

    研究課題番号:jh200064-NAH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

    高木洋平

      詳細を見る

    担当区分:研究分担者 

  13. 多粒子分散系の乱流輸送に関する大規模シミュレーション

    研究課題番号:jh200006-NAH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

    渡邊威

      詳細を見る

    担当区分:研究分担者 

  14. 管楽器の大規模流体音響解析

    研究課題番号:jh200001-MDH  2020年4月 - 2021年3月

    学際大規模情報基盤共同利用・共同研究拠点  JHPCN共同研究 

    髙橋公也

      詳細を見る

    担当区分:研究分担者 

  15. 先進的可視化環境の利活用に関する研究

    2020年4月 - 2021年3月

    2020 年度核融合科学研究所共同研究 

    大野暢亮, 大谷寛明

      詳細を見る

    担当区分:連携研究者 

▼全件表示

科研費 7

  1. レイトレーシング加速機構を備える画像処理ハードウェアを用いた高性能計算科学の創成

    研究課題/研究課題番号:21K19763  2021年7月 - 2024年3月

    科学研究費助成事業  挑戦的研究(萌芽)

    大島 聡史

      詳細を見る

    担当区分:研究代表者 

    配分額:6370000円 ( 直接経費:4900000円 、 間接経費:1470000円 )

  2. 格子H行列に基づく数値線形代数の構築と最新アーキテクチャへの高性能実装法

    研究課題/研究課題番号:21H03447  2021年4月 - 2024年3月

    科学研究費助成事業  基盤研究(B)

    伊田 明弘, 岩下 武史, 塙 敏博, 横田 理央, 平石 拓, 大島 聡史, 星野 哲也

      詳細を見る

    担当区分:研究分担者 

    本研究では、科学技術計算およびデータ科学計算に必要な数値線形代数の行列演算について、格子H行列に基づき実行するアルゴリズム群を開発する。
    格子H行列は、研究代表者らが提案した低ランク構造行列法の一種であり、従来型のH行列では困難なアルゴリズムの開発を見通し良く行うことができる。計算に必要な密行列演算を格子H行列による近似演算に置き換え、計算機メモリと演算量の大幅な削減により、計算の大規模化・高速化を実現する。
    アルゴリズム開発は、最新の計算機アーキテクチャで構成されるクラスタ計算機を意識して行う。実装に際しては、混合精度演算・動的負荷分散などを含め最適な手法を研究する。

  3. 超巨大ニューラルネットの継続学習への型破りな線形代数技術の適用

    研究課題/研究課題番号:20K20624  2020年4月 - 2023年3月

    挑戦的研究(開拓)

    横田 理央

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    近年の深層学習は個々のタスクに特化した小規模なモデルを皆が冗長に学習するのではなく、大規模なモデルを用いて様々なタスクを一元的かつ継続的に学習する方向に向かっている。しかし、国内のAI分野の研究には、GAFAなどの 膨大なデータ、計算資源、人的資源を持つ企業と同じ土俵で競争しようとするものは少ない。本研究は、これらの企業との超高精度・超大型のDNNを学習する競争に果敢に挑み、世界最大の複数のスパコンを利用できる恵まれた計算環境と、二次最適化の分散並列実装という独自技術を用いて画像処理や自然言語処理などの幅広いタスクで国際的に優位性を示すことを目指している。

  4. 機械学習向けハードウェアとの親和性が高い連立一次方程式の解法

    研究課題/研究課題番号:18H03248  2018年4月 - 2021年3月

    基盤研究(B)

    横田 理央

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    今年度の目標は低精度演算の有効活用であったが,これは概ね達成できたといえる.Tensor Coreを用いたQR分解の実装において16bitに起因する精度の低下を補正する手法を考案した.これは16bitの変数を2つ用いて仮数部を2倍に拡張することで情報落ちや丸め誤差を抑制するKahanの加算法に類似した手法である.ただし,Kahanの加算法がスカラーに対する手法なのに対して,本手法はそれを行列に拡張した手法となっている.この精度補正によりTensorCoreを用いたQR分解において単精度と同等の相対残差と直交性を実現することができた.また,このときの演算速度はTensorCoreの性能を最大限に引き出すことができていることを確認した.この成果は高性能計算分野のトップカンファレンスであるSC19のベストポスターの候補に選ばれた.
    このような低精度のQR分解を最大限に活用できる手法として階層的低ランク近似法が挙げられる.行列が低精度の浮動小数点で表される場合,それを低ランク近似することで精度をそれ以上劣化させることなく,演算量を大幅に低減できる.今年度は,階層的低ランク近似法として提案されているBLR,HODLR, HSS, H-matrix, H2-matrixの全ての手法を一般化した手法を提案し,C++の機能を最大限に活用することで簡素な実装を行うことができた.このフレームワークを用いて,これら5つの形式に対して行列の加算,行列ー行列積,LU分解,QR分解を容易に実装することができた.この成果は国内外の学会に採択され,現在ジャーナル論文も投稿中である.
    2019年度の目標を達成しただけでなく,階層的低ランク近似法の全てのアルゴリズムに変幻自在に対応できるフレームワークをさらにGPU,MPIへの拡張し,その応用先としても2018年度のLU分解からさらに QR分解にも発展させることができた.
    <BR>
    2018年のTensor CoreのQR分解では単に10TFlopsという演算性能のみが得られていたが,2019年度にKahanの加算法を行列に拡張した手法を考案することにより,Tensor Coreの弱点ともいえる精度の面での大幅な改善を行うことに成功した.
    今年度はPEZY SC2での性能評価までは手が回らなかったが,2020年度の目標は「省電力・耐故障性、ハードウェア間の比較」であるため,このような電力性能をウリにしている異種アーキテクチャ上で実験することを目指す.また,階層的低ランク近似法のQR分解ではまだBLRでしか実験ができていないが,2020年度はHODLR, HSS, H-matrix, H2-matrix全てで実験ができるようにフレームワークを整備する.2019年度後半からテネシー大学のJack Dongarraのグループと共同研究を始めており,ParSECやStarPUを用いた非同期実行によるLU分解,QR分解の分散並列実装を進める予定である.

  5. ディープラーニングを利用した革新的自動チューニング基盤の創製

    研究課題/研究課題番号:18K19782  2018年4月 - 2020年3月

    挑戦的研究(萌芽)

    片桐 孝洋

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    GPUやメニーコアCPUに代表される約300スレッド実行が可能な先進計算機アーキテクチャがもたらすチューニング作業の困難性の爆発的増大から、ソフトウェア性能を人手を介さず最大限に引き出す仕組み(自動チューニング、AT)が求められている。一方、近年ディープラーニング(DL)の技術進展がはなはだしく、多くの分野へ適用がなされている。DLは本来AT方式を実現する手法の1つであるが、DLを用いたAT方式の開発は殆どなされていない。そこで本研究では、(1) 数値計算ライブラリの性能パラメタチューニング;(2) AT基盤インターフェース開発;(3) スーパーコンピュータへの適用;の研究を行った。
    (1)数値計算ライブラリにおいて収束性に影響し実行時間に大きな影響を及ぼす前処理選択がある。本研究では前処理選択へ活用できるDLを用いたAT方式を開発した。これにより、数値計算を低いコストで高性能実行できる環境に貢献し、ものつくり等の生産性の向上に資する。(2)提案するAT方式の実用化に向け実行時の性能の揺らぎに対しても追随できるように改良を行なったことで、より堅牢なATシステムの実現に資する。(3)GPUやメニーコア環境における数値計算コードの最適化行うことで、最新計算機環境における最適化と性能評価のためのコードやデータを集め、高性能数値計算プログラム開発のコスト削減に資する。

  6. 逐次問題の並列計算の数理とフレームワーク研究開発・実証

    研究課題/研究課題番号:17H01750  2017年4月 - 2020年3月

    小野 謙二

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    多くの科学技術計算に現れる時間発展問題は状態変化の時間方向への依存性から並列化が困難とされてきたが、時間並列計算法はその問題点を緩和できる。この計算法は単に時間発展問題を並列化できるだけでなく、逐次性をもつ計算全般を並列化する汎用的な計算法を示している。逐次計算全般の並列化の数理研究を進め、逐次問題を反復形式で表現し、時間並列計算法を適用することにより、並列処理が可能なことを確認した。また、 並列化を支援する汎用フレームワークの研究開発を進めるとともに、チュートリアルを作成し公開することにより、計算工学の諸分野へ貢献した。
    これまで並列化の導入が困難であった逐次計算に対して、新しい並列化の軸を導入した並列処理の方法を提案し、その基礎と数理的解釈を理論的に明らかにすることだけでなく、具体的な応用に役立つ基本的な問題を例題として準備した。時間並列計算の考え方を普及するために、本研究の成果として書籍を執筆中である。これにより、これまでは難しかった変動現象の長時間計算が短時間で計算できるようになり、現象の新しい知見がえられる。また、計算時間の大幅な短縮により、不確かさの定量化や設計パラメータ空間探査などの効果的な利用法を実現し、ものづくりの高度化を推し進めることが期待される。

  7. H行列法ライブラリの機能拡張と次世代スパコン向け最適化

    研究課題/研究課題番号:17H01749  2017年4月 - 2020年3月

    伊田 明弘

      詳細を見る

    担当区分:研究分担者  資金種別:競争的資金

    H行列法ライブラリHACApKの高機能化に関する研究を行った。H行列生成に動的負荷分散を導入し、H行列・ベクトル積計算に対してGPU向けアルゴリズムの開発・実装し、混合精度演算を導入した計算法を確立した。これらの新手法を用いた実装は、既存実装の数倍~十数倍の高速化を実現した。従来H行列に比べて効率的な演算・通信パターンを構築可能な新しい低ランク構造行列法である格子H行列法を提案した。数千プロセスを用いた実験では格子H行列・ベクトル積計算は既存実装の数十倍高速化を達成した。格子H行列に基づくLU分解法を開発し、BLR行列(単純な格子H行列)のQR分解法を開発した。これら分解手法の並列化も行った。
    本研究で高機能化を行ったH行列法ライブラリHACApKは、多くの科学技術シミュレーション(超電導解析、地震波動解析、マイクロマグネティクス計算など)で利用されている。本研究の成果として、HACApKを利用している科学技術計算を、GPUなど最新アーキテクチャを搭載したスパコンにおいても効率よく行うことができるようになる。また、従来のマルチコアCPUクラスタにおいても、さらなる解析の大規模化・高速化を達成できる。HACApKはソースのWeb公開や講習会開催を通して広く普及を図っており、本研究の成果は科学技術計算の発展に大きく寄与する。

▼全件表示

 

担当経験のある科目 (本学) 4

  1. 大規模計算特論B

    2020

  2. プログラミング2

    2020

  3. 大規模計算特論B

    2019

  4. プログラミング2

    2019

 

社会貢献活動 20

  1. 第1回 スーパーコンピュータ「不老」 ユーザ会

    役割:講師, 企画

    名古屋大学情報基盤センター  2020年8月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  2. スーパーコンピュータ「不老」利用型講習会 機械学習(初級)(岐大・名大構成員向けハンズオン講習会)

    役割:講師

    名古屋大学情報基盤センター  2021年3月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  3. 第10回スーパーコンピュータ「不老」利用型講習会 機械学習(初級)

    役割:講師

    名古屋大学情報基盤センター  2021年3月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  4. スーパーコンピュータ「不老」 オンライン利用説明会(一般および企業利用)

    役割:講師

    名古屋大学情報基盤センター  2021年2月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  5. 第9回スーパーコンピュータ「不老」利用型講習会 機械学習(初級)

    役割:講師

    名古屋大学情報基盤センター  2021年1月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  6. 第8回スーパーコンピュータ「不老」利用型講習会 OpenACC(初級)

    役割:講師

    名古屋大学情報基盤センター  2021年1月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  7. 第6回スーパーコンピュータ「不老」利用型講習会 OpenMP(初級)

    役割:講師

    名古屋大学情報基盤センター  2021年1月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  8. 東海地区弁理士会研修セミナー

    役割:講師

    東海地区弁理士会  2020年11月

     詳細を見る

    対象: 学術団体, 企業

  9. スーパーコンピュータ「不老」披露式

    役割:司会

    名古屋大学情報基盤センター  2020年11月

  10. スーパーコンピュータ「不老」Type IIサブシステム利用 マルチGPU・Deep Learningハッカソン

    役割:講師, 企画

    名古屋大学情報基盤センター  2020年11月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  11. スーパーコンピュータ「不老」Type IIサブシステム利用 Optuna利用講習会

    役割:講師

    名古屋大学情報基盤センター  2020年10月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  12. 第3回 スーパーコンピュータ「不老」利用型講習会 OpenACC(初級)

    役割:講師

    名古屋大学情報基盤センター  2020年10月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  13. 第2回 スーパーコンピュータ「不老」利用型講習会 OpenMP(初級)

    役割:講師

    名古屋大学情報基盤センター  2020年9月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  14. 2019年度(令和元年度)名古屋大学HPC計算科学連携研究プロジェクト成果報告会

    役割:企画

    名古屋大学情報基盤センター  2020年9月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  15. スーパーコンピュータ「不老」 オンライン利用説明会

    役割:講師

    名古屋大学情報基盤センター  2020年8月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  16. スーパーコンピュータ「不老」企業利用説明会

    役割:講師

    名古屋大学情報基盤センター  2020年7月

     詳細を見る

    対象: 研究者, 社会人・一般, 学術団体, 企業

  17. スーパーコンピュータ「不老」学外利用説明会(名古屋工業大学)

    役割:講師

    名古屋大学情報基盤センター  2020年7月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  18. スーパーコンピュータ「不老」学内利用説明会

    役割:講師

    名古屋大学情報基盤センター  2020年7月

     詳細を見る

    対象: 大学生, 大学院生, 教育関係者, 研究者, 社会人・一般, 学術団体, 企業

  19. スーパーコンピュータ「不老」サービス開始(報道対応)

    役割:運営参加・支援

    名古屋大学情報基盤センター  2020年7月

  20. スーパーコンピュータ「不老」利用&企業利用説明会

    役割:講師

    名古屋大学情報基盤センター  2020年4月

▼全件表示

学術貢献活動 14

  1. 東京大学情報基盤センターデータ活用社会創成プラットフォーム共同研究基盤立ち上げWG委員 国際学術貢献

    東京大学 情報基盤センター  2020年12月 - 現在

  2. 名古屋大学 名古屋大学HPC計算科学連携研究プロジェクト 運営委員・審査委員

    役割:企画立案・運営等, 審査・評価

    名古屋大学 情報基盤センター、宇宙地球環境研究所  2020年4月 - 現在

     詳細を見る

    種別:審査・学術的助言 

  3. 計算工学講演会オーガナイズドセッション オーガナイザー

    役割:企画立案・運営等

    2020年4月 - 現在

     詳細を見る

    種別:大会・シンポジウム等 

    2020年度はコロナ禍のため開催自体が中止となり、予稿集の発行のみ行われた。2021年度に向けて進行中。

  4. プログラミングシンポジウム 幹事

    役割:企画立案・運営等

    2020年4月 - 現在

     詳細を見る

    種別:大会・シンポジウム等 

  5. xSIG2020/2021 プログラム委員 国際学術貢献

    役割:企画立案・運営等, 査読

    2020年4月 - 現在

     詳細を見る

    種別:大会・シンポジウム等 

  6. 国際会議iWAPT2020/2021 実行委員・プログラム委員 国際学術貢献

    役割:企画立案・運営等, 査読

    2020年4月 - 現在

     詳細を見る

    種別:大会・シンポジウム等 

  7. 日本応用数理学会 行列・固有値問題の解法とその応用研究部会 幹事 国際学術貢献

    役割:企画立案・運営等

    2020年4月 - 2021年3月

     詳細を見る

    種別:学会・研究会等 

  8. SWoPP2020/2021 実行委員

    役割:企画立案・運営等

    2020年4月 - 2021年3月

     詳細を見る

    種別:大会・シンポジウム等 

  9. 国際会議LHAM2020プログラム委員 国際学術貢献

    役割:査読

    2020年4月 - 2021年3月

     詳細を見る

    種別:大会・シンポジウム等 

  10. 国際会議Cluster2020 実行委員 国際学術貢献

    役割:企画立案・運営等

    2020年4月 - 2021年3月

     詳細を見る

    種別:大会・シンポジウム等 

  11. 名古屋大学 情報基盤センター 全国共同利用システム専門委員会委員

    役割:審査・評価

    名古屋大学 情報基盤センター  2020年4月 - 2021年3月

     詳細を見る

    種別:審査・学術的助言 

  12. 九州大学 情報基盤研究開発センター 全国共同利用システム専門委員会委員

    役割:審査・評価

    九州大学 情報基盤研究開発センター  2020年4月 - 2021年3月

     詳細を見る

    種別:審査・学術的助言 

  13. HPCI課題審査委員 国際学術貢献

    役割:査読

    HPCI  2020年4月 - 2021年3月

     詳細を見る

    種別:審査・学術的助言 

  14. 日本応用数理学会 Letters編集委員 国際学術貢献

    日本応用数理学会  2020年4月 - 2021年3月

     詳細を見る

    種別:査読等 

▼全件表示