科研費 - 片桐 孝洋
-
ワークフローエンジンとの連携に基づく臨機応変なジョブスケジューリングの実現
研究課題/研究課題番号:24K02945 2024年4月 - 2027年3月
科学研究費助成事業 基盤研究(B)
滝沢 寛之, 片桐 孝洋, 佐野 健太郎
担当区分:研究分担者
現代の科学技術計算においては、数値シミュレーションを単独で実行するだけではなく、そのプリ処理・ポスト処理に加えて機械学習によるデータ解析など、異種複数のジョブが協調動作するワークフローの効率的実行が求められる。このため、スーパーコンピュータの動的な状況変化に合わせて、多様なワークフローに対して適切な計算資源を臨機応変に割当てるジョブスケジューリング技術の確立を目指す。臨機応変な対応が求められる防災減災分野を想定し、実運用に必要な要素技術を研究開発する。その結果、システム全体としての計算資源利用効率を落とすことなく、実行優先度の高いジョブの緊急実行などの動的な要因への迅速な対応も実現する。
-
研究課題/研究課題番号:23K11126 2023年4月 - 2027年3月
科学研究費助成事業 基盤研究(C)
田中 輝雄, 片桐 孝洋
担当区分:研究分担者
本研究は、自動チューニングにおけるユーザプログラムの性能を決める複数性能パラメタの最適な組合せの探索に関する。我々は、これまで多くの成果およびノウハウについて報告・発表している.本研究では、この成果をもとに、この複数の性能パラメタの最適組合せ探索機能のツール化を行う。
ツールとして、主に次の2つを目的とする。(1)実行時自動チューニングを可能とするために、チューニングに要する時間が無視できる軽量ツールとする。(2)特に、時間を要する機械学習における複数のハイパーパラメタ群の自動チューニングを可能とするために、スーパーコンピュータの多数のノードを同時に並列利用可能とする並列実行制御を実現する。
本研究の目的は、自動チューニングにおける複数の性能パラメタの最適な組合せの探索を行うツールの開発である。主に次の2つの開発を行う。(1)実行時自動チューニングを可能とするために、チューニングに要する時間が無視できる軽量ツールを実現する。(2)特に、時間を要する機械学習における複数のハイパーパラメタ群の自動チューニングを可能とするために、スーパーコンピュータの多数のノードを同時に並列利用可能とする並列実行制御を実現する。目的を達成するために、次の3つの計画を推進する。
[計画1]性能パラメタ最適化ツールの開発:(1)実行時自動チューニングを可能とする軽量ツールを開発する。(2)機械学習のハイパーパラメタチューニングを対象とし、スーパーコンピュータの環境での並列実行制御環境を開発する。前者については、プロトタイプにより数々の機能を試行している。後者については、名古屋大学の不老TypeIIの環境で実現済であり、この手法を他のスーパーコンピュータの環境でも実行できるように汎用化する。[計画2]事例蓄積:ユーザプログラムを調査、入手し、実問題などの実例を積み上げてフィードバックを行うことにより、使い勝手の良いツールの開発を推進する。[計画3]ユーザへのβ版ツール提供とフィードバック:実際にユーザが使えるツールとするために、開発フェーズごとにβ版をユーザに提供し、実際に使用してもらうことにより使い勝手、課題を明確化し、フィードバックをかける。
2023年度は、[計画1](1)に対しては、5つの関数の仕様を定義、(2)に対しては、名大スーパーコンピュータ上で試作したツールを九大スーパーコンピュータ上での動作を確認した。[計画2]に対しては、学習型ゲームプログラムの最適化に試作ツールを適用し、自動的最適化を確認した。[計画3]については、試作ツールの提供先を調査した。
[計画1](1)に対しては、ユーザプログラムに試作ツールを組み込むことができるような関数とその利用仕様をまとめた。(2)に対しては、機会学習プログラムのハイパーパラメタはそのプログラムの外側から設定できることが多いので、そのインターフェースを利用して、学習プログラム全体を制御し、スーパーコンピュータの複数ノード(ここではGPUノードが前提)を有効に活用し、我々が開発している自動チューニングのアルゴリズムに適用させることを実現した。この開発は、名大スーパーコンピュータ上で行った。さらに、この試作したツールの汎用性を確かめるために、このツールを九大スーパーコンピュータ上で実行し、その動作を確認した。
[計画2]に対しては、学習型ゲームプログラムの最適化に試作ツールを適用し、自動的最適化を確認した。
[計画3]については、試作ツールの提供先を調査した。
前者については、プロトタイプにより数々の機能を試行している。後者については、名古屋大学の不老TypeIIの環境で実現済であり、この手法を他のスーパーコンピュータの環境でも実行できるように汎用化する。性能パラメタ最適化ツール開発は各フェーズを分けて行う。
これらはおおむね計画通りに進められている。
当初の研究計画をもとに、状況に応じて修正を加えながら、研究を推進する。
[計画1]試作ツールを試用することによって判明した、ツールの能力の向上、ツールの使い勝手について、検討を進める。特に、(2)に対しては、ツールを実現するパラメタ最適化アルゴリズムにより、まだ、スーパーコンピュータのノードの利用効率が十分でないことが分かったので、アルゴリズム自体を変更し、ノードの利用効率を上げることにより、トータルで、パラメタ最適化の時間を短縮する方策を検討中であり、これを実装し、評価することを推進する。
[計画2]に対しては、さらに、実用レベルの問題を調査し、適用することを試みる。
[計画3]については、試作ツールの提供先を探していく。 -
(計算+データ+学習)融合によるエクサスケール時代の革新的シミュレーション手法
2019年6月 - 2024年3月
科学研究費補助金 基盤研究(S)
担当区分:研究分担者
-
(計算+データ+学習)融合によるエクサスケール時代の革新的シミュレーション手法
研究課題/研究課題番号:19H05662 2019年6月 - 2024年3月
科学研究費助成事業 基盤研究(S)
中島 研吾, 荻田 武史, 岩下 武史, 片桐 孝洋, 下川辺 隆史, 長尾 大道, 八代 尚, 松葉 浩也
担当区分:研究分担者
エクサスケール時代のスパコンによる科学的発見の持続的促進のために,計算科学にデータ科学,機械学習の知見を導入した(計算+データ+学習)融合による革新的シミュレーション手法を提案する。最小の計算時間・消費電力での融合の実現のために,①変動精度演算・精度保証・自動チューニングによる新計算原理に基づく高性能・高信頼性・省電力数値解法,②機械学習による階層型データ駆動アプローチの二項目を中心に研究し,革新的ソフトウェア基盤「h3-Open-BDEC」として整備する。(計算+データ+学習)融合による多階層シミュレーションにおいて,従来手法と同等の正確さを保ちつつ10倍以上の計算量・消費電力削減を目指す。
エクサスケール時代のスパコンの能力を最大限活用し,科学的発見を持続的に促進するために,「計算+データ+学習」融合による革新的シミュレーション手法を提案し,最小限の計算量・消費電力で融合シミュレーションを実現する研究開発,革新的ソフトウェア基盤「h3-Open-BDEC」実装を実施した。2021年度以降は,東大情報基盤センターのWisteria/BDEC-01を使用して,様々な分野における「計算+データ+学習」融合シミュレーションを推進し,精度を保ちつつ従来の100倍前後の効率で,車体周囲定常流,全球大気アンサンブルシミュレーションを実施することができた。研究成果は国際的にも高く評価されている。
スーパーコンピュータ(スパコン)は従来のシミュレーションの他,データ解析,機械学習・AI等様々な分野で使用されている。本研究では,「計算(シミュレーション)・データ・学習」融合による,新しい計算科学の開拓と,それにより安心・安全な人間中心の社会(Society 5.0)の構築を実現するためのソフトウェア開発を実施した。「計算・データ・学習」融合により,車体周囲定常流,全球大気アンサンブルシミュレーションが従来の100分の1の計算時間で実施可能となり,スパコンの新しい利用方法を開拓した。本研究の成果は量子コンピュータとスパコンの連携にも転用可能であり,量子コンピューティング普及に貢献する。 -
ディープラーニングを利用した革新的自動チューニング基盤の創製
2018年6月 - 2020年3月
科学研究費補助金 挑戦的研究(萌芽)
担当区分:研究代表者
-
ディープラーニングを利用した革新的自動チューニング基盤の創製
研究課題/研究課題番号:18K19782 2018年6月 - 2020年3月
挑戦的研究(萌芽)
片桐 孝洋
担当区分:研究代表者
配分額:6240000円 ( 直接経費:4800000円 、 間接経費:1440000円 )
GPUやメニーコアCPUに代表される約300スレッド実行が可能な先進計算機アーキテクチャがもたらすチューニング作業の困難性の爆発的増大から、ソフトウェア性能を人手を介さず最大限に引き出す仕組み(自動チューニング、AT)が求められている。一方、近年ディープラーニング(DL)の技術進展がはなはだしく、多くの分野へ適用がなされている。DLは本来AT方式を実現する手法の1つであるが、DLを用いたAT方式の開発は殆どなされていない。そこで本研究では、(1) 数値計算ライブラリの性能パラメタチューニング;(2) AT基盤インターフェース開発;(3) スーパーコンピュータへの適用;の研究を行った。
(1)数値計算ライブラリにおいて収束性に影響し実行時間に大きな影響を及ぼす前処理選択がある。本研究では前処理選択へ活用できるDLを用いたAT方式を開発した。これにより、数値計算を低いコストで高性能実行できる環境に貢献し、ものつくり等の生産性の向上に資する。(2)提案するAT方式の実用化に向け実行時の性能の揺らぎに対しても追随できるように改良を行なったことで、より堅牢なATシステムの実現に資する。(3)GPUやメニーコア環境における数値計算コードの最適化行うことで、最新計算機環境における最適化と性能評価のためのコードやデータを集め、高性能数値計算プログラム開発のコスト削減に資する。 -
膵癌腫瘍3次元内部構造の徹底的な理解のための超高精細情報空間構築
研究課題/研究課題番号:18H03262 2018年4月 - 2021年3月
科学研究費助成事業 基盤研究(B)
本谷 秀堅, 片桐 孝洋, Kugler Mauricio, 横田 達也
担当区分:研究分担者
空間的に連続した薄切切片の顕微鏡画像群を非剛体位置合わせする手法を開発し、実際に、KPCマウスの膵癌腫瘍を含む3次元病理画像の再構成に成功し、腫瘍中の様々な器官の3次元形状を視認することが可能になった。このことによりMRI画像と病理顕微鏡画像の非剛体位置合わせが可能となり、MRI画像中の各ボクセルに対応する病理顕微鏡画像中の矩形領域を同定出来るようになった。この成果は、膵癌診断に際して病理顕微鏡画像とMRI画像を統合管理する上で有用である。また、この対応付けを利用することにより、MRI画像中の各ボクセルに対応しうる病理顕微鏡画像群の従う確率密度分布を推定する画像生成モデルの構築に成功した。
病理顕微鏡画像は癌の種別を鑑別する際などに用いられる重要なモダリティであり、近年そのデジタル化が進んでいる。病理診断を実施する病院の多くにおいて癌診断に際して撮影されるMRI画像や病理画像が診断結果とともに記録され、保存され続けている。これら保存された画像と診断の組を有効活用するためには、例えば目の前の患者と類似する画像を過去の症例から検索したり、非侵襲で撮影出来るMRI画像から侵襲的にしか撮影することの出来ない病理画像を予測したりする画像処理技術が不可欠である。本研究成果は、腫瘍内部の微細な3次元構造に基づく病理画像の検索や、MRI画像からの病理画像予測に基づく手術計画立案に有用である。 -
スーパーコンピュータを活用した多元計算解剖学処理の大規模化・高性能化技術の創成
研究課題/研究課題番号:17H05290 2017年4月 - 2019年3月
新学術領域研究(研究領域提案型)
片桐 孝洋
担当区分:研究代表者
配分額:4290000円 ( 直接経費:3300000円 、 間接経費:990000円 )
多元計算解剖モデルは、空間、時間、機能、病理の4つの軸にまたがる医用画像に基づきコンピュータ上に構築する。この空間軸を考えると、顕微鏡などのミクロモデルからMRなどのマクロモデルを3次元化してシームレスに扱うためには、膨大なデータ量を扱わなければならない。1回当たり数TB、総合で数百TBの大容量なデータ処理を扱わなければならない。データ量の大規模化に従い処理の演算量も爆発的に増大する。その結果、PCなど通常の計算機では現実的時間で処理できなくなることが危惧されている。一方で、スーパーコンピュータ(以降、スパコン)の発展はめざましい。I/O処理を高速化できるシステムソフトウェア、並列化および高性能化の技術も進展している。そのため、High Performance Computing (HPC) 技術を多元計算解剖学の処理に適用することで処理時間の壁を打破することが期待できる。
本研究では、昨年度に引き続き、HPCの研究者と多元計算解剖学の研究者が連携することで、処理時間の壁を打破するアルゴリズムと実装技法を開発する。実用的な技術を創成するため、研究代表者の機関が所有するスパコンであるFX100システムを活用し、幅広い計算機環境に対応する並列アルゴリズムと高性能実装技法を開発した。
具体的には、1.画像非剛体位置合わせ問題について、有効となる並列アルゴリズムおよび高性能実装技法の性能改善を行った。高性能化のための並列化に加えて、最先端の並列化技法であるMPIとOpenMPを利用したハイブリッドMPI/OpenMP並列化による実装方式も性能改善を行い、実用問題で現実的な実行時間で処理可能なことを示した。
平成30年度が最終年度であるため、記入しない。
平成30年度が最終年度であるため、記入しない。 -
通信回避・削減アルゴリズムのための自動チューニング技術の新展開
研究課題/研究課題番号:16H02823 2016年4月 - 2019年3月
片桐 孝洋
担当区分:研究代表者
配分額:17030000円 ( 直接経費:13100000円 、 間接経費:3930000円 )
(1)AT方式開発:コード変換を伴うAT方式、実行時にスレッド数を変更する新方式を提案し有効性の評価を行った。また、機械学習を適用する新しいAT方式の実現可能性について検討と評価を行った。(2)AT性能モデル化:複数の性能パラメタからなる多次元空間上をd-Spline関数により一次元探索を繰り返す超軽量なAT機構を実現した。(3)アプリケーション適用: 4次元変分法をフェーズフィールドモデルに実装したアプリケーションを構築し、高性能実装手法による高速化を行った。核融合プラズマの磁気流体力学(MHD)不安定性の解析にて使用される簡約化二流体モデル解析を半陰的時間積分法の導入により高速化した。
幅広い分野のプログラムに適用できる自動チューニング方式と性能モデルを開発したことにより、科学の進展に資するプログラムや、ものつくりなどのプログラムの高速化を、最先端のスーパーコンピュータ上で、低いコストで実施できるようになる可能性がある。このことで、新たな科学上の発見や、効率の良い工業製品の開発、などを支援する計算機環境の構築に貢献することが期待できる。 -
機械学習技術の活用による職人的プログラミングの知能化
研究課題/研究課題番号:16H02822 2016年4月 - 2019年3月
滝沢 寛之
担当区分:研究分担者
本研究では,高性能計算(HPC)プログラミングの支援に機械学習を効果的に利用できる事例を示した.すでに機械学習の利用が成功している問題に変換することにより,コード最適化における種々の問題も機械学習で解決できる可能性がある.また,HPCプログラミング分野で膨大な数の訓練データを用意できる問題は稀であり,効率的な収集のためには対象問題を十分に分析する重要性が示された.さらに,HPCプログラミングと同様に,機械学習の利用においても熟練者の経験と勘に頼らなければならないが,すでに数値化されているハイパーパラメータの調整であるため,計算コストの問題に置き換えて考えることが可能であることも明らかになった.
従前,熟練のプログラマによる知識と経験に基づいて,高性能計算アプリケーションコードが対象計算システム向けに最適化されてきた.しかし,ポストムーア時代の大規模かつ複雑な計算システム向けにコードを最適化する労力は,今後ますます増大することが予想され,そのための人材を確保し続けることは困難である.この問題に対して,本研究では近年注目されている機械学習技術を有効活用することで,熟練のプログラマに求められる性能最適化の労力を大幅に軽減できる可能性を明確に示すことができた.多様な科学技術分野で必要不可欠なツールとなっている高性能計算アプリケーションの開発の効率化は,学術的にも社会的にも意義深い成果である. -
通信回避・削減アルゴリズムのための自動チューニング技術の新展開(研究代表者)
2016年4月 - 2018年3月
科学研究費補助金 基盤研究(B)
担当区分:研究代表者
-
機械学習技術の活用による職人的プログラミングの知能化(研究分担者)
2016年4月 - 2018年3月
科学研究費補助金 基盤研究(B)
滝沢寛之
担当区分:研究分担者
-
精度保証のための高性能計算技術の創成
研究課題/研究課題番号:16K12432 2016年4月 - 2018年3月
片桐 孝洋
担当区分:研究代表者
配分額:3380000円 ( 直接経費:2600000円 、 間接経費:780000円 )
高精度行列-行列積(HP_GEMM)の新実装方式の開発と性能評価を行なった。HP_GEMMを実現するスレッド並列化において疎行列化を行い演算量を削減する高性能実装方式を開発した。既存のスーパーコンピュータで複数の方式の実装評価を行った。これらの方式は、疎行列格納方式CRS、ELL、密行列積DGEMM方式、および、疎行列-ベクトル積の実装を問題特性を利用しスレッド実行効率を高める。性能評価により各実装方式の性能を明らかにした。
HP_GEMMの精度面について理論検討・実装・評価を行った。特に、行列積のエラーフリー変換を用いて隣接浮動小数点丸めを達成するアルゴリズムを開発した。 -
精度保証のための高性能基盤技術の創成(研究代表者)
2016年4月 - 2017年3月
科学研究費補助金
担当区分:研究代表者
-
複合的・階層的な自動チューニングを実現する数理基盤手法の研究とライブラリの開発
研究課題/研究課題番号:15H02708 2015年4月 - 2018年3月
須田 礼仁
担当区分:連携研究者
自動チューニングは、ソフトウェアが内包するパラメタを自ら調整し、多様な条件下で良好な性能を達成することを目指す技術である。従来、複数のパラメタの調整が必要な場合、網羅試行か経験的枝刈りが広く用いられてきたが、本研究では、ベイズ統計に基づき、現実的に有効かつ漸近的に最適解を導く数理的手法を目指した。
従来研究の調査により、線形モデルと相関モデルが使われており、両者は同時に使うこともできることを示した。そのようなモデルを記述から、事前情報と実測結果から性能モデルを構築するプログラムを自動生成する仕組みを構築した。また、自動チューニング数理ライブラリの多様な計算に適用し、その有効性を確認した。 -
自らを進化させ未知の計算環境に適応するソフトウェア自動チューニング機構方式の研究
研究課題/研究課題番号:15K12033 2015年4月 - 2018年3月
須田 礼仁
担当区分:その他
自動チューニングは、ソフトウェアにあらかじめ可変性を仕込み、この可変性をソフトウェア自身に調整させて、様々な計算環境で良好な実行性能を目指す。本研究では、既存のプログラムに対して、事後的に可変性と調整機能を組み込むことにより、新しい計算環境や新しい高性能手法が登場しても、それを既存のプログラムに組込み自動チューニングができる仕組みを目指して研究した。
我々はチームメンバーが開発してきた Xevolverというコード変換システムを活用することで、自動チューニングを想定していないプログラムに可変性と自動チューニング機構を組み込む手法を明らかにした。ただし原プログラムの分析の必要性が明らかになった。 -
複合的・階層的な自動チューニングを実現する数理基盤手法の研究とライブラリの開発(研究協力者)
2015年4月 - 2017年3月
科学研究費補助金 基盤研究(B)
須田礼仁
担当区分:その他
-
自らを進化させ未知の計算環境に適応するソフトウェア自動チューニング機構方式の研究(研究協力者)
2015年4月 - 2017年3月
科学研究費補助金
須田礼仁
担当区分:その他