講演・口頭発表等 - 戸田 智基
-
注意機構付きVAEを用いたテキスト発話スタイル変換の改良
吉岡 大貴, 安田 裕介, 松永 悟行, 大谷 大和, 戸田 智基
日本音響学会研究発表会
-
深層生成モデルに基づく音声合成技術
戸田 智基
第21回情報科学技術フォーラム(FIT2022)
-
Direction-aware target speaker extraction with conditional variational autoencoders and its sensitivity to direction-of-arrival error
R. Wang, L. Li, T. Toda
-
DNN音声強調におけるNoisy-target Trainingの挙動分析
藤村 拓弥, 戸田 智基
日本音響学会研究発表会
-
FC-HiFi-GAN:全結合層型アップサンプリングを導入した高速HiFi-GAN
山下 陽生, 岡本 拓磨, 高島 遼一, 滝口 哲也, 戸田 智基, 河井 恒
日本音響学会研究発表会
-
Sequence-wise parameter extraction of quasi-harmonic model for speech waveform generation
S. Chen, T. Toda
-
Harmonic-Net+:高調波入力とLayerwise-Quasi-Periodic畳み込みを用いた基本周波数制御可能な高速ニューラルボコーダ
松原 圭亮, 岡本 拓磨, 高島 遼一, 滝口 哲也, 戸田 智基, 河井 恒
日本音響学会研究発表会
-
基本周波数制御可能なメルスペクトログラム入力型HiFi-GANの初期検討
清水 聡太, 岡本 拓磨, 高島 遼一, 滝口 哲也, 戸田 智基, 河井 恒
日本音響学会研究発表会
-
Three-stage voice conversion framework for noisy and reverberant speech
Y. Choi, C. Xie, T. Toda
-
Sequence-to-sequence voice conversion training using synthetic parallel data for electrolaryngeal speech enhancement
D. Ma, L.P. Violeta, K. Kobayashi, T. Toda
-
音声認識コーパスを用いた高品質複数話者テキスト音声合成に向けたニューラルボコーダによる帯域拡張
日田 光紀, 岡本 拓磨, 西村 竜一, 戸田 智基, 河井 恒
日本音響学会研究発表会
-
Interpretable emotional control for text-to-speech system toward development of sympathetic educational-support robots
J. Feng, T. Yoshikawa, T. Toda
-
A comparison of pretraining frameworks for improving pathological speech recognition
L.P. Violeta, W.-C. Huang, T. Toda
-
拡散確率モデルとアライメントモデルを用いた潜在特徴系列変換に基づくテキスト音声合成
安田 裕介, 戸田 智基
日本音響学会研究発表会
-
構音障害者のための高明瞭度音声合成におけるHiFi-GANを用いた品質改善
松原 圭亮, 高島 遼一, 岡本 拓磨, 滝口 哲也, 戸田 智基, 河井 恒
日本音響学会研究発表会
-
群論を用いた解析的声道長正規化処理と音声認識への応用
宮下 敦志, 戸田 智基
日本音響学会研究発表会
-
Robustness of noisy-to-noisy voice conversion against variations of noisy condition
C. Xie, T. Toda
-
各楽器音源に着目した楽曲間類似度学習の評価
橋爪 優果, 李 莉, 戸田 智基
日本音響学会研究発表会
-
Note-level automatic guitar transcription using attention mechanism and multi-task learning
S. Kim, T. Hayashi, T. Toda
-
各楽器音に着目した楽曲間類似度学習
橋爪 優果, 李 莉, 戸田 智基
情報処理学会 音楽情報科学研究発表会