論文 - 戸田 智基
-
The VoiceMOS Challenge 2024: beyond speech quality prediction 査読有り 国際共著
W.-C. Huang, S.-W. Fu, E. Cooper, R. Zezario, T. Toda, H.-M. Wang, J. Yamagishi, Y. Tsao
Proc. IEEE SLT 頁: 813 - 820 2024年12月
-
Multi-speaker text-to-speech training with speaker anonymized data 査読有り 国際共著
W.-C. Huang, Y.-C. Wu, T. Toda
IEEE Signal Processing Letters 31 巻 頁: 2995 - 2999 2024年10月
-
Challenge of singing voice synthesis using only text-to-speech corpus with FIRNet source-filter neural vocoder 査読有り
T. Okamoto, Y. Ohtani, S. Shimizu, T. Toda, H. Kawai
Proc. INTERSPEECH 頁: 1870 - 1874 2024年9月
-
2DP-2MRC: 2-dimensional pointer-based machine reading comprehension method for multimodal moment retrieval 査読有り
J. He, T. Toda
Proc. INTERSPEECH 頁: 5073 - 5077 2024年9月
-
CtrSVDD: a benchmark dataset and baseline analysis for controlled singing voice deepfake detection 査読有り 国際共著
Y. Zang, J. Shi, Y. Zhang, R. Yamamoto, J. Han, Y. Tang, S. Xu, W. Zhao, J. Guo, T. Toda, Z. Duan
Proc. INTERSPEECH 頁: 4783 - 4787 2024年9月
-
Exploring the robustness of text-to-speech synthesis based on diffusion probabilistic models to heavily noisy transcriptions 査読有り
J. Feng, Y. Yasuda, T. Toda
Proc. INTERSPEECH 頁: 4408 - 4412 2024年9月
-
QHM-GAN: neural vocoder based on quasi-harmonic modeling 査読有り
S. Chen, T. Toda
Proc. INTERSPEECH 頁: 3889 - 3893 2024年9月
-
Multimodal fusion of music theory-inspired and self-supervised representations for improved emotion recognition 査読有り 国際共著
X. Shi, X. LI, T. Toda
Proc. INTERSPEECH 頁: 3724 - 3728 2024年9月
-
Quantifying the effect of speech pathology on automatic and human speaker verification 査読有り 国際共著
B. Halpern, T. Tienkamp, W.-C. Huang, L.P. Violeta, T. Rebernik, S. de Visscher, M.J.H. Witjes, M. Wieling, D. Abur, T. Toda
Proc. INTERSPEECH 頁: 3015 - 3019 2024年9月
-
Embedding learning for preference-based speech quality assessment 査読有り
C.-H. Hu, Y. Yasuda, T. Toda
Proc. INTERSPEECH 頁: 2685 - 2689 2024年9月
-
Discriminative neighborhood smoothing for generative anomalous sound detection 査読有り
T. Fujimura, K. Imoto, T. Toda
Proc. EUSIPCO 頁: 156 - 160 2024年8月
-
Unsupervised training of neural network-based virtual microphone estimator 査読有り
J. Wang, T. Toda
Proc. EUSIPCO 頁: 256 - 260 2024年8月
-
Robust sequence-to-sequence voice conversion for electrolaryngeal speech enhancement in noisy and reverberant conditions 査読有り
D. Ma, Y. Choi, F. Li, C. Xie, K. Kobayashi, T. Toda
Proc. IEEE EMBC 頁: 4 pages 2024年7月
-
合成音声の客観評価とVoiceMOSチャレンジ 招待有り 査読有り 国際共著
クーパー エリカ, ホワン ウェンチン, ツァオ ユ, ワン シンミン, 戸田 智基, 山岸 順一
日本音響学会誌 80 巻 ( 7 ) 頁: 381 - 392 2024年7月
-
A review on subjective and objective evaluation of synthetic speech 招待有り 査読有り 国際共著
E. Cooper, W.-C. Huang, Y. Tsao, H.-M. Wang, T. Toda, J. Yamagishi
Acoustical Science and Technology 45 巻 ( 4 ) 頁: 161 - 183 2024年7月
-
Mandarin speech reconstruction from tongue motion ultrasound images based on generative adversarial networks 査読有り 国際共著
F. Li, F. Shen, D. Ma, S. Zhang, J. Zhou, L. Wang, F. Fan, T. Liu, X. Chen, T. Toda, H. Niu
Proc. IEEE EMBC 頁: 4 pages 2024年7月
-
音声のMOS評価法の限界と大規模比較評価の新しい可能性 招待有り 査読有り
安田 裕介, 戸田 智基
日本音響学会誌 80 巻 ( 7 ) 頁: 393 - 400 2024年7月
-
Unequally spaced sound field interpolation for rotation-robust beamforming 査読有り
S. Luan, Y. Wakabayashi, T. Toda
IEEE/ACM Transactions on Audio, Speech and Language Processing 32 巻 頁: 3185 - 3199 2024年6月
-
Pretraining and adaptation techniques for electrolaryngeal speech recognition 査読有り
L.P. Violeta, D. Ma, W.-C. Huang, T. Toda
IEEE/ACM Transactions on Audio, Speech and Language Processing 32 巻 頁: 2777 - 2789 2024年5月
-
Audio difference learning for audio captioning 査読有り
T. Komatsu, Y. Fujita, K. Takeda, T. Toda
Proc. IEEE ICASSP 頁: 1456 - 1460 2024年4月