論文 - 戸田 智基
-
2DP-2MRC: 2-dimensional pointer-based machine reading comprehension method for multimodal moment retrieval 査読有り
J. He, T. Toda
Proc. INTERSPEECH 頁: 5073 - 5077 2024年9月
-
CtrSVDD: a benchmark dataset and baseline analysis for controlled singing voice deepfake detection 査読有り 国際共著
Y. Zang, J. Shi, Y. Zhang, R. Yamamoto, J. Han, Y. Tang, S. Xu, W. Zhao, J. Guo, T. Toda, Z. Duan
Proc. INTERSPEECH 頁: 4783 - 4787 2024年9月
-
Exploring the robustness of text-to-speech synthesis based on diffusion probabilistic models to heavily noisy transcriptions 査読有り
J. Feng, Y. Yasuda, T. Toda
Proc. INTERSPEECH 頁: 4408 - 4412 2024年9月
-
QHM-GAN: neural vocoder based on quasi-harmonic modeling 査読有り
S. Chen, T. Toda
Proc. INTERSPEECH 頁: 3889 - 3893 2024年9月
-
Multimodal fusion of music theory-inspired and self-supervised representations for improved emotion recognition 査読有り 国際共著
X. Shi, X. LI, T. Toda
Proc. INTERSPEECH 頁: 3724 - 3728 2024年9月
-
Quantifying the effect of speech pathology on automatic and human speaker verification 査読有り 国際共著
B. Halpern, T. Tienkamp, W.-C. Huang, L.P. Violeta, T. Rebernik, S. de Visscher, M.J.H. Witjes, M. Wieling, D. Abur, T. Toda
Proc. INTERSPEECH 頁: 3015 - 3019 2024年9月
-
Embedding learning for preference-based speech quality assessment 査読有り
C.-H. Hu, Y. Yasuda, T. Toda
Proc. INTERSPEECH 頁: 2685 - 2689 2024年9月
-
Unsupervised training of neural network-based virtual microphone estimator 査読有り
J. Wang, T. Toda
Proc. EUSIPCO 頁: 256 - 260 2024年8月
-
Discriminative neighborhood smoothing for generative anomalous sound detection 査読有り
T. Fujimura, K. Imoto, T. Toda
Proc. EUSIPCO 頁: 156 - 160 2024年8月
-
Robust sequence-to-sequence voice conversion for electrolaryngeal speech enhancement in noisy and reverberant conditions 査読有り
D. Ma, Y. Choi, F. Li, C. Xie, K. Kobayashi, T. Toda
Proc. IEEE EMBC 頁: 4 pages 2024年7月
-
音声のMOS評価法の限界と大規模比較評価の新しい可能性 招待有り 査読有り Open Access
安田 裕介, 戸田 智基
日本音響学会誌 80 巻 ( 7 ) 頁: 393 - 400 2024年7月
-
合成音声の客観評価とVoiceMOSチャレンジ 招待有り 査読有り 国際共著 Open Access
クーパー エリカ, ホワン ウェンチン, ツァオ ユ, ワン シンミン, 戸田 智基, 山岸 順一
日本音響学会誌 80 巻 ( 7 ) 頁: 381 - 392 2024年7月
-
A review on subjective and objective evaluation of synthetic speech 招待有り 査読有り 国際共著 Open Access
E. Cooper, W.-C. Huang, Y. Tsao, H.-M. Wang, T. Toda, J. Yamagishi
Acoustical Science and Technology 45 巻 ( 4 ) 頁: 161 - 183 2024年7月
-
Mandarin speech reconstruction from tongue motion ultrasound images based on generative adversarial networks 査読有り 国際共著
F. Li, F. Shen, D. Ma, S. Zhang, J. Zhou, L. Wang, F. Fan, T. Liu, X. Chen, T. Toda, H. Niu
Proc. IEEE EMBC 頁: 4 pages 2024年7月
-
Unequally spaced sound field interpolation for rotation-robust beamforming 査読有り
S. Luan, Y. Wakabayashi, T. Toda
IEEE/ACM Transactions on Audio, Speech and Language Processing 32 巻 頁: 3185 - 3199 2024年6月
-
Pretraining and adaptation techniques for electrolaryngeal speech recognition 査読有り Open Access
L.P. Violeta, D. Ma, W.-C. Huang, T. Toda
IEEE/ACM Transactions on Audio, Speech and Language Processing 32 巻 頁: 2777 - 2789 2024年5月
-
Audio difference learning for audio captioning 査読有り
T. Komatsu, Y. Fujita, K. Takeda, T. Toda
Proc. IEEE ICASSP 頁: 1456 - 1460 2024年4月
-
ConvNeXt-TTS and ConvNeXt-VC: ConvNeXt-based fast end-to-end sequence-to-sequence text-to-speech and voice conversion 査読有り
T. Okamoto, Y. Ohtani, T. Toda, H. Kawai
Proc. IEEE ICASSP 頁: 12456 - 12460 2024年4月
-
MF-AED-AEC: speech emotion recognition by leveraging multimodal fusion, ASR error detection, and ASR error correction 査読有り 国際共著
J. He, X. Shi, X. Li, T. Toda
Proc. IEEE ICASSP 頁: 11066 - 11070 2024年4月
-
Electrolaryngeal speech intelligibility enhancement through robust linguistic encoders 査読有り
L.P. Violeta, W.-C. Huang, D. Ma, R. Yamamoto, K. Kobayashi, T. Toda
Proc. IEEE ICASSP 頁: 10961 - 10965 2024年4月