論文 - 戸田 智基
-
Comparison of real-time multi-speaker neural vocoders on CPUs 査読有り
K. Matsubara, T. Okamoto, R. Takashima, T. Takiguchi, T. Toda, H. Kawai
Acoustical Science and Technology, Acoustical Letter 43 巻 ( 2 ) 頁: 121 - 124 2022年3月
-
Neural speech-rate conversion with multispeaker WaveNet vocoder 査読有り
T. Okamoto, K. Matsubara, T. Toda, Y. Shiga, H. Kawai
Speech Communication 138 巻 頁: 1 - 12 2022年3月
-
S3PRL-VC: open-source voice conversion framework with self-supervised speech representations 査読有り 国際共著
W.-C. Huang, S.-W. Yang, T. Hayashi, H.-Y. Lee, S. Watanabe, T. Toda
Proc. AAAI-22 Workshop, W35: Self-Supervised Learning for Audio and Speech Processing 頁: 5 pages 2022年2月
-
Time alignment using lip images for frame-based electrolaryngeal voice conversion 査読有り 国際共著
Y.-S. Liou, W.-C. Huang, M.-C. Yen, S.-W. Tsai, Y.-H. Peng, T. Toda, Y. Tsao, H.-M. Wang
Proc. APSIPA ASC 頁: 1234 - 1238 2021年12月
-
Multi-stream HiFi-GAN with data-driven waveform decomposition 査読有り
T. Okamoto, T. Toda, H. Kawai
Proc. IEEE ASRU 頁: 610 - 617 2021年12月
-
On prosody modeling for ASR+TTS based voice conversion 査読有り 国際共著
W.-C. Huang, T. Hayashi, X. Li, S. Watanabe, T. Toda
Proc. IEEE ASRU 頁: 642 - 649 2021年12月
-
Mandarin electrolaryngeal speech voice conversion with sequence-to-sequence modeling 査読有り 国際共著
M.-C. Yen, W.-C. Huang, K. Kobayashi, Y.-H. Peng, S.-W. Tasi, Y. Tsao, T. Toda, J.-S. R. Jang, H.-M. Wang
Proc. IEEE ASRU 頁: 650 - 657 2021年12月
-
HASA-Net: a non-intrusive hearing-aid speech assessment network 査読有り 国際共著
H.-T. Chiang, Y.-C. Wu, C. Yu, T. Toda, H.-M. Wang, Y.-C. Hu, Y. Tsao
Proc. IEEE ASRU 頁: 907 - 913 2021年12月
-
Mandarin electro-laryngeal speech enhancement based on statistical voice conversion and manual tone control 査読有り 国際共著
Z. Qian, H. Niu, L. Wang, K. Kobayashi, S. Zhang, T. Toda
Proc. APSIPA ASC 頁: 546 - 552 2021年12月
-
Noisy-to-noisy voice conversion framework with denoising model 査読有り
C. Xie, Y.-C. Wu, P.L. Tobing, W.-C. Huang, T. Toda
Proc. APSIPA ASC 頁: 814 - 820 2021年12月
-
Investigation of text-to-speech-based synthetic parallel data for sequence-to-sequence non-parallel voice conversion 査読有り
D. Ma, W.-C. Huang, T. Toda
Proc. APSIPA ASC 頁: 870 - 877 2021年12月
-
An ensemble approach to anomalous sound detection based on conformer-based autoencoder and binary classifier incorporated with metric learning 査読有り
I. Kuroyanagi, T. Hayashi, Y. Adachi, T. Yoshimura, K. Takeda, T. Toda
Proc. DCASE 2021 Workshop 頁: 110 - 114 2021年11月
-
Singing fundamental frequency contour generation using generalized command response model and score-conditional variational autoencoder 査読有り
S. Seki, H. Taga, T. Toda
Proc. IEEE MLSP 頁: 1 - 6 2021年10月
-
Singing fundamental frequency contour generation using generalized command response model and score-conditional variational autoencoder 査読有り
S. Seki, H. Taga, T. Toda
Proc. IEEE MLSP 頁: 6 pages 2021年10月
-
Anomalous sound detection using a binary classification model and class centroids 査読有り
I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda
Proc. EUSIPCO 頁: 1995 - 1999 2021年8月
-
学習支援サービスの運用とオンデマンド型を中心としたオンライン授業への展開――名古屋大学における事例―― 招待有り
戸田 智基, 大平 茂輝, 後藤 明史, 出口 大輔, 森 健策
電子情報通信学会誌 104 巻 ( 8 ) 頁: 862 - 866 2021年8月
-
Relational data selection for data augmentation of speaker-dependent multi-band MelGAN vocoder 査読有り 国際共著
Y.-C. Wu, C.-H. Hu, H.-S. Lee, Y.-H. Peng, W.-C. Huang, Y. Tsao, H.-M. Wang, T. Toda
Proc. INTERSPEECH 頁: 3630 - 3634 2021年8月
-
High-fidelity and low-latency universal neural vocoder based on multiband WaveRNN with data-driven linear prediction for discrete waveform modeling 査読有り
P.L. Tobing, T. Toda
Proc. INTERSPEECH 頁: 2217 - 2221 2021年8月
-
Unified source-filter GAN: unified source-filter network based on factorization of quasi-periodic parallel WaveGAN 査読有り
R. Yoneyama, Y.-C. Wu, T. Toda
Proc. INTERSPEECH 頁: 2187 - 2191 2021年8月
-
A preliminary study of a two-stage paradigm for preserving speaker identity in dysarthric voice conversion 査読有り 国際共著
W.-C. Huang, K. Kobayashi, Y.-H. Peng, C.-F. Liu, Y. Tsao, H.-M. Wang, T. Toda
Proc. INTERSPEECH 頁: 1329 - 1333 2021年8月