Faculty Profiles - TODA Tomoki

写真a

TODA Tomoki

Organization

Institutes of Innovation for Future Society Global Research Institute for Mobility in Society Professor

Graduate School

Graduate School of Informatics

Undergraduate School

School of Informatics Department of Computer Science

Contact information

Homepage

https://sites.google.com/site/tomokitoda/

Degree 1

Doctor of Engineering （ 2003.3 Nara Institute of Science and Technology ）

To the head of Degree.▲

Research Interests 3

Sound Environment Information Processing
Music Information Processing
Speech Information Processing

To the head of Research Interests.▲

Research Areas 1

Informatics / Perceptual information processing / Speech Information Processing

To the head of Research Areas.▲

Current Research Project and SDGs 2

音メディア機能拡張
音メディア情報処理

To the head of Current Research Project and SDGs.▲

Research History 7

Nagoya University Department of Intelligent Systems, Graduate School of Informatics Professor

2017.4
Nagoya University Information Technology Center Professor

2015.9

　 More details

Country：Japan
Nagoya University Department of Media Science, Graduate School of Information Science Professor

2015.9
Nara Institute of Science and Technology Graduate School of Information Science Associate Professor

2011.4 - 2015.8

　 More details

Country：Japan
Nara Institute of Science and Technology Graduate School of Information Science Assistant Professor

2007.4 - 2011.3

　 More details

Country：Japan
Nara Institute of Science and Technology Graduate School of Information Science Assistant

2005.4 - 2007.3

　 More details

Country：Japan
Japan Society for Promotion of Science Research Fellow

2003.4 - 2005.3

　 More details

Country：Japan

▼display all

To the head of Research History.▲

Education 3

Nara Institute of Science and Technology Doctoral Course, Graduate School of Information Science

2001.4 - 2003.3

　 More details

Country： Japan
Nara Institute of Science and Technology Master's Course, Graduate School Information Science

1999.4 - 2001.3

　 More details

Country： Japan
Nagoya University Faculty of Engineering Electrical and Electronic Engineering and Information Engineering

1995.4 - 1999.3

　 More details

Country： Japan

To the head of Education.▲

Professional Memberships 6

情報処理学会理事

2026.6
情報処理学会代表会員

2026.4
情報処理学会代表会員

2023.4 - 2025.3
日本音響学会東海支部評議員

2021.4
IEEE Senior Member

2019.2
日本音響学会代議員／評議員

2015.6

▼display all

To the head of Professional Memberships.▲

Committee Memberships 40

情報処理学会メディア知能情報領域委員会委員長

2026.6
APSIPA Transactions on Signal and Information Processing, Editorial Board Senior Editor

2025.4
APSIPA Speech and Language Processing Technical Committee Chair

2025.1

　 More details

Committee type：Academic society
情報処理学会メディア知能情報領域委員会財務委員

2024.6 - 2026.6
大学ICT運営協議会 2023年度年次大会実行委員会実行委員

2022.11 - 2023.12
IEEE ASRU 2023, Organizing Committee Organizing Committee Member, Tutorial Chair

2022.7 - 2023.12
国公立大学情報システム研究会世話人

2022.6 - 2024.5
日本音響学会音声研究専門委員会幹事

2022.6 - 2024.3
電子情報通信学会音声研究専門委員会委員長

2022.6 - 2024.3
情報処理学会音声言語情報処理研究運営委員会主査

2022.4 - 2024.3
IEEE SLT 2022, Organizing Committee Organizing Committee Member, Regional Publicity Chair

2021.7 - 2023.1
IEEE Signal Processing Letters, Editorial Board Senior Area Editor

2020.12
JASA Express Letters, Editorial Board Associate Editor

2020.6 - 2023.6
Joint Workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, Organizing Committee Organizing Committee Member

2020.2 - 2020.11
IEEE Signal Processing Society, Tokyo Joint Chapter Treasurer

2019.1 - 2021.1
DSP in vehicles 2018, Organizing Committee Organizing Committee Member, Program Chair

2018.1 - 2018.10
IEEE Signal Processing Letters, Editorial Board Associate Editor

2016.11 - 2020.12
電子情報通信学会／日本音響学会音声研究専門委員会専門委員

2016.6 - 2020.5
国公立大学情報システム研究会編集委員会編集委員長

2016.6 - 2018.6
国公立大学情報システム研究会世話人

2016.6 - 2018.6
IEEE ASRU 2017, Organizing Committee Organizing Committee Member, Challenge Chair

2016.6 - 2017.12
大学ICT運営協議会 2015年度年次大会実行委員会実行委員

2015.9 - 2015.12
International Workshop on Machine Learning in Spoken Language Processing (MLSLP), Organizing Committee Organizing Committee Member, Technical Program Chair

2015.4 - 2015.9
IEEE ASRU 2015, Organizing Committee Organizing Committee Member, Regional Publicity Chair

2014.8 - 2015.12
IEEE Signal Processing Society Speech and Language Technical Committee Member

2014.1 - 2016.12
日本音響学会事業委員会委員

2013.8 - 2017.8
日本音響学会編集委員会論文部会委員

2013.6 - 2017.6
電子情報通信学会／日本音響学会音声研究専門委員会幹事（企画）

2013.5 - 2015.5
EURASIP Journal on Audio, Speech, and Music Processing, Editorial Board Associate Editor

2013.4 - 2024.3
情報処理学会音楽情報科学研究運営委員会運営委員

2013.4 - 2017.3
IEEE Signal Processing Society, Kansai Chapter Treasurer

2013.2 - 2015.1
IEEE ICASSP 2012, Organizing Committee Organizing Committee Member

2011.12 - 2012.3
International Workshop on Statistical Machine Learning for Speech Processing (IWSML), Organizing Committee Organizing Committee Member, Local Chair

2011.9 - 2012.3
ACM Transactions on Speech and Language Processing, Editorial Board Associate Editor

2011.3 - 2013.12
IEEE Signal Processing Society, Kansai Chapter Secretary

2011.2 - 2013.1
APSIPA Speech, Language, and Audio Technical Committee Member

2010.4 - 2016.12
INTERSPEECH 2010,Organizing Committee Organizing Committee Member, Student Award

2010.1 - 2010.9
The 7th ISCA Speech Synthesis Workshop (SSW7), Organizing Committee Organizing Committee Member

2008.8 - 2010.9
情報処理学会音声言語情報処理研究運営委員会運営委員

2008.4 - 2012.3
IEEE Signal Processing Society Speech and Language Technical Committee Member

2007.1 - 2009.12

▼display all

To the head of Committee Memberships.▲

Awards 22

DCASE 2025 Challenge Task 2 Judges' Award

2025.10 IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events

T. Fujimura, I. Kuroyanagi, T. Toda

　More details

Award type：Award from international society, conference, symposium, etc.
SpandLDeteriorate Workshop of ACM MM Asia 2024 Best Paper Award

2024.12 SpandLDeteriorate Workshop Organizers of ACM MM Asia 2024

B. Halpern, T. Toda

　More details

Award type：Award from international society, conference, symposium, etc.
研究会活動貢献賞

2024.3 情報処理学会学会音声言語情報処理研究会活動への貢献

戸田智基

　More details

Country：Japan
第35回中小企業優秀新技術・新製品賞産学官連携特別賞

2023.4 りそな中小企業振興財団，日刊工業新聞社

戸田智基

　More details

Award type：Award from publisher, newspaper, foundation, etc. Country：Japan
DCASE 2022 Challenge Task 2 Judges' Award

2022.11 IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events

I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda

　More details

Award type：Award from international society, conference, symposium, etc.
APSIPA ASC 2021 The Best Paper Award

2021.12 APSIPA

D. Ma, W.-C. Huang, T. Toda

　More details

Award type：Award from international society, conference, symposium, etc.
大学ICT推進協議会 2018年度年次大会優秀ポスター賞

2019.3 大学ICT推進協議会手書きレポートとLMSの連携を実現する名大版紙レポシステムの全学運用

出口大輔, 清谷竣也, 大平茂輝, 戸田智基

　More details

Award type：Award from Japanese society, conference, symposium, etc. Country：Japan
大学ICT推進協議会 2017年度年次大会優秀論文賞

2018.3 大学ICT推進協議会名古屋大学におけるサーバ型紙レポート・LMS連携システムの開発

清谷竣也, 伊藤瑠哉, 岡本康佑, 谷川右京, 大平茂輝, 出口大輔, 戸田智基

　More details

Award type：Award from Japanese society, conference, symposium, etc. Country：Japan
文部科学大臣表彰若手科学者賞

2015.4 文部科学省

戸田智基

　More details

Country：Japan
言語処理学会第21回年次大会優秀賞

2015.3 言語処理学会

小田悠介、Graham Neubig、Sakriani Sakti、戸田智基、中村哲

　More details

Country：Japan
APSIPA ASC 2014 The Best Paper Award

2014.12 APSIPA

S. Takamichi, T. Toda, A.W. Black, S. Nakamura
The 2013 EURASIP-ISCA Best Paper Award (Speech Communication Journal)

2013.9 EURASIP, and ISCA

T. Toda, A.W. Black, K. Tokuda
情報処理学会 2012年度喜安記念業績賞

2013.6 情報処理学会

徳田恵一, 戸田智基, 全炳河, 山岸順一, 大浦圭一郎

　More details

Country：Japan
APSIPA ASC 2012 The Best Paper Award (Short Paper in Regular Session Category)

2012.12 APSIPA

H. Doi, T. Toda, T. Nakano, M. Goto, S. Nakamura
2010年度音声研究会研究奨励賞

2011.6 電子情報通信学会／日本音響学会音声研

戸田智基

　More details

Country：Japan
IEEE Signal Processing Society 2009 Young Author Best Paper Award

2010.3 IEEE Signal Processing Society

T. Toda
日本音響学会第４回独創研究奨励賞板倉記念

2009.3 日本音響学会

戸田智基

　More details

Country：Japan
日本音響学会第２６回粟屋潔学術奨励賞

2009.3 日本音響学会

戸田智基

　More details

Country：Japan
電子情報通信学会 2007年度情報・システムソサイエティ論文賞（連作論文）

2008.12 電子情報通信学会情報・システムソサイエティ

全炳河, 戸田智基, 中村勝, 徳田恵一, 益子貴史, 小林隆夫, 北村正

　More details

Country：Japan
第１０回エリクソン・ヤング・サイエンティスト・アワード

2008.11 日本エリクソン株式会社

戸田智基

　More details

Country：Japan
第２３回電気通信普及財団賞テレコムシステム技術賞

2008.3 電気通信普及財団

全炳河, 戸田智基, 中村勝, 徳田恵一, 益子貴史, 小林隆夫, 北村正, 吉村貴克

　More details

Country：Japan
第１８回電気通信普及財団賞テレコムシステム技術学生賞

2003.3 電気通信普及財団

戸田智基

　More details

Country：Japan

▼display all

To the head of Awards.▲

Papers 351

SiFi-GAN: combining source-filter modeling and upsampling-based high-fidelity neural vocoder for fast and pitch-controllable speech synthesis Reviewed Open Access

R. Yoneyama, T. Toda

IEICE Transactions on Information and Systems Vol. E109-D ( 6 ) page： 945 - 956 2026.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1587/transinf.2025EDP7142

Open Access
From fixed positions to free-form signals: Virtual Microphone signal estimation for general-purpose spatial audio processing Reviewed

J. Wang, T. Toda

Proc. IEEE ICASSP page： 21011 - 21015 2026.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Audio-visual feature fusion for re-scoring relevance scores of video moment retrieval Reviewed

T. Imamura, T. Komatsu, H. Munakata, T. Toda

Proc. IEEE ICASSP page： 5551 - 5555 2026.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The singing voice conversion challenge 2025: from singer identity conversion to singing style conversion Reviewed International coauthorship

L.P. Violeta, X. Zhang, J. Shi, Y. Yasuda, W.-C. Huang, Z. Wu, T. Toda

Proc. IEEE ICASSP page： 17707 - 17711 2026.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Robust speech emotion recognition under human speech noise Reviewed Open Access

J. Mi, X. Shi, D. Ma, J. He, T. Fujimura, T. Toda

Computer Speech and Language Vol. 100 ( Article 101987 ) page： 1 - 16 2026.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.csl.2026.101987

Open Access
Emotion similarity and shift: modeling temporal dynamic interactions for emotion prediction in conversation Reviewed International coauthorship

X. Shi, X. Li, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 34 page： 2552 - 2567 2026.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
MOS-Bench: benchmarking generalization abilities of subjective speech quality assessment models Reviewed

W.-C. Huang, E. Cooper, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 34 page： 2385 - 2397 2026.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
An investigation of the robustness of flow- and diffusion-based speech generation models on noisy transcriptions Reviewed

J. Feng Y. Yasuda, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 15 ( 1 ) page： 270 - 292 2026.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Investigation of perceptual music similarity based on individual instrumental parts by large-scale listening test Reviewed

Y. Hashizume, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 15 ( 1 ) page： 249 - 269 2026.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Semi-supervised text-audio contrastive learning method using pseudo-text input Reviewed Open Access

T. Komatsu, H. Munakata, Y. Ishikawa, K. Takeda, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 15 ( 1 ) page： 183 - 198 2026.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1108/ATSIP-08-2025-0076

Open Access
A voice conversion system from electrolarynx speech to preoperative patient’s speech for total laryngectomy Reviewed Open Access

N. Nishio, K. Kobayashi, D. Ma, S. Mitani, M. Sone, T. Toda

OTO Open Vol. 10 ( 1 ) page： 5 pages 2026.2

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1002/oto2.70207

Open Access
Severity-controllable pathological text-to-speech synthesis for clinical applications Reviewed Open Access

B.M. Halpern, W.-C. Huang, L.P. Violeta, T. Toda

IEEE Transactions on Neural Systems and Rehabilitation Engineering Vol. 34 page： 573 - 582 2026.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TNSRE.2026.3651761

Open Access
A comprehensive study on the effectiveness of ASR representations for noise-robust speech emotion recognition Reviewed International coauthorship

X. Shi, J. He, X. Li, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 34 page： 707 - 722 2026.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
PARCO: phoneme-augmented robust contextual ASR via contrastive entity disambiguation Reviewed

J. He, N. Sawada, K. Miyazaki, T. Toda

Proc. IEEE ASRU page： 7 pages 2025.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Voice factor control using FIR-based fast neural vocoder for speech generation applications Reviewed

Y. Ohtani, T. Okamoto, T. Toda, H. Kawai

Proc. IEEE ASRU page： 4 pages 2025.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
The AudioMOS Challenge 2025 Reviewed International coauthorship

W.-C. Huang, H. Wang, C. Liu, Y.-C. Wu, A. Tjandra, W.-N. Hsu, E. Cooper, Y. Qin, T. Toda

Proc. IEEE ASRU page： 8 pages 2025.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Layer-wise analysis for quality of multilingual synthesized speech Reviewed

E. Cooper, T. Okamoto, Y. Ohtani, T. Toda, H. Kawai

Proc. IEEE ASRU page： 7 pages 2025.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Sequence-to-sequence voice conversion with weighted guided attention Reviewed Open Access

H. Yamashita, T. Okamoto, R. Takashima, Y. Ohtani, T. Takiguchi, T. Toda, H. Kawai

IEEE Access Vol. 13 page： 216583 - 216595 2025.12

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2025.3647153

Open Access
Audio difference learning framework for audio captioning Reviewed

T. Komatsu, K. Takeda, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e34 ) page： 1 - 18 2025.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Study on automatic generation of lecture videos based on content analysis of lecture slides Reviewed

K. Mizukami, D. Deguchi, T. Toda, H. Murase, H. Kyutoku, T. Minematsu

Proc. CELDA page： 4 pages 2025.11

　More details

Language：English Publishing type：Research paper (international conference proceedings)
XPPG-PCA: reference-free automatic speech severity evaluation with principal components Reviewed International coauthorship Open Access

B.M. Halpern, T.B. Tienkamp, T. Rebernik, R.J.J.H. van Son, S.A.H.J. de Visscher, M.J.H. Witjes, D. Abur, T. Toda

IEEE Journal of Selected Topics in Signal Processing Vol. 19 ( 5 ) page： 783 - 795 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/JSTSP.2025.3617859
Wavehax: aliasing-free neural waveform synthesis based on 2D convolution and harmonic prior for reliable complex spectrogram estimation Reviewed

R. Yoneyama, A. Miyashita, R. Yamamoto, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 4454 - 4470 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Handling domain shifts for anomalous sound detection: a review of DCASE-related work Reviewed International coauthorship

K. Wilkinghoff, T. Fujimura, K. Imoto, J. Le Roux, Z.-H. Tan, T. Toda

Proc. DCASE Workshop page： 20 - 24 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Speaker privacy and security in the big data era: protection and defense against deepfake Invited International coauthorship

L. Chen, K.A. Lee, Z.-H. Ling, X. Wang, R.K. Das, T. Toda, H. Li

Proc. APSIPA ASC 2025.10

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Neural semi-fragile watermarking for proactive deepfake speech detection Reviewed

D. Yoon, T. Toda

Proc. APSIPA ASC page： 2396 - 2401 2025.10

　More details

Authorship：Last author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)
Disfluency disentanglement enhancement in spoken-text-style transfer for spontaneous speech synthesis Reviewed

Y. Nakata, D. Yoshioka, W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 2254 - 2259 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Investigation of the effectiveness of converted speech auditory feedback in low-latency real-time voice conversion Reviewed

K. Niwa, K. Kobayashi, T. Toda

Proc. APSIPA ASC page： 905 - 910 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Designing a music difficulty measure for controllable automatic piano rearrangement Reviewed

H. Miyaji, K. Sawada, W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 834 - 839 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Estimating speaker'ss seating position from monaural speech in a simulated vehicle interior sound field Reviewed

M. Kaneko, W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 625 - 629 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An evaluation of supervised virtual microphone estimators in reverberant sound fields Reviewed

K. Hattori, W.-C. Huang, K. Takeda, T. Toda

Proc. APSIPA ASC page： 517 - 522 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
A preliminary study on sectional voice anonymization and detection Reviewed International coauthorship

S. Tang, Z. Liu, L. Chen, K. Lee, T. Toda, Z.-H. Ling

Proc. APSIPA ASC page： 318 - 323 2025.10

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Hierarchical symbolic music generation with variational autoencoder-based bar-wise feature sequences Reviewed

K. Sawada, W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 299 - 304 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Adjusting bias in anomaly scores via variance minimization for domain-generalized discriminative anomalous sound detection Reviewed

M. Matsumoto, T. Fujimura, W.-C. Huang, T. Toda

Proc. DCASE Workshop page： 25 - 29 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
ASDKit: a toolkit for comprehensive evaluation of anomalous sound detection methods Reviewed International coauthorship

T. Fujimura, K. Wilkinghoff, K. Imoto, T. Toda

Proc. DCASE Workshop page： 40 - 44 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Discriminative anomalous sound detection using pseudo labels, target signal enhancement, and ensemble feature extractors Reviewed

T. Fujimura, I. Kuroyanagi, T. Toda

Proc. DCASE Workshop page： 180 - 184 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Music similarity representation learning focusing on individual instruments with source separation and human preference Reviewed Open Access

T. Imamura, Y. Hashizume, W.-C. Huang, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 4, e305 ) page： 1 - 29 2025.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20250016

Open Access
喉頭摘出者における自己音声の再獲得～Save the Voice Project～ Reviewed

西尾直樹, 小林和弘, 戸田智基

気管食道科学会会報 Vol. 76 ( 5 ) page： 255 - 263 2025.10

　More details

Authorship：Last author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.2468/jbes.76.255
VAE-SiFiGAN: source-filter HiFi-GAN based on variational autoencoder representations with enhanced pitch controllability Reviewed Open Access

K. Ogita, R. Yoneyama, W.-C. Huang, T. Toda

Proc. EUSIPCO page： 531 - 535 2025.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

Open Access
QHARMA-GAN: quasi-harmonic neural vocoder based on autoregressive moving average model Reviewed Open Access

S. Chen, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 3703 - 3719 2025.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2025.3603847

Open Access
Automatic design optimization of preference-based subjective evaluation with online learning in crowdsourcing environment Reviewed Open Access

Y. Yasuda, T. Toda

Computer Speech and Language Vol. 96 ( Article 101888 ) page： 1 - 16 2025.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.csl.2025.101888

Open Access
Serenade: a singing style conversion framework based on audio infilling Reviewed Open Access

L.P. Violeta, W.-C. Huang, T. Toda

Proc. EUSIPCO page： 411 - 415 2025.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

Open Access
M4SER: multimodal, multirepresentation, multitask, and multistrategy learning for speech emotion recognition Reviewed International coauthorship

J. He, X. Shi, C.-H. Hu, J. Mi, X. Li, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 4055 - 4070 2025.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Text- and speech-style control for lecture speech generation focusing on disfluency Reviewed

D. Yoshioka, Y. Nakata, Y. Yasuda, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e26 ) page： 1 - 31 2025.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Continual subjective evaluation method of speech by merging sort-based preference tests towards ever-expanding corpus of human ratings Reviewed Open Access

Y. Yasuda, J. Yamagishi, T. Toda

Proc. SSW page： 14 - 20 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/SSW.2025-3

Open Access
Eigenvoice synthesis based on model editing for speaker generation Reviewed Open Access

M. Murata, K. Miyazaki, T. Koriyama, T. Toda

Proc. INTERSPEECH page： 5523 - 5527 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-277

Open Access
Unifying listener scoring scales: comparison learning framework for speech quality assessment and continuous speech emotion recognition Reviewed Open Access

C.-H. Hu, Y. Yasuda, A. Yoshimoto, T. Toda

Proc. INTERSPEECH page： 5428 - 5432 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1435

Open Access
SHEET: a multi-purpose open-source speech human evaluation estimation toolkit Reviewed Open Access

W.-C. Huang, E. Cooper, T. Toda

Proc. INTERSPEECH page： 2355 - 2359 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1977

Open Access
CMT-LLM: context-aware multi-talker ASR utilizing large language models Reviewed Open Access

J. He, N. Sawada, K. Miyazaki, T. Toda

Proc. INTERSPEECH page： 2575 - 2579 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-943

Open Access
GIA-MIC: multimodal emotion recognition with gated interactive attention and modality-invariant learning constraints Reviewed Open Access

J. He, J. Mi, T. Toda

Proc. INTERSPEECH page： 2695 - 2699 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-2696

Open Access
Relationship between objective and subjective perceptual measures of speech in individuals with head and neck cancer Reviewed International coauthorship Open Access

B. Halpern, T. Tienkamp, T. Rebernik, R. van Son, M. Wieling, D. Abur, T. Toda

Proc. INTERSPEECH page： 3733 - 3737 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1127

Open Access
Speaker-aware multi-task learning for speech emotion recognition Reviewed International coauthorship Open Access

X. Shi, X. Li, T. Toda

Proc. INTERSPEECH page： 4333 - 4337 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1439

Open Access
Advancing emotion recognition via ensemble learning: integrating speech, context, and text representations Reviewed International coauthorship Open Access

X. Shi, J. Mi, X. Li, T. Toda

Proc. INTERSPEECH page： 4693 - 4697 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1445

Open Access
Comparative analysis of fast and high-fidelity neural vocoders for low-latency streaming synthesis in resource-constrained environments Reviewed Open Access

R. Yoneyama, M. Kawamura, R. Terashima, R. Yamamoto, T. Toda

Proc. INTERSPEECH page： 4888 - 4892 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1819

Open Access
Who, When, and What: leveraging the "Three Ws" concept for emotion recognition in conversation Reviewed International coauthorship Open Access

X. Shi, X, Li, T. Toda

Proc. INTERSPEECH page： 1763 - 1767 2025.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1433

Open Access
GST-BERT-TTS: prosody prediction without accentual labels for multi-speaker TTS using BERT with global style tokens Reviewed Open Access

T. Ogura, T. Okamoto, Y. Ohtani, E. Cooper, T. Toda, H. Kawai

Proc. INTERSPEECH page： 444 - 448 2025.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.21437/Interspeech.2025-1098

Open Access
Improving electrolaryngeal speech enhancement via a representation learning method based on integrated text and speech representations Reviewed International coauthorship

D. Ma, J. Mi, F. Li, L.P. Violeta, K. Kobayashi, T. Toda

Proc. IEEE EMBC page： 6 pages 2025.7

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.1109/EMBC58623.2025.11254511
Phoneme-level duration controllable neural text-to-speech with phoneme embedding skip connection and modified Gaussian duration modeling Reviewed Open Access

T. Ogura, T. Okamoto, Y. Ohtani, E. Cooper, T. Toda, H. Kawai

IEEE Access Vol. 13 page： 118369 - 118380 2025.7

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2025.3585135

Open Access
Learning separated representations for instrument-based music similarity Reviewed Open Access

Y. Hashizume, L. Li, A. Miyashita, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e16 ) page： 1 - 32 2025.7

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20250013

Open Access
Pretraining and fine-tuning techniques for electrolaryngeal speech enhancement based on sequence-to-sequence voice conversion Reviewed Open Access

D. Ma, L.P. Violeta, K. Kobayashi, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 3189 - 3201 2025.7

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2025.3577374

Open Access
Noise and reverberation-controllable voice conversion Reviewed Open Access

Y. Choi, C. Xie, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 2430 - 2443 2025.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2025.3578761

Open Access
PMF-CEC: phoneme-augmented multimodal fusion for context-aware ASR error correction with error-specific selective decoding Reviewed Open Access

J. He, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 2402 - 2417 2025.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2025.3577356

Open Access
Improving anomalous sound detection through pseudo-anomalous set selection and pseudo-label utilization under unlabeled conditions Reviewed Open Access

I. Kuroyanagi, T. Fujimura, K. Takeda, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e13 ) page： 1 - 28 2025.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20250017

Open Access
Analysis and extension of noisy-target training for unsupervised target signal enhancement Reviewed Open Access

T. Fujimura, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e12 ) page： 1 - 27 2025.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20250018

Open Access
An investigation of noisy-to-noisy voice conversion performance in various noisy conditions Reviewed Open Access

C. Xie, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e10 ) page： 1 - 30 2025.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20250008

Open Access
Resolving domain mismatches in electrolaryngeal speech enhancement with linguistic intermediates Reviewed

L.P. Violeta, W.-C. Huang, D. Ma, R. Yamamoto, K. Kobayashi, T. Toda

IEEE Journal of Selected Topics in Signal Processing Vol. 19 ( 5 ) page： 827 - 839 2025.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Sequence-to-sequence voice conversion-based techniques for electrolaryngeal speech enhancement in noisy and reverberant conditions Reviewed International coauthorship Open Access

D. Ma, Y. Choi, T. Fujimura, F. Li, C. Xie, K. Kobayashi, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e8 ) page： 1 - 40 2025.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20240094

Open Access
Fast neural vocoder with fundamental frequency control using finite impulse response filters Reviewed Open Access

Y. Ohtani, T. Okamoto, T. Toda, H. Kawai

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 1893 - 1906 2025.4

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2025.3564048

Open Access
Predicting fundamental frequency patterns in electrolaryngeal speech using automated phoneme extraction Reviewed Open Access

M. Eshghi, T. Toda

IEEE Access Vol. 13 page： 73831 - 73847 2025.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2025.3564648

Open Access
Generalized sound field interpolation for freely spaced microphone arrays in rotation-robust beamforming Reviewed Open Access

S. Luan, Y. Wakabayashi, T. Toda

Applied Acoustics Vol. 236 ( Article 110706 ) page： 1 - 15 2025.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.apacoust.2025.110706

Open Access
Mora-level prosody prediction for text-to-speech using Japanese BERT without accentual labels Reviewed

T. Ogura, T. Okamoto, Y. Ohtani, E. Cooper, T. Toda, H. Kawai

Proc. IEEE ICASSP page： 1 - 5 2025.4

　More details

Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.1109/ICASSP49660.2025.10887607.
Investigating factors related to the naturalness of synthesized unison singing Reviewed

K. Nishizawa, R. Yamamoto, W.-C. Huang, T. Toda

Proc. IEEE ICASSP page： 1 - 5 2025.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.1109/ICASSP49660.2025.10889744
Improvements of discriminative feature space training for anomalous sound detection in unlabeled conditions Reviewed

T. Fujimura, I. Kuroyanagi, T. Toda

Proc. IEEE ICASSP page： 1 - 5 2025.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.1109/ICASSP49660.2025.10890020
Investigation of perceptual music similarity focusing on each instrumental part Reviewed

Y. Hashizume, T. Toda

Proc. IEEE ICASSP page： 1 - 5 2025.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)

DOI： 10.1109/ICASSP49660.2025.10887810
Mandarin speech reconstruction from surface electromyography based on generative adversarial networks Reviewed International coauthorship Open Access

F. Li, F. Shen, D. Ma, J. Zhou, L. Wang, F. Fan, T. Liu, X. Chen, T. Toda, H. Niu

Medicine in Novel Technology and Devices Vol. 26 ( Article 100359 ) page： 1 - 7 2025.3

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.medntd.2025.100359

Open Access
E2EPref: an end-to-end preference-based framework for speech quality assessment to alleviate bias in direct assessment scores Reviewed Open Access

C.-H. Hu, Y. Yasuda, T. Toda

Computer Speech and Language Vol. 93 ( Article 101799 ) page： 1 - 17 2025.3

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.csl.2025.101799

Open Access
Serial-OE: Anomalous sound detection based on serial method with outlier exposure capable of using small amounts of anomalous data for training Reviewed Open Access

I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e1 ) page： 1 - 32 2025.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20240060

Open Access
Nonparallel spoken-text-style transfer for linguistic expression control in speech generation Reviewed Open Access

D. Yoshioka, Y. Yasuda, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 333 - 346 2025.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2024.3522757

Open Access
Sequence-wise speech waveform modeling via gradient descent optimization of quasi-harmonic parameters Reviewed

S. Chen, T. Toda

IEEE Transactions on Audio, Speech and Language Processing Vol. 33 page： 319 - 332 2025.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLPRO.2024.3522784
Target speaker extraction under noisy underdetermined conditions using conditional variational autoencoder, global style token, and neural postfilter Reviewed Open Access

R. Wang, T. Fujimura, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 14 ( 1, e2 ) page： 1 - 26 2025.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1561/116.20240067

Open Access
SVDD 2024: The Inaugural Singing Voice Deepfake Detection Challenge Reviewed International coauthorship

Y. Zhang, Y. Zang, J. Shi, R. Yamamoto, T. Toda, Z. Duan

Proc. IEEE SLT page： 792 - 797 2024.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
End-to-end Mandarin speech reconstruction based on ultrasound tongue images using deep learning Reviewed International coauthorship Open Access

F. Li, F. Shen, D. Ma, J. Zhou, S. Zhang, L. Wang, F. Fan, T. Liu, X. Chen, T. Toda, H. Niu

IEEE Transactions on Neural Systems and Rehabilitation Engineering Vol. 33 page： 140 - 149 2024.12

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TNSRE.2024.3520498

Open Access
Two-stage framework for robust speech emotion recognition using target speaker extraction in human speech noise conditions Reviewed

J. Mi, X. Shi, D. Ma, J. He, T. Fujimura, T. Toda

Proc. APSIPA ASC page： 6 pages 2024.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Improved architecture for high-resolution piano transcription to efficiently capture acoustic characteristics of music signals Reviewed

J. Mi, S. Kim, T. Toda

Proc. APSIPA ASC page： 6 pages 2024.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Multi-modal video summarization based on two-stage fusion of audio, visual, and recognized text information Reviewed

Z. Yang, J. He, T. Toda

Proc. APSIPA ASC page： 6 pages 2024.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Multi-task learning approaches for music similarity representation learning based on individual instrument sounds Reviewed

T. Imamura, Y. Hashizume, T. Toda

Proc. APSIPA ASC page： 6 pages 2024.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
A study on multimodal fusion and layer adapter in emotion recognition Reviewed International coauthorship

X. Shi, Y. Gao, J. He, J. Mi, X. Li, T. Toda

Proc. APSIPA ASC page： 6 pages 2024.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Reference-free automatic speech severity evaluation using acoustic unit language modelling Reviewed

B. Halpern, T. Toda

Proc. SpandLDeteriorate Workshop of ACM Multimedia Asia (Workshop on Multi-Biological Sensing Data for Speech and Language Deterioration Prediction) page： 5 pages 2024.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The VoiceMOS Challenge 2024: beyond speech quality prediction Reviewed International coauthorship

W.-C. Huang, S.-W. Fu, E. Cooper, R. Zezario, T. Toda, H.-M. Wang, J. Yamagishi, Y. Tsao

Proc. IEEE SLT page： 813 - 820 2024.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Multi-speaker text-to-speech training with speaker anonymized data Reviewed International coauthorship

W.-C. Huang, Y.-C. Wu, T. Toda

IEEE Signal Processing Letters Vol. 31 page： 2995 - 2999 2024.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/LSP.2024.3482701
2DP-2MRC: 2-dimensional pointer-based machine reading comprehension method for multimodal moment retrieval Reviewed

J. He, T. Toda

Proc. INTERSPEECH page： 5073 - 5077 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
CtrSVDD: a benchmark dataset and baseline analysis for controlled singing voice deepfake detection Reviewed International coauthorship

Y. Zang, J. Shi, Y. Zhang, R. Yamamoto, J. Han, Y. Tang, S. Xu, W. Zhao, J. Guo, T. Toda, Z. Duan

Proc. INTERSPEECH page： 4783 - 4787 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Exploring the robustness of text-to-speech synthesis based on diffusion probabilistic models to heavily noisy transcriptions Reviewed

J. Feng, Y. Yasuda, T. Toda

Proc. INTERSPEECH page： 4408 - 4412 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
QHM-GAN: neural vocoder based on quasi-harmonic modeling Reviewed

S. Chen, T. Toda

Proc. INTERSPEECH page： 3889 - 3893 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Multimodal fusion of music theory-inspired and self-supervised representations for improved emotion recognition Reviewed International coauthorship

X. Shi, X. LI, T. Toda

Proc. INTERSPEECH page： 3724 - 3728 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Quantifying the effect of speech pathology on automatic and human speaker verification Reviewed International coauthorship

B. Halpern, T. Tienkamp, W.-C. Huang, L.P. Violeta, T. Rebernik, S. de Visscher, M.J.H. Witjes, M. Wieling, D. Abur, T. Toda

Proc. INTERSPEECH page： 3015 - 3019 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Embedding learning for preference-based speech quality assessment Reviewed

C.-H. Hu, Y. Yasuda, T. Toda

Proc. INTERSPEECH page： 2685 - 2689 2024.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Challenge of singing voice synthesis using only text-to-speech corpus with FIRNet source-filter neural vocoder Reviewed

T. Okamoto, Y. Ohtani, S. Shimizu, T. Toda, H. Kawai

Proc. INTERSPEECH page： 1870 - 1874 2024.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Discriminative neighborhood smoothing for generative anomalous sound detection Reviewed

T. Fujimura, K. Imoto, T. Toda

Proc. EUSIPCO page： 156 - 160 2024.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Unsupervised training of neural network-based virtual microphone estimator Reviewed

J. Wang, T. Toda

Proc. EUSIPCO page： 256 - 260 2024.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Robust sequence-to-sequence voice conversion for electrolaryngeal speech enhancement in noisy and reverberant conditions Reviewed

D. Ma, Y. Choi, F. Li, C. Xie, K. Kobayashi, T. Toda

Proc. IEEE EMBC page： 4 pages 2024.7

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
音声のMOS評価法の限界と大規模比較評価の新しい可能性 Invited Reviewed Open Access

安田裕介, 戸田智基

日本音響学会誌 Vol. 80 ( 7 ) page： 393 - 400 2024.7

　More details

Authorship：Last author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.20697/jasj.74.9_535

Open Access
合成音声の客観評価とVoiceMOSチャレンジ Invited Reviewed International coauthorship Open Access

クーパーエリカ, ホワンウェンチン, ツァオユ, ワンシンミン, 戸田智基, 山岸順一

日本音響学会誌 Vol. 80 ( 7 ) page： 381 - 392 2024.7

　More details

Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.20697/jasj.80.7_381

Open Access
A review on subjective and objective evaluation of synthetic speech Invited Reviewed International coauthorship Open Access

E. Cooper, W.-C. Huang, Y. Tsao, H.-M. Wang, T. Toda, J. Yamagishi

Acoustical Science and Technology Vol. 45 ( 4 ) page： 161 - 183 2024.7

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1250/ast.e24.12

Open Access
Mandarin speech reconstruction from tongue motion ultrasound images based on generative adversarial networks Reviewed International coauthorship

F. Li, F. Shen, D. Ma, S. Zhang, J. Zhou, L. Wang, F. Fan, T. Liu, X. Chen, T. Toda, H. Niu

Proc. IEEE EMBC page： 4 pages 2024.7

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Unequally spaced sound field interpolation for rotation-robust beamforming Reviewed

S. Luan, Y. Wakabayashi, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 32 page： 3185 - 3199 2024.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2024.3410879
Pretraining and adaptation techniques for electrolaryngeal speech recognition Reviewed Open Access

L.P. Violeta, D. Ma, W.-C. Huang, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 32 page： 2777 - 2789 2024.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2024.3402557
Audio difference learning for audio captioning Reviewed

T. Komatsu, Y. Fujita, K. Takeda, T. Toda

Proc. IEEE ICASSP page： 1456 - 1460 2024.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
ConvNeXt-TTS and ConvNeXt-VC: ConvNeXt-based fast end-to-end sequence-to-sequence text-to-speech and voice conversion Reviewed

T. Okamoto, Y. Ohtani, T. Toda, H. Kawai

Proc. IEEE ICASSP page： 12456 - 12460 2024.4

　More details

Language：English Publishing type：Research paper (international conference proceedings)
MF-AED-AEC: speech emotion recognition by leveraging multimodal fusion, ASR error detection, and ASR error correction Reviewed International coauthorship

J. He, X. Shi, X. Li, T. Toda

Proc. IEEE ICASSP page： 11066 - 11070 2024.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Electrolaryngeal speech intelligibility enhancement through robust linguistic encoders Reviewed

L.P. Violeta, W.-C. Huang, D. Ma, R. Yamamoto, K. Kobayashi, T. Toda

Proc. IEEE ICASSP page： 10961 - 10965 2024.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
FIRNET: fundamental frequency controllable fast neural vocoder with trainable finite impulse response filter Reviewed

Y. Ohtani, T. Okamoto, T. Toda, H. Kawai

Proc. IEEE ICASSP page： 10871 - 10875 2024.4

　More details

Language：English Publishing type：Research paper (international conference proceedings)
An investigation of fundamental frequency pattern prediction for Japanese eelectrolaryngeal speech enhancement based on frame-wise phoneme representations Reviewed Open Access

M. Eshghi, T. Toda

IEEE Access Vol. 12 page： 50137 - 50153 2024.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2024.3384973

Open Access
Dual-channel target speaker extraction based on conditional variational autoencoder and directional information Reviewed Open Access

R. Wang, L. Li, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 32 page： 12 pages 2024.3

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2024.3376154
Fast neural speech waveform generative models with fully-connected layer-based upsampling Reviewed Open Access

H. Yamashita, T. Okamoto, R. Takashima, Y. Ohtani, T. Takiguchi, T. Toda, H. Kawai

IEEE Access Vol. 12 page： 31409 - 31421 2024.2

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2024.3366707

Open Access
喉頭摘出者における音声収録アプリを用いた術前音声の保存 ―Save the Voice プロジェクト― Reviewed Open Access

西尾直樹, 戸田智基, 小林和弘, 三谷壮平, 飴矢美里, 向山宣昭, 木村宏之, 徳倉達也, 坪井崇, 藤本保志, 曾根三千彦

喉頭 Vol. 35 ( 2 ) page： 142 - 147 2023.12

　More details

Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.5426/larynx.35.142

Open Access
The Singing Voice Conversion Challenge 2023 Reviewed International coauthorship

W.-C. Huang, L.P. Violeta, S. Liu, J. Shi, T. Toda

Proc. IEEE ASRU page： 8 pages 2023.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
ED-CEC: improving rare word recognition using ASR post-processing based on error detection and context-aware error correction Reviewed

J. He, Z. Yang, T. Toda

Proc. IEEE ASRU page： 6 pages 2023.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Improving severity preservation of healthy-to-pathological voice conversion with global style tokens Reviewed International coauthorship

B. Halpern, W.-C. Huang, L.P. Violeta, R. van Son, T. Toda

Proc. IEEE ASRU page： 7 pages 2023.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
A comparative study of voice conversion models with large-scale speech and singing data: the T13 systems for the Singing Voice Conversion Challenge 2023 Reviewed

R. Yamamoto, R. Yoneyama, L.P. Violeta, W.-C. Huang, T. Toda

Proc. IEEE ASRU page： 6 pages 2023.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The VoiceMOS Challenge 2023: zero-shot subjective speech quality prediction for multiple domains Reviewed International coauthorship

E. Cooper, W.-C. Huang, Y. Tsao, H.-M. Wang, T. Toda, J. Yamagishi

Proc. IEEE ASRU page： 7 pages 2023.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
WaveNeXt: ConvNeXt-based fast neural vocoder without iSTFT layer Reviewed

T. Okamoto, H. Yamashita, Y. Ohtani, T. Toda, H. Kawai

Proc. IEEE ASRU page： 8 pages 2023.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Sequence-to-sequence network training methods for automatic guitar transcription with tokenized outputs Reviewed

S. Kim, K. Takeda, T. Toda

Proc. ISMIR page： 524 - 531 2023.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Evaluating methods for ground-truth-free foreign accent conversion Reviewed

W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 1136 - 1141 2023.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An analysis of personalized speech recognition system development for the deaf and hard-of-hearing Reviewed

L.P. Violeta, T. Toda

Proc. APSIPA ASC page： 1851 - 1856 2023.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Semi-supervised multimodal emotion recognition with consensus decision-making and label correction Reviewed International coauthorship

J. Tian, D. Hu, X. Shi, J. He, X. Li, Y. Gao, T. Toda, X. Xu, X. Hu

Proc. MRAC page： 67 - 73 2023.10

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Differentiable representation of warping based on Lie group theory Reviewed

A. Miyashita, T. Toda

Proc. IEEE WASPAA page： 5 pages 2023.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Directional target speaker extraction under noisy underdetermined conditions through conditional variational autoencoder with global style tokens Reviewed

R. Wang, T. Toda

Proc. IEEE WASPAA page： 5 pages 2023.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Sound field interpolation with unsupervised calibration for freely spaced circular microphone array in rotation-robust beamforming Reviewed

S. Luan, Y. Wakabayashi, T. Toda

Proc.EUSIPCO page： 21 - 25 2023.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
High-fidelity and pitch-controllable neural vocoder based on unified source-filter networks Reviewed

R. Yoneyama, Y.-C. Wu, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 31 page： 3717 - 3729 2023.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Noisy-to-noisy voice conversion under variations of noisy condition Reviewed

C. Xie, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 31 page： 3871 - 3882 2023.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Preference-based training framework for automatic speech quality assessment using deep neural network Reviewed

C.-H. Hu, Y. Yasuda, T. Toda

Proc. INTERSPEECH page： 546 - 550 2023.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Analysis of mean opinion scores in subjective evaluation of synthetic speech based on tail probabilities Reviewed

Y. Yasuda, T. Toda

Proc. INTERSPEECH page： 5491 - 5495 2023.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Reverberation-controllable voice conversion using reverberation time estimator Reviewed

Y. Choi, C. Xie, T. Toda

Proc. INTERSPEECH page： 2103 - 2107 2023.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
E2E-S2S-VC: end-to-end sequence-to-sequence voice conversion Reviewed

T. Okamoto, H. Yamashita, T. Toda, H. Kawai

Proc. INTERSPEECH page： 2043 - 2047 2023.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Emotion awareness in multi-utterance turn for improving emotion prediction in multi-speaker conversation Reviewed International coauthorship

X. Shi, X. Li, T. Toda

Proc. INTERSPEECH page： 765 - 769 2023.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Representation of vocal tract length transformation based on group theory Reviewed

A. Miyashita, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Analysis of Noisy-target Training for DNN-based speech enhancement Reviewed

T. Fujimura, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Intermediate fine-tuning using imperfect synthetic speech for improving electrolaryngeal speech recognition Reviewed

L.P. Violeta, D. Ma, W.-C. Huang, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Source-Filter HiFiGAN: fast and pitch controllable high-fidelity neural vocoder Reviewed International coauthorship

R. Yoneyama, Y.-C. Wu, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
NNSVS: a neural network based singing voice synthesis toolkit Reviewed

R. Yamamoto, R. Yoneyama, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Low-latency electrolaryngeal speech enhancement based on FastSpeech2-based voice conversion and self-supervised speech representation Reviewed

K. Kobayashi, T. Hayashi, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Text-to-speech synthesis based on latent variable conversion using diffusion probabilistic model and variational autoencoder Reviewed

Y. Yasuda, T. Toda

Proc. IEEE ICASSP page： 5 pages 2023.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Harmonic-Net: fundamental frequency and speech rate controllable fast neural vocoder Reviewed

K. Matsubara, T. Okamoto, R. Takashima, T. Takiguchi, T. Toda, H. Kawai

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 31 page： 1902 - 1915 2023.5

　More details

Language：English Publishing type：Research paper (scientific journal)
Two-stage training method for Japanese electrolaryngeal speech enhancement based on sequence-to-sequence voice conversion Reviewed

D. Ma, L.P. Violeta, K. Kobayashi, T. Toda

Proc. IEEE SLT page： 949 - 954 2023.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Music similarity calculation of individual instrumental sounds using metric learning Reviewed

Y. Hashizume, L. Li, T. Toda

Proc. APSIPA ASC page： 33 - 38 2022.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Sequence-wise optimization for quasi-harmonic speech waveform modeling Reviewed

S. Chen, T. Toda

Proc. APSIPA ASC page： 1658 - 1663 2022.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Direction-aware target speaker extraction with a dual-channel system based on conditional variational autoencoders under underdetermined conditions Reviewed

R. Wang, L. Li, T. Toda

Proc. APSIPA ASC page： 347 - 353 2022.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Interpretable control for emotional text-to-speech system toward development of sympathetic educational-support robots Reviewed

J. Feng, T. Yoshikawa, T. Toda

Proc. APSIPA ASC page： 342 - 346 2022.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Investigation of Japanese Png BERT language model in text-to-speech synthesis for pitch accent language Reviewed

Y. Yasuda, T. Toda

IEEE Journal of Selected Topics in Signal Processing Vol. 16 ( 6 ) page： 1319 - 1328 2022.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
A comparative study of self-supervised speech representation based voice conversion Reviewed International coauthorship

W.-C. Huang, S.-W. Yang, T. Hayashi, T. Toda

IEEE Journal of Selected Topics in Signal Processing Vol. 16 ( 6 ) page： 1308 - 1318 2022.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/JSTSP.2022.3193761
Noisy-to-noisy voice conversion with pre-training strategy Invited Reviewed

C. Xie, T. Toda

Proc. ICA page： 5 pages 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
A cyclical approach to synthetic and natural speech mismatch refinement of neural post-filter for low-cost text-to-speech system Reviewed

Y.-C. Wu, P.L. Tobing, K. Yasuhara, N. Matsunaga, Y. Ohtani, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 11 ( e30 ) page： 1 - 32 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Investigating self-supervised pretraining frameworks for pathological speech recognition Reviewed

L.P. Violeta, W.-C. Huang, T. Toda

Proc. INTERSPEECH page： 41 - 45 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Unified source-filter GAN with harmonic-plus-noise source excitation generation Reviewed

R. Yoneyama, Y.-C. Wu, T. Toda

Proc. INTERSPEECH page： 848 - 852 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The VoiceMOS Challenge 2022 Reviewed International coauthorship

W.-C. Huang, E. Cooper, Y. Tsao, H.-M. Wang, T. Toda, J. Yamagishi

Proc. INTERSPEECH page： 4536 - 4540 2022.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Spoken-text-style transfer with conditional variational autoencoder and content word storage Reviewed

D. Yoshioka, Y. Yaduda, N. Matsunaga, Y. Ohtani, T. Toda

Proc. INTERSPEECH page： 4576 - 4580 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An evaluation of three-stage voice conversion framework for noisy and reverberant conditions Reviewed

Y. Choi, C. Xie, T. Toda

Proc. INTERSPEECH page： 4910 - 4914 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Improvement of anomalous sound detection method considering the distribution of embedding Invited Reviewed

I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda

Proc. ICA page： 5 pages 2022.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Modified sound field interpolation method for rotation-robust beamforming with unequally spaced circular microphone array Reviewed

S. Luan, Y. Wakabayashi, T. Toda

Proc. EUSIPCO page： 344 - 348 2022.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Note-level automatic guitar transcription using attention mechanism Reviewed

S. Kim, T. Hayashi, T. Toda

Proc. EUSIPCO page： 229 - 233 2022.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Improvement of serial approach to anomalous sound detection by incorporating two binary cross-entropies for outlier exposure Reviewed

I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda

Proc. EUSIPCO page： 294 - 298 2022.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Generalization ability of MOS prediction networks Reviewed

E. Cooper, W.-C. Huang, T. Toda, J. Yamagishi

Proc. IEEE ICASSP page： 8442 - 8446 2022.5

　More details

Language：English Publishing type：Research paper (international conference proceedings)
LDNet: unified listener dependent modeling in MOS prediction for synthetic speech Reviewed

W.-C. Huang, E. Cooper, J. Yamagishi, T. Toda

Proc. IEEE ICASSP page： 896 - 900 2022.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
S3PRL-VC: open-source voice conversion framework with self-supervised speech representations Reviewed International coauthorship

W.-C. Huang, S.-W. Yang, T. Hayashi, H.-Y. Lee, S. Watanabe, T. Toda

Proc. IEEE ICASSP page： 6552 - 6556 2022.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Towards identity preserving normal to dysarthric voice conversion Reviewed International coauthorship

W.-C. Huang, B.M Halpern, L.P. Violeta, O. Scharenborg, T. Toda

Proc. IEEE ICASSP page： 6672 - 6676 2022.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Direct noisy speech modeling for noisy-to-noisy voice conversion Reviewed

C. Xie, Y-.C. Wu, P.L. Tobing, W-.C. Huang, T. Toda

Proc. IEEE ICASSP page： 6787 - 6791 2022.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An investigation of streaming non-autoregressive sequence-to-sequence voice conversion Reviewed

T. Hayashi, K. Kobayashi, T. Toda

Proc. IEEE ICASSP page： 6802 - 6806 2022.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Comparison of real-time multi-speaker neural vocoders on CPUs Reviewed Open Access

K. Matsubara, T. Okamoto, R. Takashima, T. Takiguchi, T. Toda, H. Kawai

Acoustical Science and Technology, Acoustical Letter Vol. 43 ( 2 ) page： 121 - 124 2022.3

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1250/ast.43.121

Open Access
Neural speech-rate conversion with multispeaker WaveNet vocoder Reviewed Open Access

T. Okamoto, K. Matsubara, T. Toda, Y. Shiga, H. Kawai

Speech Communication Vol. 138 page： 1 - 12 2022.3

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.specom.2022.01.003

Open Access
S3PRL-VC: open-source voice conversion framework with self-supervised speech representations Reviewed International coauthorship

W.-C. Huang, S.-W. Yang, T. Hayashi, H.-Y. Lee, S. Watanabe, T. Toda

Proc. AAAI-22 Workshop, W35: Self-Supervised Learning for Audio and Speech Processing page： 5 pages 2022.2

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Time alignment using lip images for frame-based electrolaryngeal voice conversion Reviewed International coauthorship

Y.-S. Liou, W.-C. Huang, M.-C. Yen, S.-W. Tsai, Y.-H. Peng, T. Toda, Y. Tsao, H.-M. Wang

Proc. APSIPA ASC page： 1234 - 1238 2021.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Multi-stream HiFi-GAN with data-driven waveform decomposition Reviewed

T. Okamoto, T. Toda, H. Kawai

Proc. IEEE ASRU page： 610 - 617 2021.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
On prosody modeling for ASR+TTS based voice conversion Reviewed International coauthorship

W.-C. Huang, T. Hayashi, X. Li, S. Watanabe, T. Toda

Proc. IEEE ASRU page： 642 - 649 2021.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Mandarin electrolaryngeal speech voice conversion with sequence-to-sequence modeling Reviewed International coauthorship

M.-C. Yen, W.-C. Huang, K. Kobayashi, Y.-H. Peng, S.-W. Tasi, Y. Tsao, T. Toda, J.-S. R. Jang, H.-M. Wang

Proc. IEEE ASRU page： 650 - 657 2021.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
HASA-Net: a non-intrusive hearing-aid speech assessment network Reviewed International coauthorship

H.-T. Chiang, Y.-C. Wu, C. Yu, T. Toda, H.-M. Wang, Y.-C. Hu, Y. Tsao

Proc. IEEE ASRU page： 907 - 913 2021.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Mandarin electro-laryngeal speech enhancement based on statistical voice conversion and manual tone control Reviewed International coauthorship

Z. Qian, H. Niu, L. Wang, K. Kobayashi, S. Zhang, T. Toda

Proc. APSIPA ASC page： 546 - 552 2021.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Noisy-to-noisy voice conversion framework with denoising model Reviewed

C. Xie, Y.-C. Wu, P.L. Tobing, W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 814 - 820 2021.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Investigation of text-to-speech-based synthetic parallel data for sequence-to-sequence non-parallel voice conversion Reviewed

D. Ma, W.-C. Huang, T. Toda

Proc. APSIPA ASC page： 870 - 877 2021.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An ensemble approach to anomalous sound detection based on conformer-based autoencoder and binary classifier incorporated with metric learning Reviewed

I. Kuroyanagi, T. Hayashi, Y. Adachi, T. Yoshimura, K. Takeda, T. Toda

Proc. DCASE 2021 Workshop page： 110 - 114 2021.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Singing fundamental frequency contour generation using generalized command response model and score-conditional variational autoencoder Reviewed

S. Seki, H. Taga, T. Toda

Proc. IEEE MLSP page： 1 - 6 2021.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Singing fundamental frequency contour generation using generalized command response model and score-conditional variational autoencoder Reviewed

S. Seki, H. Taga, T. Toda

Proc. IEEE MLSP page： 6 pages 2021.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Low-latency real-time non-parallel voice conversion based on cyclic variational autoencoder and multiband WaveRNN with data-driven linear prediction Reviewed

P.L. Tobing, T. Toda

Proc. 11th ISCA Speech Synthesis Workshop (SSW11) page： 142 - 147 2021.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Anomalous sound detection using a binary classification model and class centroids Reviewed

I. Kuroyanagi, T. Hayashi, K. Takeda, T. Toda

Proc. EUSIPCO page： 1995 - 1999 2021.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
A preliminary study of a two-stage paradigm for preserving speaker identity in dysarthric voice conversion Reviewed International coauthorship

W.-C. Huang, K. Kobayashi, Y.-H. Peng, C.-F. Liu, Y. Tsao, H.-M. Wang, T. Toda

Proc. INTERSPEECH page： 1329 - 1333 2021.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
学習支援サービスの運用とオンデマンド型を中心としたオンライン授業への展開――名古屋大学における事例――

戸田智基, 大平茂輝, 後藤明史, 出口大輔, 森健策

電子情報通信学会誌 Vol. 104 ( 8 ) page： 862 - 866 2021.8

　More details

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (scientific journal)
Relational data selection for data augmentation of speaker-dependent multi-band MelGAN vocoder Reviewed International coauthorship

Y.-C. Wu, C.-H. Hu, H.-S. Lee, Y.-H. Peng, W.-C. Huang, Y. Tsao, H.-M. Wang, T. Toda

Proc. INTERSPEECH page： 3630 - 3634 2021.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
High-fidelity and low-latency universal neural vocoder based on multiband WaveRNN with data-driven linear prediction for discrete waveform modeling Reviewed

P.L. Tobing, T. Toda

Proc. INTERSPEECH page： 2217 - 2221 2021.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Unified source-filter GAN: unified source-filter network based on factorization of quasi-periodic parallel WaveGAN Reviewed

R. Yoneyama, Y.-C. Wu, T. Toda

Proc. INTERSPEECH page： 2187 - 2191 2021.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Full-band LPCNet: a real-time neural vocoder for 48 kHz audio with a CPU Reviewed

K. Matsubara, T. Okamoto, R. Takashima, T. Takiguchi, T. Toda, Y. Shiga, H. Kawai

IEEE Access Vol. 9 page： 94923 - 94933 2021.7

　More details

Language：English Publishing type：Research paper (scientific journal)
Speech recognition by simply fine-tuning BERT Reviewed International coauthorship

W.-C. Huang, C.-H. Wu, S.-B. Luo, K.-Y. Chen, H.-M. Wang, T. Toda

Proc. IEEE ICASSP page： 7343 - 7347 2021.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Non-autoregressive sequence-to-sequence voice conversion Reviewed

T. Hayashi, W.-C. Huang, K. Kobayashi, T. Toda

Proc. IEEE ICASSP page： 7068 - 7072 2021.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
High-intelligibility speech synthesis for dysarthric speakers with LPCNet-based TTS and CycleVAE-based VC Reviewed

K. Matsubara, T. Okamoto, R. Takashima, T. Takiguchi, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ICASSP page： 7058 - 7062 2021.6

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Speech emotion recognition based on listener adaptive models Reviewed

A. Ando, R. Masumura, H. Sato, T. Moriya, T. Ashihara, Y. Ijima, T. Toda

Proc. IEEE ICASSP page： 6274 - 6278 2021.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Noise level limited sub-modeling for diffusion probabilistic vocoders Reviewed

T. Okamoto, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ICASSP page： 6029 - 6033 2021.6

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Any-to-one sequence-to-sequence voice conversion using self-supervised discrete speech representations Reviewed

W.-C. Huang, Y.-C. Wu, T. Hayashi, T. Toda

Proc. IEEE ICASSP page： 5944 - 5948 2021.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Crank: an open-source software for nonparallel voice conversion based on vector-quantized variational autoencoder Reviewed

K. Kobayashi, W.-C. Huang, Y.-C. Wu, P.L. Tobing, T. Hayashi, T. Toda

Proc. IEEE ICASSP page： 5934 - 5938 2021.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Speech emotion recognition based on listener-dependent emotion perception models Reviewed Open Access

A. Ando, T. Mori, S. Kobashikawa, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 10 ( e6 ) page： 1 - 11 2021.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1017/ATSIP.2021.7

Open Access
Quasi-periodic WaveNet: an autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network Reviewed

Y.-C. Wu, T. Hayashi, P.L. Tobing, K. Kobayashi, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 29 page： 1134 - 1148 2021.3

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Pretraining techniques for sequence-to-sequence voice conversion Reviewed

W.-C. Huang, T. Hayashi, Y.-C. Wu, H. Kameoka, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 29 page： 745 - 755 2021.2

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Quasi-periodic parallel WaveGAN: a non-autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network Reviewed

Y.-C. Wu, T. Hayashi, T. Okamoto, H. Kawai, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 29 page： 792 - 806 2021.2

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Many-to-many voice transformer network Reviewed

H. Kameoka, W.-C. Huang, K. Tanaka, T. Kaneko, N. Hojo, T. Toda

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 29 page： 656 - 670 2021.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
Investigation of training data size for real-time neural vocoders on CPUs Reviewed Open Access

K. Matsubara, T. Okamoto, R. Takashima, T. Takiguchi, T. Toda, Y. Shiga, H. Kawai

Acoustical Science and Technology, Acoustical Letter Vol. 42 ( 1 ) page： 65 - 68 2021.1

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1250/ast.42.65

Open Access
Cross-lingual voice conversion using cyclic variational auto-encoder and a WaveNet vocoder Reviewed

H. Nakatani, P.L. Tobing, K. Takeda, T. Toda

Proc. APSIPA ASC page： 520 - 526 2020.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Phoneme embeddings on predicting fundamental frequency pattern for electrolaryngeal speech Reviewed

M. Eshghi, K. Kobayashi, K. Tanaka, H. Kameoka, T. Toda

Proc. APSIPA ASC page： 572 - 577 2020.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
ASVspoof 2019: a large-scale public database of synthetic, converted and replayed speech Reviewed International coauthorship

X. Wang, J. Yamagishi, M. Todisco, H. Delgado, A. Nautsch, N. Evans, M. Sahidullah, V. Vestman, T. Kinnunen, K.A. Lee, L. Juvela, P. Alku, Y.-H. Peng, H.-T. Hwang, Y. Tsao, H.-M. Wang, S. Le Maguer, M. Becker, F. Henderson, R. Clark, Y. Zhang, Q. Wang, Y. Jia, K. Onuma, K. Mushika, T. Kaneda, Y. Jiang, L.-J. Liu, Y.-C. Wu, W.-C. Huang, T. Toda, K. Tanaka, H. Kameoka, I. Steiner, D. Matrouf, J.-F. Bonastre, A. Govender, S. Ronanki, J.-X. Zhang, Z.-H. Ling

Computer Speech and Language Vol. 64 ( Article 101114 ) page： 1 - 27 2020.11

　More details

Language：English Publishing type：Research paper (scientific journal)
Conformer-based sound event detection with semi-supervised learning and data augmentation Reviewed International coauthorship

K. Miyazaki, T. Komatsu, T. Hayashi, S. Watanabe, T. Toda, K. Takeda

Proc. DCASE 2020 Workshop page： 100 - 104 2020.11

　More details

Language：English Publishing type：Research paper (international conference proceedings)
An evaluation of voice conversion with neural network spectral mapping models and WaveNet vocoder Reviewed Open Access

P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda

APSIPA Transactions on Signal and Information Processing Vol. 9 ( e26, ) page： 1 - 14 2020.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1017/ATSIP.2020.24

Open Access
Quasi-periodic parallel WaveGAN vocoder: a non-autoregressive pitch-dependent dilated convolution model for parametric speech generation Reviewed

Y.-C. Wu, T. Hayashi, T. Okamoto, H. Kawai, T. Toda

Proc. INTERSPEECH page： 3535 - 3539 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The NU voice conversion system for the Voice Conversion Challenge 2020: on the effectiveness of sequence-to-sequence models and autoregressive neural vocoders Reviewed

W.-C. Huang, P.L. Tobing, Y.-C. Wu, K. Kobayashi, T. Toda

Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020 page： 165 - 169 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The sequence-to-sequence baseline for the Voice Conversion Challenge 2020: cascading ASR and TTS Reviewed International coauthorship

W.-C. Huang, T. Hayashi, S. Watanabe, T. Toda

Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020 page： 160 - 164 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Baseline system of Voice Conversion Challenge 2020 with cyclic variational autoencoder and parallel WaveGAN Reviewed

P.L. Tobing, Y.-C. Wu, T. Toda

Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020 page： 155 - 159 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Predictions of subjective ratings and spoofing assessments of Voice Conversion Challenge 2020 submissions Reviewed International coauthorship

R.K. Das, T. Kinnunen, W.-C. Huang, Z. Ling, J. Yamagishi, Z. Yi, X. Tian, T. Toda

Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020 page： 99 - 120 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Voice Conversion Challenge 2020 -- intra-lingual semi-parallel and cross-lingual voice conversion -- Reviewed International coauthorship

Z. Yi, W.-C. Huang, X. Tian, J. Yamagishi, R.K. Das, T. Kinnunen, Z. Ling, T. Toda

Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020 page： 80 - 98 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Cyclic spectral modeling for unsupervised unit discovery into voice conversion with excitation and waveform modeling Reviewed

P.L. Tobing, T. Hayashi, Y.-C. Wu, K. Kobayashi, T. Toda

Proc. INTERSPEECH page： 4861 - 4865 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Voice transformer network: sequence-to-sequence voice conversion using transformer with text-to-speech pretraining Reviewed

W.-C. Huang, T. Hayashi, Y.-C. Wu, H. Kameoka, T. Toda

Proc. INTERSPEECH page： 4676 - 4680 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Intelligibility enhancement based on speech waveform modification using hearing impairment simulator Reviewed

S. Hikosaka, S. Seki, T. Hayashi, K. Kobayashi, K. Takeda, H. Banno, T. Toda

Proc. INTERSPEECH page： 4059 - 4063 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Semi-supervised self-produced speech enhancement and suppression based on joint source modeling of air- and body-conducted signals using variational autoencoder Reviewed

S. Seki, M. Takada, T. Toda

Proc. INTERSPEECH page： 4039 - 4043 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
A cyclical post-filtering approach to mismatch refinement of neural vocoder for text-to-speech systems Reviewed

Y.-C. Wu, P.L. Tobing, K. Yasuhara, N. Matsunaga, Y. Ohtani, T. Toda

Proc. INTERSPEECH page： 3540 - 3544 2020.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Implementation of low-latency electrolaryngeal speech enhancement based on multi-task CLDNN Reviewed

K. Kobayashi, T. Toda

Proc. EUSIPCO page： 396 - 400 2020.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Semi-supervised enhancement and suppression of self-produced speech using correspondence between air- and body-conducted signals Reviewed

M. Takada, S. Seki, P.L. Tobing, T. Toda

Proc. EUSIPCO page： 456 - 460 2020.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Weakly-supervised sound event detection with self-attention Reviewed International coauthorship

K. Miyazaki, T. Komatsu, T. Hayashi, S. Watanabe, T. Toda, K. Takeda

Proc. IEEE ICASSP page： 66 - 70 2020.5

　More details

Language：English Publishing type：Research paper (international conference proceedings)
ESPNET-TTS: Uunified, reproducible, and integratable open source end-to-end text-to-speech toolkit Reviewed International coauthorship

T. Hayashi, R. Yamamoto, K. Inoue, T. Yoshimura, S. Watanabe, T. Toda, K. Takeda, Y. Zhang, X. Tan

Proc. IEEE ICASSP page： 7654 - 7658 2020.5

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Efficient shallow WaveNet vocoder using multiple samples output based on Laplacian distribution and linear prediction Reviewed

P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda

Proc. IEEE ICASSP page： 7204 - 7208 2020.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Transformer-based text-to-speech with weighted forced attention Reviewed

T. Okamoto, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ICASSP page： 6729 - 6733 2020.5

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Non-parallel voice conversion system with WaveNet vocoder and collapsed speech suppression Reviewed

Y.-C. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda

IEEE Access Vol. 8 ( 1 ) page： 62094 - 62106 2020.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
LMS経由で手書きレポートを返却するWebサービス「かみレポ」の開発・評価 Reviewed Open Access

大平茂輝, 清谷峻也, 伊藤瑠哉, 岡本康佑, 谷川右京, 出口大輔, 戸田智基

情報処理学会論文誌：教育とコンピュータ Vol. 6 ( 1 ) page： 52 - 68 2020.2

　More details

Authorship：Last author Language：Japanese Publishing type：Research paper (scientific journal)

Open Access
Customer satisfaction estimation in contact center calls based on a hierarchical multi-task model Reviewed

A. Ando, R. Masumura, H. Kamiyama, S. Kobashikawa, Y. Aono, T. Toda

IEEE/ACM Transactions on Audio, Speech, and Language Processing Vol. 28 ( 1 ) page： 715 - 728 2020.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2020.2966857
機械学習と音声生成：音声波形モデリングの進展 Open Access

戸田智基

計測と制御 Vol. 58 ( 12 ) page： 951 - 954 2019.12

　More details

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.11499/sicejl.58.951

Open Access
Investigation of shallow WaveNet vocoder with Laplacian distribution output Reviewed

P.L. Tobing, T. Hayashi, T. Toda

Proc. IEEE ASRU page： 176 - 183 2019.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Tacotron-based acoustic model using phoneme alignment for practical neural text-to-speech synthesis Reviewed

T. Okamoto, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ASRU page： 214 - 221 2019.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Underdetermined source separation based on generalized multichannel variational autoencoder Reviewed Open Access

S. Seki, H. Kameoka, L. Li, T. Toda, K. Takeda

IEEE Access Vol. 7 ( 1 ) page： 168104 - 168115 2019.12

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2019.2954120

Open Access
Voice conversion with CycleRNN-based spectral mapping and finely-tuned WaveNet vocoder Reviewed Open Access

P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda

IEEE Access Vol. 7 ( 1 ) page： 171114 - 171125 2019.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/ACCESS.2019.2955978

Open Access
Improving singing aid system for laryngectomees with statistical voice conversion and VAE-SPACE Reviewed

L. Li, T. Toda, K. Morikawa, K. Kobayashi, S. Makino

Proc. ISMIR page： 784 - 790 2019.11

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Development of a real-time bionic voice generation system based on statistical excitation prediction Reviewed International coauthorship

F. Ahmadi, K. Kobayashi, T. Toda

Proc. ACM ASSETS page： 655 - 657 2019.10

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Generalized multichannel variational autoencoder for underdetermined source separation Reviewed

S. Seki, H. Kameoka, L. Li, T. Toda, K. Takeda

Proc. EUSIPCO page： 5 pages 2019.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
統計的手法による音響イベント検出 Open Access

林知樹, 戸田智基

日本音響学会誌 Vol. 75 ( 9 ) page： 532 - 537 2019.9

　More details

Authorship：Last author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.20697/jasj.75.9_532

Open Access
An investigation of features for fundamental frequency pattern prediction in electrolaryngeal speech enhancement Reviewed

M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda

Proc. 10th ISCA Speech Synthesis Workshop (SSW10) page： 251 - 256 2019.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Statistical voice conversion with quasi-periodic WaveNet vocoder Reviewed

Y.-C. Wu, T. Hayashi, P.L. Tobing, K. Kobayashi, T. Toda

Proc. 10th ISCA Speech Synthesis Workshop (SSW10) page： 63 - 68 2019.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Generalization of spectrum differential based direct waveform modification for voice conversion Reviewed International coauthorship

W.-C. Huang, Y.-C. Wu, K. Kobayashi, Y.-H. Peng, H.-T. Hwang, P.L. Tobing, Y. Tsao, H.-M. Wang, T. Toda

Proc. 10th ISCA Speech Synthesis Workshop (SSW10) page： 57 - 62 2019.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Pre-trained text embeddings for enhanced text-to-speech synthesis Reviewed International coauthorship

T. Hayashi, S. Watanabe, T. Toda, K. Takeda, S. Toshniwal, K. Livescu

Proc. INTERSPEECH page： 4430 - 4434 2019.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Real-time neural text-to-speech with sequence-to-sequence acoustic model and WaveGlow or single Gaussian WaveRNN vocoders Reviewed

T. Okamoto, T. Toda, Y. Shiga, H. Kawai

Proc. INTERSPEECH page： 1308 - 1312 2019.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Investigation of F0 conditioning and fully convolutional networks in variational autoencoder based voice conversion Reviewed International coauthorship

W.-C. Huang, Y.-C. Wu, C.-C. Lo, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang

Proc. INTERSPEECH page： 709 - 713 2019.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Robustness of statistical voice conversion based on direct waveform modification against background sounds Reviewed

Y. Kurita, K. Kobayashi, K. Takeda, T. Toda

Proc. INTERSPEECH page： 684 - 688 2019.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Non-parallel voice conversion with cyclic variational autoencoder Reviewed

P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda

Proc. INTERSPEECH page： 674 - 678 2019.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Quasi-periodic WaveNet vocoder: a pitch dependent dilated convolution model for parametric speech generation Reviewed

Y.-C. Wu, T. Hayashi, P.L. Tobing, K. Kobayashi, T. Toda

Proc. INTERSPEECH page： 196 - 200 2019.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Refined WaveNet vocoder for variational autoencoder based voice conversion Reviewed International coauthorship

W.-C. Huang, Y.-C. Wu, H.-T. Hwang, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang

Proc. EUSIPCO page： 5 pages 2019.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Investigations of real-time Gaussian FFTNet and parallel WaveNet neural vocoders with simple acoustic features Reviewed

T. Okamoto, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ICASSP page： 7020 - 7024 2019.5

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Voice conversion with cyclic recurrent neural network and fine-tuned WaveNet vocoder Reviewed

P.L. Tobing, Y. Wu, T. Hayashi, K. Kobayashi, T. Toda

Proc. IEEE ICASSP page： 6815 - 6819 2019.5

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Scene-dependent anomalous acoustic-event detection based on conditional WaveNet and i-Vector Reviewed

T. Komatsu, T. Hayashi, R. Kondo, T. Toda, K. Takeda

Proc. IEEE ICASSP page： 870 - 874 2019.5

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Environmental sound processing and its applications Invited Reviewed Open Access

K. Miyazaki, T. Toda, T. Hayashi, K. Takeda

IEEJ Transactions on Electronics, Information and Systems Vol. 14 ( 3 ) page： 340 - 351 2019.3

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1002/tee.22868
Speech-to-singing voice conversion: the challenges and strategies for improving vocal conversion processes Reviewed International coauthorship

K. Vijayan, H. Li, T. Toda

IEEE Signal Processing Magazine Vol. 36 ( 1 ) page： 95 - 102 2019.1

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)
An end-to-end model for cross-lingual transformation of paralinguistic information Reviewed

T. Kano, S. Takamichi, S. Sakti, G. Neubig, T. Toda, S. Nakamura

Machine Translation Vol. 32 ( 4 ) page： 353 - 368 2018.12

　More details

Language：English Publishing type：Research paper (scientific journal)
Back-translation-style data augmentation for end-to-end ASR Reviewed International coauthorship

T. Hayashi, S. Watanabe, Y. Zhang, T. Toda, T. Hori, R. Astudillo, K. Takeda

Proc. IEEE SLT page： 426 - 433 2018.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Improving FFTNet vocoder with noise shaping and subband approaches Reviewed

T. Okamoto, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE SLT page： 304 - 311 2018.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
An evaluation of deep spectral mappings and WaveNet vocoder for voice conversion Reviewed

P.L. Tobing, T. Hayashi, Y. Wu, K. Kobayashi, T. Toda

Proc. IEEE SLT page： 297 - 303 2018.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Daily activity recognition based on recurrent neural network using multi-modal signals Reviewed

A. Tamamori, T. Hayashi, T. Toda, K. Takeda

APSIPA Transactions on Signal and Information Processing Vol. 7 ( e21 ) page： 1 - 11 2018.12

　More details

Language：English Publishing type：Research paper (scientific journal)
Self-produced speech enhancement and suppression method using air- and body-conductive microphones Reviewed

M. Takada, S. Seki, T. Toda

Proc. APSIPA ASC page： 1240 - 1245 2018.11

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Connectionist temporal classification-based sound event encoder for converting sound events into onomatopoeia representations Reviewed

K. Miyazaki, T. Hayashi, T. Toda, K. Takeda

Proc. EUSIPCO page： 857 - 861 2018.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Designing a pneumatic bionic voice prosthesis - statistical approach for source excitation generation Reviewed International coauthorship

F. Ahmadi, T. Toda

Proc. INTERSPEECH page： 3142 - 3146 2018.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Audio-visual voice conversion using deep canonical correlation analysis for deep bottleneck features Reviewed

S. Tamura, K. Horio, H. Endo, S. Hayamizu, T. Toda

Proc. INTERSPEECH page： 2469 - 2473 2018.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Frequency domain variants of velvet noise and their application to speech processing and synthesis Reviewed

H. Kawahara, K. Sakakibara, M. Morise, H. Banno, T. Toda, T. Irino

Proc. INTERSPEECH page： 2027 - 2031 2018.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Collapsed segment detection and reduction for WaveNet vocoder Reviewed

Y. Wu, K. Kobayashi, T. Hayashi, P.L. Tobing, T. Toda

Proc. INTERSPEECH page： 1998 - 1992 2018.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Multi-Head Decoder for end-to-end speech recognition Reviewed International coauthorship

T. Hayashi, S. Watanabe, T. Toda, K. Takeda

Proc. INTERSPEECH page： 801 - 805 2018.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Anomalous sound event detection based on WaveNet Reviewed

T. Hayashi, T. Komatsu, R. Kondo, T. Toda, K. Takeda

Proc. EUSIPCO page： 2508 - 2512 2018.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Electrolarygeal speech enhancement with statistical voice conversion based on CLDNN Reviewed

K. Kobayashi, T. Toda

Proc. EUSIPCO page： 2129 - 2133 2018.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
音声翻訳システムにおける音声変換の利用 Open Access

高道慎之介, 戸田智基

日本音響学会誌 Vol. 74 ( 9 ) page： 535 - 538 2018.9

　More details

Authorship：Last author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.20697/jasj.74.9_535

Open Access
Stereophonic music separation based on non-negative tensor factorization with cepstral distance regularization Reviewed

S. Seki, T. Toda, K. Takeda

IEICE Transactions on Fundamentals Vol. E101-A ( 7 ) page： 1057 - 1064 2018.7

　More details

Language：English Publishing type：Research paper (scientific journal)
A spoofing benchmark for the 2018 voice conversion challenge: leveraging from spoofing countermeasures for speech artifact assessment Reviewed International coauthorship

T. Kinnunen, J. Lorenzo-Trueba, J. Yamagishi, T. Toda, D. Saito, F. Villavicencio, Z. Ling

Proc. Odyssey 2018 page： 187 - 194 2018.6

　More details

Language：English Publishing type：Research paper (international conference proceedings)
NU voice conversion system for the voice conversion challenge 2018 Reviewed

P.L. Tobing, Y. Wu, T. Hayashi, K. Kobayashi, T. Toda

Proc. Odyssey 2018 page： 219 - 226 2018.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The NU non-parallel voice conversion system for the voice conversion challenge 2018 Reviewed

Y. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda

Proc. Odyssey 2018 page： 211 - 218 2018.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
sprocket: open-source voice conversion software Reviewed

K. Kobayashi, T. Toda

Proc. Odyssey 2018 page： 203 - 210 2018.6

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
The voice conversion challenge 2018: promoting development of parallel and nonparallel methods Reviewed International coauthorship

J. Lorenzo-Trueba, J. Yamagishi, T. Toda, D. Saito, F. Villavicencio, T. Kinnunen, Z. Ling

Proc. Odyssey 2018 page： 195 - 202 2018.6

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Intra-gender statistical singing voice conversion with direct waveform modification using log-spectral differential Reviewed Open Access

K. Kobayashi, T. Toda, S. Nakamura

Speech Communication Vol. 99 page： 211 - 220 2018.5

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.specom.2018.03.011

Open Access
An investigation of subband WaveNet vocoder covering entire audible frequency range with limited acoustic features Reviewed

T. Okamoto, K. Tachibana, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ICASSP page： 5654 - 5658 2018.4

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Development of "KamiRepo" system with automatic student identification to handle handwritten assignments on LMS Reviewed

S. Seiya, R. Ito, K. Okamoto, U. Tanikawa, S. Ohira, D. Deguchi, T. Toda

Proc. IEEE EDUCON page： 841 - 848 2018.4

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An investigation of noise shaping with perceptual weighting for WaveNet-based speech generation Reviewed

K. Tachibana, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ICASSP page： 5664 - 5668 2018.4

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Deep neural network-based power spectrum reconstruction to improve quality of vocoded speech with limited acoustic parameters Reviewed

T. Okamoto, K. Tachibana, T. Toda, Y. Shiga, H. Kawai

Acoustical Science and Technology, Acoustical Letter Vol. 39 ( 2 ) page： 163 - 166 2018.3

　More details

Language：Japanese Publishing type：Research paper (scientific journal)
統計的声質変換ソフトウェア入門 Invited Reviewed Open Access

戸田智基, 小林和弘

システム/制御/情報 Vol. 62 ( 2 ) page： 69 - 75 2018.2

　More details

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.11509/isciesci.62.2_69

Open Access
Daily activity recognition with large-scaled real-life recording datasets based on deep neural network using multi-modal signals Reviewed

T. Hayashi, M. Nishida, N. Kitaoka, T. Toda, K. Takeda

IEICE Transactions on Fundamentals Vol. E101-A ( 1 ) page： 199 - 210 2018.1

　More details

Language：English Publishing type：Research paper (scientific journal)
Electrolaryngeal speech modification towards singing aid system for laryngectomees Reviewed

K. Morikawa, T. Toda

Proc. APSIPA ASC page： 1 - 4 2017.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Articulatory controllable speech modification based on statistical inversion and production mappings Reviewed Open Access

P.L. Tobing, K. Kobayashi, T. Toda

IEEE/ACM Transactions on Audio, Speech, and Language Processing Vol. 25 ( 12 ) page： 2337 - 2350 2017.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2017.2753583

Open Access
An investigation of multi-speaker training for WaveNet vocoder Reviewed

T. Hayashi, A. Tamamori, K. Kobayashi, K. Takeda, T. Toda

Proc. IEEE ASRU page： 712 - 718 2017.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Subband WaveNet with overlapped single-sideband filterbanks Reviewed

T. Okamoto, K. Tachibana, T. Toda, Y. Shiga, H. Kawai

Proc. IEEE ASRU page： 698 - 704 2017.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Accurate estimation of fo and aperiodicity based on periodicity detector residuals and deviations of phase derivatives Reviewed

H. Kawahara, K. Sakakibara, M. Morise, H. Banno, T. Toda

Proc. APSIPA ASC page： 1 - 9 2017.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
An investigation of how to design control parameters for statistical voice timbre control Reviewed

K. Kubo, K. Kobayashi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. APSIPA ASC page： 1 - 4 2017.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Investigation of effectiveness on recurrent neural network for daily activity recognition using multi-modal signals Invited Reviewed

A. Tamamori, T. Hayashi, T. Toda, K. Takeda

Proc. APSIPA ASC page： 1 - 7 2017.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Deep acoustic-to-articulatory inversion mapping with latent trajectory modeling Reviewed

P.L. Tobing, H. Kameoka, T. Toda

Proc. APSIPA ASC page： 1 - 4 2017.12

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Duration-controlled LSTM for polyphonic sound event detection Reviewed International coauthorship

T. Hayashi, S. Watanabe, T. Toda, T. Hori, J. Le Roux, K. Takeda

IEEE/ACM Transactions on Audio, Speech, and Language Processing Vol. 25 ( 11 ) page： 2059 - 2070 2017.11

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2017.2740002
Missing component restoration for masked speech signals based on time-domain spectrogram factorization Reviewed

S. Seki, H. Kameoka, T. Toda, K. Takeda.

Proc. IEEE MLSP page： 6 pages 2017.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
A vibration control method of an electrolarynx based on statistical F0 pattern prediction Reviewed

K. Tanaka, T. Toda, S. Nakamura

IEICE Transactions on Information and Systems Vol. E100-D ( 9 ) page： 2165 - 2173 2017.9

　More details

Language：English Publishing type：Research paper (scientific journal)
A modulation property of time-frequency derivatives of filtered phase and its application to aperiodicity and FO estimation Reviewed

H. Kawahara, K. Sakakibara, M. Morise, H. Banno, T. Toda

Proc. INTERSPEECH page： 424 - 428 2017.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Stereophonic music separation based on non-negative tensor factorization with cepstrum regularization Reviewed

S. Seki, T. Toda, K. Takeda

Proc. EUSIPCO page： 1011 - 1015 2017.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Speech enhancement using non-negative spectrogram models with mel-generalized cepstral regularization Reviewed

L. Li, H. Kameoka, T. Toda, S. Makino

Proc. INTERSPEECH page： 1998 - 2002 2017.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
A new cosine series antialiasing function and its application to aliasing-free glottal source models for speech and singing synthesis Reviewed

H. Kawahara, K. Sakakibara, H. Banno, M. Morise, T. Toda, T. Irino

Proc. INTERSPEECH page： 1358 - 1362 2017.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Statistical voice conversion with WaveNet-based waveform generation Reviewed

K. Kobayashi, T. Hayashi, A. Tamamori, T. Toda

Proc. INTERSPEECH page： 1138 - 1142 2017.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Speaker-dependent WaveNet vocoder Reviewed

A. Tamamori, T. Hayashi, K. Kobayashi, K. Takeda, T. Toda

Proc. INTERSPEECH page： 1118 - 1122 2017.8

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Physically constrained statistical F0 prediction for electrolaryngeal speech enhancement Reviewed

K. Tanaka, H. Kameoka, T. Toda, S. Nakamura

Proc. INTERSPEECH page： 1069 - 1073 2017.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Preserving word-level emphasis in speech-to-speech translation Reviewed

Q. Truong Do, T. Toda, G. Neubig, S. Sakti, S. Nakamura

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 25 ( 3 ) page： 544 - 556 2017.3

　More details

Language：English Publishing type：Research paper (scientific journal)
A noise suppression method for body-conducted soft speech based on non-negative tensor factorization of air- and body-conducted signals Reviewed

Y. Tajiri, H. Kameoka, T. Toda

Proc. IEEE ICASSP page： 4960 - 4964 2017.3

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
BLSTM-HMM hybrid system combined with sound activity detection network for polyphonic sound event detection Reviewed International coauthorship

T. Hayashi, S. Watanabe, T. Toda, T. Hori, J. Le Roux, K. Takeda

Proc. IEEE ICASSP page： 766 - 770 2017.3

　More details

Language：English Publishing type：Research paper (international conference proceedings)
中間言語情報を記憶するピボット翻訳手法 Reviewed Open Access

三浦明波, Graham Neubig, Sakriani Sakti, 戸田智基, 中村哲

自然言語処理 Vol. 23 ( 5 ) page： 499 - 528 2016.12

　More details

Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.5715/jnlp.23.499

Open Access
Non-native text-to-speech preserving speaker individuality based on partial correction of prosodic and phonetic characteristics Reviewed

Y. Oshima, S. Takamichi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

IEICE Transactions on Information and Systems Vol. E99-D ( 12 ) page： 3132 - 3139 2016.12

　More details

Language：English Publishing type：Research paper (scientific journal)
F0 transformation techniques for statistical voice conversion with direct waveform modification with spectral differential Reviewed

K. Kobayashi, T. Toda, S. Nakamura

Proc. IEEE SLT page： 693 - 700 2016.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Learning cooperative persuasive dialogue policies using framing Reviewed

T. Hiraoka, G. Neubig, S. Sakti, T. Toda, S. Nakamura

Speech Communication Vol. 84 page： 83 - 96 2016.11

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1016/j.specom.2016.09.002
Improvements of voice timbre control based on perceived age in singing voice conversion Reviewed

K. Kobayashi, T. Toda, T. Nakano, M. Goto, S. Nakamura

IEICE Transactions on Information and Systems Vol. E99-D ( 11 ) page： 2767 - 2777 2016.11

　More details

Language：English Publishing type：Research paper (scientific journal)
Investigation on recurrent neural network architectures for daily activity recognition Reviewed

A. Tamamori, T. Hayashi, T. Toda, K. Takeda

Proc. UV2016 page： 1 - 4 2016.10

　More details

Language：English Publishing type：Research paper (international conference proceedings)
A statistical sample-based approach to GMM-based voice conversion using tied-covariance acoustic models Reviewed

S. Takamichi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

IEICE Transactions on Information and Systems Vol. E99-D ( 10 ) page： 2490 - 2498 2016.10

　More details

Language：English Publishing type：Research paper (scientific journal)
A hybrid system for continuous word-level emphasis modeling based on HMM state clustering and adaptive training Reviewed

Q. Truong Do, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. INTERSPEECH page： 3196 - 3200 2016.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Nonaudible murmur enhancement based on statistical voice conversion and noise suppression with external noise monitoring Reviewed

Y. Tajiri, T. Toda

Proc. 9th ISCA Speech Synthesis Workshop (SSW9) page： 54 - 60 2016.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Acoustic-to-articulatory inversion mapping based on latent trajectory Gaussian mixture model Reviewed

P.L. Tobing, T. Toda, H. Kameoka, S. Nakamura

Proc. INTERSPEECH page： 953 - 957 2016.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
The Voice Conversion Challenge 2016 Reviewed International coauthorship

T. Toda, L.-H. Chen, D. Saito, F. Villavicencio, M. Wester, Z. Wu, J. Yamagishi

Proc. INTERSPEECH page： 1632 - 1636 2016.9

　More details

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)
The NU-NAIST voice conversion system for the Voice Conversion Challenge 2016 Reviewed

K. Kobayashi, S. Takamichi, S. Nakamura, T. Toda

Proc. INTERSPEECH page： 1667 - 1671 2016.9

　More details

Authorship：Last author Language：English Publishing type：Research paper (international conference proceedings)
Model integration for HMM- and DNN-based speech synthesis using Product-of-Experts framework Reviewed

K. Tachibana, T. Toda, Y. Shiga, H. Kawai

Proc. INTERSPEECH page： 2288 - 2292 2016.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Removing noise from event-related potentials using a probabilistic generative model with grouped covariance matrices Reviewed

H. Maki, T. Toda, S. Sakti, G. Neubig, S. Nakamura

Proc. IEEE EMBC page： 1 - 4 2016.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Real-time vibration control of an electrolarynx based on statistical F0 contour prediction Reviewed

K. Tanaka, T. Toda, G. Neubig, S. Nakamura

Proc. EUSIPCO page： 1333 - 1337 2016.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Teaching social communication skills through human-agent interaction Reviewed

H. Tanaka, S. Sakti, G. Neubig, T. Toda, H. Negoro, H. Iwasaka, S. Nakamura

ACM Transactions on Interactive Intelligent Systems Vol. 6 ( 2 ) page： 1 - 23 2016.8

　More details

Language：English Publishing type：Research paper (scientific journal)
Bidirectional LSTM-HMM hybrid system for polyphonic sound event detection Reviewed International coauthorship

T. Hayashi, S. Watanabe, T. Toda, T. Hori, J. Le Roux, K. Takeda

Proc. DCASE2016 workshop page： 1 - 5 2016.8

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Enhancing event-related potentials based on maximum a posteriori estimation with a spatial correlation prior Reviewed

H. Maki, T. Toda, S. Sakti, G. Neubig, S. Nakamura

IEICE Transactions on Information and Systems Vol. E99-D ( 6 ) page： 1410 - 1419 2016.6

　More details

Language：English Publishing type：Research paper (scientific journal)
はじめての音声変換 Open Access

戸田智基

日本音響学会誌 Vol. 72 ( 6 ) page： 324 - 331 2016.6

　More details

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.20697/jasj.72.6_324

Open Access
Post-filters to modify the modulation spectrum for statistical parametric speech synthesis Reviewed International coauthorship

S. Takamichi, T. Toda, A.W. Black, G. Neubig, S. Sakti, S. Nakamura

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 24 ( 4 ) page： 755 - 767 2016.4

　More details

Language：English Publishing type：Research paper (scientific journal)
Anti-spoofing for text-independent speaker verification: an initial database, comparison of countermeasures, and human performance Reviewed International coauthorship Open Access

Z. Wu, P. De Leon, C. Demiroglu, A. Khodabakhsh, S. King, Z.-H. Ling, D. Saito, B. Stewart, T. Toda, M. Wester, J. Yamagishi

IEEE/ACM Transactions on Audio, Speech and Language Processing Vol. 24 ( 4 ) page： 768 - 783 2016.4

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2016.2526653
Implementation of F0 transformation for statistical singing voice conversion based on direct waveform modification Reviewed

K. Kobayashi, T. Toda, S. Nakamura

Proc. IEEE ICASSP page： 5670 - 5674 2016.3

　More details

Language：English Publishing type：Research paper (international conference proceedings)
An estimation method of voice timbre evaluation values using feature extraction with Gaussian mixture model based on reference singer Reviewed

S. Yamane, K. Kobayashi, T. Toda, T. Nakano, M. Goto, S. Nakamura

Proc. IEEE ICASSP page： 5265 - 5269 2016.3

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Statistical F0 prediction for electrolaryngeal speech enhancement considering generative process of F0 contours within product of experts framework Reviewed

K. Tanaka, H. Kameoka, T. Toda, S. Nakamura

Proc. IEEE ICASSP page： 5665 - 5669 2016.3

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Noise suppression method for body-conducted soft speech enhancement based on external noise monitoring Reviewed

Y. Tajiri, T. Toda, S. Nakamura

Proc. IEEE ICASSP page： 5935 - 5939 2016.3

　More details

Language：English Publishing type：Research paper (international conference proceedings)
A dialog system to detect deception Reviewed

Y. Tsunomori, G. Neubig, T. Hiraoka, M. Mizukami, S. Sakti, T. Toda, S. Nakamura

Proc. IWSDS page： 1 - 6 2016.1

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Example based dialogue system based on satisfaction prediction Reviewed Open Access

Vol. 31 ( 1 ) page： 1 - 12 2016.1

　More details

Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.1527/tjsai.dsf-517

Open Access
Active learning for example-based dialog systems Reviewed

T. Hiraoka, G. Neubig, K. Yoshino, T. Toda, S. Nakamura

Proc. IWSDS page： 1 - 11 2016.1

　More details

Language：English Publishing type：Research paper (international conference proceedings)
機械翻訳システムの誤り分析のための誤り箇所選択手法 Reviewed Open Access

赤部晃一, Graham Neubig, Sakriani Sakti, 戸田智基, 中村哲

自然言語処理 Vol. 23 ( 1 ) page： 88 - 117 2016.1

　More details

Language：Japanese Publishing type：Research paper (scientific journal)

DOI： 10.5715/jnlp.23.87

Open Access
Improving translation of emphasis with pause prediction in speech-to-speech translation systems Reviewed

Q. Truong Do, S. Sakti, G. Neubig, T. Toda, S. Nakamura

Proc. IWSLT page： 204 - 208 2015.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Semantic parsing of ambiguous input through paraphrasing and verification Reviewed

P. Arthur, G. Neubig, S. Sakti, T. Toda, S. Nakamura

Transactions of the Association for Computational Linguistics Vol. 3 page： 571 - 584 2015.12

　More details

Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1162/tacl_a_00159
Adaptive selection from multiple response candidates in example-based dialogue Reviewed

M. Mizukami, H. Kizuki, T. Nomura, G. Neubig, K. Yoshino, S. Sakti, T. Toda, S. Nakamura

Proc. IEEE ASRU page： 784 - 790 2015.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
A study of social-affective communication: automatic prediction of emotion triggers and responses in television talk shows Reviewed

N. Lubis, S. Sakti, G. Neubig, K. Yoshino, T. Toda, S. Nakamura

Proc. IEEE ASRU page： 777 - 783 2015.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
The NAIST ASR system for the 2015 Multi-Genre Broadcast Challenge: on combination of deep learning systems using a rank-score function Reviewed

Q. Truong Do, M. Heck, S. Sakti, G. Neubig, T. Toda, S. Nakamura

Proc. IEEE ASRU page： 654 - 659 2015.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Incremental sentence compression using LSTM recurrent networks Reviewed International coauthorship

S. Sakti, F. Ilham, G. Neubig, T. Toda, Purwarianti, S. Nakamura

Proc. IEEE ASRU page： 252 - 258 2015.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Aliasing-free implementation of discrete-time glottal source models and their applications to speech synthesis and F0 extractor evaluation Reviewed

H. Kawahara, K. Sakakibara, H. Banno, M. Morise, T. Toda, T. Irino

Proc. APSIPA ASC page： 520 - 529 2015.12

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Learning to generate pseudo-code from source code using statistical machine translation Reviewed

Y. Oda, H. Fudaba, G. Neubig, H. Hata, S. Sakti, T. Toda, S. Nakamura

Proc. ASE page： 1 - 11 2015.11

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Pseudogen: a tool to automatically generate pseudo-code from source code Reviewed

H. Fudaba, Y. Oda, K. Akabe, G. Neubig, H. Hata, S. Sakti, T. Toda, S. Nakamura

Proc. ASE page： 1 - 6 2015.11

　More details

Language：English Publishing type：Research paper (international conference proceedings)
An enhanced electrolarynx with automatic fundamental frequency control based on statistical prediction Reviewed

K. Tanaka, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. ASSETS page： 435 - 436 2015.10

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Construction and analysis of social-affective interaction corpus in English and Indonesian Reviewed

N. Lubis, S. Sakti, G. Neubig, T. Toda, S. Nakamura

Proc. O-COCOSDA page： 202 - 206 2015.10

　More details

Language：English Publishing type：Research paper (international conference proceedings)
An investigation of machine translation evaluation metrics in cross-lingual question answering Reviewed

K. Sugiyama, M. Mizukami, G. Neubig, K. Yoshino, S. Sakti, T. Toda, S. Nakamur

Proc. 10th Workshop on Statistical Machine Translation page： 442 - 449 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Preserving word-level emphasis in speech-to-speech translation using linear regression HSMMs Reviewed

D.Q. Truong, S. Takamichi, S. Sakti, G. Neubig, T. Toda, S. Nakamura

Proc. INTERSPEECH page： 3665 - 3669 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Articulatory controllable speech modification based on Gaussian mixture models with direct waveform modification using spectrum differential Reviewed

P.L. Tobing, K. Kobayashi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. INTERSPEECH page： 3350 - 3354 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Non-audible murmur enhancement based on statistical conversion using air- and body-conductive microphones in noisy environments Reviewed

Y. Tajiri, K. Tanaka, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. INTERSPEECH page： 2769 - 2773 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Statistical singing voice conversion based on direct waveform modification with global variance Reviewed

K. Kobayashi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. INTERSPEECH page： 2754 - 2758 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
A latent variable model for joint pause prediction and dependency parsing Reviewed

T.T. Nguyen, G. Neubig, H. Shindo, S. Sakti, T. Toda, S. Nakamura

Proc. INTERSPEECH page： 2719 - 2723 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Speed or accuracy? a study in evaluation of simultaneous speech translation Reviewed

T. Mieno, G. Neubig, S. Sakti, T. Toda, S. Nakamura

Proc. INTERSPEECH page： 2267 - 2271 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Modulation spectrum-constrained trajectory training algorithm for HMM-based speech synthesis Reviewed International coauthorship

S. Takamichi, T. Toda, A.W. Black, S. Nakamura

Proc. INTERSPEECH page： 1206 - 1210 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Non-native speech synthesis preserving speaker individuality based on partial correction of prosodic and phonetic characteristics Reviewed

Y. Oshima, S. Takamichi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. INTERSPEECH page： 299 - 303 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
The NAIST text-to-speech system for the Blizzard Challenge 2015 Reviewed

S. Takamichi, K. Kobayashi, K. Tanaka, T. Toda, S. Nakamura

Proc. Blizzard Challenge Workshop page： 1 - 4 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)
Prosody-controllable HMM-based speech synthesis using speech input Reviewed

Y. Nishigaki, S. Takamichi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

Proc. MLSLP page： 1 - 5 2015.9

　More details

Language：English Publishing type：Research paper (international conference proceedings)

▼display all

To the head of Papers.▲

Books 6

機械学習と音声生成：統計的手法に基づく音声信号モデリング

戸田智基（ Role： Contributor）

計測自動制御学会（編）機械学習の可能性, コロナ社 2022.12

　More details

Language：Japanese Book type：Scholarly book
音声（上）

滝口哲也, 有木康雄, 鏑木時彦, 戸田智基, 南角吉彦, 藤本雅清, 木下慶介（ Role： Contributor）

日本音響学会（編）音響学講座 6, コロナ社 2021.8

　More details

Language：Japanese Book type：Textbook, survey, introduction
音声言語の自動翻訳－コンピュータによる自動翻訳を目指して－

中村哲, Sakriani Sakti, Graham Neubig, 戸田智基, 高道慎之介（ Role： Contributor）

日本音響学会（編）, コロナ社 2018.6

　More details

Language：Japanese Book type：Scholarly book
人工知能学大辞典・声質変換

戸田智基（ Role： Contributor）

共立出版 2017.7

　More details

Language：Japanese Book type：Dictionary, encyclopedia
音響キーワードブック・声質変換

戸田智基（ Role： Contributor）

コロナ社 2016.3

　More details

Language：Japanese Book type：Textbook, survey, introduction
シンギュラリティ限界突破を目指した最先端研究・声とその表情を生み出すコンピュータ

戸田智基（ Role： Contributor）

近代科学者 2016.2

　More details

Language：Japanese Book type：Scholarly book

▼display all

To the head of Books.▲

Presentations 371

聴覚フィードバック音声制御に向けた体内伝導自己聴取音マスキングの調査

浪崎恭佑, ホワンウェンチン, 戸田智基

情報処理学会音声言語情報処理研究発表会

　More details

Event date： 2026.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
モジュール分離型アーキテクチャによるオーディオエフェクト設定逆推定

デポンテスジェフェルソンマコト, ホワンウェンチン, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2026.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
QHARMA-GAN: quasi-harmonic neural vocoder based on autoregressive moving average model International conference

S. Chen, T. Toda

　More details

Event date： 2026.5

Language：English Presentation type：Poster presentation

Country：Spain
XPPG-PCA: reference-free automatic speech severity evaluation with principal components International coauthorship International conference

B.M. Halpern, T.B. Tienkamp, T. Rebernik, R.J.J.H. van Son, S.A.H.J. de Visscher, M.J.H. Witjes, D. Abur, T. Toda

　More details

Event date： 2026.5

Language：English Presentation type：Oral presentation (general)

Country：Spain
M4SER: multimodal, multirepresentation, multitask, and multistrategy learning for speech emotion recognition International coauthorship International conference

J. He, X. Shi, C.-H. Hu, J. Mi, X. Li, , T. Toda

　More details

Event date： 2026.5

Language：English Presentation type：Poster presentation

Country：Spain
Pretraining and fine-tuning techniques for electrolaryngeal speech enhancement based on sequence-to-sequence voice conversion International conference

D. Ma, L.P. Violeta, K. Kobayashi, T. Toda

　More details

Event date： 2026.5

Language：English Presentation type：Poster presentation

Country：Spain
個別楽器音に着目した楽曲間類似度表現学習におけるテキスト表現による楽器指定

今村剛大, 橋爪優果, ホワンウェンチン, 戸田智基

電子情報通信学会応用音響研究会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
ピアノ楽曲の「ジャズらしさ」の知覚評価データ収集と潜在因子の分析

Minseok Kim, Wen-Chin Huang, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
発話障害者の自発音声を対象とした非参照型明瞭度予測

Bence Mark Halpern, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
NICT日本語複数話者複数スタイル音声合成コーパスのための知覚表現および話者印象語データセットの構築

大谷大和, 岡本拓磨, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
fo-BERTを用いた日本語音声合成アクセントラベル推定の検討

小椋忠志, 岡本拓磨, 大谷大和, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
知識蒸留による因果的な音声潜在特徴抽出と音声変換への適用

古田京平, Wen-Chin Huang, 安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
系列変換型複数話者声質変換方式の比較

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
自動音声品質評価モデルにおけるマルチデータセット学習の調査

Wen-Chin Huang, Erica Cooper, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声表情に着目した音声情報処理の進展 Invited

戸田智基, Xiaohan Shi

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
動画内区間検索における関連度値校正のための音響・映像特徴量統合

今村剛大, 小松達也, 宗像北斗, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
異常スコア分散最小化に基づくバイアス調整を用いたドメイン汎化型識別的異常音検知

松本昌亮, 藤村拓弥, Wen-Chin Huang, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
声質変換による原話者音声出力を行う音声から音声への同時翻訳システム

須藤克仁, 譚皓天, 西川勇太, 加納保昌, サクティサクリアニ, 高道慎之介, 戸田智基, 中村哲

情報処理学会自然言語処理研究発表会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
大規模学習条件下および雑音環境下におけるVAE-SiFiGANの性能評価

荻田健一, 米山怜於, ホワンウェンチン, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2026.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
MixQuery: ユーザ選択ステムの集約に基づく楽器音色指向楽曲検索システム

橋爪優果, 渡邉研斗, 中塚貴之, 佃洸摂, Tian Cheng, 中野倫靖, 後藤真孝, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2026.2

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
名古屋大学におけるLMS連携システムを一元管理するためのWebアプリケーションの開発

鈴木直樹, 木迫璃玖, 槫林優, 大平茂輝, 戸田智基

大学ICT推進協議会 2025年度年次大会

　More details

Event date： 2025.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Lessons learned from research in speech signal processing Invited International conference

T. Toda

Symposium on Speech and Behavior Informatics

　More details

Event date： 2025.12

Language：English Presentation type：Oral presentation (invited, special)

Country：United States
Cascaded symbolic music generation with bar-wise feature sequence modeling International conference

K. Sawada, W.-C. Huang, T. Toda

ASA-ASJ Joint Meeting

　More details

Event date： 2025.12

Language：English Presentation type：Oral presentation (general)

Country：United States
Investigation of perceptual music similarity based on individual instrumental parts and its correspondence to deep learning features International conference

Y. Hashizume, T. Toda

ASA-ASJ Joint Meeting

　More details

Event date： 2025.12

Language：English Presentation type：Oral presentation (general)

Country：United States
Instrument-wise music similarity representation learning with source separation and human preference International conference

T. Imamura, Y. Hashizume, W.-C. Huang, T. Toda

ASA-ASJ Joint Meeting

　More details

Event date： 2025.12

Language：English Presentation type：Oral presentation (general)

Country：United States
Robust fundamental frequency control in source-filter neural vocoding via probabilistic latent representations International conference

K. Ogita, R. Yoneyama, W.-C. Huang, T. Toda

ASA-ASJ Joint Meeting

　More details

Event date： 2025.12

Language：English Presentation type：Oral presentation (general)

Country：United States
Why is a sinusoidal signal input effective in time-domain neural vocoders? International conference

R. Yoneyama, T. Toda

ASA-ASJ Joint Meeting

　More details

Event date： 2025.12

Language：English Presentation type：Poster presentation

Country：United States
名古屋大学における課題採点支援LMS 連携Web ツールの開発

槫林優, 鈴木直樹, 木迫璃玖, 大平茂輝, 戸田智基

大学ICT推進協議会 2025年度年次大会

　More details

Event date： 2025.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
名古屋大学における受講状況の可視化を支援するLMS連携システムの開発と運用

木迫璃玖, 鈴木直樹, 槫林優, 大平茂輝, 戸田智基

大学ICT推進協議会 2025年度年次大会

　More details

Event date： 2025.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
模擬車内音場におけるモノラル音声を用いた話者の着座位置推定

兼子政孝, ホワンウェンチン, 戸田智基

日本法科学技術学会第31回学術集会

　More details

Event date： 2025.11

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Personalized speech generation Invited International conference

T. Toda

APSIPA ASC 2025.10

　More details

Event date： 2025.10

Language：English Presentation type：Symposium, workshop panel (nominated)

Country：Singapore
系列変換型声質変換モデルのモバイル端末実装

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2025.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
The AudioMOS Challenge 2025

Huang Wen-Chin, Wang Hui, Liu Cheng, Wu Yi-Chiao, Tjandra Andros, Hsu Wei-Ning, Cooper Erica, Yong Qin, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Pretraining and adaptation techniques for electrolaryngeal speech recognition International conference

L.P. Violeta, D. Ma, W.-C. Huang, T. Toda

EUSIPCO, SPS journal paper presentation, Palermo, Italy, Sep. 2025.

　More details

Event date： 2025.9

Language：English Presentation type：Poster presentation

Country：Italy
説明性向上マルチモーダルAIによるMOCの潜在的異常見える化

中井淳一, 藤村拓弥, 高田将典, 浅野憲司, 若松智之, 戸田智基

第24回情報科学技術フォーラム（FIT2025）

　More details

Event date： 2025.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
GST-BERT-TTS：アクセントラベル不要な複数話者日本語TTS

小椋忠志, 岡本拓磨, 大谷大和，Erica Cooper, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2025.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
アクセント制御音声合成と主観比較評価最適化による専門家非依存アクセントアノテーション法

安田裕介, 井本桂右, 深山覚, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Recent advances and future directions in voice conversion Invited International conference

T. Toda

INTERSPEECH

　More details

Event date： 2025.8

Language：English Presentation type：Oral presentation (invited, special)

Country：Netherlands
Mandarin speech reconstruction from neck and facial surface electromyography International coauthorship International conference

F. Li, F. Shen, D. Ma, J. Zhou, L. Wang, F. Fan, X. Chen, T. Toda, H. Niu

IEEE EMBC

　More details

Event date： 2025.7

Language：English Presentation type：Poster presentation

Country：Denmark
JATTS: a comparison-oriented Japanese text-to-speech open-sourced toolkit

W.-C. Huang, L.P. Violeta, T. Toda

　More details

Event date： 2025.6

Language：English Presentation type：Poster presentation

Country：Japan
多様なシミュレーション音場における教師あり仮想マイクアレイ信号推定の汎化性能評価

服部公宏, ホワンウェンチン, 武田一哉, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2025.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
音声研究の知見がニューラルボコーダの発展にもたらす効果 Invited

戸田智基

情報処理学会音声言語情報処理研究会

　More details

Event date： 2025.6

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
制御性の高いピアノ自動編曲に向けた楽曲難易度指標の設計

宮司光梨, 澤田桂都, ホワンウェンチン, 戸田智基

情報処理学会音声言語情報処理研究会

　More details

Event date： 2025.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
重み付きAttentionのアライメント機構を用いた系列変換型声質変換

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

情報処理学会音声言語情報処理研究会

　More details

Event date： 2025.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
歌声合成を用いた斉唱の自然性に関する要因調査

西澤佳飛, 山本龍一, Wen-Chin Huang, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
聴取実験に基づく深層音声電子透かし最適化基準の設計

尹道鉉, 安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
倍音の振幅操作に基づく母音の無限音階化の検討

橋本圭織，河村隆生, 小野順貴, 西澤佳飛, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
VAE-SiFiGAN: 変分自己符号化表現に基づくSiFiGAN

荻田健一, 米山怜於, Wen-Chin Huang, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
テキスト・発話スタイル同時制御を可能とする非流暢性に着目した講演音声合成

吉岡大貴, 中田優翔, 安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
小節特徴量を活用した楽曲の大局的構造を反映した自動作曲

澤田桂都, Wen-Chin Huang, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
MOS-Bench: 音声品質評価モデルの汎化能力に着目したベンチマーク

Wen-Chin Huang, Erica Cooper, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Wavehax：調波信号モデルと2次元畳み込みを用いた複素スペクトログラム推定に基づくエイリアシングフリーニューラルボコーダ

米山怜於, 宮下敦志, 山本龍一, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
BERTを用いたアクセントラベル不要な日本語ニューラルTTS

小椋忠志, 岡本拓磨, 大谷大和, Erica Cooper, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
個別楽器音に基づく知覚的楽曲間類似度表現学習

今村剛大, 橋爪優果, ホワンウェンチン, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
大局的構造生成のための小節特徴量系列モデリングに基づく階層的自動作曲

澤田桂都, Wen-Chin Huang, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
動画内区間検索及びハイライト検出における音響特徴量活用の有効性

今村剛大, 西村太一, 小松達也, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
系列変換型声質変換におけるアライメント方式の比較

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2025.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
話し言葉音声合成のためのテキスト発話スタイル変換の改良

中田優翔, 吉岡大貴, ホワンウェンチン, 戸田智基

情報処理学会音声言語情報処理研究会

　More details

Event date： 2024.12

Language：Japanese Presentation type：Poster presentation

Country：Japan
音メディア情報処理に関する研究 Invited

戸田智基

名古屋大学-NTT技術交流会

　More details

Event date： 2024.12

Language：Japanese Presentation type：Poster presentation

Country：Japan
Panel Discussion on SVDD, Challenge Session on Singing Voice Deepfake Detection (SVDD) International conference

Z. Duan, T. Toda, Q. Zhang, T. Liu, Y. Wang, X. Zhang, C. Zeng

IEEE SLT

　More details

Event date： 2024.12

Language：English Presentation type：Symposium, workshop panel (nominated)

Country：China
音声変換の基礎と研究動向 Invited

戸田智基

名古屋工業大学国際音声言語生成技術研究所特別講演会

　More details

Event date： 2024.12

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
Augmented speech production and hearing systems International conference

T. Toda, N. Ono, H. Kameoka

　More details

Event date： 2024.9

Language：English Presentation type：Poster presentation

Country：Japan
音素埋め込みスキップ接続を用いた継続長拡張に頑健な音声合成

小椋忠志, 岡本拓磨, 大谷大和, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
合成音声の大規模主観比較評価からの絶対品質推定

安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
系列変換型声質変換モデルにおける単調アライメント探索の改良

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
話者匿名化したデータを用いる多話者テキスト音声合成

Wen-Chin Huang, Yi-Chiao Wu, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
FIR型深層波形生成モデルを用いたF0制御可能なEnd-to-End音声合成の検討

大谷大和, 岡本拓磨, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
物理的制約を超えた発声・聴覚機能の獲得

戸田智基, 小野順貴, 亀岡弘和

JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 2024年度終了課題成果発表シンポジウム

　More details

Event date： 2024.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
音メディアコミュニケーションにおける共創型機能拡張技術の創出

戸田智基

JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 2024年度終了課題成果発表シンポジウム

　More details

Event date： 2024.9

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
各楽器パートに焦点を当てた知覚的楽曲間類似度の調査

橋爪優果, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
ワーピングを用いた電気式人工喉頭音声変換システムに適した発話例生成

宮下敦志, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
模擬電気喉頭音声コーパス

小林和弘, 荻田健一, 丹羽希碩, Lester Violeta，Wen-Chin Huang, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
Voice conversion techniques to separately control static and dynamic speech characteristics Invited International conference

T. Toda

Frontier Forum on Intelligent Speech Analysis and Generation

　More details

Event date： 2024.7

Language：English Presentation type：Oral presentation (invited, special)

Country：China
個別楽器音に基づく楽曲間類似度表現学習における音源分離の活用法

今村剛大, 橋爪優果, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2024.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
音メディア情報処理に関する研究事例

戸田智基

名古屋大学情報基盤センターコロキウム

　More details

Event date： 2024.6

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
多視点楽曲検索に向けた楽曲分離表現学習

橋爪優果, 宮下敦志, 李莉, 戸田智基

人工知能学会全国大会

　More details

Event date： 2024.5

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Challenges in leveraging large models for augmented speech production Invited International conference

T. Toda

TCSDAP, RASDAP 2024

　More details

Event date： 2024.4

Language：English Presentation type：Oral presentation (invited, special)

Country：China
High-fidelity and pitch-controllable neural vocoder based on unified source-filter networks International coauthorship International conference

R. Yoneyama, Y.-C. Wu, T. Toda

　More details

Event date： 2024.4

Language：English Presentation type：Oral presentation (general)

Country：Korea, Republic of
広帯域英語コーパス帯域拡張モデルによるCSJコーパスを用いた日本語複数話者テキスト音声合成の高品質化

日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
正弦波入力型ニューラルボコーダを用いたTTSモデルによる歌声合成

清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
AAS-VC：非自己回帰型系列音声変換における時間対応付け学習の頑健性

HUANG Wen-Chin, 小林和弘, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Eden-VC：音素継続長とアライメントの協調学習を用いた系列長変換型声質変換モデル

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
トランペット演奏を対象としたオンセット検出に基づくテンポ変化推定

岡森一樹, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
F0制御可能な有限インパルス応答に基づく高速ニューラルボコーダ

大谷大和, 岡本拓磨, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
テキストスタイル変換を用いた話し言葉音声合成

吉岡大貴，安田裕介，戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
生成的異常音検知における識別的近傍平滑化

藤村拓弥, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
深層情報埋め込み・検出に基づくプロアクティブ型ディープフェイク音声検知

尹道鉉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
ConvNeXt型超高速End-to-end音声合成・声質変換モデル

岡本拓磨, 大谷大和, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
リアルタイム音声変換における聴覚フィードバックの影響に関する調査

丹羽希碩, 小林和弘, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
クラウドソーシングを用いた大規模比較評価のための評価ペアの組み合わせと評価数のオンライン最適化

安田裕介，戸田智基

日本音響学会研究発表会

　More details

Event date： 2024.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
音声生成に関する情報処理技術の研究事例

戸田智基

第76回人工知能セミナー「音声AIを支える基盤技術の最前線」, 人工知能研究センター

　More details

Event date： 2024.3

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
Enhancing recognition of rare words in ASR through error detection and context-aware error correction

J. He, Z. Yang, T. Toda

電子情報通信学会音声研究会

　More details

Event date： 2023.12

Language：English Presentation type：Oral presentation (general)

Country：Japan
Electrolaryngeal speech enhancement through strong linguistic encoding methods

L.P. Violeta, W.-C. Huang, D. Ma, R. Yamamoto, K. Kobayashi, T. Toda

電子情報通信学会音声研究会

　More details

Event date： 2023.10

Language：English Presentation type：Oral presentation (general)

Country：Japan
Sequence-to-sequence voice conversion for electrolaryngeal speech enhancement with multi-stage pretraining and fine-tuning techniques

D. Ma, L.P. Violeta, K. Kobayashi, T. Toda

電子情報通信学会音声研究会

　More details

Event date： 2023.10

Language：English Presentation type：Oral presentation (general)

Country：Japan
End-to-End系列変換型声質変換への高速ニューラル波形生成モデル導入の検討," 音講論, 2-Q-47, pp. 1295-1298, Sep. 2023.

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
F0予測・波形生成ネットワークの一貫学習によるメルスペクトログラム入力型F0制御可能ニューラルボコーダ

清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
NNSVS: ニューラルネットワークに基づく歌声合成のためのオープンソースソフトウェア

山本龍一, 米山怜於, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2023.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
複数話者テキスト音声合成における話者ベクトルの安定化に関する検討

日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
注意機構付きVAEを用いたテキスト発話スタイル変換における少量パラレルデータの活用

吉岡大貴, 安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2023.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
音メディアコミュニケーションにおける共創型機能拡張技術の創出 Invited

戸田智基

JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 中間報告シンポジウム－共生インタラクション研究が創る新しい未来社会デザイン－

　More details

Event date： 2023.8

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
パラ言語音声翻訳のための音声合成技術～ノンパラレル音声言語表情変換～～多様な音調とスタイルを持つ言語・非言語音声合成～ Invited

戸田智基, 高道慎之介

多元自動通訳研究シンポジウム2023

　More details

Event date： 2023.8

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
個別楽器音に基づいた楽曲間類似度のための分離表現学習

橋爪優果, 李莉, 宮下敦志, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2023.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
A comparative study of self-supervised speech representation based voice conversion International coauthorship International conference

W.-C. Huang, S.-W. Yang, T. Hayashi, T. Toda

　More details

Event date： 2023.6

Language：English Presentation type：Poster presentation

Country：Greece
Investigation of Japanese PnG BERT Language Model in Text-to-Speech Synthesis for Pitch Accent Language International conference

Y. Yasuda, T. Toda

　More details

Event date： 2023.6

Language：English Presentation type：Poster presentation

Country：Greece
音声情報処理の最先端から見える未来 Invited

戸田智基

第64回日本神経学会学術大会シンポジウム「脳神経内科領域でのAIの未来：基礎研究から臨床応用まで」

　More details

Event date： 2023.6

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
x-vectorと音声認識コーパスを用いた多様な発話スタイルに対応する複数話者テキスト音声合成の評価

日田光紀, 岡本拓磨, 西村竜一, 大谷大和, 戸田智基，河井恒

電子情報通信学会音声研究会

　More details

Event date： 2023.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
全結合層型アップサンプリングを導入した高速ニューラル波形生成モデル

山下陽生, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基，河井恒

電子情報通信学会音声研究会

　More details

Event date： 2023.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
MS-Harmonic-Net++ vs SiFi-GAN: 基本周波数制御可能な高速ニューラル波形生成モデルの比較

清水聡太, 岡本拓磨, 高島遼一, 大谷大和, 滝口哲也, 戸田智基，河井恒

電子情報通信学会音声研究会

　More details

Event date： 2023.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
トークン表現を用いたギター自動採譜における系列変換ネットワークの学習法

金世訓, 武田一哉, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2023.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査

藤村拓弥, 戸田智基

電子情報通信学会応用音響研究会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
サイクル学習を用いた注意機構付きVAEによるテキスト発話スタイル変換

吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
合成音声の主観評価結果の統計的解析

安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
SiFi-GAN：音源フィルタ構造に基づくHiFi-GAN

米山怜於, Y.-C. Wu, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Harmonic-Net++: 基本周波数制御可能なメルスペクトログラム入力型高速ニューラルボコーダ

清水聡太, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
End-to-End系列変換型声質変換の高速化およびノンネイティブ話者変換の検討

山下陽生, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
E2E-S2S-VC：End-to-end系列変換型声質変換

岡本拓磨, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声認識用コーパスを用いた複数話者テキスト音声合成における高品質化の検討

日田光紀, 岡本拓磨, 西村竜一, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
大規模雑音混入音声データを利用したDNN音声強調学習の効果

藤村拓弥, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2023.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
基本周波数制御可能な高速ニューラル波形生成モデルの比較

清水聡太, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

電子情報通信学会音声研究会

　More details

Event date： 2023.2

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
リー群論に基づく一般化ワーピング

宮下敦志, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2023.2

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
MS-FC-HiFi-GAN：学習可能な軽量アップサンプリングを用いた高速ニューラル波形生成モデル

山下陽生, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

電子情報通信学会音声研究会

　More details

Event date： 2023.2

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
名古屋大学における学生の利便性向上を目指したLMS連携システムの開発

澤田桂都, 山本実央, 木迫璃玖, 大平茂輝, 後藤明史, 戸田智基

大学ICT推進協議会 2022年度年次大会

　More details

Event date： 2022.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
内容語保存機構を備えた変分自己符号化器に基づくテキスト発話スタイル変換

吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基

情報処理学会音声言語情報処理研究会

　More details

Event date： 2022.11

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
異常音検知に対する深層学習適用事例

戸田智基

第144回ロボット工学セミナー「ロボットのための音声・音響処理技術」, 日本ロボット学会

　More details

Event date： 2022.11

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
注意機構付きVAEを用いたテキスト発話スタイル変換の改良

吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
深層生成モデルに基づく音声合成技術

戸田智基

第21回情報科学技術フォーラム（FIT2022）

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
Direction-aware target speaker extraction with conditional variational autoencoders and its sensitivity to direction-of-arrival error

R. Wang, L. Li, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
DNN音声強調におけるNoisy-target Trainingの挙動分析

藤村拓弥, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
FC-HiFi-GAN：全結合層型アップサンプリングを導入した高速HiFi-GAN

山下陽生, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Sequence-wise parameter extraction of quasi-harmonic model for speech waveform generation

S. Chen, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
Harmonic-Net+：高調波入力とLayerwise-Quasi-Periodic畳み込みを用いた基本周波数制御可能な高速ニューラルボコーダ

松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
基本周波数制御可能なメルスペクトログラム入力型HiFi-GANの初期検討

清水聡太, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Three-stage voice conversion framework for noisy and reverberant speech

Y. Choi, C. Xie, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
Sequence-to-sequence voice conversion training using synthetic parallel data for electrolaryngeal speech enhancement

D. Ma, L.P. Violeta, K. Kobayashi, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
音声認識コーパスを用いた高品質複数話者テキスト音声合成に向けたニューラルボコーダによる帯域拡張

日田光紀, 岡本拓磨, 西村竜一, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Interpretable emotional control for text-to-speech system toward development of sympathetic educational-support robots

J. Feng, T. Yoshikawa, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
A comparison of pretraining frameworks for improving pathological speech recognition

L.P. Violeta, W.-C. Huang, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Poster presentation

Country：Japan
拡散確率モデルとアライメントモデルを用いた潜在特徴系列変換に基づくテキスト音声合成

安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
構音障害者のための高明瞭度音声合成におけるHiFi-GANを用いた品質改善

松原圭亮, 高島遼一, 岡本拓磨, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
群論を用いた解析的声道長正規化処理と音声認識への応用

宮下敦志, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
Robustness of noisy-to-noisy voice conversion against variations of noisy condition

C. Xie, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Poster presentation

Country：Japan
各楽器音源に着目した楽曲間類似度学習の評価

橋爪優果, 李莉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Note-level automatic guitar transcription using attention mechanism and multi-task learning

S. Kim, T. Hayashi, T. Toda

　More details

Event date： 2022.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
各楽器音に着目した楽曲間類似度学習

橋爪優果, 李莉, 戸田智基

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2022.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
群論を用いた声道長変換の表現と解析的正規化処理

宮下敦志, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2022.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
二種の二値分類タスクに基づく外れ値検出を用いた直列型異常音検知法

畔栁伊吹, 林知樹, 武田一哉, 戸田智基

電子情報通信学会応用音響研究会

　More details

Event date： 2022.5

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Target speaker extraction based on conditional variational autoencoder and directional information in underdetermined condition

R. Wang, L. Li, T. Toda

　More details

Event date： 2022.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
The VoiceMOS Challenge 2022 International coauthorship

W.-C. Huang, E. Cooper, Y. Tsao, H.-M. Wang, T. Toda, J. Yamagishi

　More details

Event date： 2022.3

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
Disfluency Removal with Speech Inpainting on Spontaneous Lecture Speech

H. Geng, Y. Yasuda, T. Toda

　More details

Event date： 2022.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
環境音波形の教師なしモデリング及び環境音識別のためのデータ拡張への応用

犬塚雅也, 林知樹, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
注意機構付きVAEを用いた日本語テキストの発話スタイル変換

吉岡大貴, 安田裕介, 松永悟行, 大谷大和, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
各楽器音源に着目した距離学習に基づく楽曲間類似度計算

橋爪優果, 李莉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音素列制約つき音声認識モデルによる音声からのアクセントラベルの自動推定

吉本暁文, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
書記素と音素を用いた事前学習モデルの日本語テキスト音声合成への適用

安田裕介, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
最尤推定型継続長モデルを用いた話速変換ニューラルTTS

岡本拓磨, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
敵対的学習による統合的ソースフィルタネットワークの改良

米山怜於, 呉宜樵, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Period-HiFi-GAN: 基本周波数を制御可能な高速ニューラルボコーダ

松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2022.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
声質の可視化を用いた所望音声検索システムの提案

佐治拓樹, 小林和弘, 石黒祥生, 戸田智基, 大谷健登, 西野隆則, 武田一哉

情報処理学会音楽情報科学研究発表会

　More details

Event date： 2022.1

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音を聴き分けて状況を判断する技術

戸田智基

第2回名古屋大学イニシアティブウェビナー「視覚と聴覚の再構築」

　More details

Event date： 2021.12

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
DXがもたらす学び支援サービスと学び生活

戸田智基

名古屋大学教育基盤連携本部高等教育システム開発部門シンポジウム

　More details

Event date： 2021.11

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
共創型音メディア機能拡張に向けた取り組み Invited

戸田智基

電気・電子・情報関係学会東海支部連合大会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
強制アライメント版Parallel Tacotron 2とHiFi-GANを用いたCPU型リアルタイム日本語ニューラルテキスト音声合成システムの実装

岡本拓麿, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
言語表現の制御を可能とするTTS実現に向けたVAEによるテキスト発話スタイル変換

吉岡大貴, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
敵対的学習による統合型ソースフィルタネットワーク

米山怜於, Y.-C. Wu, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
HiFi-GANボコーダにおけるLPCNet特徴量の検討

松原圭亮, 岡本拓麿, 高島遼一, 滝口哲也, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
距離学習を導入した二値分類モデルによる異常音検知

畔栁伊吹, 林知樹, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
発声機能拡張のためのインタラクティブ音声変換 Invited

戸田智基

電気・電子・情報関係学会東海支部連合大会

　More details

Event date： 2021.9

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
Interactive voice conversion for augmented speech production Invited International conference

T. Toda

5th International Workshop on Symbolic-Neural Learning (SNL-2021)

　More details

Event date： 2021.7

Language：English Presentation type：Oral presentation (invited, special)

Country：Japan
Practical use of LMS and related tools - case of Japanese university International conference

H. Hatakeyama, T. Toda, D. Ando, S. Kajita

Open Apereo

　More details

Event date： 2021.6

Language：English Presentation type：Oral presentation (general)

Country：United States
統合型ソースフィルタネットワークによるニューラルボコーダ

米山怜於, Yi-Chiao Wu, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
名古屋大学における2020年度LMS利用ログ分析ならびに学習活動分析に向けた今後の展開

戸田智基, 大平茂輝, 後藤明史

国立情報学研究所「大学の情報環境のあり方検討会」【第28回】大学等におけるオンライン教育とデジタル変革に関するサイバーシンポジウム「教育期間DXシンポ」

　More details

Event date： 2021.3

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
COVID-19とLMS - 大学教育の大幅な変化を経験して

森健策, 戸田智基

情報処理学会第38回全国大会イベント企画「コロナ新時代の情報処理（教育）～口頭教育におけるニューノーマルの模索～」

　More details

Event date： 2021.3

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
電気式人工喉頭を用いた歌唱システムにおける自然な身体動作を利用した歌唱表現付与の提案

大川舜平, 石黒祥生, 大谷健登, 西野隆典, 小林和弘, 戸田智基, 武田一哉

情報処理学会シンポジウムインタラクション2021

　More details

Event date： 2021.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
音高情報条件つき変分自己符号化器を用いたF0歌唱パターン生成

関翔悟, 多賀遥香, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
マルチタスク学習を用いたU-Netに基づく楽曲音源分離に関する調査

大竹徹郎, 関翔悟, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
テキスト音声合成のためのポストフィルタ用WaveNetボコーダの学習条件に関する評価

安原和輝, Yi-Chiao Wu, Patrick Lumban Tobing, 松永悟行, 大谷大和, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
DiffWaveGrad: 拡散確率型ニューラルボコーダの併用モデル

岡本拓麿, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
CycleVAEを用いた声質変換におけるWaveNetボコーダのファインチューニング法の調査

中谷輝, Patrick Lumban Tobing, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
CycleVAE型声質変換を用いた構音障害者のための高明瞭度音声合成

松原圭亮, 岡本拓麿, 高島遼一, 滝口哲也, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
特徴量空間のクラス重心を考慮した二値分類モデルによる異常音検知

畔栁伊吹, 林知樹, 武田一哉, 戸田智基

電子情報通信学会応用音響研究会

　More details

Event date： 2021.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト Invited

戸田智基

情報処理学会音声言語情報処理研究会

　More details

Event date： 2021.2

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
Recent progress on voice conversion: what is next? Invited International conference

T. Tod

IEEE SLT

　More details

Event date： 2021.1

Language：English Presentation type：Oral presentation (invited, special)

Country：China
名古屋大学におけるオンライン授業支援サービスの運用

戸田智基, 大平茂輝, 後藤明史, 田上奈緒, 松岡孝, 島田啓史, 田島尚徳, 中務孝広, 出口大輔, 森健策

大学ICT推進協議会 2020年度年次大会

　More details

Event date： 2020.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Open Apereo 2020 Online参加報告

畠山久, 常盤祐司, 戸田智基, 梶田将司

情報処理学会教育学習支援情報システム研究会

　More details

Event date： 2020.11

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
CycleVAEとWaveNetボコーダを用いたクロスリンガル声質変換

中谷輝, Patrick Lumban Tobing, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
FastSpeech型ニューラルTTSモデルの比較

岡本拓磨, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
聴取者ごとの感情知覚モデルに基づく音声感情認識

安藤厚志, 森岳至, 小橋川哲, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
微分可能全域通過フィルタを用いたダイナミックレンジ圧縮

彦坂秀, 関翔悟, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Full-band LPCNet：48kHzリアルタイムニューラルボコーダ

松原圭亮, 岡本拓麿, 高島遼一, 滝口哲也, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
一般化指令応答モデルを用いた変分自己符号化器に基づく歌唱F0パターンの生成

多賀遥香, 関翔悟, 李莉, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Recent trend of voice conversion research and its possible future direction Invited International conference

T. Toda

ROCLING (32nd annual Conference on Computational Linguistics and Speech Processing)

　More details

Event date： 2020.9

Language：English Presentation type：Oral presentation (keynote)

Country：Taiwan, Province of China
オンデマンド型オンライン授業における学習活動分析に向けた授業支援システムログ活用の試み

戸田智基, 大平茂輝, 後藤明史

国立情報学研究所「大学の情報環境のあり方検討会」【第17回】4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム

　More details

Event date： 2020.9

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
名古屋大学におけるオンライン授業支援に関する事例紹介

戸田智基

電気・電子・情報関係学会東海支部連合大会

　More details

Event date： 2020.9

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
Sustainable Digital Learning Environment - Our Practices of Sakai International conference

H. Hatakeyama, T. Toda, Y. Tokiwa, S. Kajita

Open Apereo

　More details

Event date： 2020.6

Language：English Presentation type：Oral presentation (general)

Country：United States
名古屋大学教育学部附属学校におけるLMS導入取組～名大情報基盤センターとの連携

森健策, 三小田博昭, 渡辺武志, 丹羽ひとみ, 戸田智基

国立情報学研究所「大学の情報環境のあり方検討会」【第4回】4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム

　More details

Event date： 2020.4

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
名古屋大学における情報基盤を活用したCOVID-19対応 - オンライン学習の観点から

森健策, 戸田智基, 楫勇一

国立情報学研究所「大学の情報環境のあり方検討会」4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム

　More details

Event date： 2020.3

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
音声変換技術と音声生成機能拡張への応用 Invited

戸田智基

電子情報通信学会2020年総合大会ソサイエティ合同企画「情報通信技術と人間相互理解の未来」

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
フルコンテキストラベル入力型リアルタイムニューラルテキスト音声合成の比較

岡本拓磨, 松原圭亮, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
End-to-end音声合成の研究を加速させるオープンソースツールキットESPnet-TTS Invited International coauthorship

林知樹, 山本龍一, 井上勝喜, 吉村建慶, 武田一哉, 戸田智基, 渡部晋治

日本音響学会研究発表会スペシャルセッション「end-to-end音声合成とその周辺」

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
テキスト音声合成におけるポストフィルタとしてのWaveNetボコーダ学習法

安原和輝, Yi-Chiao Wu, Patrick Lumban Tobing, 松永悟行, 大谷大和, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
リアルタイムニューラルボコーダにおける学習データ量の影響の調査

松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
発話感情認識における音韻・話者情報の低減

岡田慎太郎, 安藤厚志, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Self-attentionを用いた弱教師あり音響イベント検出 International coauthorship

宮崎晃一, 小松達也, 林知樹, 渡部晋治, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
変分自己符号化器を用いた空気・体内伝導音の結合音源モデリングに基づく半教師あり自己発声音強調・抑圧

関翔悟, 高田萌絵, 武田一哉, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
CycleVAEを用いたクロスリンガル声質変換

中谷輝, P.L. Tobing, 武田一哉, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
複数話者WaveNetボコーダを用いたニューラル話速変換の試み

岡本拓磨, 松原圭亮, 戸田智基, 志賀芳則, 河井恒

電子情報通信学会音声研究会

　More details

Event date： 2020.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
周りに内緒で通話できるか

戸田智基

第6回名古屋大学の卓越・先端・次世代シンポジウム「専門性と学際性の狭間で」

　More details

Event date： 2020.1

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
ユーザの適応能力を活用する共創型音声生成機能拡張技術の構築

戸田智基

JSTさきがけ「新しい社会システムデザインに向けた情報基盤技術の創出」研究成果報告会

　More details

Event date： 2020.1

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
音声コミュニケーションにおける機能拡張

戸田智基

名古屋大学情報学シンポジウム2020「人工知能技術がもたらす価値創造と情報学の使命－音声言語コミュニケーション技術とポジティブ情報学の交差点から」

　More details

Event date： 2020.1

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
Speech waveform modeling for advanced voice conversion Invited International conference

T. Toda

　More details

Event date： 2019.12

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Singapore
発話感情認識における音素事後確率を利用した表現学習とデータ拡張の評価

岡田慎太郎, 安藤厚志, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2019.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Creation of cooperative human augmentation techniques in sound media communication

T. Toda

　More details

Event date： 2019.12

Language：English Presentation type：Symposium, workshop panel (nominated)

Country：Japan
Improving singing aid system for laryngectomees with statistical voice conversion and VAE-SPACE

L. Li, T. Toda, K. Morikawa, K. Kobayashi, S. Makino

　More details

Event date： 2019.11

Language：English Presentation type：Poster presentation

Country：Japan
音声合成技術の進展 Invited

戸田智基

第3回次期グローバルコミュニケーション計画検討WG

　More details

Event date： 2019.11

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
声を変える技術の発展と社会に与える影響

戸田智基

名古屋大学-NTT技術交流会

　More details

Event date： 2019.11

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
音声を変換する技術と機能拡張への応用 Invited

戸田智基

豊田工業大学研究談話会

　More details

Event date： 2019.10

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
Speech waveform modeling for advanced voice conversion International conference

T. Toda

　More details

Event date： 2019.10

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：United States
パソコン必携化を活用した授業設計に向けて

戸田智基

令和元年度第2回名古屋大学情報連携統括本部公開講演会・研究会

　More details

Event date： 2019.10

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
音声波形直接生成モデル「ニューラルボコーダ」の比較 Invited

岡本拓磨, 戸田智基, 志賀芳則, 河井恒

情報処理学会音声言語情報処理研究会

　More details

Event date： 2019.10

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
音声翻訳のための柔軟な音声合成の進展

戸田智基, 高道慎之介

次世代音声言語研究シンポジウム2019

　More details

Event date： 2019.9

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
Statistical voice conversion with direct waveform modeling International conference

T. Toda, K. Kobayashi, T. Hayashi

　More details

Event date： 2019.9

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Austria
An investigation of fundamental frequency pattern prediction in electrolaryngeal speech enhancement

M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda

　More details

Event date： 2019.9

Language：English Presentation type：Poster presentation

Country：Japan
コンタクトセンタ顧客満足度推定におけるドメイン適応の検討

安藤厚志, 増村亮, 神山歩相名, 小橋川哲, 青野裕司, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
WaveGlowボコーダを用いたリアルタイムニューラルテキスト音声合成

岡本拓麿, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2019.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
End-to-End型テキスト音声合成におけるWaveNetボコーダの学習に関する調査

安原和輝, 林知樹, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
模擬難聴処理を活用した補聴器フィルタ設計

彦坂秀, 小林和弘, 林知樹, 関翔悟, 武田一哉, 坂野秀樹, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
空気／体内伝導音の対応関係を活用した自己発声音強調／抑圧法

高田萌絵, 関翔悟, P.L. Tobing, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
楽曲音源分離のための個別音源マスク推定ネットワークの統合法

大竹徹郎, 関翔悟, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声分析・合成

戸田智基

音声認識・音声対話技術講習会

　More details

Event date： 2019.8

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
End-to-End型テキスト音声合成におけるWaveNetボコーダの学習についての調査

安原和輝, 林知樹, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2019.8

Language：Japanese Presentation type：Poster presentation

Country：Japan
模擬難聴処理を活用した音声波形加工に基づく明瞭度改善

彦坂秀, 小林和弘, 林知樹, 関翔悟, 武田一哉, 坂野秀樹, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2019.8

Language：Japanese Presentation type：Poster presentation

Country：Japan
Advanced voice conversion Invited International conference

T. Toda

　More details

Event date： 2019.7

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Greece
Hands on voice conversion Invited International conference

T. Toda

　More details

Event date： 2019.7

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Greece
空気・体内伝導音を対象とした音声・音環境情報処理

戸田智基

2019年度第1回住友理工株式会社―名古屋大学探索型共同研究テーマ検討会

　More details

Event date： 2019.6

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
多チャンネル変分自己符号化器を用いた劣決定音源分離

関翔悟, 亀岡弘和, 李莉, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2019.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
多チャンネル変分自己符号化器に基づく劣決定音源分離の評価

関翔悟, 亀岡弘和, 李莉, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2019.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
波形加工に基づく統計的声質変換の外部雑音に対する頑健性

栗田優佑, 小林和弘, 武田一哉, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2019.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
基本周波数とメルケプストラムを用いたリアルタイムニューラルボコーダの検討

岡本拓磨, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2019.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Voice conversion with cyclic recurrent neural network for WaveNet fine-tuning

P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda

　More details

Event date： 2019.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Reducing mismatch of WaveNet vocoder for variational autoencoder based voice conversion International coauthorship

W.-C. Huang, Y.-C. Wu, H.-T. Hwang, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang

　More details

Event date： 2019.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
雑音環境下における統計的声質変換の頑健性に関する調査

栗田優佑, 小林和弘, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音素事後確率を利用した表現学習に基づく発話感情認識

岡田慎太郎, 安藤厚志, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2019.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Augmented vocal production towards new singing style development Invited International conference

T. Toda

　More details

Event date： 2019.1

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Germany
楽曲中歌声加工における声質変換精度向上のための歌声・伴奏分離法

山田智也, 関翔悟, 小林和弘, 戸田智基

信号処理シンポジウム,

　More details

Event date： 2018.11

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
手書きレポートとLMSの連携を実現する名大版紙レポシステムの全学運用

出口大輔, 清谷竣也, 大平茂輝, 戸田智基

大学ICT推進協議会 2018年度年次大会

　More details

Event date： 2018.11

Language：Japanese Presentation type：Poster presentation

Country：Japan
Voice Conversion Challenge 2018 International coauthorship International conference

Z.-H. Ling, J. Yamagishi, J. Lorenzo-Trueba, T. Toda, D. Saito, F. Villavicencio, T. Kinnunen

　More details

Event date： 2018.11

Language：English Presentation type：Poster presentation

Country：Taiwan, Province of China
音声変換による発声機能の拡張 Invited

戸田智基

東京大学ヒューマンオーグメンテーション学第4回セミナー

　More details

Event date： 2018.11

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
深層ボトルネック特徴と深層正準相関分析を用いたマルチモーダル声質変換

田村哲嗣, 堀尾健斗, 遠藤肇, 速水悟, 戸田智基

第5回サイレント音声認識ワークショップ

　More details

Event date： 2018.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
嚥下音を利用した嚥下障害診断のための咽頭残留推定法

内野達貴, 橋詰淳, 勝野雅央, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2018.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
FFTNetボコーダの高品質化に関する検討

岡本拓磨, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2018.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
Electrolaryngeal Speech Enhancement by Using Attached Microphones onto Electrolarynx

M. Eshghi, S. Seki, K. Kobayashi, T. Toda

　More details

Event date： 2018.9

Language：English Presentation type：Poster presentation

Country：Japan
End-to-End音声認識ためのMulti-Head Decoderネットワーク International coauthorship

林知樹, 渡部晋治, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2018.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
WaveNetに基づく振幅スペクトログラムからの波形生成

関翔悟, 林知樹, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2018.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
空気／体内伝導マイクロフォンを用いた雑音環境下における自己発声音強調／抑圧法

高田萌絵, 関翔悟, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2018.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
ウェアラブルな空気／体内伝導マイクロフォンを用いた自己発声音強調／抑圧法

高田萌絵, 関翔悟, 戸田智基

電子情報通信学会応用音響研究会

　More details

Event date： 2018.8

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
End-to-Endアプローチに基づく音イベントの擬音語表現への記号化

宮崎晃一, 林知樹, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2018.8

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
嚥下障害診断における嚥下音からの咽頭残留判定

内野達貴, 橋詰淳, 勝野雅央, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2018.8

Language：Japanese Presentation type：Poster presentation

Country：Japan
音声分析・合成

戸田智基

音声認識・音声対話技術講習会

　More details

Event date： 2018.8

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
発声者の協力的動作を活用した音声生成機能の拡張技術

戸田智基

JSTフェア2018

　More details

Event date： 2018.8

Language：Japanese Presentation type：Poster presentation

Country：Japan
Advanced voice conversion Invited International conference

T. Toda

　More details

Event date： 2018.7

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Greece
Hands on voice conversion Invited International conference

T. Toda

　More details

Event date： 2018.7

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Greece
深層ボトルネック特徴と深層正準相関分析を用いたマルチモーダル声質変換

田村哲嗣, 堀尾健斗, 遠藤肇, 速水悟, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2018.6

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Collapsed speech segment detection and suppression for WaveNet vocoder Invited International conference

Y.-C. Wu, K. Kobayashi, T. Hayashi, P.L. Tobing, T. Toda

　More details

Event date： 2018.5

Language：English Presentation type：Poster presentation

Country：United Kingdom
Development of NU voice conversion system 2018 Invited International conference

P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda

　More details

Event date： 2018.5

Language：English Presentation type：Poster presentation

Country：United Kingdom
Development of NU voice conversion system for Voice Conversion Challenge 2018

P.L. Tobing, Y. Wu, T. Hayashi, K. Kobayashi, T. Toda

　More details

Event date： 2018.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
統計的手法に基づく楽曲中の歌声加工のための歌声分離法の検討

山田智也, 関翔悟, 小林和弘, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2018.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
Development of NU non-parallel voice conversion system 2018

Y. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda

　More details

Event date： 2018.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Development of NU Voice Conversion System 2018

P.L. Tobing, Y. Wu, T. Hayashi, K. Kobayashi, T. Toda

　More details

Event date： 2018.3

Language：English Presentation type：Poster presentation

Country：Japan
A Hybrid approach to electrolaryngeal speech enhancement based on log-spectral differential conversion and noise suppression

M. Eshghi, K. Kobayashi, T. Toda

　More details

Event date： 2018.3

Language：English Presentation type：Poster presentation

Country：Japan
Electrolaryngeal speech enhancement based on vocoder-free statistical voice conversion and noise suppression

M. Eshghi, K. Kobayashi, T. Toda

　More details

Event date： 2018.3

Language：English Presentation type：Poster presentation

Country：Japan
統計的音声変換ソフトウェアsprocket

小林和弘, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2018.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
サブバンドWaveNetボコーダによる全可聴帯域音声合成の検討

岡本拓麿, 橘健太郎, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2018.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
WaveNetボコーダにおける学習データ量の影響に関する調査

林知樹, 小林和弘, 玉森聡, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2018.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Development of NU non-parallel voice conversion system for Voice Conversion Challenge 2018

Y. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda

　More details

Event date： 2018.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Sneak Preview of the 2nd Voice Conversion Challenge 2018 International coauthorship

J. Yamagishi, J. Lorenzo-Trueba, T. Toda, D. Saito, F. Villavicencio, T. Kinnunen, Z. Ling

　More details

Event date： 2018.2

Language：English Presentation type：Poster presentation

Country：Japan
WaveNetが音声合成研究に与える影響 Invited

戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2018.1

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
WaveNetボコーダを用いた統計的音声変換法

小林和弘, 林知樹, 玉森聡, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2018.1

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
複数話者WaveNetボコーダに関する調査

林知樹, 小林和弘, 玉森聡, 武田一哉, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2018.1

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
DNN適応に基づく非可聴つぶやき認識用話者・環境依存音響モデルの構築

野田聖太, 林知樹, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2017.12

Language：Japanese Presentation type：Poster presentation

Country：Japan
名古屋大学におけるサーバ型紙レポート・LMS連携システムの開発

清谷竣也, 伊藤瑠哉, 岡本康佑, 谷川右京, 大平茂輝, 出口大輔, 戸田智基

大学ICT推進協議会 2017年度年次大会

　More details

Event date： 2017.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
雑音環境下における音声了解度向上に向けた音声波形加工手法の評価

武山知弘, 小林和弘, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2017.12

Language：Japanese Presentation type：Poster presentation

Country：Japan
実環境下サイレント音声通話に向けた統計的非可聴つぶやき強調のための外部雑音抑圧法

田尻祐介, 亀岡弘和, 戸田智基

第4回サイレント音声認識ワークショップ

　More details

Event date： 2017.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
WaveNetボコーダ学習における複数話者音声データの利用に関する検討

林知樹, 玉森聡, 小林和弘, 武田一哉, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2017.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
サブバンド処理に基づくWaveNetの高速化

岡本拓麿, 橘健太郎, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2017.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
喉頭摘出者のための歌唱支援を目指した電気音声から歌声への変換法

森川一穂, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2017.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
CTCに基づく音響イベントから擬音語表現への変換

宮崎晃一, 林知樹, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2017.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
非可聴つぶやき認識のための深層学習に基づく音響モデリング

野田聖太, 林知樹, 戸田智基, 武田一哉

平成29年度電気・電子・情報関係学会東海支部連合大会

　More details

Event date： 2017.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
大学教育とラーニングアナリティクス基盤

緒方広明, 稲垣知宏, 中野裕司, 竹村治雄, 柴山悦哉, 島田敬士, 戸田智基, 三石大, 梶田将司, 重田勝介

第16回情報科学技術フォーラム（FIT2017）

　More details

Event date： 2017.9

Language：Japanese Presentation type：Symposium, workshop panel (nominated)

Country：Japan
Recent topics in voice conversion: towards better waveform modification Invited International conference

T. Toda

　More details

Event date： 2017.9

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Hong Kong
イベント継続長を明示的に制御したBLSTM-HSMMハイブリッドモデルによる多重音響イベント検出 International coauthorship

林知樹, 渡部晋治, 戸田智基, 堀　貴明, Jonathan Le Roux, 武田一哉

電子情報通信学会応用音響研究会

　More details

Event date： 2017.7

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
ケプストラム距離正則化を用いた半教師ありステレオチャネル楽曲音源分離

関翔悟, 戸田智基, 武田一哉

音学シンポジウム2017

　More details

Event date： 2017.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
歌声分離ならびに統計的歌声声質変換に基づく楽曲中の歌声加工

山田智也, 関翔悟, 小林和弘, 戸田智基

音学シンポジウム2017

　More details

Event date： 2017.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
喉頭摘出者のための歌唱支援を目指した統計的電気音声変換法

森川一穂, 戸田智基

音学シンポジウム2017

　More details

Event date： 2017.6

Language：Japanese Presentation type：Poster presentation

Country：Japan
系列データモデリングの基礎と最近のトピックス Invited

戸田智基, Graham Neubig

日本音響学会第155回技術講習会

　More details

Event date： 2017.6

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
音声の声質を変換する技術とその応用 Invited

戸田智基

2017年度人工知能学会全国大会オーガナイズドセッション OS-9 質感と感性

　More details

Event date： 2017.5

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
名古屋大学における紙レポートシステムの試験導入と課題

戸田智基, 田上奈緒, 中務孝広, 松岡孝, 大平茂輝, 後藤明史, 出口大輔

Ja Sakai カンファレンス 2017

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声変換技術の進展と課題 Invited

戸田智基

日本音響学会東海支部総会・講演会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
音声生成過程を考慮したWaveNetに基づく音声波形合成法

玉森聡, 林知樹, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声器官動作操作機能を備えた統計的音声変換法の評価

伊佐衣代, Patrick Lumban Tobing, 田中宏, 戸田智基, 中村哲

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
DNN型パワースペクトル復元によるボコーダ音質改善

岡本拓磨, 橘健太郎, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
WaveNetにおける音声波形量子化法の評価

橘健太郎, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
非可聴つぶやき認識のための通常音声を活用したDNN音響モデル学習

野田聖太, 林知樹, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
Acoustic-to-articulatory inversion mapping with variational latent trajectory Gaussian mixture model

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Combination of state clustering and adaptive training for modeling continuous word-level emphasis

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
非可聴つぶやき強調のためのセグメント特徴量正則化NTF

田尻祐介, 亀岡弘和, 戸田智基

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元

関翔悟, 亀岡弘和, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
統計的音声波形変換に基づく雑音環境下における音声了解度向上

武山知弘, 小林和弘, 田尻祐介, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
差分スペクトル補正に基づく声質変換におけるF0変換法の調査

小林和弘, 戸田智基, 中村哲

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
周期非周期分離に基づくV/UV判定フリーな統計的パラメトリック音声合成システム

橘健太郎, 志賀芳則, 戸田智基, 河井恒

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
電気音声強調のためのF0パターン生成過程確率モデルの指令列推定法

田中宏, 亀岡弘和, 戸田智基, 中村哲

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
イベント区間検出統合型BLSTM-HMMハイブリッドモデルによる多重音響イベント検出 International coauthorship

林知樹，渡部晋治，戸田智基，堀貴明，Jonathan Le Roux, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声信号の分析と加工 − 音声を自在に変換するには？ Invited

戸田智基

日本音響学会研究発表会学術委員会スペシャルセッション音響学の基礎3（音響信号処理）

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
Acoustic-to-articulatory inversion mapping with variational latent trajectory Gaussian mixture model

P.L. Tobing, H. Kameoka, T. Toda

　More details

Event date： 2017.3

Language：English Presentation type：Poster presentation

Country：Japan
時間領域信号推定に基づく音声スペクトログラムの欠損成分復元

関翔悟, 亀岡弘和, 戸田智基, 武田一哉

電子情報通信学会応用音響研究会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
セグメント特徴量正則化NTFに基づく雑音環境下における非可聴つぶやき強調

田尻祐介, 亀岡弘和, 戸田智基

電子情報通信学会音声研究会

　More details

Event date： 2017.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Convolutional bidirectional long short-term memory hidden Markov model hybrid system for polyphonic sound event detection International coauthorship International conference

T. Hayashi, S. Watanabe, T. Toda, T. Hori, J.L. Roux, K. Takeda

　More details

Event date： 2016.12

Language：English Presentation type：Oral presentation (general)

Country：United States
教育情報メディア技術を活用した授業設計に関する予備的検討

戸田智基

平成28年度第9回名古屋大学情報連携統括本部公開講演会・研究会

　More details

Event date： 2016.12

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
高等教育におけるデジタル教科書の利活用についてのアンケート調査

出口大輔, 山里敬也, 大平茂輝, 戸田智基, 中島英博, 重田勝介, 岡田義広, 山地一禎

大学ICT推進協議会 2016年度年次大会

　More details

Event date： 2016.12

Language：Japanese Presentation type：Poster presentation

Country：Japan
クリッカーの実時間データに基づく講義スライド改善支援ツールの開発

大平茂輝, 後藤明史, 戸田智基

大学ICT推進協議会 2016年度年次大会

　More details

Event date： 2016.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Stereo channel music signal separation based on nonnegative tensor factorization with cepstrum regularization International conference

S. Seki, K. Ohtani, T. Toda, K. Takeda

　More details

Event date： 2016.11

Language：English Presentation type：Oral presentation (general)

Country：United States
Statistical voice conversion and its application to augmented speech production Invited

T. Toda

　More details

Event date： 2016.11

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
Evaluation of electrolarynx controlled by real-time statistical F0 prediction International conference

K. Tanaka, T. Toda, S. Nakamura

　More details

Event date： 2016.11

Language：English Presentation type：Poster presentation

Country：United States
Low delay statistical singing voice conversion with direct waveform modification based on spectral differential considering global variance International conference

K. Kobayashi, T. Toda, S. Nakamura

　More details

Event date： 2016.11

Language：English Presentation type：Poster presentation

Country：United States
実環境下におけるサイレント音声通話の実現に向けた雑音環境変動に頑健な非可聴つぶやき強調法

田尻祐介, 亀岡弘和, 戸田智基

第3回サイレント音声認識ワークショップ

　More details

Event date： 2016.10

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
深層学習に基づく非可聴つぶやき認識用音響モデルの構築

野田聖太, 林知樹, 戸田智基, 武田一哉

第3回サイレント音声認識ワークショップ

　More details

Event date： 2016.10

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
日常生活行動認識のためのRecurrent Neural Network構造の調査

玉森聡, 林知樹, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2016.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音楽制作におけるミキシングのモデル化に向けたフィルタ推定

三好真人, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2016.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
ケプストラム正則化NTFによるステレオチャネル楽曲音源分離

関翔悟, 大谷健登, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2016.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Deep Neural Networkに基づく日常生活行動認識における適応手法

林知樹, 北岡教英, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2016.8

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Deep Recurrent Neural Networkに基づく日常生活行動認識

玉森聡, 林知樹, 戸田智基, 武田一哉

電子情報通信学会音声研究会

　More details

Event date： 2016.8

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音情報処理における特徴表現 Invited

戸田智基

MIRU2016 第19回画像の認識・理解シンポジウム特別企画MIRU x KIKU（音学シンポジウム連携オーガナイズドセッション）

　More details

Event date： 2016.8

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
音声分析・合成

戸田智基

音声認識・音声対話技術講習会

　More details

Event date： 2016.8

Language：Japanese Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Japan
音情報処理における特徴表現 Invited

戸田智基

音学シンポジウム2016（MIRU連携オーガナイズドセッション）

　More details

Event date： 2016.5

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
Semantic parsing of ambiguous input with multi synchronous grammars

P. Arthur, G. Neubig, S. Sakti, S. Nakamura, T. Toda

　More details

Event date： 2016.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
選択型傾聴システムのための音信号提示手法の検討

鈴木友美, 西野隆典, 石黒祥生, 戸田智基, 武田一哉

電子情報通信学会応用音響研究会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
An evaluation of acoustic-to-articulatory inversion mapping with latent trajectory Gaussian mixture model International conference

P.L. Tobing, T. Toda, H. Kameoka, S. Nakamura

　More details

Event date： 2016.3

Language：English Presentation type：Poster presentation

Country：Japan
差分スペクトル補正に基づく歌声声質変換のためのF0変換の評価

小林和弘, 戸田智基, 中村哲

電子情報通信学会音声研究会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
空気／体内伝導信号の非負値テンソル分解に基づく実環境下における非可聴つぶやき強調

田尻祐介, 亀岡弘和, 戸田智基, 中村哲

電子情報通信学会音声研究会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
電気音声強調のための統計的F0予測におけるProduct-of-ExpertsによるF0パターン生成過程モデルの導入

田中宏, 亀岡弘和, 戸田智基, 中村

電子情報通信学会音声研究会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
A joint model for pause prediction and dependency parsing using latent variables

T.T. Nguyen, G. Neubig, H. Shindo, S. Sakti, T. Toda, S. Nakamura

　More details

Event date： 2016.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Automatic detection of memorable spoken quotes

F. Koto, S. Sakti, G. Neubig, T. Toda, M. Adriani, S. Nakamura

　More details

Event date： 2016.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
事象関連電位の空間的事前情報を利用したノイズ除去

真木勇人, 戸田智基, Sakriani Sakti, Graham Neubig, 中村哲

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
空気／体内伝導信号の非負値テンソル分解に基づく体内伝導微弱音声に対する雑音抑圧法

田尻祐介, 亀岡弘和, 戸田智基, 中村哲

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
F0パターン生成過程を考慮したProduct-of-Expertsに基づく電気音声強調のための統計的F0予測法

田中宏, 亀岡弘和, 戸田智基, 中村哲

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声波形加工に基づく非母語音声の継続長補正による品質劣化の分析

倶羅真也, 高道慎之介, 戸田智基, Graham Neubig, 中村哲

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
歌声合成システムの音源データに対する声質評価値に基づく声質制御

山根壮一, 小林和弘, 戸田智基, 中野倫靖, 後藤真孝, 中村哲

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
統計的パラメトリック音声合成におけるモデル統合法

橘健太郎, 戸田智基, 志賀芳則, 河井恒

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
非負値テンソル因子分解を用いた劣決定ステレオチャネル音源分離

関翔悟, 西野隆典, 戸田智基, 武田一哉

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
系列内変動を考慮した差分スペクトル補正に基づく短遅延歌声声質変換

小林和弘, 戸田智基, 中村哲

日本音響学会研究発表会

　More details

Event date： 2016.3

Language：Japanese Presentation type：Poster presentation

Country：Japan
An investigation of acoustic-to-articulatory inversion mapping with latent trajectory Gaussian mixture model

P.L. Tobing, T. Toda, H. Kameoka, S. Nakamura

　More details

Event date： 2016.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Word-level Emphasis Transfer in Speech-to-speech Translation

D.Q. Truong,S. Takamichi,S. Sakti,G. Neubig, T. Toda, S. Nakamura

　More details

Event date： 2016.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
Incongruity detection on ASR outputs based on EEG signals

S. Sakti, Y. Odagaki, T. Sasakura, G. Neubig, T. Toda, S. Nakamura

　More details

Event date： 2016.3

Language：English Presentation type：Oral presentation (general)

Country：Japan
名古屋大学におけるSakai上での全講義登録のための教務連携システム開発

田上奈緒, 中務孝広, 松岡孝, 太田芳博, 大平茂輝, 後藤明史, 出口大輔, 戸田智基, 森健策

Ja Sakai カンファレンス 2016

　More details

Event date： 2016.3

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声波形加工に基づく非母語音声の継続等補正法の評価と分析

倶羅真也, 高道慎之介, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲

電子情報通信学会音声研究会

　More details

Event date： 2015.12

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Augmented speech production based on real-time statistical voice conversion International conference

T. Toda

Talk, MARCS institute, Western Sydney University

　More details

Event date： 2015.12

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：Australia
Augmented speech production based on real-time statistical voice conversion International conference

T. Toda

Talk, UNITEC

　More details

Event date： 2015.12

Language：English Presentation type：Public lecture, seminar, tutorial, course, or other speech

Country：New Zealand
外部雑音モニタリングに基づく体内伝導微弱音声に対する雑音抑圧法

田尻祐介, 戸田智基, 中村哲

電子情報通信学会応用音響研究会

　More details

Event date： 2015.11

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
差分スペクトル補正による統計的歌声声質変換とパラメータ生成

小林和弘, 戸田智基, 中村哲

電子情報通信学会音声研究会

　More details

Event date： 2015.10

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
EEGを用いた未知語知覚の検出

笹倉隆史, Sakriani Sakti, 真木勇人, Graham Neubig, 戸田智基, 中村哲

第2回サイレント音声認識ワークショップ

　More details

Event date： 2015.10

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
雑音環境下におけるサイレント音声通話の実現に向けた非可聴つぶやきに対する2チャネル雑音抑圧法

田尻祐介, 戸田智基, 中村哲

第2回サイレント音声認識ワークショップ

　More details

Event date： 2015.10

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
音声生成機能拡張のための統計的音声変換技術の研究～物理的制約を超えた発声機能の獲得を目指して～ Invited

戸田智基

奈良先端科学技術大学院大学創立記念学術講演会

　More details

Event date： 2015.10

Language：Japanese Presentation type：Oral presentation (invited, special)

Country：Japan
An evaluation of articulatory controllable speech modification based on Gaussian mixture models with direct waveform modification

P.L. Tobing, K. Kobayashi, T. Toda, G. Neubig, S. Sakti, S. Nakamura

　More details

Event date： 2015.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
統計的手法を用いた電気式人工喉頭制御における遅延時間と予測精度の調査

田中宏, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲

日本音響学会研究発表会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
Study on word-level emphasis across English and Japanese

D.Q. Truong, S. Takamichi, S. Sakti, G. Neubig, T. Toda, S. Nakamur

　More details

Event date： 2015.9

Language：English Presentation type：Oral presentation (general)

Country：Japan
歌声合成による学習データ生成を利用した歌声の声質評価値推定法

山根壮一, 小林和弘, 戸田智基, 中野倫靖, 後藤真孝, Graham Neubig, Sakriani Sakti, 中村哲

日本音響学会研究発表会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
機械翻訳を用いた擬似コード生成による学習者支援

札場寛之, 小田悠介, Graham Neubig, 畑秀明, Sakriani Sakti, 戸田智基, 中村哲

教育システム情報学会第40回全国大会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
HMMに基づく日本人英語音声合成における中学生徒の英語音声を用いた評価

高道慎之介, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲

日本音響学会研究発表会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
外部雑音モニタリングを用いた非可聴つぶやきに対する雑音抑圧法

田尻祐介, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲

日本音響学会研究発表会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
HMM音声合成における音声分析合成器STRAIGHTとWORLDの比較

高道慎之介, 戸田智基, 森勢将雅, 中村哲

日本音響学会研究発表会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Poster presentation

Country：Japan
差分スペクトル補正による歌声声質変換のためのF0変換に関する検討

小林和弘, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲

日本音響学会研究発表会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan
歌声合成システムの音源データ検索のための声質評価値推定

山根壮一, 小林和弘, 戸田智基, 中野倫靖, 後藤真孝, Graham Neubig, Sakriani Sakti, 中村

情報処理学会音楽情報科学研究会

　More details

Event date： 2015.9

Language：Japanese Presentation type：Oral presentation (general)

Country：Japan

▼display all

To the head of Presentations.▲

Research Project for Joint Research, Competitive Funding, etc. 25

音識別の新規アルゴリズムおよび実用化に関する研究開発

2020.9 - 2021.3

国内共同研究
音響信号処理モデルの汎用化・適応化とアプリケーション構築容易化のための基盤技術の開発

2020.7

国立研究開発法人産業技術総合研究所受託研究

戸田智基
音声合成の品質・性能向上に関する研究

2020.4 - 2021.3

国内共同研究
音メディアコミュニケーションにおける共創型機能拡張技術の創出

2019.10

科学技術振興機構戦略的創造研究推進事業チーム型研究（CREST）「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域

戸田智基

　 More details

Grant type：Competitive
音識別の新規アルゴリズムおよび実用化に関する研究開発

2019.9 - 2020.3

国内共同研究
発声障碍者補助を視野に入れた音声変換・認識技術に関する研究

2019.4 - 2020.3

国内共同研究
音声合成の品質・性能向上に関する研究

2019.4 - 2020.3

国内共同研究
演奏情報自動抽出に向けた楽音分離技術に関する研究

2019.2 - 2020.1

国内共同研究
空気／体内伝導音信号の相補的活用に基づく音声強調法の研究

2018.8 - 2019.2

国内共同研究
発声障碍者補助を視野に入れた音声変換・認識技術に関する研究

2018.5 - 2019.3

国内共同研究
音識別の新規アルゴリズムおよび実用化に関する研究開発

2018.4 - 2019.3

国内共同研究
音声合成の品質・性能向上に関する研究

2018.4 - 2019.3

国内共同研究
音声変換技術の商用化検討について

2018.3 - 2018.5

国内共同研究
話者認識の新規アルゴリズムおよび実用化に関する研究開発

2017.10 - 2018.3

国内共同研究
発声障碍者補助を視野に入れた音声変換技術に関する研究

2017.9 - 2018.4

国内共同研究
幼児を対象とした音声認識技術に関する研究

2017.8 - 2018.3

国内共同研究
統計的音声生成過程モデリングに基づく音声強調技術に関する研究

2017.6 - 2018.2

国内共同研究
ユーザの適応能力を活用する共創型音声生成機能拡張技術の構築

2016.12 - 2020.3

科学技術振興機構戦略的創造研究推進事業個人研究（さきがけ）「新しい社会システムデザインに向けた情報基盤技術の創出」領域

戸田智基

　 More details

Grant type：Competitive
話者認識の新規アルゴリズムおよび応用に関する研究

2016.8 - 2017.3

国内共同研究
統計的音声生成過程モデリングに基づく音声強調技術に関する研究

2016.8 - 2017.2

国内共同研究
話者識別のための音声特徴量抽出アルゴリズムの検討

2016.1 - 2016.7

企業からの受託研究
発声障害者補助のためのリアルタイム声質変換処理の実装

2011.12 - 2012.7

科学技術振興機構研究成果最適展開支援プログラム（A-STEP）　探索タイプ

戸田智基

　 More details

Grant type：Competitive
CASSIS -- Computer-Assisted communication and Silent Speech InterfaceS --

2009.4 - 2011.3

Tomoki Toda

　 More details

Grant type：Competitive
発声障害者補助のための統計的声質変換技術の研究開発

2008.4 - 2011.3

総務省戦略的情報通信研究開発推進制度（SCOPE）　若手ICT研究者育成型研究開発

戸田智基

　 More details

Grant type：Competitive
固有声変換法に基づく声質変換ソフトウェアの開発

2006.5 - 2007.2

情報処理推進機構（IPA）未踏ソフトウェア創造事業

戸田智基

　 More details

Grant type：Competitive

▼display all

To the head of Research Project for Joint Research, Competitive Funding, etc..▲

KAKENHI (Grants-in-Aid for Scientific Research) 21

次世代音声翻訳の研究

Grant number：17H06101 2017.5

科学研究費補助金基盤研究(S)

　 More details

Authorship：Coinvestigator(s)

Grant amount：\13000000 （ Direct Cost: \10000000 、 Indirect Cost：\3000000 ）
空気／体内伝導音信号の相補的活用に基づく音声／音環境情報処理基盤の構築

Grant number：17H01763 2017.4 - 2020.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Principal investigator
聴覚特性に基づく明瞭音声の客観指標と音声聴覚支援手法の開発

Grant number：16H01734 2016.4 - 2020.3

科学研究費補助金基盤研究(A)

　 More details

Authorship：Coinvestigator(s)
対話的可視化可聴化に基づく音声コミュニケーション研究支援環境

Grant number： 16K12464 2016.4 - 2018.3

科学研究費補助金挑戦的萌芽研究

　 More details

Authorship：Collaborating Investigator(s) (not designated on Grant-in-Aid)
雑音環境下で頑健に動作するサイレント音声通話技術の構築

Grant number： 15K12064 2015.4 - 2019.3

科学研究費補助金挑戦的萌芽研究

　 More details

Authorship：Principal investigator
聴覚情報の静的表現に基づく高度音声処理基盤の構築

Grant number： 15H02726 2015.4 - 2018.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
統計的手法と生成過程モデリング手法の融合に基づく音声生成機能拡張技術の構築

Grant number： 26280060 2014.4 - 2017.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Principal investigator
自閉症等コミュニケーション障害の多元測定と統計モデルによる測定・支援の研究

Grant number： 26540117 2014.4 - 2017.3

科学研究費補助金挑戦的萌芽研究

　 More details

Authorship：Coinvestigator(s)
超巨大データに基づくユニバーサル音声モデル構築のための技術的・社会的基盤の確立

Grant number： 25280061 2013.4 - 2016.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
外国語ニュース・講演の音声同時通訳方式に関する研究

Grant number： 24240032 2012.5 - 2017.3

科学研究費補助金基盤研究(A)

　 More details

Authorship：Coinvestigator(s)
聴覚の情報表現に基づく高度音声分析変換合成方式の研究

Grant number： 24300073 2012.4 - 2015.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

Grant number： 23240023 2011.4 - 2016.3

科学研究費補助金基盤研究(A)

　 More details

Authorship：Coinvestigator(s)
バリアフリー音声コミュニケーションのための次世代ボイスチェンジャー技術の構築

Grant number： 22680016 2010.4 - 2014.3

科学研究費補助金若手研究(A)

　 More details

Authorship：Principal investigator
新しい音声メディアによるユニバーサルコミュニケーションの研究

Grant number： 19200009 2007.4 - 2011.3

科学研究費補助金基盤研究(A)

　 More details

Authorship：Coinvestigator(s)
聴覚・音声機能の支援・拡張技術に関する総合的研究

Grant number： 19200017 2007.4 - 2011.3

科学研究費補助金基盤研究(A)

　 More details

Authorship：Coinvestigator(s)
任意のユーザーを対象とする統計的声質変換・制御法の構築に関する研究

Grant number： 18680018 2006.4 - 2009.3

科学研究費補助金若手研究(A)

　 More details

Authorship：Principal investigator
多元観測信号を用いた音信号の予測及び復元に関する研究

Grant number： 18300064 2006.4 - 2009.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
ディジタルメディアコンテンツ制作のための多様な音声の合成技術

Grant number：17300063 2005.4 - 2009.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
音情景の分解・合成・拡張に基づく音響拡張現実感に関する研究

Grant number：15300035 2005.4 - 2007.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
環境、話者、タスクへの適応性をもつユーザにやさしい音声認識アルゴリズムの研究

Grant number： 15300060 2005.4 - 2007.3

科学研究費補助金基盤研究(B)

　 More details

Authorship：Coinvestigator(s)
多様な話者性の制御を可能とする高品質なテキスト音声合成の研究

Grant number： 03J01700 2003.4 - 2005.3

科学研究費補助金特別研究員奨励費

　 More details

Authorship：Principal investigator

▼display all

To the head of KAKENHI (Grants-in-Aid for Scientific Research).▲