からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS(Tacotron 2)

論文へのリンク

[1712.05884] Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions

筆者・所属機関

投稿日付

概要(一言まとめ)

Googleが開発したディープラーニングを用いたText to speechの手法。

新規性(何が過去の研究に比べて凄い?)

自然な発音

手法の概要

コメント

関連情報

Google AI Blog: Tacotron 2: Generating Human-like Speech from Text

Googleが音声合成を機械学習で訓練する方法Tacotron 2を発表、システムの調教が楽になる | TechCrunch Japan

次に読む論文

 音声変換。コナンくんのやつができる?

https://www.researchgate.net/publication/307434911_Phonetic_posteriorgrams_for_many-to-one_voice_conversion_without_parallel_data_training

GitHub - andabi/deep-voice-conversion: Deep neural networks for voice conversion (voice style transfer) in Tensorflow

自分なりのアウトプット

気になった英単語・英語表現