論文紹介動画を自動生成し、 YouTube Shorts に投稿する「論文紹介Bot」のアップデートについて解説します。 運用中のBotはこちらです。 今回は、論文紹介Botの「声」をどう作るかというテーマです。 自動生成した台本を読み上げるTTS(Text-to-Speech)エンジンを ...
Stream text to the ElevenLabs WebSocket API and receive synthesized speech audio in real time — ideal for LLM-powered voice applications. This project implements real-time text-to-speech using ...
女性感ある音声の方はあまり好きな感じではなかったが、男性感ある音声の方は悪くない。音声クローニングは無いのかな? Python で動かした場合は、CPU のみでも、とても軽い(早い)。Web は環境のせいか、ちょっと実用厳しいくらい重い。 WebGPU バッヂが ...
To prepare a docker image with Python implementation of the TTS Client, open the project's main directory and run following command: docker build -f Dockerfile-python -t tts-client-python:2.2.0 . To ...