Rhasspy Piper LU TTS Streaming

Dropdown

D'Rhasspy Piper TTS Technologie gouf vum Michael Hansen, alias Synesthesiam, entwéckelt. Hien huet och d'Marylux Stëmm trainéiert. Déi zwou aner Lëtzebuergesch Stëmme goufe vum Marco Barnig realiséiert.

D'Piper Technik berout op enger Ëmwandlung vun Text an eSpeak-Phonemen, déi zesumme mat den entspriechenden Audio-Dateien an engem neuronale KI-Netz trainéiert ginn. Déi generéiert TTS-Modeller sinn optiméiert fir Streaming a kënnen a Screenliesmaschinnen, wéi NVDA, agesat ginn. Sie kënnen awer och am Ganze synthetiséiert ginn, woubäi d'Qualitéit da besser gëtt.

Verschidde Parameter wéi Liestempo, Sazpaus a Geräischintensitéiten kënnen mat Radioknäpp oder mat Schieberen (am Control-Tab) agestallt ginn. D'Parameter kënnen och an enger Datei ofgespäichert a reimportéiert ginn.

Liestempo
Sazpaus

Streaming is fast, but lower quality

0.01 10
0.01 3
0.01 3
0.1 10