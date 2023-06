So funktioniert es

Ähnlich wie KI, die Texte oder Bilder generiert, sei das ChatGPT oder Midjourney, kann Voicebox ebenfalls mehrere Outputs erzeugen, basierend auf Text oder Audio. So kann das Modell in sechs Sprachen Stimmen synthetisieren. Gesprochene Inhalte können verändert, Rauschen oder Unterbrüche entfernt werden. Es ist sogar möglich, mit der eigenen Stimme perfekt gesprochene Sätze in anderen Sprachen zu generieren. Die KI wurde mit über 50.000 Stunden an gesprochenen Audio-Dateien trainiert.