Als Sprecher-Stimme wäre das nicht meine erste Wahl. Aber dann denkt man sich "Kost' ja nichts - warum eigentlich nicht!".
Eine Firma, die nicht betriebswirtschaftlich organisiert ist, ist entweder bald Pleite und/oder hat sehr bald große Probleme mit dem Finanzamt, weil es sich dann um "liebhaberei" handelt (ist tatsächlich so definiert, wenn keine Gewinnerzielungsabsichten vorliegen) - spaß beiseite, ich verstehe vollkommen, was Du meinst, ich denke bei solchen Firmen primär an Gewinnmaximierung und ich erkenne, welche potentiell existenzbedrohende Situation sich Firmen da schaffen, wenn sie einen zunehmend wachsenden Anteil ihrer Produktionsprozesse irgendwelchen Unternehmen am anderen Ende der Welt anvertrauen. Je nach Komplexität dürfte es da nicht wenige Fälle geben, wo der Ausfall oder Angriff der Dienste die sofortige Pleite bedeuten könnte, bspw. wenn man sich in der Endfertigung befindet und auf einmal absolut notwendige Änderungen des Sprechertextes gebraucht werden bzw., wenn das soweit ist, k.i. generierte Bilder, Videos, Musik etc. Ich stecke in diesem Moment z.B. in der Endfertigung eines sehr umfangreichen Projekts für eine gewisse deutsche Airline, wo morgen ein Event in Frankfurt stattfindet wo es gespielt werden muss, es wird noch immer an letzten Schnittänderungen, Motion Design, Sounddesign, Online und Grading gearbeitet...
Ich weiß, hab ich alles schon durch (und wieder gelöscht), war spannend und unterhaltsam, hab allerdings für beides (außer Spieltrieb) keine wirkliche Anwendung - was ich brauche ist TTS und Voice Cloning in Deutsch.blindcat hat geschrieben: ↑Di 23 Mai, 2023 17:07
@Frank: Stable Diffusion mit Automatic 1111 läuft ziemlich ... einfach. Wenn es mal um das ausprobieren geht. Und der Installer von Oobabooga (ChatGPT artige Textmodelle) läuft gerade ebenso unkompliziert durch. Beide Varianten installieren sich offenbar ohne Systemeingriff. Wenn es nicht gefällt, Ordner löschen und weg ist es.