XfrogX hat geschrieben: ↑26. Nov 2023, 02:29
Könnte man nun daran noch weiter schrauben? Also sowas wie ließ den ersten absatz etwas schneller? Oder erhebe die stimmt zum Ende von Satz 3 oder sowas?
Ja, wie schon weiter oben mal erwähnt, versucht man das aktuell auch so zu lösen, dass man nicht mehr nur den Text eingibt (also Text to Speech) sondern bei Momenten wo es zu monoton klingt oder die Betonung falsch ist, kann man dann mit „Speech to Speech“ nachhelfen. Heißt, man nimmt eine ganz andere Stimme bzw. Person auf, die den Satz oder Text mit den gewünschten Betonungen und Emotionen spricht. Damit kann die KI dann mit dieser Vorlage nochmal deutlich besser sprechen.
Das steckt aber noch etwas in den Kinderschuhen. Zumindest für die breite Öffentlichkeit.
Schon beachtlich dass sowas "einfach so" möglich ist. Andres Stimme ist schon sehr gut getroffen, aber die Sprechart wirkt ziemlich seelenlos, bin mir sicher dass Andre das mit sehr viel mehr Charakter und subtilen Eigenheiten vortragen würde.
akill0816 hat geschrieben: ↑26. Nov 2023, 10:20
Noch kann man definitviv hören, dass es nicht das Original ist. Aber es schon absehbar, dass das in ein paar Jahren nicht so sein wird.
Das ist es heute schon. Die meisten schauen bei plakativen KI-Bildern nicht, ob die Personen fünf Finger haben, sondern auf ganz andere Dinge.
5 Finger sind bei KI Bildern eh längst Geschichte, zumindest wenn man ein Minimum an Zeit und Mühe in die Generierung steckt. Das zeugt höchstens davon, das der menschliche Stichwortgeber noch ungeübt ist (oder sehr wenig Aufwand investiert hat). Auch die Stimme von Andre bekäme man heute schon besser hin. Das Beispiel war ja nur ein (für die investierte Zeit sehr beeindruckendes) Anschauungsbeispiel. Grad von "öffentlichen" Personen (mit viel Bild- oder Audiomaterial) kann man bereits heute erschreckend gute Resultate produzieren.
Wirklich gefährlich für die öffentliche Debatte wird es erst, wenn Täuschungen entstehen können, die selbst Journalisten nicht so leicht verifizieren oder falsifizieren können. Erst dann besteht eine echte Unsicherheit, die zu Falschmeldungen führt. Diese können wiederum das Vertrauen in Medien weiter untergraben und dazu führen, die keine gemeinsame Faktenbasis mehr besteht.
Bisher scheint mir das Niveau noch nicht erreicht zu sein.
Interessant wird es auch wenn Politiker irgentwann real getätigte Aussagen durch bezugnahme auf einen angeblichen Fake in Zweifel ziehen können. Es wird sicher in Zukunft alles ungewisser werden. Aber noch hat es ja zu keinem großen Skandal gereicht, da der Technik das letzte bisschen fehlt?
Wann rechnet die Community hier mit einen KI vertonten Spiel? Der Vorteil für Entwickler wäre evident. Allein die Möglichkeit einmal aufgenommene Recordings durch KI verändern zu können, wäre im Bereich des textlastigen Rollenspiels ein echter Gamechanger. Ich erhoffe mir gerade in Puncto Dialoge in Spielen mit großen Textmengen hier schon einen kleinen Quantensprung, frage mich aber wie lange man wohl noch warten muss um erste Experimente zu sehen.
Guthwulf hat geschrieben: ↑26. Nov 2023, 13:52
Grad von "öffentlichen" Personen (mit viel Bild- oder Audiomaterial) kann man bereits heute erschreckend gute Resultate produzieren.
Ich hatte vor ein paar Monaten auch mal ein paar Samples von Fake Dom/Jochen/Seb erstellt. Die basierten sogar nur auf einzelnen 1-Minuten-Clips und das Ergebnis war schon "geht in die richtige Richung", wenn auch erkennbar noch mistig.
Ich vermute, es wird also in Zukunft nichtmal große Mengen an Material brauchen.
Ich habe das übrigens sogar heute schon im Einsatz gesehen, wo Szenen von Thomas Gottschalk mit einem despektierlichen Spruch über Habeck unterlegt und geteilt wurden. Man erkennt an den Lippenbewegungen, dass er etwas völlig anderes sagt und die Aufnahme rauscht seltsam, vielleicht wegen schlechtem Ausgangsmaterial. Aber es wird schon zur Desinformation benutzt - sogar da, wo es nicht wirklich Not täte, denn Gottschalk hat ja von allein schon genug Kram zum Augenrollen rausgehauen (was es aber natürlich wieder glaubwürdiger macht).
Guthwulf hat geschrieben: ↑26. Nov 2023, 13:52
Grad von "öffentlichen" Personen (mit viel Bild- oder Audiomaterial) kann man bereits heute erschreckend gute Resultate produzieren.
Ich hatte vor ein paar Monaten auch mal ein paar Samples von Fake Dom/Jochen/Seb erstellt. Die basierten sogar nur auf einzelnen 1-Minuten-Clips und das Ergebnis war schon "geht in die richtige Richung", wenn auch erkennbar noch mistig.
Andre
Im vergleich zu deinen Stimmen: Ist dieses Sample treffender oder gleich?
Textsortenlinguistik hat geschrieben: ↑26. Nov 2023, 19:39
Wer weiß, wann dieser Podcast von KI-Versionen unserer Podcaster produziert wird, während André und Jochen auf den Bahamas liegen..?
Textsortenlinguistik hat geschrieben: ↑27. Nov 2023, 15:22
Wird mit dem nächsten Update der Software dann der Bug gefixed, dass Dom For Honor für ein gutes Spiel hält?
Ich fürchte, das ist ein Systemfehler auf Root-Level. Den kriegst du nicht ohne komplette Neuinstallation raus.
Guthwulf hat geschrieben: ↑26. Nov 2023, 13:52
Grad von "öffentlichen" Personen (mit viel Bild- oder Audiomaterial) kann man bereits heute erschreckend gute Resultate produzieren.
Ich hatte vor ein paar Monaten auch mal ein paar Samples von Fake Dom/Jochen/Seb erstellt. Die basierten sogar nur auf einzelnen 1-Minuten-Clips und das Ergebnis war schon "geht in die richtige Richung", wenn auch erkennbar noch mistig.
Ich vermute, es wird also in Zukunft nichtmal große Mengen an Material brauchen.
Ich habe das übrigens sogar heute schon im Einsatz gesehen, wo Szenen von Thomas Gottschalk mit einem despektierlichen Spruch über Habeck unterlegt und geteilt wurden. Man erkennt an den Lippenbewegungen, dass er etwas völlig anderes sagt und die Aufnahme rauscht seltsam, vielleicht wegen schlechtem Ausgangsmaterial. Aber es wird schon zur Desinformation benutzt - sogar da, wo es nicht wirklich Not täte, denn Gottschalk hat ja von allein schon genug Kram zum Augenrollen rausgehauen (was es aber natürlich wieder glaubwürdiger macht).
Andre
die Bild macht doch auch aktuell Werbung, mit KI generierten Bildern und Aussagen von Politikern und ich will nicht wissen, wie viele nicht bis zum Disclaimer zu hören, das das alles KI-Zeug ist