Automatische Transkription der Podcasts

Hier bitte alle Diskussionen rein zu Dingen, die sich um Ausbau und Verbesserung unseres Angebots drehen.
Forumsregeln
Datenschutzerklärung: https://www.gamespodcast.de/datenschutzerklaerung/
Impressum: https://www.gamespodcast.de/impressum/

Forenregeln und zukünftige Weltverfassung
ART 1: Behandle andere Nutzer mit Respekt.
ART 2: Do NOT piss off the Podcasters

Lies bitte weitere Hinweise hier: viewtopic.php?f=4&t=2789
Antworten
Benutzeravatar
suschi
Beiträge: 60
Registriert: 7. Nov 2017, 18:13

Automatische Transkription der Podcasts

Beitrag von suschi »

Hallo zusammen,

neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet. Das erlaubt das nachträgliche Lesen, bzw. Auffinden von bestimmten Stellen im Podcast. Weiterhin könnte so ein Feature auch generell die Suche erleichtern.

Natürlich wird diese Transkription nicht fehlerfrei sein, bedarf meiner Meinung nach aber auch keine Korrektur, sondern kann einfach mitlaufen. Wie das ganze technisch gelöst ist weiß ich gerade nicht, es werden jedoch auch die Stimmen der Podcaster erkannt. Vielleicht kennt ja hier im Forum jemand Tools mit denen sowas möglich ist. Bei Interesse verlinke ich auch noch den Podcast bei dem ich das gesehen habe, möchte aber nicht, dass das hier als Werbung rüberkommt.

Resultat wäre in etwa so:

Andre: "Auf ein Bier meine Damen und Herren, heute sprechen wir über <Thema> mit dabei sind heute der Sebastian Stange."
Sebastion: "Ahoi"
Andre: "und Jochen Gebauer"
Jochen: "Guten Tag"
....
Sebastian: "<hier folgt ein sehr langer Monolog>"
Jochen: "<irgendwas mit Dachlatte>"
...
Andre: "Bis zum nächsten mal"
Rince81
Beiträge: 8668
Registriert: 21. Dez 2015, 04:30

Re: Automatische Transkription der Podcasts

Beitrag von Rince81 »

suschi hat geschrieben: 31. Dez 2021, 14:23 Natürlich wird diese Transkription nicht fehlerfrei sein, bedarf meiner Meinung nach aber auch keine Korrektur, sondern kann einfach mitlaufen.
Ich habe einmal versucht eine Podiumsdiskussion automatisch zu transkribieren. Das Ergebnis war eine Katastrophe. :ugly:

Transkriptionssoftware arbeitet gut, wenn man diktiert und bewusst für diese Software spricht - eine automatische Transkription eines Podcasts mit mehreren Teilnehmern die sich auch noch ins Wort fallen? Du willst nicht wissen, was das für eine wertlose Textwüste ist - ohne stundenlange Nacharbeit und Korrektur ist das imho schlicht unmöglich...

Wenn es wirklich Zaubertools gibt, die das praktisch fehlerfrei hinkriegen - ich bin interessiert...
Die "Gesendet von meinem HTC11 Life mit Tapatalk"-Signatur
Benutzeravatar
suschi
Beiträge: 60
Registriert: 7. Nov 2017, 18:13

Re: Automatische Transkription der Podcasts

Beitrag von suschi »

Das ganze kann schon sehr gut funktionieren. Klar gibt es sicherlich u.a. Fremdwörter die vielleicht nicht richtig erkannt werden, oder auch wenn mal etwas undeutlich ausgesprochen wurde, aber das Ergebnis kann durchaus überzeugend sein und das Archiv enorm aufwerten weil es auf einmal viel besser durchsuchbar ist.

Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
Rince81
Beiträge: 8668
Registriert: 21. Dez 2015, 04:30

Re: Automatische Transkription der Podcasts

Beitrag von Rince81 »

suschi hat geschrieben: 7. Jan 2022, 11:41 Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
Das ist aber so definitiv nicht aus einer fast automatischen Transkriptionssoftware...
Die "Gesendet von meinem HTC11 Life mit Tapatalk"-Signatur
Benutzeravatar
Boris
Beiträge: 406
Registriert: 30. Jan 2017, 20:54

Re: Automatische Transkription der Podcasts

Beitrag von Boris »

Rince81 hat geschrieben: 7. Jan 2022, 11:50 Das ist aber so definitiv nicht aus einer fast automatischen Transkriptionssoftware...
Ich meine bei Forschergeist macht jemand tatsaechlich jemand eine manuelle transkription. Da steht auch kein Hinweis, dass es automatisch ist. Und man sieht typos, automatische transkription macht eher unsinn als typos :mrgreen:

Zum Vergleich hier eine Sendung die automatisch transkribiert ist
https://freakshow.fm/fs263-performance- ... erformance
Da steht der Hinweis, dass es automatisch passsiert. Machte irgendeine Bude as-a-service, die gehoert jetzt zum Facebook/Meta Konzern.
Finde ich erstaunlich gut, aber schon fehlerbehaftet. Wichtig ist auf jeden Fall dass man eine Spur pro Sprecher hat um das auseinanderhalten zu koennen.
In den letzten 5-10 Jahren seitdem ich zum ersten Mal grottenschlechte Transkriptionen von Youtube gesehen habe hat sich auf jeden Fall einiges getan. Bin gespannt wie es in 5-10 Jahren ist.
Benutzeravatar
suschi
Beiträge: 60
Registriert: 7. Nov 2017, 18:13

Re: Automatische Transkription der Podcasts

Beitrag von suschi »

Rince81 hat geschrieben: 7. Jan 2022, 11:50
suschi hat geschrieben: 7. Jan 2022, 11:41 Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
Das ist aber so definitiv nicht aus einer fast automatischen Transkriptionssoftware...
Oh, das kann tatsächlich sein, dass es in diesem Fall noch mal nachgebessert wurde. Wie aber schon von Boris erwähnt gibt es auch Episoden mit dem Hinweis, dass es völlig automatisch generiert wurde. Ich finde das Resultat dennoch erstaunlich gut und bin auch über die weitere Entwicklung gespannt.
Benutzeravatar
Andre Peschke
Beiträge: 9735
Registriert: 9. Jan 2016, 16:16
Kontaktdaten:

Re: Automatische Transkription der Podcasts

Beitrag von Andre Peschke »

suschi hat geschrieben: 31. Dez 2021, 14:23 neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet.
Ich habe das schon vor zwei Jahren mal getestet. Das ist zu viel Aufwand, weil es für die Webseite dann ja auch nochmal formatiert werden muss. Abgesehen davon war das Ergebnis auch stellenweise (!) sehr schlecht und wir wollen nicht, dass am Ende Aussagen von uns als Text im Netz stehen, die so aber nie getätigt wurden. Umgekehrt ist der Aufwand mit Nachkontrolle erst recht zu hoch.

Falls es da irgendwann mal die AI-Superlösung-Komfort-Gold gibt: klar. Aber vorerst würde ich eher sagen, das kriegen wir nicht hin.

Andre
Benutzeravatar
suschi
Beiträge: 60
Registriert: 7. Nov 2017, 18:13

Re: Automatische Transkription der Podcasts

Beitrag von suschi »

Ok, die Beweggründe kann ich nachvollziehen. Nur für den Fall, dass es doch noch mal ausgegraben werden sollte hier noch mal ein Link zu der Software die von Tim Pritlove genutzt wird: https://auphonic.com. Diese bietet scheinbar die Möglichkeit die Text-to-Speech Services von Google, Amazon und anderen direkt zu nutzen. https://auphonic.com/help/algorithms/sp ... ition.html

Da gibt es auch in eine Übersicht über die Funktionen und Preise der verschiedenen Anbieter.
Das ist zu viel Aufwand, weil es für die Webseite dann ja auch nochmal formatiert werden muss.
Die oben genannte Software bietet einen Export an der auch mit dem Podlove Player funkioniert den ihr auf der Website nutzt. Der Aufwand sollte sich damit imerhin in Grenzen halten. ;)

https://podlove.org/2019/05/13/podlove-publisher-2-8/
Benutzeravatar
Andre Peschke
Beiträge: 9735
Registriert: 9. Jan 2016, 16:16
Kontaktdaten:

Re: Automatische Transkription der Podcasts

Beitrag von Andre Peschke »

suschi hat geschrieben: 7. Jan 2022, 14:53 Ok, die Beweggründe kann ich nachvollziehen. Nur für den Fall, dass es doch noch mal ausgegraben werden sollte hier noch mal ein Link zu der Software die von Tim Pritlove genutzt wird: https://auphonic.com. Diese bietet scheinbar die Möglichkeit die Text-to-Speech Services von Google, Amazon und anderen direkt zu nutzen. https://auphonic.com/help/algorithms/sp ... ition.html
Auphonic nutzen wir sowieso schon für die Post-Production. Googles Speech-to-Text habe ich damals auf jeden Fall ausprobiert. Amazon weiß ich nicht.

Bessere Durchsuchbarkeit wäre schon nett, haben wir daher auch auf dem Schirm. Aber weil das ein laufender Aufwand für jede einzelne Folge ist, muss sich das im Rahmen halten.

Andre
Benutzeravatar
exx
Beiträge: 634
Registriert: 10. Apr 2017, 22:07

Re: Automatische Transkription der Podcasts

Beitrag von exx »

Mir würde ja schon reichen den Biertalk transkribiert zu haben einfach um ne schöne Auflistung aller Probierten mit Beschreibungen und Bewertung zu haben ohne in alle Folgen Reinhören zu müssen :eusa-whistle:
GoodLord
Beiträge: 1614
Registriert: 11. Jan 2021, 17:10

Re: Automatische Transkription der Podcasts

Beitrag von GoodLord »

exx hat geschrieben: 8. Jan 2022, 11:54 Mir würde ja schon reichen den Biertalk transkribiert zu haben einfach um ne schöne Auflistung aller Probierten mit Beschreibungen und Bewertung zu haben ohne in alle Folgen Reinhören zu müssen :eusa-whistle:
Falls du es noch nicht kennst: Für die ganz alten folgen gibt's die Bierografie: https://www.gamespodcast.de/2016/04/09/ ... rographie/
Aber das ist inzwischen natürlich nur ein kleiner Bruchteil der Folgen
Benutzeravatar
exx
Beiträge: 634
Registriert: 10. Apr 2017, 22:07

Re: Automatische Transkription der Podcasts

Beitrag von exx »

GoodLord hat geschrieben: 8. Jan 2022, 15:03
exx hat geschrieben: 8. Jan 2022, 11:54 Mir würde ja schon reichen den Biertalk transkribiert zu haben einfach um ne schöne Auflistung aller Probierten mit Beschreibungen und Bewertung zu haben ohne in alle Folgen Reinhören zu müssen :eusa-whistle:
Falls du es noch nicht kennst: Für die ganz alten folgen gibt's die Bierografie: https://www.gamespodcast.de/2016/04/09/ ... rographie/
Aber das ist inzwischen natürlich nur ein kleiner Bruchteil der Folgen
Oh danke, das kannte ich tatsächlich nicht.
Benutzeravatar
Dr. Zoidberg [np]
Cronjob of Justice
Beiträge: 3888
Registriert: 7. Jul 2016, 23:28
Kontaktdaten:

Re: Automatische Transkription der Podcasts

Beitrag von Dr. Zoidberg [np] »

Andre Peschke hat geschrieben: 7. Jan 2022, 13:43
suschi hat geschrieben: 31. Dez 2021, 14:23 neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet.
Ich habe das schon vor zwei Jahren mal getestet. Das ist zu viel Aufwand, weil es für die Webseite dann ja auch nochmal formatiert werden muss. Abgesehen davon war das Ergebnis auch stellenweise (!) sehr schlecht und wir wollen nicht, dass am Ende Aussagen von uns als Text im Netz stehen, die so aber nie getätigt wurden. Umgekehrt ist der Aufwand mit Nachkontrolle erst recht zu hoch.

Falls es da irgendwann mal die AI-Superlösung-Komfort-Gold gibt: klar. Aber vorerst würde ich eher sagen, das kriegen wir nicht hin.

Andre
Ich hab die besten Erfahrungen mit https://www.amberscript.com/ gemacht, habe da aber auch bisher nur 2 Interviews transkribieren lassen
"I'm still tired from all the crossfit this morning" - "It's pronounced croissant and you ate 4 of them"
Benutzeravatar
HerrReineke
Archduke of Banhammer
Beiträge: 2124
Registriert: 6. Apr 2018, 12:03

Re: Automatische Transkription der Podcasts

Beitrag von HerrReineke »

Dr. Zoidberg [np] hat geschrieben: 9. Jan 2022, 10:50 Ich hab die besten Erfahrungen mit https://www.amberscript.com/ gemacht, habe da aber auch bisher nur 2 Interviews transkribieren lassen
Wenn ich mir das Pricing so anschaue, dann müssten sich die Backerzahlen bei dem Output hier eher verdoppeln, bevor sich das irgendjemand leisten kann :ugly:
Quis leget haec?
Antworten