Automatische Transkription der Podcasts
Forumsregeln
Datenschutzerklärung: https://www.gamespodcast.de/datenschutzerklaerung/
Impressum: https://www.gamespodcast.de/impressum/
Forenregeln und zukünftige Weltverfassung
ART 1: Behandle andere Nutzer mit Respekt.
ART 2: Do NOT piss off the Podcasters
Lies bitte weitere Hinweise hier: viewtopic.php?f=4&t=2789
Datenschutzerklärung: https://www.gamespodcast.de/datenschutzerklaerung/
Impressum: https://www.gamespodcast.de/impressum/
Forenregeln und zukünftige Weltverfassung
ART 1: Behandle andere Nutzer mit Respekt.
ART 2: Do NOT piss off the Podcasters
Lies bitte weitere Hinweise hier: viewtopic.php?f=4&t=2789
Automatische Transkription der Podcasts
Hallo zusammen,
neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet. Das erlaubt das nachträgliche Lesen, bzw. Auffinden von bestimmten Stellen im Podcast. Weiterhin könnte so ein Feature auch generell die Suche erleichtern.
Natürlich wird diese Transkription nicht fehlerfrei sein, bedarf meiner Meinung nach aber auch keine Korrektur, sondern kann einfach mitlaufen. Wie das ganze technisch gelöst ist weiß ich gerade nicht, es werden jedoch auch die Stimmen der Podcaster erkannt. Vielleicht kennt ja hier im Forum jemand Tools mit denen sowas möglich ist. Bei Interesse verlinke ich auch noch den Podcast bei dem ich das gesehen habe, möchte aber nicht, dass das hier als Werbung rüberkommt.
Resultat wäre in etwa so:
Andre: "Auf ein Bier meine Damen und Herren, heute sprechen wir über <Thema> mit dabei sind heute der Sebastian Stange."
Sebastion: "Ahoi"
Andre: "und Jochen Gebauer"
Jochen: "Guten Tag"
....
Sebastian: "<hier folgt ein sehr langer Monolog>"
Jochen: "<irgendwas mit Dachlatte>"
...
Andre: "Bis zum nächsten mal"
neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet. Das erlaubt das nachträgliche Lesen, bzw. Auffinden von bestimmten Stellen im Podcast. Weiterhin könnte so ein Feature auch generell die Suche erleichtern.
Natürlich wird diese Transkription nicht fehlerfrei sein, bedarf meiner Meinung nach aber auch keine Korrektur, sondern kann einfach mitlaufen. Wie das ganze technisch gelöst ist weiß ich gerade nicht, es werden jedoch auch die Stimmen der Podcaster erkannt. Vielleicht kennt ja hier im Forum jemand Tools mit denen sowas möglich ist. Bei Interesse verlinke ich auch noch den Podcast bei dem ich das gesehen habe, möchte aber nicht, dass das hier als Werbung rüberkommt.
Resultat wäre in etwa so:
Andre: "Auf ein Bier meine Damen und Herren, heute sprechen wir über <Thema> mit dabei sind heute der Sebastian Stange."
Sebastion: "Ahoi"
Andre: "und Jochen Gebauer"
Jochen: "Guten Tag"
....
Sebastian: "<hier folgt ein sehr langer Monolog>"
Jochen: "<irgendwas mit Dachlatte>"
...
Andre: "Bis zum nächsten mal"
Re: Automatische Transkription der Podcasts
Ich habe einmal versucht eine Podiumsdiskussion automatisch zu transkribieren. Das Ergebnis war eine Katastrophe.
Transkriptionssoftware arbeitet gut, wenn man diktiert und bewusst für diese Software spricht - eine automatische Transkription eines Podcasts mit mehreren Teilnehmern die sich auch noch ins Wort fallen? Du willst nicht wissen, was das für eine wertlose Textwüste ist - ohne stundenlange Nacharbeit und Korrektur ist das imho schlicht unmöglich...
Wenn es wirklich Zaubertools gibt, die das praktisch fehlerfrei hinkriegen - ich bin interessiert...
Die "Gesendet von meinem HTC11 Life mit Tapatalk"-Signatur
Re: Automatische Transkription der Podcasts
Das ganze kann schon sehr gut funktionieren. Klar gibt es sicherlich u.a. Fremdwörter die vielleicht nicht richtig erkannt werden, oder auch wenn mal etwas undeutlich ausgesprochen wurde, aber das Ergebnis kann durchaus überzeugend sein und das Archiv enorm aufwerten weil es auf einmal viel besser durchsuchbar ist.
Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
Re: Automatische Transkription der Podcasts
Das ist aber so definitiv nicht aus einer fast automatischen Transkriptionssoftware...suschi hat geschrieben: ↑7. Jan 2022, 11:41 Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
Die "Gesendet von meinem HTC11 Life mit Tapatalk"-Signatur
Re: Automatische Transkription der Podcasts
Ich meine bei Forschergeist macht jemand tatsaechlich jemand eine manuelle transkription. Da steht auch kein Hinweis, dass es automatisch ist. Und man sieht typos, automatische transkription macht eher unsinn als typos
Zum Vergleich hier eine Sendung die automatisch transkribiert ist
https://freakshow.fm/fs263-performance- ... erformance
Da steht der Hinweis, dass es automatisch passsiert. Machte irgendeine Bude as-a-service, die gehoert jetzt zum Facebook/Meta Konzern.
Finde ich erstaunlich gut, aber schon fehlerbehaftet. Wichtig ist auf jeden Fall dass man eine Spur pro Sprecher hat um das auseinanderhalten zu koennen.
In den letzten 5-10 Jahren seitdem ich zum ersten Mal grottenschlechte Transkriptionen von Youtube gesehen habe hat sich auf jeden Fall einiges getan. Bin gespannt wie es in 5-10 Jahren ist.
Re: Automatische Transkription der Podcasts
Oh, das kann tatsächlich sein, dass es in diesem Fall noch mal nachgebessert wurde. Wie aber schon von Boris erwähnt gibt es auch Episoden mit dem Hinweis, dass es völlig automatisch generiert wurde. Ich finde das Resultat dennoch erstaunlich gut und bin auch über die weitere Entwicklung gespannt.Rince81 hat geschrieben: ↑7. Jan 2022, 11:50Das ist aber so definitiv nicht aus einer fast automatischen Transkriptionssoftware...suschi hat geschrieben: ↑7. Jan 2022, 11:41 Tim Pritlove, das Urgestein des deutschen Podcasts, verwendet Transkriptionssoftware in (fast) allen seinen Produktion. Als Beispiel verlinke ich hier mal eine Sendung https://forschergeist.de/podcast/fg086- ... fernsehen/. Auf der Sendungsseite kann man weiter unten das Transkript aufklappen. Die einzelnen Passagen können dann wiederum genau mit dem Zeitstempel im Podcast verlinkt sein, so dass man durch klicken auf einen Satz direkt an die Stelle im Podcast springt.
- Andre Peschke
- Beiträge: 9852
- Registriert: 9. Jan 2016, 16:16
- Kontaktdaten:
Re: Automatische Transkription der Podcasts
Ich habe das schon vor zwei Jahren mal getestet. Das ist zu viel Aufwand, weil es für die Webseite dann ja auch nochmal formatiert werden muss. Abgesehen davon war das Ergebnis auch stellenweise (!) sehr schlecht und wir wollen nicht, dass am Ende Aussagen von uns als Text im Netz stehen, die so aber nie getätigt wurden. Umgekehrt ist der Aufwand mit Nachkontrolle erst recht zu hoch.suschi hat geschrieben: ↑31. Dez 2021, 14:23 neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet.
Falls es da irgendwann mal die AI-Superlösung-Komfort-Gold gibt: klar. Aber vorerst würde ich eher sagen, das kriegen wir nicht hin.
Andre
Re: Automatische Transkription der Podcasts
Ok, die Beweggründe kann ich nachvollziehen. Nur für den Fall, dass es doch noch mal ausgegraben werden sollte hier noch mal ein Link zu der Software die von Tim Pritlove genutzt wird: https://auphonic.com. Diese bietet scheinbar die Möglichkeit die Text-to-Speech Services von Google, Amazon und anderen direkt zu nutzen. https://auphonic.com/help/algorithms/sp ... ition.html
Da gibt es auch in eine Übersicht über die Funktionen und Preise der verschiedenen Anbieter.
https://podlove.org/2019/05/13/podlove-publisher-2-8/
Da gibt es auch in eine Übersicht über die Funktionen und Preise der verschiedenen Anbieter.
Die oben genannte Software bietet einen Export an der auch mit dem Podlove Player funkioniert den ihr auf der Website nutzt. Der Aufwand sollte sich damit imerhin in Grenzen halten.Das ist zu viel Aufwand, weil es für die Webseite dann ja auch nochmal formatiert werden muss.
https://podlove.org/2019/05/13/podlove-publisher-2-8/
- Andre Peschke
- Beiträge: 9852
- Registriert: 9. Jan 2016, 16:16
- Kontaktdaten:
Re: Automatische Transkription der Podcasts
Auphonic nutzen wir sowieso schon für die Post-Production. Googles Speech-to-Text habe ich damals auf jeden Fall ausprobiert. Amazon weiß ich nicht.suschi hat geschrieben: ↑7. Jan 2022, 14:53 Ok, die Beweggründe kann ich nachvollziehen. Nur für den Fall, dass es doch noch mal ausgegraben werden sollte hier noch mal ein Link zu der Software die von Tim Pritlove genutzt wird: https://auphonic.com. Diese bietet scheinbar die Möglichkeit die Text-to-Speech Services von Google, Amazon und anderen direkt zu nutzen. https://auphonic.com/help/algorithms/sp ... ition.html
Bessere Durchsuchbarkeit wäre schon nett, haben wir daher auch auf dem Schirm. Aber weil das ein laufender Aufwand für jede einzelne Folge ist, muss sich das im Rahmen halten.
Andre
Re: Automatische Transkription der Podcasts
Mir würde ja schon reichen den Biertalk transkribiert zu haben einfach um ne schöne Auflistung aller Probierten mit Beschreibungen und Bewertung zu haben ohne in alle Folgen Reinhören zu müssen
Re: Automatische Transkription der Podcasts
Falls du es noch nicht kennst: Für die ganz alten folgen gibt's die Bierografie: https://www.gamespodcast.de/2016/04/09/ ... rographie/
Aber das ist inzwischen natürlich nur ein kleiner Bruchteil der Folgen
Re: Automatische Transkription der Podcasts
Oh danke, das kannte ich tatsächlich nicht.GoodLord hat geschrieben: ↑8. Jan 2022, 15:03Falls du es noch nicht kennst: Für die ganz alten folgen gibt's die Bierografie: https://www.gamespodcast.de/2016/04/09/ ... rographie/
Aber das ist inzwischen natürlich nur ein kleiner Bruchteil der Folgen
- Dr. Zoidberg [np]
- Cronjob of Justice
- Beiträge: 3889
- Registriert: 7. Jul 2016, 23:28
- Kontaktdaten:
Re: Automatische Transkription der Podcasts
Ich hab die besten Erfahrungen mit https://www.amberscript.com/ gemacht, habe da aber auch bisher nur 2 Interviews transkribieren lassenAndre Peschke hat geschrieben: ↑7. Jan 2022, 13:43Ich habe das schon vor zwei Jahren mal getestet. Das ist zu viel Aufwand, weil es für die Webseite dann ja auch nochmal formatiert werden muss. Abgesehen davon war das Ergebnis auch stellenweise (!) sehr schlecht und wir wollen nicht, dass am Ende Aussagen von uns als Text im Netz stehen, die so aber nie getätigt wurden. Umgekehrt ist der Aufwand mit Nachkontrolle erst recht zu hoch.suschi hat geschrieben: ↑31. Dez 2021, 14:23 neulich bin ich bei einem anderen Podcast auf ein Feature gestoßen welches ich mir auch hier bei The Pod als Zugewinn vorstellen könnte. Bei besagtem Podcast wurde das Gesprochene automatisch transkribiert und in Form eines Dialogs mit auf der Seite der Folge gepostet.
Falls es da irgendwann mal die AI-Superlösung-Komfort-Gold gibt: klar. Aber vorerst würde ich eher sagen, das kriegen wir nicht hin.
Andre
"I'm still tired from all the crossfit this morning" - "It's pronounced croissant and you ate 4 of them"
- HerrReineke
- Archduke of Banhammer
- Beiträge: 2130
- Registriert: 6. Apr 2018, 12:03
Re: Automatische Transkription der Podcasts
Wenn ich mir das Pricing so anschaue, dann müssten sich die Backerzahlen bei dem Output hier eher verdoppeln, bevor sich das irgendjemand leisten kannDr. Zoidberg [np] hat geschrieben: ↑9. Jan 2022, 10:50 Ich hab die besten Erfahrungen mit https://www.amberscript.com/ gemacht, habe da aber auch bisher nur 2 Interviews transkribieren lassen
Quis leget haec?