Spracherkennung zur Interview-Transkription?

Viele Journalisten fragen, ob und wie man Spracherkennung zur Interview-Transkription einsetzen kann. Schließlich funktioniert ja eine Software wie Dragon Naturally Speaking 11 ganz hervorragend und mit ausgezeichneter Erkennungsleistung. Wer als Journalist ein solches Programm im Einsatz erlebt hat, denkt natürlich gleich an seine Interviews und die langwierige Texterfassung der Aufzeichnung. Warum sollte das nicht mit Spracherkennung einfacher und schneller funktionieren?

Drei Gründe sprechen jedoch dagegen:

1. Spracherkennung benötigt ein Benutzer-Profil. Die Software muss also vor dem ersten Einsatz an die individuellen Sprechweise angepasst werden. Ein solches Profil kann man für sich selbst in weniger als fünf Minuten erstellen. Aber es fehlt dann noch immer das Profil für das Gegenüber, also den Interviewpartner. Und selbst wenn man von seinem Partner ein Profil hätte, müsste die Software zwischen jeder Frage und jeder Antwort das Profil wechseln, was derzeit nicht funktioniert.

2. Es fehlen die gesprochenen Satzzeichen. „Herr Ministerpräsident Komma was sagen groß Sie zur aktuellen Lage auf dem Arbeitsmarkt Fragezeichen„: So kann man diktieren, aber kein Interview führen. Auch der Herr Ministerpräsident wird nicht mit diktierten Satzzeichen antworten (wollen).

Nun wäre es ja ein leichtes, fehlende Satzzeichen bei der ohnehin erforderlichen Korrektur nachträglich per Hand einzufügen. Aber Dragon Naturally Speaking benötigt die Satzzeichen schon für die Erkennung an sich, sie sind quasi Haltepunkte, an denen sich die Software während der Transkription entlang hangelt.

3. Ein Diktat ist kein Interview. Damit Spracherkennung ordentlich funktioniert, benötigt man eine gewisse Konzentration und eine klare Artikulation. Das typische Hin und Her im Interview, der angefangene und nicht abgeschlossene Satz, der Einwurf des Gegenüber und gegebenenfalls der Umgebungslärm in einem Café: all das macht den Einsatz von Spracherkennung nahezu unmöglich.

Gibt es weitere Möglichkeiten?

Journalisten, die ohnehin Spracherkennung einsetzen und mit der Technik umzugehen wissen, können sich mit folgendem Trick behelfen: Man höre das Interview mit einem Kopfhörer ab, pausiere bei der Wiedergabe und diktiere anschließend Frage und Antwort mit seinem eigenen Profil. Das funktioniert ganz ordentlich, erfordert aber viel Konzentration. Und, wie gesagt, eine gewisse Erfahrung im Umgang mit der Technik.

 

Eine Antwort auf „Spracherkennung zur Interview-Transkription?“

  1. Und genau der letzte Hinweis im Text ist der Knackpunkt, das ‚Nachsprechen‘, in Fachkreisen Respeaking genannt, ist wirklich nicht ganz einfach. Ich habe selbst Dragon gekauft, aber nach kurzer Zeit wieder beiseite gelegt. Für Interviews mit Hintergrundgeräuschen, Sprechern die mehrere Gedankensprünge innerhalb eines Satzes machen und zudem in Sachen Sprech-Tempo neue Rekorde versuchen aufzustellen, ist man mit dem guten alten 10-Finger-Schreiben allemal schneller.
    Letztendlich kann ich Punkt 3 „Ein Diktat ist kein Interview“ wirklich nur beipflichten. Trotzdem fragt man sich, warum selbst bei klar gesprochenen Inhalten (Tagesthemen o.ä.) ein „Benutzer-Profil“ erforderlich ist… wenn die Hersteller das in den Griff bekommen könnten, dann wäre Spracherkennung vielleicht doch (wieder) interessant.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.