Test: Olympus DS 7000

An der Spitze wird die Luft dünn. Wenn es um das professionelle digitale Diktieren geht, landet der Arzt oder Anwalt unweigerlich bei den hochwertigen Geräten von Philips oder Olympus. Es sind Arbeitsinstrumente für den Dauereinsatz, überzeugend in Anmutung, Ergonomie, Verarbeitung und Bedienung. Wer sein Diktiergerät rund um die Uhr nutzt, will keinen Kompromiss in der Hand halten. Die beiden Referenzgeräte in der Oberklasse, das DPM 9600 von Philips und das DS 5000 von Olympus, sind mittlerweile fast fünf Jahre alt.

Farbdisplay und Docking-Station: Olympus DS 7000 (Foto Hersteller)

Nun steht der Wachwechsel an, zunächst bei Olympus. Das neue DS 7000 ist bei uns seit einigen Wochen im Einsatz, und der Fortschritt soll sofort sichtbar sein: Als erstes Profigerät hat es ein TFT-Farbdisplay. Was bringt das? Ehrlich gesagt: nicht viel. Olympus hat die gewohnte Menüführung beibehalten, nun sind die einzelnen Einträge unterhalb der Karteireiter etwas besser voneinander abgesetzt und schneller zu identifizieren. Aber ein großer Schritt nach vorn ist das nicht. Denn mit einem Diktiergerät geht man weder ins Internet, noch schaut man Fotos. Im Gegenteil, die farbige Anzeige hat sogar einige Nachteile: Sie muss früher dunkel schalten als das monochrome Pendant, und ihr Stromverbrauch ist höher. Aber Olympus hat beim Akku alles richtig gemacht und verwendet seine Lithium-Ionen-Batterie aus den Digitalkameras. Der Kraftspender hält um die 30 Stunden durch und hat damit eine Ausdauer, die deutlich über der des Philips DPM 9600 mit Monochromdisplay liegt. So muss man sich nur an die fortwährende Abdunklung der Anzeige gewöhnen.

Meisterstück der Feinmechanik

Die Hardware des neuen DS 7000 ist – wie beim Vorgängermodell – über jeden Zweifel erhaben. Der Body aus Metall ist teilweise mit schwarzem Kunststoff überzogen, das Akkufach ist gegen unbeabsichtigtes Öffnen durch einen Riegel geschützt, und der abermals verbesserte Schiebeschalter, der auf Rollen gleitet, darf als Meisterstück der Feinmechanik gelten. Er arbeitet im Unterschied zur Konkurrenz geräuschlos und fährt absolut leichtgängig und geschmeidig auf seine vier Positionen. Bei diesem Hauptbedienelement spürt man sofort den Unterschied zwischen einem Profigerät und billigen Möchtegern-Apparaten. Bei Bedarf lässt sich der Stand des Schalters auf dem Display visualisieren, so dass der ungeübte Nutzer eine optische Rückmeldung bekommt.

Die zweite Neuerung ist das modifizierte Mikrofon, das mit einer nach oben herausgezogenen Kapsel und einer Feinabstimmung für die Spracherkennung aufwartet. Damit Dragon Naturally Speaking bessere Ergebnisse liefert, hat Olympus zusammen mit dem Softwarehersteller Nuance das Frequenzspektrum des Mikros optimiert. Wir haben mit dem Philips in der linken und dem Olympus in der rechten Hand ein Probediktat aufgenommen und anschließend der PC-Software vorgesetzt. Das Ergebnis: Obwohl die Aufnahme des Olympus in der subjektiven Wahrnehmung besser klingt, gab es hinsichtlich der Erkennungs- und Fehlerrate nicht den geringsten Unterschied – weder in sehr leiser Umgebung noch bei dezent im Hintergrund laufender Musik. Das bestätigt unsere These, wonach eine ordentliche Aussprache bei der Spracherkennung hilfreicher ist als ausgeklügelte Mikrofontechnik.

In gewisser Hinsicht gibt es beim neuen Olympus sogar ein Mikrofonproblem. Denn die Klinkenbuchsen für ein Zusatzmikrofon und den Ohrhörerausgang wurden von der Oberseite des Geräts auf die linke Seitenfläche gelegt. Zugegeben, das sieht nun schicker aus. Aber ein Aufsteckmikrofon mit Nebengeräuschunterdrückung lässt sich jetzt nicht mehr sinnvoll mit dem DS 7000 verwenden, landen doch Zeige- und Mittelfinger nahezu automatisch über der Buchse. Was sich die Japaner dabei gedacht haben, möchte man doch gern wissen. Mit den kleinen Aufsteckmikros erstellt man nämlich auch im Auto, in der Bahn oder am Flughafen eine spracherkennungstaugliche Aufzeichnung. Ohne die Nebengeräuschunterdrückung hörten sich unsere DS-7000-Aufnahmen im Auto durchaus gut an, aber die Fehlerrate bei der Spracherkennung ist indiskutabel. In diesem Sinne ist es gewiss klug, das ältere DS 5000 und seine ID-Variante (mit biometrischem Fingerabdruckscanner) noch eine Zeitlang im Markt zu belassen.

Alle weiteren Details des neuen DS 7000 entsprechen nahezu dem Vorgängermodell. Aufgezeichnet wird, wie bei jedem Profigerät, in den Formaten DSS und DSS Pro, beides sind quasi die MP3-Pendants für Sprache. Ein Diktiergerät ist ein Spezialist und kein Audio-Generalist. Dateien lassen sich mit 256-Bit-AES-Verschlüsselung vor unbefugtem Zugriff schützen, bis zu zehn Autoren und 20 Diktattypen sind direkt am Gerät administrierbar. Die typische Olympus-Marotte, neben der SD-Speicherkarte ein zweites Micro-SD-Laufwerk unterhalb des Akkufachs unterzubringen, wurde beibehalten.

Die kleine Karte lässt sich nur mit chirurgischem Werkzeug aus ihrem Fach herauspfriemeln. Da Speicherplatz weder knapp noch teuer ist, sehen wir hier keinen Gewinn und den Nachteil, dass beim Andocken an Windows gleich zwei störende „Was soll ich nun mit dem Laufwerk anfangen?“-Meldungen aufploppen. Auch irritiert, dass man – wie gehabt – zwischen verschiedenen USB-Klassen umschalten muss. Wer das DS 7000 zusammen mit Dragon Naturally Speaking einsetzt, erhält mit der ebenfalls neuen Zusatzsoftware Olympus Dictation Management System (ODMS) ein sehr leistungsfähiges Programm, das einen ausgefeilten Workflow vom Diktat über die Spracherkennung bis hin zum Versand der transkribierten Dateien per E-Mail oder FTP bietet.

Ganze Befehlsketten und Regeln sind programmierbar, auch in Abhängigkeit vom Diktierer und seinem Kürzel. Es gibt zwar noch einige kleine Fehler, aber insgesamt ist das Gebotene sehr üppig. Die Software eignet sich nicht nur für den Einzelplatz, sondern auch für große Arbeitsgruppen, Dragon lässt sich zudem als Hintergrund-Anwendung integrieren.

Weiterlesen auf FAZnet

Spracherkennung zur Interview-Transkription?

Viele Journalisten fragen, ob und wie man Spracherkennung zur Interview-Transkription einsetzen kann. Schließlich funktioniert ja eine Software wie Dragon Naturally Speaking 11 ganz hervorragend und mit ausgezeichneter Erkennungsleistung. Wer als Journalist ein solches Programm im Einsatz erlebt hat, denkt natürlich gleich an seine Interviews und die langwierige Texterfassung der Aufzeichnung. Warum sollte das nicht mit Spracherkennung einfacher und schneller funktionieren?

Drei Gründe sprechen jedoch dagegen:

1. Spracherkennung benötigt ein Benutzer-Profil. Die Software muss also vor dem ersten Einsatz an die individuellen Sprechweise angepasst werden. Ein solches Profil kann man für sich selbst in weniger als fünf Minuten erstellen. Aber es fehlt dann noch immer das Profil für das Gegenüber, also den Interviewpartner. Und selbst wenn man von seinem Partner ein Profil hätte, müsste die Software zwischen jeder Frage und jeder Antwort das Profil wechseln, was derzeit nicht funktioniert.

2. Es fehlen die gesprochenen Satzzeichen. „Herr Ministerpräsident Komma was sagen groß Sie zur aktuellen Lage auf dem Arbeitsmarkt Fragezeichen„: So kann man diktieren, aber kein Interview führen. Auch der Herr Ministerpräsident wird nicht mit diktierten Satzzeichen antworten (wollen).

Nun wäre es ja ein leichtes, fehlende Satzzeichen bei der ohnehin erforderlichen Korrektur nachträglich per Hand einzufügen. Aber Dragon Naturally Speaking benötigt die Satzzeichen schon für die Erkennung an sich, sie sind quasi Haltepunkte, an denen sich die Software während der Transkription entlang hangelt.

3. Ein Diktat ist kein Interview. Damit Spracherkennung ordentlich funktioniert, benötigt man eine gewisse Konzentration und eine klare Artikulation. Das typische Hin und Her im Interview, der angefangene und nicht abgeschlossene Satz, der Einwurf des Gegenüber und gegebenenfalls der Umgebungslärm in einem Café: all das macht den Einsatz von Spracherkennung nahezu unmöglich.

Gibt es weitere Möglichkeiten?

Journalisten, die ohnehin Spracherkennung einsetzen und mit der Technik umzugehen wissen, können sich mit folgendem Trick behelfen: Man höre das Interview mit einem Kopfhörer ab, pausiere bei der Wiedergabe und diktiere anschließend Frage und Antwort mit seinem eigenen Profil. Das funktioniert ganz ordentlich, erfordert aber viel Konzentration. Und, wie gesagt, eine gewisse Erfahrung im Umgang mit der Technik.

 

Test: Device Control Center von Philips

Dumm gelaufen: Wer sich eines der teuren Handmikrofone für Diktate am PC kauft, stellt bei den beiden Marktführern Philips und Olympus fest, dass er zwar feinste Hardware erworben hat, aber zusammen mit der Spracherkennung Dragon Naturally Speaking genau das nicht funktioniert, was für den Vieldiktierer selbstverständlich ist: das Nutzen des Schiebeschalters für Aufnahmestopp und -pause. Warum ist das wichtig? Weil man damit arbeiten kann wie mit einem Diktiergerät. Nach oben geschoben startet die Aufnahme, nach unten hält sie an, und mit zwei weiteren Positionen lassen sich der schnelle Rücklauf sowie die Wiedergabe starten. Also eine perfekte Einhandbedienung, die bald in Fleisch und Blut übergeht. Nur mit dem Spracherkenner klappt das alles nicht, und wer auch immer die Schuld hat: Dragon-Hersteller Nuance oder die beiden Hardware-Lieferanten, es ist zum Verzweifeln.

Wir haben darüber schon öfter geklagt, und nun hat uns jemand erhört. Philips bietet seit kurzem für seine Speech Mike-Reihe unentgeltlich eine Windows-Software, die grundlegend Abhilfe schafft. Sie heißt „Speech Control“ und installiert sich kurioserweise als „Device Control Center“ am PC. Für das Laden der 300-Megabyte-Datei sollte ein schneller DSL-Anschluss vorhanden sein (www.philips.com/dictation). Nach dem Installieren wird das Programm im Autostart-Modus stets geladen, der Windows-PC fährt deshalb etwas langsamer hoch. Der Vorteil indes: Nach dem Start von Dragon ist das Diktiermikrofon sofort einsatzbereit.

Im Hauptmenü der Steuerungszentrale kann man nun das Speech Mike individuell konfigurieren, und zwar für verschiedene Anwendungen, nicht nur für Dragon Naturally Speaking. Es lässt sich das Verhalten des Schiebeschalters einstellen, aber auch die Belegung der Tasten am Gerät programmieren. Dabei gibt es verschiedene Befehlsarten: Tastenkombinationen, Mausaktionen, Text oder – im Fall Dragon – etwa ein Dutzend Kommandos für die Spracherkennung. Dass nicht das gesamte Befehlsrepertoire von Naturally Speaking aufrufbar ist, sei als kleine Kritik angemerkt. Aber schon mit der Voreinstellung des Herstellers kommt man prima zurecht: Eine Taste ruft etwa direkt den Korrekturmodus auf, wenn ein Wort oder eine Phrase falsch erkannt wurde. Und mit einer weiteren sendet man „Nimm 2“ und wählt damit den zweitbesten Treffer. Kurzum: Diese Software erlaubt ein nahezu optimales Zusammenspiel mit Dragon, man spart viele Kommandos und komplizierte Aktionen, ein großes Lob an die Entwickler.

Bei uns zeigte sich zudem im täglichen Einsatz ein weiterer Pluspunkt, nämlich die Entdeckung des Trackballs auf dem Speech Mike. Bislang hatten wir die Rollkugel stets vernachlässigt. Aber nun offenbarte sie beim Diktieren ins Dragon Pad ihre Vorzüge: Ohne zur Maus greifen zu müssen, lässt sich flink im Text manövrieren oder der Cursor verschieben, das klappt mit einer Hand bestens. Für konzentriertes Arbeiten reichen Bildschirm und Speech Mike vollkommen aus, ein Pluspunkt etwa für die Ärzte, die an einem PC-Terminal stehen.

Alles in allem arbeitet die Kombination aus Dragon Naturally Speaking und Philips Speech Mike wunderbar zusammen. Auf Dauer wird es sich kein Hardware-Hersteller leisten können, Produkte für Spracherkennung und -verarbeitung ohne Dragon-Anbindung auf den Markt zu bringen. Wer ein Olympus-Handmikro einsetzt, muss sich indes nicht grämen, sondern nur etwas Geld in die Hand nehmen. Die Software „Local“ von 4 Voice (www.4voice.de, F.A.Z. vom 16. Oktober 2007) leistet Ähnliches (und einiges mehr), kostet zwar ebenso viel wie ein gutes Handmikrofon, kann von uns aber nach wie vor empfohlen werden.

Test: SpeechMike Air von Philips

Beim digitalen Diktieren hat man die Qual der Wahl des passenden Eingabegeräts. Bewährt haben sich das Headset mit einem kleinen Mikrofonsteg, das kabelgebundene Handmikrofon und für den mobilen Einsatz das Diktiergerät. Jede Art hat ihre Vor- und Nachteile. Was zum eigenen Diktierstil passt, muss jeder selbst herausfinden. Beim Headset und beim Handmikrofon arbeitet man direkt am PC, sieht sofort das Diktierte auf dem Bildschirm und hat den Kontext im Blick. Andere Vieldiktierer arbeiten so konzentriert, dass die Anzeige nur stört. Sie nehmen deshalb ein Diktiergerät und übertragen später zum Computer. Philips bringt nun sein erstes schnurloses Handmikrofon auf den Markt, das Speechmike Air. Es vereint die Vorteile eines Diktiergeräts – man kann im Raum umhergehen und ist nicht an den Arbeitsplatz gefesselt – mit den Vorzügen des Direktdiktats in den Rechner: Beim Einsatz einer Spracherkennung ist alles sofort transkribiert, man muss nicht auf die Umsetzung warten.

Die Referenz: SpeechMike Air von Philips, hier mit Tastensteuerung (Foto: Hersteller)

Ein solches Schnurlosgerät kann jedoch auch Nachteile mitbringen: Wie sieht es bei der drahtlosen Übertragung mit der Akustik aus? Herkömmliche Bluetooth-Protokolle beschneiden das Frequenzspektrum und scheiden aus, wenn es um höchste Qualität geht. Und was passiert, wenn sich der in Gedanken vertiefte Professor versehentlich aus der Reichweite des Funkmoduls herausbewegt? Diktiert er dann ins Nichts?

So waren wir auf das Speechmike Air sehr gespannt. Es ist in verschiedenen Varianten erhältlich, etwa mit einer reinen Tastensteuerung oder in der von uns ausprobierten Version mit internationaler Schiebeschalter-Belegung. Das Paket besteht aus mehreren Komponenten: An den PC wird eine Docking-Station mit einem USB-Kabel angeschlossen, sie dient zum Laden des Handgeräts und nimmt weiterhin einen Bluetooth-Empfänger namens Airbridge auf. Dieser lässt sich herausnehmen, so dass man beispielsweise für den mobilen Einsatz mit dem Notebook allein das streichholzschachtelgroße Airbridge und das Mikrofon braucht. Alle Komponenten sind hochwertig verarbeitet und wirken robust.

Das Speechmike Air liegt mit 16,5 × 4,5 × 2,5 Zentimeter und 130 Gramm Gewicht sehr gut in der Hand. Die Rückseite mit ihrer geschwungenen Form lässt genug Platz für Zeige- und Mittelfinger, der Daumen landet automatisch an der richtigen Stelle über dem Schiebeschalter. Dessen Mechanik ist ordentlich, er reagiert präzise und satt. Noch besser gefällt der Trackball mit seiner schmutzabweisenden Beschichtung und einer phantastischen Haptik. Die Rollkugel in Verbindung mit den neben ihr liegenden Tasten ist ein vollwertiger Maus-Ersatz. Ein schönes Extra, denn während des Diktats kann man schnell ein paar Windows-Befehle geben, ohne das Gerät in der Hand zu wechseln. Zwei Standardakkus versorgen das Air stundenlang mit Strom, der Hersteller gibt rund einen Arbeitstag Betriebszeit an. Die Inbetriebnahme des Speechmike ist einfach und schnell erledigt. Das bewährte „Device Control Center“ (DCC) fungiert als Treiber und Anlaufstelle für die Konfiguration. Wer das Air ohne Spracherkennung einsetzt, findet mit der aufpreispflichtigen Software „Speech Exec Pro Dictate“ alles für einen reibungslosen Workflow vom Diktat über die Weiterbearbeitung im Schreibpool bis hin zum E-Mail-Versand der transkribierten Dokumente.

Wir haben das Ganze mit der Spracherkennung Dragon Naturally Speaking ausprobiert. Hier ist „Speech Exec Pro Dictate“ im Einzelplatzbetrieb zwar bei manchen Gelegenheiten nützlich, aber nicht unbedingt erforderlich. Allein mit dem DCC kann man jedoch sehr glücklich werden. Was andere Hersteller jahrelang vergeblich versucht haben, ist hier perfekt umgesetzt. Das Speechmike Air arbeitet aus dem Stand heraus einwandfrei mit dem Drachen zusammen. Das heißt unter anderem: Der Schiebeschalter regelt Aufnahme und -pause, eine rote Leuchtdiode signalisiert den Aufnahmebetrieb, man kann im Diktat zurückspulen, und die zahlreichen Funktionstasten des Speechmike sind ab Werk mit sinnvollen und naheliegenden Dragon-Kommandos belegt. Mit der oberen rechten Funktionstaste lässt sich etwa sofort das Korrekturmenü aufrufen.

Wer noch mehr Raffinesse sucht, kann im DCC alle Tasten nach eigenem Gusto umprogrammieren. Das funktioniert mit üblichen Windows-Tastenkombinationen einwandfrei. Etliche Dragon-Kommandos stehen ebenfalls zur Auswahl, leider nicht alle. Wir hätten uns zum Beispiel gewünscht, die Tasten so belegen zu können, dass das markierte Wort wahlweise groß oder klein geschrieben wird, denn Fehler in der Groß- und Kleinschreibung kommen bei Dragon Naturally Speaking mit am häufigsten vor. Das ist indes keine Schludrigkeit von Philips, sondern dem eingeschränkten Repertoire der Dragon-Schnittstelle geschuldet. Von unseren Extrawünschen abgesehen, waren wir jedoch begeistert über die nahtlose drahtlose Integration von Hard- und Software. Da merkt man mal wieder: Philips ist in diesem Bereich der Innovationsführer.

Die Liebe zum raffinierten Detail zeigt sich auch bei der Akustik. Das Air verwendet zwar Bluetooth mit einer Reichweite von mehr als zehn Meter. Aber die Programmierer haben ein eigenes abhörsicheres Blauzahn-Profil mit Verschlüsselung entwickelt, das eine erstklassige Audioqualität bietet. Im praktischen Einsatz mit Dragon Naturally Speaking lag die Erkennungsgenauigkeit über der des kabelgebundenen alten Speechmike (vorsichtige Naturen legen eine neue „Diktierquelle“ für das Air an. So kann man sein altes Sprachprofil am einfachsten mit der neuen Hardware nutzen). Und schließlich die Funkreichweite: Philips macht es pfiffig, das Handgerät warnt mit einem dezenten Vibrieren. Nicht etwa, wenn man den Radius des Airbridge-Empfängers verlassen hat – dann wäre es zu spät -, sondern vorher, so dass kein Wort verlorengeht. Wer die Umstandskrämerei kennt, mit der andere Hersteller dieses Problem angegangen sind, kann angesichts der verblüffenden Philips-Lösung nur staunen.

Alles in allem meinen wir nach mehrwöchiger Erprobung, dass es derzeit kein besseres schnurloses Handmikrofon für den professionellen Einsatz gibt. Die 475 Euro sind gut angelegt, das Speechmike macht Spaß und die Arbeit spürbar leichter. Diktieren mit Kabelanschluss kommt einem schon bald als Technik von gestern vor. Für uns bleiben neben dem erwähnten nur zwei weitere Wünsche: Wenn die Docking Station zusätzlich als Ladeschale für die Philips-Diktiergeräte dienen könnte, würde man Platz auf dem Schreibtisch und ein zweites Netzteil sparen. Und schließlich haben es die Ingenieure mit den Kontrolllämpchen zu gut gemeint: Da leuchtet und blinkt es, selbst dann, wenn alles funktioniert. Das lenkt ab, vor allem wenn beim Arzt oder Anwalt ein sehr persönliches oder vertrauliches Gespräch geführt wird.

Test: Dragon NaturallySpeaking 11

Dreimal schneller als Tippen: Dragon NaturallySpeaking 11 (Foto: Hersteller)
Dreimal schneller als Tippen: Dragon NaturallySpeaking 11 (Foto: Hersteller)

Nach ungefähr zwei Stunden stellen sich die ersten Aha-Effekte ein, und dann kommt man aus dem Staunen nicht mehr heraus. Dass man sich nicht nur oberflächlich mit dieser Software beschäftigen muss und eine gewisse Übung benötigt – das ist der größte Nachteil der Spracherkennung am Computer. Wir haben es in den vergangenen Jahren immer wieder erlebt: Wer mit der Technik allein herumexperimentiert, ungeduldig ist und elementare Regeln missachtet, gibt nach kurzer Zeit auf. Wer jedoch Spracherkennung bei einem erfahrenen Benutzer im praktischen Einsatz sieht, will sie haben, die Faszination ist groß.

Spracherkennung wird von Jahr zu Jahr besser, derzeit hat sie ihren Durchbruch auf den modernen Smartphones. Mit dem offenen Betriebssystem Android in der aktuellen Variante 2.2 und mit dem iPhone von Apple kann man SMS und andere Nachrichten diktieren, die passenden „Apps“ vorausgesetzt. Die beste und zuverlässigste Lösung mit hoher Erkennungsrate ist „Dragon Dictation“ für das iPhone. Das Mini-Programm steht gratis parat, der Hersteller Nuance will damit für seine PC-Spracherkennung Dragon Naturally Speaking werben. Dass dies gelingt, zeigt die Plazierung der App als eine der meistgeladenen in Apples Online-Geschäft.

Nun bringt Nuance seine Windows-Software in der Version 11 auf den Markt und zeigt, was sich in den vergangenen zwei Jahren getan hat: Das vielfach verbesserte Programm ist der Maßstab, es gibt keine andere Software mit vergleichbarer Leistungsfähigkeit, man mag diese Monopolstellung bedauern. Wir haben den neuen Drachen zunächst an seiner Erkennungsleistung gemessen: Wie viel Prozent der Worte werden richtig erkannt? Das hört sich trivial an, ist es aber nicht. Berücksichtigt man, dass eine Spracherkennung nur jene Begriffe fehlerfrei umsetzen kann, die in ihrem Vokabular gespeichert sind, hängt die Beurteilung von den Texten und Inhalten ab. Eine prägnante Zusammenfassung der Art „98 Prozent Genauigkeit“ ist also unsinnig. Ein Arzt, Anwalt oder Gutachter, der für seine Diktate ein begrenztes Fachvokabular verwendet und dies sinnvollerweise gleich mit Dragon dazukauft, erreicht spielend 99 Prozent und mehr. Ein Nutzer mit einem reichhaltigen Vokabular, sagen wir ein Schriftsteller oder Journalist, wird eher bei 97 Prozent liegen. Er wird vermutlich eigene Ad-hoc-Begriffe (wie diesen hier) verwenden und vielleicht nur einmal und dann nie wieder. Kein Wörterbuch kann da mithalten.

Wie gut die Erkennungsleistung von Dragon 11 im Vergleich mit der Vorgängerversion 10 ist, haben wir mit unseren eigenen Diktaten ermittelt, das ist eine subjektive Komponente im Test. Aber wir suchten reproduzierbare Ergebnisse. Deshalb wurde aus Hunderten von Diktiergerät-Aufzeichnungen im DSS-Pro-Format eine Auswahl erstellt. Neben kurzen, knappen E-Mails auch längere mit privatem Inhalt, Nachrichtenmeldungen, ein Protokoll einer Testfahrt im Auto und spaßeshalber ein wissenschaftlicher Aufsatz aus der DDR-Geschichtsschreibung in einer aus heutiger Sicht merkwürdigen Sprache. Ein und dieselbe Diktat-Datei ließen wir der Reihe nach erkennen, und zwar mit der alten und der neuen Version, so wie sie der Nutzer nach der Installation vorfindet (also ohne benutzerspezifische Anpassungen). Die Ergebnisse: Die Fehlerrate ist in etwa halbiert, die Genauigkeit liegt – je nach Text – bei bis zu 99 Prozent, ein vorzügliches Ergebnis. Es fußt auf zwei Verbesserungen: Zum einen ist das Vokabular mehr als doppelt so groß. Rund 300 000 Einträge zählt das „Bestmatch IV“ der aktuellen Version, 135 000 waren es bei „Bastmatch III“ in Dragon 10. Zum anderen wurde die Abtastrate des Mikrofons von 11 auf 22 Kilohertz ebenfalls verdoppelt, und so verschwinden viele Probleme mit undeutlich gesprochenen Wortendungen quasi von allein.

Schon wegen des größeren Vokabulars empfiehlt es sich nicht, ein altes Dragon-Profil für die neue Version zu aktualisieren. Man fange von vorn an. Bei uns arbeitete das neue 11er-Profil besser als das zwei Jahre lang gepflegte und persönlich angepasste 10er-Profil. Gegebenenfalls exportiere man seine Wortliste und importiere sie in die neue Version. Das gilt aber nur für Anwender, die ein eigenes opulentes Fachvokabular aufgebaut haben. Die typischen Schwierigkeiten sind übrigens in beiden Versionen gleich: Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen, Produkt- und Eigennamen bereiten noch immer Kopfzerbrechen. Mit ein bisschen Erfahrung kennt man im Laufe der Zeit die Stolpersteine und wird dann beispielsweise „ist vom Feinsten“ dahingehend diktieren, dass man dem „Feinsten“ das Kommando „groß“ voranstellt.

Die neue Version erfüllt zudem viele alte Wünsche, an erster Stelle der Import von DSS-Pro-Dateien professioneller Diktiergeräte: das ist für Ärzte und Anwälte ein Schritt nach vorn. Um Handmikrofone der Hersteller Philips und Olympus perfekt einzubinden, benötigt man wie gehabt Zusatzsoftware, hier hat vor allem Philips mit seinem „Device Control Center“ gute Arbeit geleistet, es funktioniert auch mit Dragon 11 prima.

Die „Verarbeitungsanzeige“ während der laufenden Erkennung wurde durch ein kleines, sich drehendes Nuance-Symbol ersetzt, man wird also weniger abgelenkt. Deutlich einfacher gerät nun die Verwaltung unterschiedlicher Benutzerprofile, und bei der Korrektur sind ebenfalls zahlreiche Verbesserungen zu beobachten. Richtiges Korrigieren bleibt entscheidend für die Lernfähigkeit von Dragon – und hier wird leider der Einsteiger mit der zwar erweiterten, aber noch immer dürren Online-Hilfe nicht besonders weit kommen. Wer den Drachen perfekt beherrschen will, muss einem Profi über die Schulter gucken.

Jenseits der Erkennung gesprochener Texte hat Dragon Naturally Speaking auch bei der PC-Bedienung zugelegt: „Durchsuche Wikipedia nach Frankfurter Allgemeine Zeitung“ versteht die Software auf Anhieb, aber auch „Durchsuche Facebook nach Max Müller“. Für uns der wichtigste neue Befehl: „Programme auflisten“ zeigt alle geöffneten Windows-Fenster. Wir probierten das Programm mit einem Core-2-Duo-Prozessor T5250 (1,5 Gigahertz) unter Windows 7 sowie einem T6300 (1,8 Gigahertz) unter Windows XP – das geht gerade noch ordentlich, etwas mehr Rechenleistung kann nicht schaden. Endlich werden mit Version 11 auch Mehrkern-Prozessoren optimal angesprochen.

Die amerikanische Software ist in mehreren Varianten erhältlich: Die teuren juristischen und medizinischen Versionen sollte man ebenso wie Professional (830 Euro) nur im Fachhandel nach entsprechender Beratung kaufen. Die von uns geprüfte Premium-Variante für 200 Euro ist das Paket der Wahl für die meisten Käufer. Sie unterstützt mehrere Audioquellen an einem Benutzerprofil, ferner das Diktat in so gut wie alle Anwendungsprogramme, auch in Microsoft Word, Excel und Outlook sowie in Open Office Writer. Mit Googlemail funktioniert es nach Angaben des Herstellers ebenfalls, bei uns aber nicht zufriedenstellend. Skeptisch sind wir bei der Einsteigerversion „Home“ für 100 Euro mit stark reduziertem Funktionsumfang. Auch „Premium Mobile“, die für 300 Euro ein billiges Diktiergerät mitbringt, würden wir nicht nehmen.

Mit Dragon Naturally Speaking 11 erfasst der Vielschreiber seine Texte dreimal schneller als mit der Tastatur. Die Ausrede, Spracherkennung sei noch unausgereift, gilt nicht mehr. Die größte Hürde ist das Diktieren selbst, also die im Textverarbeitungszeitalter verlernte Fähigkeit, im Kopf klar zu formulieren.