Test: Philips Speech Mike Premium für Spracherkennung

Mit den Eingabemikrofonen für Spracherkennung am PC verhält es sich wie mit Werkzeug des Heimwerkers. Man ist mit der günstigen Massenware aus dem Baumarkt zufrieden, aber sobald ein Profi anrückt, schüttelt er den Kopf. Denn für Dauereinsatz ist andere Qualität gefragt. Wer mit dem neuen Dragon Naturally Speaking 12, das wir hier unlängst vorgestellt haben, privat seine Korrespondenz diktiert, ist mit einem 100-Euro-Mikrofon gut bedient. Vieldiktierende Ärzte und Anwälte halten ihr Gerät jeden Tag stundenlang in der Hand. Dann sind hohe Anforderungen zu erfüllen, nicht nur in Bezug auf Ergonomie und Akustik, sondern auch in der Steuerung mit Funktionstasten.

Diktiermikrofone im professionellen Segment sind die Directrec-Reihe von Olympus und die Speechmikes von Philips. Letztere haben ihr Spracherkennungsportfolio ausgelagert in die „Speech Processing Solutions“, die wiederum der österreichischen Invest AG gehören. Die Marke Philips bleibt jedoch erhalten, und wir haben das neue Speechmike Premium ausprobiert, das jetzt in mehreren Varianten im Handel ist. Das Speechmike ist hübscher geworden, es wirkt hochwertiger, und die Oberfläche ist nun glatt poliert. Das ist nicht allein dem schönen Schein geschuldet, sondern soll dank eines „Pearl Metal“-Zusatzes dafür sorgen, dass Nebengeräusche durch Fingerbewegungen auf der Oberfläche gar nicht erst entstehen. Wie gehabt ist auch das Neue mit einer antimikrobiellen Oberfläche versehen, ein Pluspunkt im Krankenhaus-Einsatz.

Referenzklasse: Philips Speech Mike Premium (Foto Hersteller)

Die wohl wichtigste Verbesserung betrifft die Mikrofontechnik. Hier hat Philips aus dem Vollen geschöpft. Die Mikrofonkapsel ist unter dem Gitter entkoppelt aufgehängt – wie bei einem Studiomikrofon. Der Effekt: deutlich bessere Akustik, weniger Verzerrungen und abermals Reduzierung von Hintergrundgeräuschen. Zwischen Gitter und Mikrofonkapsel befindet sich ein Flies; der Veloursstoff soll Knall- und Zischgeräusche dämpfen, die bei einem dicht am Mund gehaltenen Mikrofon entstehen. Das Speechmike ist zunächst nur mit Tastensteuerung erhältlich und kostet 320 Euro. Es gibt in dieser Ausführung noch keine Schiebeschalter-Variante. Wer sich an dieses Bedienprinzip gewöhnt hat, schaut zwar nicht in die Röhre, bezahlt aber kräftigen Aufschlag, weil er das Mikro mit Barcode-Scanner nehmen muss, das 950 Euro kostet. Das kann es nicht sein.

Nach dem Anschluss des Premium an den PC mit einem USB-Kabel installiert sich der Gerätetreiber unter Windows automatisch. Das Gerät liegt mit Maßen von 17 × 4,5 × 3 Zentimeter gut in der Hand. Die Rückseite mit ihrer geschwungenen Form lässt genug Platz für Zeige- und Mittelfinger, und der Daumen landet geradezu automatisch an der richtigen Stelle, entweder auf der Start-Stopp-Taste oder über dem Schiebeschalter. Dessen Mechanik ist ordentlich, er reagiert präzise. Der Trackball lässt sich in Verbindung mit den neben ihm liegenden Tasten als vollwertiger Maus-Ersatz nutzen, ein schönes Extra: Denn während des Diktats kann man ein paar Windows-Befehle ausführen, ohne das Gerät zu wechseln. Die Rollkugel ist sogar als Taste nutzbar, und die Kugel des Trackballs besteht jetzt aus Edelstahl. Ihre Bewegungen werden genau mit einem Laserscanner erfasst.

Das beiliegende „Device Control Center“ (DCC) fungiert als Anlaufstelle für die Konfiguration, wenn man mit der Spracherkennung Dragon Naturally Speaking von Nuance unter Windows arbeitet. Wie bei Philips nicht anders zu erwarten: Das Speechmike arbeitet aus dem Stand heraus einwandfrei mit dem Drachen zusammen. Das heißt unter anderem: Der Schiebeschalter regelt Aufnahme und Pause, eine rote Leuchtdiode signalisiert den Aufnahmebetrieb, es lässt sich im Diktat zurückspulen, und die zahlreichen Funktionstasten des Speechmike sind ab Werk mit sinnvollen und naheliegenden Kommandos belegt.

Wer noch mehr Raffinesse sucht, kann im DCC alle Tasten nach eigenem Gusto programmieren. Das funktioniert mit üblichen Windows-Tastenkombinationen einwandfrei. Etliche Dragon-Kommandos stehen ebenfalls zur Auswahl, aber leider nicht alle. Wir hätten uns zum Beispiel gewünscht, die Tasten so belegen zu können, dass das markierte Wort wahlweise groß oder klein geschrieben wird, denn Fehler in der Groß- und Kleinschreibung kommen bei Dragon Naturally Speaking mit am häufigsten vor. Das ist indes keine Schludrigkeit von Philips, sondern dem eingeschränkten Repertoire der Dragon-Schnittstelle geschuldet. Eine feine Neuerung ist der integrierte Bewegungssensor. Er lässt sich so programmieren, dass die Aufnahme automatisch stoppt, wenn das Gerät auf dem Tisch abgelegt wird. Die Akustik des neuen Speechmike ist überragend. Wer nicht gerade viel Musik am Computer hört, benötigt …

Weiterlesen auf FAZnet

Test: Ford Sync

Vernetzung angekündigt: Ford Sync will auch bei den Apps mitspielen

Vernetzung angekündigt: Ford Sync will auch bei den Apps mitspielen (Foto Hersteller)

Als der Autohersteller Ford vor genau fünf Jahren in den Vereinigten Staaten mit seinem Sync-System an den Start ging, war das eine Revolution. Die Anlage holte sich ungezählte Preise, wurde in der Ford-Werbung prominent herausgestellt – und wir kennen einige Amerikaner, die sich beim Neuwagenkauf nur wegen Sync für einen Ford entschieden haben.

Sync ist ein Spracherkennungssystem rund um die Telefonie und Musikwiedergabe im Fahrzeug, es setzt ein Handy oder Smartphone voraus, und dann kann man in der amerikanischen Variante nicht nur seinen Musikspieler ansteuern, sondern auch mit Sprachkommandos durchs Telefonbuch blättern, Assistenzdienste aufrufen, Verkehrsnachrichten hören, und Apps auf dem Blackberry, iPhone oder Android-Gerät integrieren. Es gibt Dutzende von Anwendungen, quasi ein eigenes „Ökosystem“ rund um Sync.

Nun kommt das System nach Europa, und das erste Fahrzeug mit Sync ist der Ford Focus ST, demnächst folgt neue der B-Max. Sync ist im Focus ST nahtlos eingebunden in die Infotainment- und Navigations-Infrastruktur. In unserem Testwagen kam das Sony-Navigationssystem (1600 Euro) mit seiner zerklüfteten Bedienlandschaft (ein Drehsteller und mehr als 20 Tasten) in Verbindung mit einem kleinen 13-Zentimeter-Monitor zum Einsatz. Bei der Routenführung ändert sich nichts, Sync arbeitet derzeit in den Abteilungen Telefonie und Musikwiedergabe, ferner gibt es (nur bei angeschlossenem Handy) einen Notruf-Assistenten. Zu unterscheiden ist indes zwischen der Anbindung des Mobilgeräts mit Bluetooth und einem USB-Kabel. Nutzt man den Blauzahn, bietet Sync einen nur rudimentären Funktionsumfang: Sprachwahl beim Telefon, Musikwiedergabe mit A2DP und der Titelsprung mit Sprachkommandos. Das alles entspricht dem Niveau einer Anlage der Mittelklasse, wobei schon hier stört, dass jedwede Spracherkennung mit einem Audiosignal und dem nervenden Hinweis „Telefon – Ein Kommando bitte“ eingeleitet wird.

Spannender wird das Ganze mit der Kabelanbindung und USB. Wir probierten das iPhone 4 mit dem älteren iOS-Betriebssystem 5.1, das als iPod erkannt wird. Nur am Rande: Diese Funktion gibt es beim iPhone 5 mit seinem Lightning-Adapter nicht mehr. Mit älteren iPhones wird der Musikbestand anschließend automatisch indiziert, und fortan kann man mit Sprachkommandos durch das gesamte Repertoire surfen. Das Gebotene geht weit über die üblichen Standards hinaus. Die Musikauswahl über den Künstlernamen oder den Albumtitel gehört dazu, ferner kann man fein differenziert nach einem Genre suchen oder „ähnliche Musik“ abspielen lassen und sprachgesteuert seine Wiedergabelisten aufrufen. Jedenfalls in der Theorie.

Im praktischen Einsatz zeigen sich gleich mehrere Tücken. Die eine ist die schlechte Leistung des Spracherkenners von Microsoft. Obwohl der Datenbestand indiziert ist und nur die wenigen eigenen Titel erkannt werden müssen, sind die Ergebnisse unbefriedigend. Statt der Schubert-Lieder von Matthias Goerne hörte Sync ein „Blondine“. Dass es nicht an unserer unklaren Aussprache liegt, zeigte die Gegenprüfung mit Diktiergerät und Spracherkennung am PC: Während sich Dragon Naturally Speaking von Nuance trotz der Nebengeräusche bestens schlug, hatte Sync mit etlichen Problemen zu kämpfen. Der zweite Minuspunkt ist das Durcheinander von englischen und deutschen Titeln und Künstlernamen. Ein „Titel Auswärtsspiel abspielen“ führt zum Erfolg, aber sobald man „Minutes to Midnight“ aufrufen will, hagelt es Fehlermeldungen. Bei der Anpassung an die deutsche Sprache hat man sich also zu wenig Gedanken gemacht.

Und dann sollte man auch sein eigenes Repertoire bestens im Kopf haben. Ist die CD unter „Goldbergvarationen“ oder „Bach: Goldberg-Variationen“ oder „Glenn Gould – The Goldberg Variations“ gespeichert? Das alles muss man wissen, denn dem Spracherkenner wurde nicht die erforderliche Redudanz mitgegeben, um schon aus kleinsten Textschnipseln zum richtigen Ziel zu kommen. Schließlich ist auch die Menüführung unbefriedigend. Wie bei der Bluetooth-Anbindung kommt zu Beginn ein Signalton und dann eine langatmige Aufforderung. Das alles können andere Fahrzeughersteller schon jetzt besser, nur fehlen jenseits von Sync die detaillierten Zugriffsmöglichkeiten auf Genre, Titel und Interpreten. Ein kleines Extra ist indes die Erkennung der Musikstücke, die gerade im Radio gespielt werden. Aber das reicht nicht aus. „Sync wird immer besser und kontinuierlich weiterentwickelt“, sagt Ford, und verspricht,

Weiterlesen auf FAZnet

Test: Dragon NaturallySpeaking 12 von Nuance

„Neuer Termin mit Martin nächste Woche Dienstag 12 Uhr“: Schon dieser eine Satz demonstriert beispielhaft die Leistungsfähigkeit einer modernen Spracherkennung. Er ist in weniger als fünf Sekunden diktiert und führt nahezu unmittelbar zu einem Eintrag im elektronischen Kalender. Ohne Spracherkennung dauert es immer länger: Das Starten des Terminkalenders, die Suche des passenden Datums und das Eintippen der Details ist viel mühseliger, als seinem Smartphone neun Wörter vorzusprechen.

Ihre frappierende Leichtigkeit hat Apples Sprachassistentin Siri so populär gemacht. Aber sie ist ja auch mehr als eine Spracherkennung, die Gesprochenes in Schriftliches überführt. Siri nimmt zusätzlich eine semantische Analyse des Inhalts vor, und anhand bestimmter Schlüsselbegriffe wie „Termin“ erfolgt automatisch die Umsetzung in Aktionen, wie der Eintrag im Terminkalender oder das Abrufen des Wetterberichts.

Siri läuft derzeit nur auf dem iPhone 4S. Wer jedoch das iPad 3 oder auf dem Mac-Rechner das aktuelle Apple-Betriebssystem Mountain Lion einsetzt, kann zumindest die Diktatfunktion, also die reine Spracherkennung, ebenfalls verwenden. Wo immer der Cursor gerade steht: Man diktiert, der Audio-Schnipsel wird via Internet auf Server von Apple übertragen, dort transkribiert, und der Text kommt retour. Apple verwendet für seine Spracherkennung die Technik des amerikanischen Herstellers Nuance, der hier seit mehr als zehn Jahren Marktführer ist. Der Charme dieser Lösung besteht darin, dass sie geradezu unmittelbar zur Verfügung steht. Man muss keine Software installieren, kein Benutzerprofil anlegen, nichts neu lernen, sondern kann einfach loslegen. Die Erkennungsrate ist sehr hoch, die Ergebnisse sind verblüffend gut.

Vergleicht man die drei Apple-Plattformen, ist die Performance nahezu identisch. Der Mac-Rechner mit flinken Prozessoren ist dem iPad 3 keineswegs überlegen. Auf allen drei Systemen sind auch ähnliche Fehler und Einschränkungen zu beobachten. Zum Beispiel die falsche Großschreibung, wenn man im Satz innegehalten hat. Und die Restriktionen sind ebenfalls nicht zu übersehen: Der Erkenner erlaubt nicht das Anlernen oder Training ihm unbekannter Begriffe, er versteht kein Fachvokabular, und man kann nur abschnittweise diktieren, weil ja jeder Satz oder Halbsatz nach Amerika geschickt wird, was nicht jeder goutiert.

Für professionelles Diktieren längerer Texte oder die Umsetzung von Diktaten, die zuvor aufgenommen wurden, ist das Apple-System ungeeignet. Es wird nur dann besser, wenn Apple die Algorithmen auf seinen Servern verbessert. In Amerika beklagen sich sogar viele Nutzer, dass Siri in den vergangenen Monaten schlechter geworden sei. Man wird also mit diesem semiprofessionellen System auf den Geschmack gebracht. Schnell gibt es Appetit auf mehr, und dann ist eine Software gefragt, die auf dem eigenen PC läuft, ein umfangreiches und ergänzbares Wörterbuch mitbringt, für bestimmte Berufsgruppen ein Fachvokabular und vieles andere mehr.

Wer Höchstleistungen sucht, benötigt einen aktuellen Rechner

Wer jedoch nach ein paar Runden im Porsche 911 die Leistung eines Formel-1-Boliden sucht, kommt um ein Fahrertraining nicht herum. Zum Glück hat Nuance bei seiner Windows-Software Dragon Naturally Speaking in den vergangenen Jahren viel getan, um die Hürden des Einstiegs zu senken. Dragon ist der Maßstab und die Referenz, es gibt keine andere Software mit vergleichbarer Leistungsfähigkeit, man mag diese Monopolstellung bedauern.

Mit der neuen Version 12, die seit Ende August im Handel ist, beschränkt sich die Inbetriebnahme nach der Installation auf ein fünfminütiges Diktat, mit dem der Erkenner den individuellen Sprachstil analysiert. Die viel größere Hürde im Alltagseinsatz ist die Fülle der Möglichkeiten und Optionen. Mit dem Drachen kann man ein Windows-System durchgängig mit Sprache steuern, eine Outlook-E-Mail verfassen oder Word-Kommandos aufrufen. Das alles will aber geübt sein – ungeachtet der zahlreichen Hilfestellungen.

Der neue Drachen bringt ein abermals verbessertes akustisches Modell mit, das nun Best Match V heißt. Dieses verlangt einen Mehrkernprozessor und mindestens 4 Gigabyte Arbeitsspeicher. Wir probierten Dragon 12 mit einem älteren Core-2-Duo-PC und zwei Gigabyte Speicher. Hier wurde uns Best Match IV empfohlen, wir nahmen trotzdem das neue Akustikmodell – und die Arbeitsgeschwindigkeit brach deutlich ein. Wer Höchstleistungen sucht, benötigt also einen aktuellen Rechner. Mit dem Core-i5 und 8 Gigabyte Arbeitsspeicher hatten wir keine Probleme. Das neue Best-Match-Modell soll um bis zu 18 Prozent verbesserte Erkennungsleistung bieten, sagt das Marketing von Nuance, eine saloppe Formulierung, die man jedoch so nicht stehen lassen kann.

Genauigkeit bei bis zu 99 Prozent

Berücksichtigt man, dass eine Spracherkennung nur jene Begriffe fehlerfrei umsetzen kann, die in ihrem Vokabular gespeichert sind, hängt die Beurteilung von den Texten und den Inhalten ab. Eine prägnante Zusammenfassung der Art „98 Prozent Genauigkeit“ ist also unsinnig. Ein Arzt, Anwalt oder Gutachter, der für seine Diktate ein begrenztes Fachvokabular verwendet und dies sinnvollerweise gleich mit Dragon dazukauft, erreicht spielend 99 Prozent und mehr. Ein Dragon-Nutzer mit einem reichhaltigen und ungewohnten Vokabular, sagen wir ein Schriftsteller oder Journalist, wird darunter liegen. Er wird vermutlich eigene Ad-hoc-Begriffe (wie diesen hier) verwenden und vielleicht nur einmal und dann nie wieder. Kein Wörterbuch kann da mithalten.

Wie gut die Erkennungsleistung von Dragon 12 im Vergleich mit der Vorgängerversion ist, haben wir also mit unseren eigenen Diktaten ermittelt, das ist eine subjektive Komponente im Test. Aber wir suchten reproduzierbare Ergebnisse. Deshalb wurde aus Hunderten von Diktiergerät-Aufzeichnungen im DSS-Pro-Format eine repräsentative Auswahl erstellt. Neben kurzen, knappen E-Mails auch längere mit privatem Inhalt, Nachrichtenmeldungen, das Protokoll einer Testfahrt im Auto, und spaßeshalber ein „abdiktierter“ wissenschaftlicher Aufsatz aus der DDR-Geschichtsschreibung in einer aus heutiger Sicht inakzeptablen Sprache.

Dragon Naturally Speaking 12: Bis in die kleinsten Verästelungen hinein anpassbar (Foto Spehr)

Ein und dieselbe Diktatdatei ließen wir der Reihe nach erkennen, und zwar mit der alten und der neuen Version, so wie sie der Nutzer nach der Installation vorfindet (also ohne benutzerspezifische Anpassungen). Die Ergebnisse: Etwa jeder zehnte Fehler wurde ausgemerzt, die Genauigkeit liegt – je nach Text – bei bis zu 99 Prozent.

Die „Premium“-Variante sollte es mindestens sein

Vor zwei Jahren konnten wir bei der Vorstellung der Version 11 festhalten, dass die Fehlerrate halbiert wurde. Der Fortschritt schreitet also um so langsamer voran, je perfekter die Erkennung wird. Die typischen Probleme sind übrigens gleich geblieben: Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen, Produkt- und Eigennamen bereiten noch immer Kopfzerbrechen. Aber mit der „richtigen“ Nutzung der Korrekturbefehle und zunehmender Adaption an das Nutzervokabular verschwindet mancher Fehler. Und mit ein bisschen Erfahrung kennt man im Laufe der Zeit die Stolpersteine und wird dann beispielsweise „ist vom Feinsten“ dahingehend diktieren, dass man dem „Feinsten“ das Kommando „groß“ voranstellt.

Eine häufige Fehlerklasse wurde indes ausgemerzt: Mit einer Option kann man Personalpronomen der 2. Person („Du“, „Dich“) immer groß schreiben lassen und mit einer weiteren kontextabhängig auch die der 3. Person („Sie“, „Ihnen“). Das ist ebenso ein Gewinn wie „Smart Format“, eine Funktion, die sich einmalige Korrekturen einer Schreibweise („Kilogramm“ statt „kg“) permanent merkt. Etliche kleinere Verbesserungen betreffen ferner die Steuerung eines E-Mail-Systems im Browserfenster, das zu diesem Zweck mit einer Erweiterung versehen sein muss.

Wie gehabt läuft Dragon 12 selbst mit Windows XP; zwei Gigabyte Arbeitsspeicher sind indes Pflicht. Weiterlesen auf FAZnet

Test: ConnectedDrive im neuen 3er-BMW

Den Gedanken, dass man im neuen 3er-BMW einfach losfährt und sich dann unterwegs mit der Kommunikationstechnik vertraut macht, den schiebe man getrost beiseite. Das volumenstärkste Modell der Bayern bringt gegen Aufpreis nahezu alles mit, was BMW derzeit im Angebot hat: Head-up-Display, Office-Funktionen, Connected Drive, Echtzeit-Staudaten, Verkehrsschilderkennung und jede Menge Apps. Man könnte ein Buch dazu schreiben, denn rund um das Navigationssystem „Professional“ ist quasi ein vollwertiges Computersystem entstanden, das mit einer Fülle von Möglichkeiten und Optionen auftrumpfen will. Es gibt Online- und Offline-Dienste, Anwendungen für die fest verbaute Sim-Karte des Fahrzeugs und weitere, die sich erst nach dem Andocken eines iPhone erschließen.

Das neue Head-up-Display mit liebevoll gezeichneten Details (Fotos Hersteller)

Also eine bunte Mischung aus viel Sinnvollem und manchem Überflüssigen, bisweilen einfach zu bedienen, aber gelegentlich tückisch wie das Programmieren eines Videorekorders vor zehn Jahren. Wir haben uns doch oft geärgert. Etwa, dass nach dem Aufruf von BMW-Apps am Smartphone die Musikübertragung mit Bluetooth neu einzurichten ist. Oder dass man vom Web-Radio ausgehend nicht ins zuletzt angezeigte Menü zurückgehen kann. Ferner über sage und schreibe drei Office-Module an verschiedenen Stellen, die ganz Unterschiedliches bedeuten.

In den Details ist die Hardware im neuen 3er-BMW den Anlagen der großen Brüder wie aus dem Gesicht geschnitten: Den Bordmonitor im Breitbild-Format mit 22 Zentimeter in der Diagonale, den Controller vor der Mittelarmlehne sowie die acht Schnellzugriffstasten kennt man schon aus 5er und 7er. Letztere sind die Rettungsanker für unbedarfte Fahrer. Denn sie lassen sich individuell mit Funktionen belegen und zeigen ihren Status, wenn man leicht mit dem Finger über die Tastenfläche fährt: Taste 1 leitet dann beispielsweise immer nach Hause. Dass die Materialanmutung der Bedienelemente nicht an den 5er oder 7er heranreicht, sei am Rande bemerkt.

Das “Professional”-System mit seinen Hauptmenüs

Das optional erhältliche Head-up-Display ist ein großer Pluspunkt, wenn es um das schnelle Erfassen von Informationen bei minimaler Fahrerablenkung geht. Über der Motorhaube scheinen die Inhalte zu schweben, und die Detailtiefe der Darstellung ist im Vergleich mit der Konkurrenz überragend. Man sieht nicht nur die aktuelle Geschwindigkeit, sondern auch sehr differenzierte Hinweise bei der Routenführung in einer Schemazeichnung. Ferner ist das von Kameras erfasste aktuelle Tempolimit der Verkehrsschilderkennung eingeblendet, und hier arbeitet die Technik deutlich besser als bei anderen Herstellern. Zudem werden Informationen aus der Telefonabteilung in die virtuelle Anzeige eingespielt, etwa der Name des Anrufers bei eingehenden Telefonaten. Auf dem Bordmonitor spielt sich das Geschehen nach den üblichen BMW-Konventionen ab. Bei hellem Sonnenschein spiegelt die stets präsente Anzeige ein bisschen, sie dient auch als Rückfahrmonitor und zeigt die Bilder einer gegebenenfalls vorhandenen Seitenkamera. Die Darstellung lässt sich teilen, ausgehend vom Hauptmenü blättert man die einzelnen Funktionsbereiche auf. Eine vollständige Schilderung aller Funktionen würde den Rahmen sprengen. Wir konzentrieren uns deshalb auf einige Finessen. Zunächst Connected Drive, die Zentrale der Vernetzung. Neben einer Reihe von BMW-Diensten wie Hotline und Notruf-Funktion gibt es zum Nutzen mit der Sim-Karte des Fahrzeugs einen browserbasierten Web-Zugang, der lediglich im stehenden Fahrzeug funktioniert und nicht nur unter der kümmerlichen Darstellung, sondern auch an der fehlenden Eingabehilfe für Web-Adressen leidet. Eine Handschrifterkennung, wie sie Audi für sein MMI-System anbietet, hat BMW zunächst nur für die asiatischen Märkte vorgesehen. Man malt dann die einzelnen Buchstaben auf die Controller-Oberfläche.

Unterwegs sehen, was die anderen im Netz machen: Facebook im 3er-BMW

Während der Fahrt nutzbar, aber stets mit einem Sicherheitshinweis zu bestätigen, ist BMW Online. Hier finden sich Nachrichten, der obligatorische Wetterbericht, eine Google-Sonderzielsuche sowie mehrere Dutzend Apps, die unabhängig vom eigenen Smartphone laufen. Die Anwendungen kann man auf einen personalisierten virtuellen Bildschirm legen. Für einzelne E-Mail-Systeme (etwa AOL oder Googlemail) gibt es die passende App, so dass man ohne weitere Konfiguration nach Eingabe von Benutzername und Kennwort auf seine Nachrichten zugreifen kann, wahlweise lassen sich die Parameter jedoch auch am PC über die Connected-Drive-Seite von BMW erfassen. Neue Post wird (auch während der Fahrt) auf dem Monitor angezeigt, den Text kann man sich mit einer synthetischen Stimme vorlesen lassen, was allerdings bei Links oder aufwendig formatierten Nachrichten oder mit dem Erreichen der Signatur zur Qual wird. Eigene E-Mails lassen sich mit Hilfe von Textbausteinen versenden. Ein BMW-Sammelkonto ist also nicht mehr erforderlich, sämtliche E-Post bleibt in ihren Konten.

Bei der Smartphone-Anbindung bevorzugen die Bayern das iPhone, die BMW-App kann ihre Inhalte auf den Bordmonitor übertragen. Dazu muss das iPhone stets mit Kabel oder Ladeschale angedockt sein, und die App muss im Vordergrund laufen. Hier gibt es dann auch Facebook und Twitter, wir hatten bereits berichtet. Neu ist der Zugriff auf den Kalender des iPhone, aber am besten gefällt uns „Wiki Local“, ein Vorlesedienst, der Sehenswürdigkeiten in der Fahrzeugumgebung automatisch erfasst, die zugehörigen Wikipedia-Einträge anzeigt und vorliest. Diesen Reiseführer haben wir sehr gern genutzt. Wer ein Android-Smartphone im neuen 3er verwenden will, muss sich ein wenig gedulden. Eine erste Android-Anwendung „My BMW Remote“ ist jetzt im „Play Store“ erhältlich, aber sie kann nicht viel.

Die große Kommunikationszentrale im jungen BMW

Für Technikbegeisterte ist der 3er ein Eldorado, keine Frage, und im Touring kommt demnächst die Freitext-Spracherkennung von Nuance dazu …

Weiterlesen auf FAZnet

Drive Kit Plus in der neuen A-Klasse von Mercedes-Benz

Irgendwie kurios: Wer bei Mercedes-Benz das Comand-System in der aktuellen Ausbaustufe „Online“ ordert, um unterwegs mit Internetanbindung und Google-Suche nach Sonderzielen zu fahnden oder sich mit seinen Facebook-Freunden zu vernetzen, muss sich gleich ein neues Smartphone kaufen. Denn Comand Online geht einige Umwege bei der Konnektivität: Es gibt weder eine fest verbaute Sim-Karte noch einen Leseschacht für die eigene, sondern einzig und allein das Bluetooth-Tethering mit dem Dun-Protokoll, dem „Dial up Network“. Das Mobiltelefon stellt also den Kontakt zum Internet her und reicht die Informationen an Comand Online weiter.

Die Idee hat bestechende Vorzüge: keine Fummelei mit Sim-Karten und kein Wirrwarr bei den Mobilfunkverträgen. Man verwendet sein Mobiltelefon, am besten mit Datenkontingent und muss sich um nichts kümmern. Das im Fahrzeug anfallende Datenvolumen wird über die gewohnte Rechnung tarifiert, unzweifelhaft ein Pluspunkt für die meisten Nutzer.

Aber der Nachteil des Dun-Protokolls ist seine begrenzte Verfügbarkeit: Mit einem iPhone von Apple oder einem Android-Smartphone guckt man in die Röhre. Die Geräte lassen sich zwar wie gewohnt mit Bluetooth für Telefonie und Musikwiedergabe koppeln. Beim Aufruf des Internet streiken sie jedoch. Als Smartphone für Comand Online empfiehlt sich ein Blackberry, der das Dun-Protokoll beherrscht.

Social, Media, Places: Drive Kit Plus in der neuen A-Klasse (Foto Hersteller)

Mit der neuen A-Klasse, die im September in den Handel kommt, soll nun alles besser werden. Aber nicht unter dem Dach von Comand Online. Es gibt vielmehr eine eigenständige Lösung, die zunächst allein auf das iPhone 4 und 4S von Apple zugeschnitten ist. Hat sich das mächtige Comand damit erledigt?

Erste Antworten mit einem Blick auf die Details: In der neuen A-Klasse, deren Grundpreis in der kleinsten Variante – A180 Blue Efficiency mit 90 kW (122 PS) und 1,6-Liter-Benziner – rund 24 000 Euro beträgt, ist das Radio „Audio 5 USB“ serienmäßig. Wie der Name schon sagt, gehört eine USB-Schnittstelle dazu, und für weitere 280 Euro kann man eine schlichte iPhone-Halterung mit Freisprecher ordern. Das „Drive Kit“ wird um eine App ergänzt, und in dieser Kombination erhält man ein vollwertiges iPhone-Navi, das sein Kartenmaterial lokal vorhält, also ohne Mobilfunkverbindung durch Westeuropa leitet. Kleine Extras sind ein Web-Radio und ein Fahrzeugfinder, der die Position speichert, sobald das iPhone aus der Halterung genommen wird.

Weitaus spannender ist das „Drive Kit Plus“ für 690 Euro, das aber zwingend die Musikanlage „Audio 20“ mit 15-Zentimeter-Display oder das größere Comand Online mit seinem 18-Zentimeter-Monitor voraussetzt. Der Pfiff dieser Plus-Lösung besteht darin, das zwingend mit einem Kabel angebundene iPhone im Handschuhfach verschwinden zu lassen – und seine Inhalte auf den Bildschirm in der Mittelkonsole zu bringen. Die Steuerung übernimmt fortan der Controller des Mercedes. Neu ist die Idee, dass die Inhalte vom kleinen Smartphone zum großen Bordmonitor wandern, indes nicht. Viele Autohersteller arbeiten an diesem „Terminal Mode“ oder „Mirror Link“, noch ist jedoch nichts serienreif. Und Mercedes-Benz überträgt keineswegs 1:1 alle Inhalte, sondern nur die Daten der hauseigenen App, die zudem im Vordergrund laufen muss.

Was wir bei der Vorstellung sehen konnten, lief jedoch butterweich und in schönster Cover-Flow-Manier. Mit dem Controller wechselt man flink von einer Abteilung zur nächsten, und das sind derzeit Facebook, Twitter, geteilte Inhalte aus den sozialen Netzwerken, die Navigation, Web-Radio und der Internetdienst Glympse, der anderen temporär Zugang zu den eigenen Standortdaten gibt.

Bei Facebook und Twitter werden neue Statusmeldungen während der Fahrt nur vorgelesen, Mercedes-Benz verweist auf die Fahrerablenkung. Klickt man mit dem Controller auf einen Link passiert nichts. Es gibt keinen Zugriff auf Facebook-Gruppen, Facebook-E-Mail oder Twitter-Listen, das Gebotene bleibt rudimentär und ist bestenfalls eine grobe Orientierung zum aktuellen Geschehen in den Netzen. Eigene Nachrichten kann man allein in der Form von Textbausteinen absetzen, hier lassen sich allerdings persönliche Inhalte wie das Navigationsziel oder die gerade gehörte Musik automatisch einfügen.

Die neue A-Klasse: Sie fährt im Herbst vor und soll besonders die iPhone-Generation ansprechen (Foto Hersteller)

Innovativ tritt hingegen die „Social Playlist“ auf. In dieser Wiedergabeliste wird plattformübergreifend jeder Audio- und Videolink gesammelt, den die Freunde veröffentlicht haben – und man kann die Musiktitel der Netzbekannten während der Fahrt im Streaming-Verfahren hören. E-Mail und Apples kluge Assistentin Siri mitsamt ihrer Spracherkennung sind im Drive Kit Plus zum Marktstart nicht implementiert – noch in diesem Jahr wird die App entsprechend ergänzt. Die Navigation nutzt abermals Karten, die auf das iPhone geladen werden, die Software stammt von Garmin, wird aber für den jüngsten Mercedes angepasst. Hier fehlt ebenfalls die Spracheingabe von Navigationszielen, aber es gibt eine Google-Suche für Sonderziele.

Weiterlesen auf FAZnet

So funktioniert die Nuance-Spracherkennung im neuen 7er BMW

Der neue 7er BMW wird das erste Fahrzeug mit einer umfassenden Freitext-Spracherkennung sein. Die Lösung stammt von Nuance, die mir heute einige zusätzliche Informationen durchgegeben haben.

Dragon Drive kommt zunächst in den 2012er Modellen des 7er BMW, später auch im 3er BMW. Es erfordert das Navigationssystem “Professional” und den Telematikdienst “BWM Assist” sowie die Bluetooth-Option. Dragon Drive ist eine serverbasierte Spracherkennung für mehrere Sprachen, d.h. die  aufgezeichnete Sprachinformation wird per Internet und Mobilfunkverbindung an Server von Nuance geschickt, dort transkribiert, und anschließend landet der erkannte Text im Fahrzeug, wo er korrigiert werden kann. Die Mobilfunkverbindung erfolgt über die Sim-Karte von BMW.

Die Spracherkennung für Navigation und Telefonie bleibt “onboard”, d.h. hier ist keine Mobilfunkverbindung erforderlich.

Dragon Drive kostet nach 60tägiger Testphase 25 Euro pro Jahr, es kommt ein Vertrag mit Nuance (nicht mit BMW) zustande.

Im Unterschied zu den Nuance-Apps auf dem Smartphones wird hier ein Benutzerprofil angelegt, d.h. die Erkennungsleistung wird sich im Laufe der Zeit verbessern. Es ist jedoch nicht möglich, eigene Begriffe dem Vokabular hinzuzufügen. Jedoch können viele Befehle und Kommandos der PC-Software Dragon Naturally Speaking genutzt werden, insbesondere Interpunktionszeichen.

Dragon Drive nutzt akustische Modelle, die eigens auf die Nebengeräusche im Fahrzeug abgestimmt sind. Damit dürfte die Erkennungsleistung deutlich höher liegen als bei einem Diktat mit dem Smartphone in der Hand.

Es lassen sich SMS und E-Mail diktieren, und die Ergebnisse landen auf dem eigenen Smartphone, also nicht in einem ggf. vorhandenen BMW-Office-E-Mail-Konto.

Zur Korrektur kann man sich den erkannten Text vorlesen lassen, und es gibt Optionen für die Korrektur, es werden also Alternativen vorgeschlagen.

Update, 22. Juli: Auf der Fahrvorstellung des neuen 7er BMW in Russland zeigte sich, dass die Nuance-Lösung nur dann funktioniert, wenn das angeschlossene Smartphone das Bluetooth-Profil MAP unterstützt. Das “Message Access Profile” beherrschen derzeit einige Blackberrys. Das iPhone-Betriebssystem iOS unterstützt MAP erst von Version 6 an.

Und hier das Video von Nuance

 

Test: Samsung Galaxy S3

Einfach ist die Entscheidung nicht. Wer sich für ein Smartphone der Spitzenklasse interessiert, mag mit dem iPhone 4S liebäugeln – oder wartet auf den Nachfolger, der vermutlich im Herbst kommt. Für die Android-Fraktion hingegen ist das neue Topgerät jetzt erhältlich. Das Galaxy S3 von Samsung ist der schärfste Rivale des iPhone. Schon der Vorgänger Galaxy S2 war in jeder Hinsicht ein Erfolg und wurde mehr als 20 Millionen Mal verkauft. Neun Millionen Kunden in aller Welt haben das jüngste Galaxy vorbestellt.

Neue Referenz bei Android: Das Samsung Galaxy S3 (Foto Hersteller)

Wir hatten das S3 einige Tage im Einsatz, und schon bei der ersten Begegnung beginnt die Diskussion über seine Größe. Mit 13,7 x 7,1 Zentimeter überragt es ein iPhone in der Höhe um 2,2 und in der Breite um mehr als einen Zentimeter. Opulent oder dick wirkt das S3 aber nicht, denn es ist einen Tick flacher (8,6 Millimeter) als das iPhone 4S und sieben Gramm leichter (133 Gramm). Die Größe ist an erster Stelle dem Display geschuldet, das bei einer Diagonale von 12,2 Zentimeter eine üppige Auflösung von 1280 x 720 Pixel bietet. Bei der Anzeige handelt es sich um ein Amoled-Display mit Pentile-Matrix, das mit zwei statt der üblichen drei Sub-Pixel auskommen muss. Eine gewisse Unschärfe soll der Nachteil dieses neuen Verfahrens sein, die längere Haltbarkeit ihr Vorteil. In der subjektiven Wahrnehmung ist das Display jedoch knackscharf, einzelne Pixel sind nicht zu unterscheiden. Wie bei jeder Amoled-Anzeige stört die schlechte Ablesbarkeit im Sonnenlicht. Zudem wünscht man sich eine bessere Beschichtung gegen Fingerfett.

Beim Lesen von Web-Seiten sowie Betrachten von Videos und Fotos sind Größe und Auflösung des Displays jedoch ein Pluspunkt. Doch die Maße des Smartphones werden nicht jedermann gefallen. Das Galaxy S3 ist nur schlecht mit einer Hand zu bedienen, und es passt nicht in jede Tasche. Letztlich ist es jedoch eine Frage des persönlichen Geschmacks; das noch größere Galaxy Note verkauft sich ebenfalls gut. Materialanmutung und Verarbeitungsqualität des Galaxy S3 sind überzeugend – mit Ausnahme der hauchdünnen Rückwand, die den Zugriff auf den Wechselakku, Micro-Sim- und Speicherkarte erlaubt.

Zu den technischen Daten: Das jüngste Samsung bringt nahezu Vollausstattung mit, wie beim iPhone 4S fehlt nur das superschnelle Datenprotokoll LTE. Sonst ist alles dabei, nicht nur Bluetooth 4.0 und NFC, sondern auch diverse Protokolle zum multimedialen Datenaustausch (WiFi Direct, DLNA, All Share Play) sowie ein üppiger zweijähriger Gratisspeicherplatz von 50 Gigabyte für Daten in der Dropbox-Cloud. In diesen Details ist das Samsung dem iPhone überlegen. Auch hinsichtlich der Rechenleistung wird aus dem Vollen geschöpft: Vier Kerne der hauseigenen Exynos-CPU legen in Benchmarks ein spektakuläres Tempo vor. Die einzelnen Kerne lassen sich separat zwischen 200 Megahertz und 1,4 Gigahertz takten, ein weiterer „Sparkern“ wie beim Tegra-3-System (etwa des HTC One X) ist nicht erforderlich. Von der hohen Rechenleistung profitieren vor allem die Spiele-Liebhaber. Und die Ausdauer leidet, deshalb hat Samsung einen kräftigen Akku mit 2100 Milliamperestunden verbaut. Mehr als 25 Stunden sind trotzdem kaum zu schaffen, da muss man sich schon sehr zurückhalten. An einigen Tagen kamen wir gerade mal auf zwölf Stunden. Zum Vergleich: Das iPhone 4S hält bei uns fast immer anderthalb Tage durch, wenig benutzt sogar zwei.

Über das Android-Betriebssystem 4.0.4 hat Samsung sein Touch-Wiz-System gelegt, das die feinen Linien des Originals nahezu vollständig überdeckt. Man kann mit Touch Wiz leben, zumal an allen Ecken und Enden gefällige Verbesserungen vorgenommen wurden. Etwa der optische Hinweis auf verpasste Anrufe mit einer LED und der vibrierende, wenn man das Gerät in die Hand nimmt. Oder die Einblendung des Ortsnamens bei Anrufern, die nicht in der Kontakteliste gespeichert sind. Und schließlich der intelligente Schlafmodus, der den aufs Gerät schauenden Nutzer erkennt – und die Display-Beleuchtung nicht deaktiviert. Viele dieser Funktionen sind so pfiffig, dass man sie nicht mehr missen möchte. Gelungen ist auch der Samsung-Kalender, der eine Übersichtsdarstellung mit einer Detailanzeige der Tagestermine verbindet. Anstehende Besprechungen kann man sich als „Widget“ permanent auf einem der Home-Bildschirme anzeigen lassen.

Viel Licht also, aber auch mancher Schatten: Das schon beim Vorgänger beklagte Kontakte-Chaos in der Adressverwaltung hat der Hersteller nicht in den Griff bekommen. Unabhängig von den gewählten Einstellungen werden alle Adressen des zuerst angelegten Google-Kontos im Gerät gespeichert. Man kann sie zwar mit „benutzerdefinierten Listen“ ausblenden lassen. Aber spätestens bei der Suche oder der Nutzung einer Bluetooth-Freisprecheinrichtung im Auto sind dann doch alle Einträge vermischt. Installiert man WhatsApp oder einen anderen Messenger, landen ärgerlicherweise auch die Kontakte aus einem privaten Konto im dienstlichen Bereich. Ferner die Spracherkennung: „S Voice“ soll das Pendant zu Apples Assistentin Siri sein. Das „look & feel“ von Siri hat Samsung in einer kaum zu übertreffenden Dreistigkeit kopiert. Aber „unter der Haube“ funktionieren nur wenige Demo-Kommandos („Wie wird das Wetter heute in Paris“) gut. Geht es um das sinnvolle Arbeiten mit Spracherkennung, das Diktat längerer Texte, sind die Resultate mangelhaft.

schließlich die Acht-Megapixel-Kamera. Auch hier gibt es eine sinnvolle Ausstattung und manche Innovation. Die Gesichtserkennung ist nach erstmaliger Identifizierung einer Person in der Lage, sie auch auf weiteren Fotos zu markieren. Und dann kann man den Schnappschuss mit einem Fingertipp sogleich an seine Freunde schicken. Bei Autofokus und Auslösung legt das Galaxy ein exzellentes Tempo vor, der Knüller ist jedoch der Serienbildmodus für maximal 20 Aufnahmen in sechs Sekunden, manche Kompaktkamera kommt da nicht mit. Unser Testgerät tendierte zu einer sehr kräftigen Zeichnung der Farben. Insgesamt ist die Fotoqualität sehr gut, bei Videos macht man Kompromisse. Aufnahmen mit schwachem Licht bewältigt das iPhone 4S geringfügig besser, ein Vergleichsfoto findet sich hier.

In vielen Details liegt das Samsung Galaxy S3 vor seinem Konkurrenten. Es hat jedoch deutlich mehr Schwächen als das iPhone, das Pendel schlägt zwischen Plus und Minus weiter aus. Die Mängel der Kontaktverwaltung und des Spracherkenners wiegen schwer. Ob man lieber die große Bauform eines Galaxy oder die kompakte eines iPhone bevorzugt, bleibt ebenso wie die Beurteilung des Betriebssystems eine Frage des Geschmacks. Insgesamt meinen wir: Das neue Galaxy ist das beste Android-Smartphone auf dem Markt, es ist zu Preisen …

Weiterlesen auf FAZnet

Der neue 7er von BMW: Das erste Auto mit E-Mail-Spracherkennung à la Siri

Ende Juli kommt der 7er von BMW mit einem Facelift auf den Markt, die wichtigsten Verbesserungen betreffen die Kommunikationstechnik. Erstmals in der Werksausstattung gibt es eine Spracherkennung für E-Mail und SMS, die BMW kurioserweise “Freitextspracherkennung” nennt. Der Hersteller wird nicht in der Pressemeldung genannt, es ist nach meinen Informationen Nuance, die auch an Apples Siri beteiligt sind.

Auszüge aus der Pressemeldung:

“Mit der neuen Generation des Navigationssystems Professional komplettiert eine Freitextspracherkennung sowie eine optimierte Sprachsteuerung das Angebotsportfolio der Officefunktionalitäten von Connected Drive. …  Durch eine Freitextspracherkennung ermöglicht die Diktierfunktion dem Fahrer erstmals, im Fahrzeug kurze Textnachrichten zu „schreiben“ – einfach, indem er sie spricht. Bereits wenige Sekunden nach der Spracheingabe erscheint der erkannte Text im Display und wird auf Wunsch vorgelesen. Selbstverständlich stehen dem Fahrer auch einfache, sprachbasierte Editierungsmöglichkeiten zur Verfügung, um komfortabel und vor allem sicher E-Mails und Kurznachrichten zu erstellen. Das System ist multilingual und erkennt aktuell sechs Sprachen.

“Eine weitere sprachbasierte Funktion rund um die Officefunktionalitäten ist das Aufnehmen von Sprachnotizen. Diese können bei Bedarf direkt über E-Mail verschickt werden. Der große Vorteil besteht für den Fahrer hier in der schnellen Konservierung von Ideen oder To-Dos mit der Möglichkeit, sie an die jeweiligen Adressaten weiterzuleiten – und das ohne Ablenkung vom Verkehrsgeschehen. Auf Wunsch lassen sich die aufgenommenen Notizen auch per USB-Stick einfach aus dem Fahrzeug mitnehmen.”

 

Der neue 7er von BMW (Foto Hersteller)

Weitere Highlights des neuen 7er BMW:

  • Multifunktionales Instrumentendisplay, “virtuelle Anzeigen” in verschiedenen Farben
  • 3D-Darstellung der Menüs
  • iDrive mit 1,3 GHz-Prozessor (keine genauen Angaben) und “eigener 3D-Grafikkarte” (keine weiteren Angaben)
  • Neu gestaltetes Kontextmenü (PIE-Menü), das mit dem Controller aufzurufen ist
  • Speed Limit Info und Überholverbotsanzeige mit Kamera

Test: Olympus DS 7000

An der Spitze wird die Luft dünn. Wenn es um das professionelle digitale Diktieren geht, landet der Arzt oder Anwalt unweigerlich bei den hochwertigen Geräten von Philips oder Olympus. Es sind Arbeitsinstrumente für den Dauereinsatz, überzeugend in Anmutung, Ergonomie, Verarbeitung und Bedienung. Wer sein Diktiergerät rund um die Uhr nutzt, will keinen Kompromiss in der Hand halten. Die beiden Referenzgeräte in der Oberklasse, das DPM 9600 von Philips und das DS 5000 von Olympus, sind mittlerweile fast fünf Jahre alt.

Farbdisplay und Docking-Station: Olympus DS 7000 (Foto Hersteller)

Nun steht der Wachwechsel an, zunächst bei Olympus. Das neue DS 7000 ist bei uns seit einigen Wochen im Einsatz, und der Fortschritt soll sofort sichtbar sein: Als erstes Profigerät hat es ein TFT-Farbdisplay. Was bringt das? Ehrlich gesagt: nicht viel. Olympus hat die gewohnte Menüführung beibehalten, nun sind die einzelnen Einträge unterhalb der Karteireiter etwas besser voneinander abgesetzt und schneller zu identifizieren. Aber ein großer Schritt nach vorn ist das nicht. Denn mit einem Diktiergerät geht man weder ins Internet, noch schaut man Fotos. Im Gegenteil, die farbige Anzeige hat sogar einige Nachteile: Sie muss früher dunkel schalten als das monochrome Pendant, und ihr Stromverbrauch ist höher. Aber Olympus hat beim Akku alles richtig gemacht und verwendet seine Lithium-Ionen-Batterie aus den Digitalkameras. Der Kraftspender hält um die 30 Stunden durch und hat damit eine Ausdauer, die deutlich über der des Philips DPM 9600 mit Monochromdisplay liegt. So muss man sich nur an die fortwährende Abdunklung der Anzeige gewöhnen.

Meisterstück der Feinmechanik

Die Hardware des neuen DS 7000 ist – wie beim Vorgängermodell – über jeden Zweifel erhaben. Der Body aus Metall ist teilweise mit schwarzem Kunststoff überzogen, das Akkufach ist gegen unbeabsichtigtes Öffnen durch einen Riegel geschützt, und der abermals verbesserte Schiebeschalter, der auf Rollen gleitet, darf als Meisterstück der Feinmechanik gelten. Er arbeitet im Unterschied zur Konkurrenz geräuschlos und fährt absolut leichtgängig und geschmeidig auf seine vier Positionen. Bei diesem Hauptbedienelement spürt man sofort den Unterschied zwischen einem Profigerät und billigen Möchtegern-Apparaten. Bei Bedarf lässt sich der Stand des Schalters auf dem Display visualisieren, so dass der ungeübte Nutzer eine optische Rückmeldung bekommt.

Die zweite Neuerung ist das modifizierte Mikrofon, das mit einer nach oben herausgezogenen Kapsel und einer Feinabstimmung für die Spracherkennung aufwartet. Damit Dragon Naturally Speaking bessere Ergebnisse liefert, hat Olympus zusammen mit dem Softwarehersteller Nuance das Frequenzspektrum des Mikros optimiert. Wir haben mit dem Philips in der linken und dem Olympus in der rechten Hand ein Probediktat aufgenommen und anschließend der PC-Software vorgesetzt. Das Ergebnis: Obwohl die Aufnahme des Olympus in der subjektiven Wahrnehmung besser klingt, gab es hinsichtlich der Erkennungs- und Fehlerrate nicht den geringsten Unterschied – weder in sehr leiser Umgebung noch bei dezent im Hintergrund laufender Musik. Das bestätigt unsere These, wonach eine ordentliche Aussprache bei der Spracherkennung hilfreicher ist als ausgeklügelte Mikrofontechnik.

In gewisser Hinsicht gibt es beim neuen Olympus sogar ein Mikrofonproblem. Denn die Klinkenbuchsen für ein Zusatzmikrofon und den Ohrhörerausgang wurden von der Oberseite des Geräts auf die linke Seitenfläche gelegt. Zugegeben, das sieht nun schicker aus. Aber ein Aufsteckmikrofon mit Nebengeräuschunterdrückung lässt sich jetzt nicht mehr sinnvoll mit dem DS 7000 verwenden, landen doch Zeige- und Mittelfinger nahezu automatisch über der Buchse. Was sich die Japaner dabei gedacht haben, möchte man doch gern wissen. Mit den kleinen Aufsteckmikros erstellt man nämlich auch im Auto, in der Bahn oder am Flughafen eine spracherkennungstaugliche Aufzeichnung. Ohne die Nebengeräuschunterdrückung hörten sich unsere DS-7000-Aufnahmen im Auto durchaus gut an, aber die Fehlerrate bei der Spracherkennung ist indiskutabel. In diesem Sinne ist es gewiss klug, das ältere DS 5000 und seine ID-Variante (mit biometrischem Fingerabdruckscanner) noch eine Zeitlang im Markt zu belassen.

Alle weiteren Details des neuen DS 7000 entsprechen nahezu dem Vorgängermodell. Aufgezeichnet wird, wie bei jedem Profigerät, in den Formaten DSS und DSS Pro, beides sind quasi die MP3-Pendants für Sprache. Ein Diktiergerät ist ein Spezialist und kein Audio-Generalist. Dateien lassen sich mit 256-Bit-AES-Verschlüsselung vor unbefugtem Zugriff schützen, bis zu zehn Autoren und 20 Diktattypen sind direkt am Gerät administrierbar. Die typische Olympus-Marotte, neben der SD-Speicherkarte ein zweites Micro-SD-Laufwerk unterhalb des Akkufachs unterzubringen, wurde beibehalten.

Die kleine Karte lässt sich nur mit chirurgischem Werkzeug aus ihrem Fach herauspfriemeln. Da Speicherplatz weder knapp noch teuer ist, sehen wir hier keinen Gewinn und den Nachteil, dass beim Andocken an Windows gleich zwei störende „Was soll ich nun mit dem Laufwerk anfangen?“-Meldungen aufploppen. Auch irritiert, dass man – wie gehabt – zwischen verschiedenen USB-Klassen umschalten muss. Wer das DS 7000 zusammen mit Dragon Naturally Speaking einsetzt, erhält mit der ebenfalls neuen Zusatzsoftware Olympus Dictation Management System (ODMS) ein sehr leistungsfähiges Programm, das einen ausgefeilten Workflow vom Diktat über die Spracherkennung bis hin zum Versand der transkribierten Dateien per E-Mail oder FTP bietet.

Ganze Befehlsketten und Regeln sind programmierbar, auch in Abhängigkeit vom Diktierer und seinem Kürzel. Es gibt zwar noch einige kleine Fehler, aber insgesamt ist das Gebotene sehr üppig. Die Software eignet sich nicht nur für den Einzelplatz, sondern auch für große Arbeitsgruppen, Dragon lässt sich zudem als Hintergrund-Anwendung integrieren.

Weiterlesen auf FAZnet

Links: Kommunikation, HiFi und Navi im Auto rund um CES und Detroit

Kleine, unkommentierte Link-Sammlung, die sich nahezu automatisch ergeben hat beim Einsatz von Instapaper, mit dem ich alles archiviere.

  1. Audi combines HUD with gesture controls, leaves us wanting
  2. Android integration for car stereos and rear-view mirrors, hands-on (video)
  3. Mercedes mbrace2 auf der CES: Auto wird digitaler Begeleiter
  4. Ford shows off updated Sync integration for iPhone
  5. Mercedes-Benz gesture control concept is DICEy
  6. CES 2012: Automotive round-up
  7. Start Your Engines! Connected Cars at CES
  8. heise online – Carsharing von User zu User
  9. WZ Newsline Mobil – Das Smartphone wird Herz und Hirn des Autos
  10. Daimler Dice: Augmented Reality in der Windschutzscheibe
  11. Nvidia: Audi, Tesla und Lamborghini setzen Tegra-Prozessoren ein
  12. Daimler-Chef Zetsche: „Wir dürfen das Auto nicht zu einer Spielhölle machen“
  13. Daimler revs up car and ride sharing at CES
  14. CES 2012: Now You Can Check Facebook From Your Benz
  15. Mercedes Benz auf der CES: Auto mit Cloud-Anschluss
  16. Economy, Business & Finance: CES: Mercedes will das Auto zum ‘digitalen Begleiter’ machen – Wirtschaftswoche
  17. Apps für Fahrer: Wenn das Auto auf Facebook surft
  18. Assistenzsysteme von Audi: Oh Helferlein kommet
  19. Ford USB Music Box adds mass storage playback, smartphone charging to AUX-enabled receivers
  20. Renault debuts R-Link, an in-dash Android system with app market
  21. 23.11.11 – Technik – Audis Assistenzsysteme der nahen Zukunft | heise Autos
  22. BMW, Mini offer MOG streaming for iPhone
  23. Trying Out the World’s First In-Car Music-Streaming System – NYTimes.com
  24. heise Autos – 01.11.11 – Fahrberichte – Ausfahrt im VW Passat Variant 1.4 TSI EcoFuel
  25. iPhone accessory review: Ford Fiesta and Microsoft SYNC
  26. Infotainment im Auto: Das Armaturenbrett aus dem Internet – SPIEGEL ONLINE – Nachrichten – Auto