So geht’s: Straßennavigation mit dem iPhone und Siri – Sprachbefehle zur Navi-Bedienung

Mit iOS 6 hat Apples Smartphone-Betriebssystem für das iPhone 5 und 4S eine Straßennavigation mit Abbiegehinweisen erhalten. Auch wenn Apples Karten zu Recht kritisiert werden: Das Gratis-Navi arbeitet ordentlich, und es lässt sich ohne jede Fahrerablenkung allein mit Sprachbefehlen verblüffend gut bedienen. Nur ist einige Tüftelei angesagt. „Navigiere nach Hamburg“ kann bisweilen funktionieren, oder auch nicht. Dann kommt die kuriose Fehlermeldung, dass einige Orte mit „Giere“ in der Nähe von Hamburg gefunden wurden.

Sonderzielsuche: Auf die richtigen Kommandos kommt es an (Foto Spehr)

Erfolgreich ist das Kommando „Zeig mir den Weg nach Hamburg“ oder vollständig „Zeig mir den Weg nach Hamburg Musterweg 99„. Ist die Adresse von Klaus Mustermann im eigenen Adressbuch hinterlegt, lautet das Kommando „Zeig mir den Weg nach Klaus Mustermann„, bei Fehlermeldungen stelle man Vor- und Nachnamen um.

Bei der Sonderzielsuche funktioniert „Zeig mir den Weg nach Alte Oper Frankfurt“ oder „… Palmengarten Frankfurt“. „Zeig mir den Weg zur nächsten Tankstelle“ funktioniert aber nicht. „Zeig mir den Weg“ wird dann kurioserweise als Straßenname im aktuellen Ort interpretiert. Hier nehme man „Wo ist die nächste Tankstelle„. Analog funktionieren „Wo ist das nächste Parkhaus„, „Wo ist der nächste Supermarkt„, „Wo ist das nächste Krankenhaus“ und so weiter.

Was kaum ein fest eingebautes Navigationssystem der Oberklasse beherrscht, ist die leidige Suche nach Erdgastankstellen: „Wo ist die nächste Erdgastankstelle“ lautet abermals das Kommando. Mit „Zeige Staus“ kann man sich während der Routenführung über die aktuelle Verkehrslage informieren lassen, soweit sie die Apple-Navigation kennt. Informationen zu öffentlichen Verkehrsmitteln sind in der Karten-App noch nicht hinterlegt.

 

Test: Audi A3 Modelljahr 2012 und das neue MMI

Jetzt sickert der Fortschritt nicht von oben nach unten, sondern geht die umgekehrte Richtung: Audi präsentierte zur CES sein gründlich überarbeitetes MMI-Kommunikationssystem, und es kommt zuerst nicht etwa im Audi A8, sondern im neuen A3. „MMI Navigation plus mit MMI Touch“ heißt das Spitzenprodukt aus dem „modularen Infotainmentbaukasten“, und damit ist gleich das erste Stichwort genannt: Angesichts des rasanten Innovationstempos in der Unterhaltungselektronik besteht der Zentralrechner im Handschuhfach aus zwei Einheiten: Neben dem Radiomodul mit Basisfunktionen ist ein austauschbares MMX-Board als Multimedia-Extension verbaut, das sich flink aktualisieren lässt.

Neues MMI: Audi A3 Modelljahr 2012 (Fotos Hersteller)

Als Recheneinheit kommt ein Dualcore ARM-Prozessor aus der Tegra-2-Serie von Nvidia zum Einsatz, der mit 1,2 Gigahertz getaktet ist und von einer zusätzlichen Grafikkarte unterstützt wird. Mit dieser geballten Rechenleistung ist es möglich, dreidimensionale Animationen in Echtzeit anzuzeigen. Es werden also keine fertigen Grafiken geladen, sondern Animationen aus dem hinterlegten Datenmaterial live berechnet.

Ran an die Antenne: Handy-Kopplung

Die ganze Pracht zeigt sich auf dem ebenfalls neuen TFT-Monitor, der auf einer Diagonale von 17,8 Zentimeter mit 800 × 480 Pixel auflöst. Das Display fährt motorbetrieben aus der Instrumententafel heraus – und versteckt sich dezent im geparkten Fahrzeug. Die sehr dünne Anzeige sieht nicht nur edel aus, sondern hat auch eine brillante Darstellung mit knackigen Farben, sie ist selbst bei hellem Sonnenschein gut ablesbar.

Neu ist ferner die Bedieneinheit, die Audi MMI Terminal nennt. Hier verschmelzen nun der gewohnte Controller und das aus der Oberklasse bereits bekannte Touchpad inklusive Handschrifterkennung zu einer Einheit. Die Oberseite des Drehstellers ist zugleich die berührungsempfindliche Fläche, auf welcher der Finger Buchstaben oder Zahlen malt.

Das System hatten wir schon im A8 gelobt, es erlaubt nämlich Texteingaben, ohne dass der Fahrer den Blick von der Fahrbahn abwenden muss, jedes erkannte Zeichen wird leise vorgelesen. Wer die ebenfalls vorhandene Sprachbedienung nicht mag, bekommt hier eine sinnvolle Alternative.

Man darf sich über Finesse freuen

Das MMI Terminal hat nun statt der gewohnten Menütasten zwei Kipphebel über dem Drehsteller, die einen schnellen Zugriff auf die Bereiche Telefon, Navigation, Medien und Radio erlauben. Sie lassen sich ohne ablenkenden Blick gut ertasten. Nur die vier Softkeys und die zwei Menütasten unter dem Controller verlangen dann doch wieder den Blick nach unten, hier ist die Fahrerablenkung höher.

Blick nach unten: Controller mit Handschrifterkennung

Geht man etwas tiefer in die Menüs, darf man sich über die feinere Zeichnung der einzelnen Einträge und manche Finesse freuen. Wer das ältere MMI kennt, kommt auch mit dem neuen sofort zurecht. Die schönen Details sind überwiegend optischer Natur. Dazu gehört etwa die Vorschaufunktion, sie blendet im Hauptmenü die Bildschirme der Untermenüs in stark verkleinerter Darstellung ein. Musik lässt sich nun im üppigen 64 Gigabyte großen internen Speicher ablegen, und wenn die Alben in der Gracenote-Datenbank gespeichert sind, sieht man Coverbilder sogar dann, wenn der MP3-Zuspieler drahtlos mit dem Musikprotokoll A2DP angebunden ist.

Die Navigationsabteilung greift jetzt problemlos auf das Kontaktverzeichnis eines angedockten Smartphones zu und übernimmt ohne manuelle Nachbesserung Ort, Straße und Hausnummer als Navigationsziel. Und schließlich die Einstellung der Fahrzeugparameter: Dank der neuen 3D-Grafik sieht man hier sofort mit toller Visualisierung, was welcher Schalter bewirkt. Das alles sind nette Argumente für den Verkaufsraum. In der Gesamtschau spielt „MMI Navigation plus mit MMI Touch“ auf allerhöchstem Niveau, die Weiterentwicklung mitsamt Handschrifterkennung ist ein Schritt nach vorn.

Aber Audi bleibt dabei nicht stehen, auch die Internetdienste ziehen demnächst unter dem Oberbegriff „Audi Connect“ in die Kompaktklasse ein. In unserem Testwagen waren sie noch nicht implementiert, angekündigt sind indes: der W-Lan-Hotspot, den es bereits in der Audi-Mittel- und Oberklasse gibt, Routenplanung am PC mitsamt Übertragung der Daten ins Fahrzeug, Navigationskarten mit Google-Earth-Anzeige sowie die Premium-Verkehrsinformationen.

Neu sind ferner eine Spracherkennung bei der Sonderzielsuche sowie die iPhone-App „Music Stream“, die bis zu 3000 Internet-Radiosender ins Fahrzeug holt. Auch kann man demnächst mit weiteren Apps auf RSS-Nachrichten zugreifen und sich diese während der Fahrt von einer synthetischen Stimme vorlesen lassen. Facebook und Twitter sind ebenfalls angekündigt.

Das alles werden wir demnächst ausprobieren, aber ein Highlight des neuen A3 haben wir schon jetzt schätzen gelernt: Die „Phone Box“ ist eine geräumige Ablageschale für das Mobiltelefon in der Mittelarmlehne. Ein Handy lässt sich hier ablegen oder mit den entsprechenden Adapterkabeln ans MMI andocken. Der Pfiff ist die Planar-Antenne im Boden der Schale. Liegt das Mobilgerät darauf auf, werden die Funksignale per Nahfeld-Kopplung und einem Verstärker als Mittelglied an die Fahrzeugantenne weitergeleitet. Es geht also um bessere Sende- und Empfangseigenschaften und nicht um das (angekündigte) kontaktlose Laden des Akkus. Wir waren anfangs sehr skeptisch, aber schon bei den ersten Fahrten zeigte sich: Das ist ein Knüller.

Die Phone Box ist ein Muss

Auf unserer Probestrecke durch den Taunus wurde an drei von fünf Stellen mit kritischer Funkversorgung das laufende Telefonat gehalten. Mit dem auf dem Beifahrersitz liegenden Handy brachen die Gespräche ab. Aber nicht jede Schwachstelle der Netze ist damit vom Tisch – Weiterlesen auf FAZnet

 

Test: Dragon NaturallySpeaking 12 von Nuance

„Neuer Termin mit Martin nächste Woche Dienstag 12 Uhr“: Schon dieser eine Satz demonstriert beispielhaft die Leistungsfähigkeit einer modernen Spracherkennung. Er ist in weniger als fünf Sekunden diktiert und führt nahezu unmittelbar zu einem Eintrag im elektronischen Kalender. Ohne Spracherkennung dauert es immer länger: Das Starten des Terminkalenders, die Suche des passenden Datums und das Eintippen der Details ist viel mühseliger, als seinem Smartphone neun Wörter vorzusprechen.

Ihre frappierende Leichtigkeit hat Apples Sprachassistentin Siri so populär gemacht. Aber sie ist ja auch mehr als eine Spracherkennung, die Gesprochenes in Schriftliches überführt. Siri nimmt zusätzlich eine semantische Analyse des Inhalts vor, und anhand bestimmter Schlüsselbegriffe wie „Termin“ erfolgt automatisch die Umsetzung in Aktionen, wie der Eintrag im Terminkalender oder das Abrufen des Wetterberichts.

Siri läuft derzeit nur auf dem iPhone 4S. Wer jedoch das iPad 3 oder auf dem Mac-Rechner das aktuelle Apple-Betriebssystem Mountain Lion einsetzt, kann zumindest die Diktatfunktion, also die reine Spracherkennung, ebenfalls verwenden. Wo immer der Cursor gerade steht: Man diktiert, der Audio-Schnipsel wird via Internet auf Server von Apple übertragen, dort transkribiert, und der Text kommt retour. Apple verwendet für seine Spracherkennung die Technik des amerikanischen Herstellers Nuance, der hier seit mehr als zehn Jahren Marktführer ist. Der Charme dieser Lösung besteht darin, dass sie geradezu unmittelbar zur Verfügung steht. Man muss keine Software installieren, kein Benutzerprofil anlegen, nichts neu lernen, sondern kann einfach loslegen. Die Erkennungsrate ist sehr hoch, die Ergebnisse sind verblüffend gut.

Vergleicht man die drei Apple-Plattformen, ist die Performance nahezu identisch. Der Mac-Rechner mit flinken Prozessoren ist dem iPad 3 keineswegs überlegen. Auf allen drei Systemen sind auch ähnliche Fehler und Einschränkungen zu beobachten. Zum Beispiel die falsche Großschreibung, wenn man im Satz innegehalten hat. Und die Restriktionen sind ebenfalls nicht zu übersehen: Der Erkenner erlaubt nicht das Anlernen oder Training ihm unbekannter Begriffe, er versteht kein Fachvokabular, und man kann nur abschnittweise diktieren, weil ja jeder Satz oder Halbsatz nach Amerika geschickt wird, was nicht jeder goutiert.

Für professionelles Diktieren längerer Texte oder die Umsetzung von Diktaten, die zuvor aufgenommen wurden, ist das Apple-System ungeeignet. Es wird nur dann besser, wenn Apple die Algorithmen auf seinen Servern verbessert. In Amerika beklagen sich sogar viele Nutzer, dass Siri in den vergangenen Monaten schlechter geworden sei. Man wird also mit diesem semiprofessionellen System auf den Geschmack gebracht. Schnell gibt es Appetit auf mehr, und dann ist eine Software gefragt, die auf dem eigenen PC läuft, ein umfangreiches und ergänzbares Wörterbuch mitbringt, für bestimmte Berufsgruppen ein Fachvokabular und vieles andere mehr.

Wer Höchstleistungen sucht, benötigt einen aktuellen Rechner

Wer jedoch nach ein paar Runden im Porsche 911 die Leistung eines Formel-1-Boliden sucht, kommt um ein Fahrertraining nicht herum. Zum Glück hat Nuance bei seiner Windows-Software Dragon Naturally Speaking in den vergangenen Jahren viel getan, um die Hürden des Einstiegs zu senken. Dragon ist der Maßstab und die Referenz, es gibt keine andere Software mit vergleichbarer Leistungsfähigkeit, man mag diese Monopolstellung bedauern.

Mit der neuen Version 12, die seit Ende August im Handel ist, beschränkt sich die Inbetriebnahme nach der Installation auf ein fünfminütiges Diktat, mit dem der Erkenner den individuellen Sprachstil analysiert. Die viel größere Hürde im Alltagseinsatz ist die Fülle der Möglichkeiten und Optionen. Mit dem Drachen kann man ein Windows-System durchgängig mit Sprache steuern, eine Outlook-E-Mail verfassen oder Word-Kommandos aufrufen. Das alles will aber geübt sein – ungeachtet der zahlreichen Hilfestellungen.

Der neue Drachen bringt ein abermals verbessertes akustisches Modell mit, das nun Best Match V heißt. Dieses verlangt einen Mehrkernprozessor und mindestens 4 Gigabyte Arbeitsspeicher. Wir probierten Dragon 12 mit einem älteren Core-2-Duo-PC und zwei Gigabyte Speicher. Hier wurde uns Best Match IV empfohlen, wir nahmen trotzdem das neue Akustikmodell – und die Arbeitsgeschwindigkeit brach deutlich ein. Wer Höchstleistungen sucht, benötigt also einen aktuellen Rechner. Mit dem Core-i5 und 8 Gigabyte Arbeitsspeicher hatten wir keine Probleme. Das neue Best-Match-Modell soll um bis zu 18 Prozent verbesserte Erkennungsleistung bieten, sagt das Marketing von Nuance, eine saloppe Formulierung, die man jedoch so nicht stehen lassen kann.

Genauigkeit bei bis zu 99 Prozent

Berücksichtigt man, dass eine Spracherkennung nur jene Begriffe fehlerfrei umsetzen kann, die in ihrem Vokabular gespeichert sind, hängt die Beurteilung von den Texten und den Inhalten ab. Eine prägnante Zusammenfassung der Art „98 Prozent Genauigkeit“ ist also unsinnig. Ein Arzt, Anwalt oder Gutachter, der für seine Diktate ein begrenztes Fachvokabular verwendet und dies sinnvollerweise gleich mit Dragon dazukauft, erreicht spielend 99 Prozent und mehr. Ein Dragon-Nutzer mit einem reichhaltigen und ungewohnten Vokabular, sagen wir ein Schriftsteller oder Journalist, wird darunter liegen. Er wird vermutlich eigene Ad-hoc-Begriffe (wie diesen hier) verwenden und vielleicht nur einmal und dann nie wieder. Kein Wörterbuch kann da mithalten.

Wie gut die Erkennungsleistung von Dragon 12 im Vergleich mit der Vorgängerversion ist, haben wir also mit unseren eigenen Diktaten ermittelt, das ist eine subjektive Komponente im Test. Aber wir suchten reproduzierbare Ergebnisse. Deshalb wurde aus Hunderten von Diktiergerät-Aufzeichnungen im DSS-Pro-Format eine repräsentative Auswahl erstellt. Neben kurzen, knappen E-Mails auch längere mit privatem Inhalt, Nachrichtenmeldungen, das Protokoll einer Testfahrt im Auto, und spaßeshalber ein „abdiktierter“ wissenschaftlicher Aufsatz aus der DDR-Geschichtsschreibung in einer aus heutiger Sicht inakzeptablen Sprache.

Dragon Naturally Speaking 12: Bis in die kleinsten Verästelungen hinein anpassbar (Foto Spehr)

Ein und dieselbe Diktatdatei ließen wir der Reihe nach erkennen, und zwar mit der alten und der neuen Version, so wie sie der Nutzer nach der Installation vorfindet (also ohne benutzerspezifische Anpassungen). Die Ergebnisse: Etwa jeder zehnte Fehler wurde ausgemerzt, die Genauigkeit liegt – je nach Text – bei bis zu 99 Prozent.

Die „Premium“-Variante sollte es mindestens sein

Vor zwei Jahren konnten wir bei der Vorstellung der Version 11 festhalten, dass die Fehlerrate halbiert wurde. Der Fortschritt schreitet also um so langsamer voran, je perfekter die Erkennung wird. Die typischen Probleme sind übrigens gleich geblieben: Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen, Produkt- und Eigennamen bereiten noch immer Kopfzerbrechen. Aber mit der „richtigen“ Nutzung der Korrekturbefehle und zunehmender Adaption an das Nutzervokabular verschwindet mancher Fehler. Und mit ein bisschen Erfahrung kennt man im Laufe der Zeit die Stolpersteine und wird dann beispielsweise „ist vom Feinsten“ dahingehend diktieren, dass man dem „Feinsten“ das Kommando „groß“ voranstellt.

Eine häufige Fehlerklasse wurde indes ausgemerzt: Mit einer Option kann man Personalpronomen der 2. Person („Du“, „Dich“) immer groß schreiben lassen und mit einer weiteren kontextabhängig auch die der 3. Person („Sie“, „Ihnen“). Das ist ebenso ein Gewinn wie „Smart Format“, eine Funktion, die sich einmalige Korrekturen einer Schreibweise („Kilogramm“ statt „kg“) permanent merkt. Etliche kleinere Verbesserungen betreffen ferner die Steuerung eines E-Mail-Systems im Browserfenster, das zu diesem Zweck mit einer Erweiterung versehen sein muss.

Wie gehabt läuft Dragon 12 selbst mit Windows XP; zwei Gigabyte Arbeitsspeicher sind indes Pflicht. Weiterlesen auf FAZnet

Und es geht doch: iPhone 5, Lightning und „iPod out“

Schon bei der Vorstellung des neuen iPhone 5 kündigte Apples Marketingchef Phil Schiller an, dass nicht jede Musikanlage mit dem neuen Lightning-Port des iPhone 5 funktionieren würde. Das Stichwort: „iPod out“ oder „iPod Kompatibilitätsmodus“. Dabei wird das iPhone mit (s)einem USB-Kabel an die Infotainment-Anlage des Fahrzeugs angedockt. Der Clou: Man kann sich im iPod-Kompatibilitätsmodus am Bordmonitor durch Alben, Listen aller Art und Wiedergabelisten bewegen. Das Infotainment-System übernimmt vollständig die Musiksteuerung. Eine tolle Sache, und vor allem: kaum Fahrerablenkung.

Für Verwirrung hat Apples Produktbeschreibung des Lightning-Adapters gesorgt, der den 8-Pin-Lightning-Anschluss umsetzt auf den alten 30-Pin-Connector. Er bietet weder Video- noch iPod-out.

Das alles bedeutet jedoch nicht, dass die Musiksteuerung im Auto nicht mehr funktionieren würde. Ich habe das Ganze mit dem iPhone 5, dem beiliegenden Lightning-USB-Kabel im neuen Hyundai i30 ausprobiert, läuft tadellos. Probleme könnte es geben, wenn das Fahrzeug keinen USB-Anschluss hat, sondern nur ein alter 30-Pin-Anschluss (etwa in der Mittelarmlehne) zur Verfügung gestellt wird. Hier würde man dann den besagten Adapter benötigen, und das kann haarig werden. Video out funktioniert definitiv nicht. Geht es jedoch allein um die Musikübertragung (und nicht die komfortable Bedienung am Bordmonitor) springt Bluetooth A2DP gern ein.

iPhone 5 im Hyundai i30 mit USB-Anschluss: iPod out funktioniert. Foto Spehr