Aus unserem Archiv:

Modern Talking im Audi TT

„Wie bitte?“ oder „Ich verstehe Sie nicht“ - Sätze, die Autofahrer bei der Sprachbedienung nicht hören wollen. Im neuen Audi TT funktioniert die Sprachsteuerung natürlichsprachlich – der Sprecher kann einen echten Dialog führen.

 „Das Denken in festen Kommandos und Menüstrukturen war gestern. Heute kann der Nutzer einen natürlichsprachlichen Dialog führen“, sagt Doreen Engelhardt
„Das Denken in festen Kommandos und Menüstrukturen war gestern. Heute kann der Nutzer einen natürlichsprachlichen Dialog führen“, sagt Doreen Engelhardt
Werte der auf dieser Seite beworbenen Fahrzeuge:

Keine Angaben

Doreen Engelhardt fährt im Audi TTS über die Autobahn. Als sie am Lenkrad den Knopf für die Sprachsteuerung drückt, bleibt ihr Blick auf der Straße. „Hol mir Christoph Voigt ans Telefon“, sagt sie so natürlich als würde sie mit einem Menschen, nicht mit einer Maschine sprechen. Sofort erscheint im virtuellen Cockpit Name und Telefonnummer ihres Kollegen. „Soll ich Christoph Voigt jetzt anrufen?“, fragt die weibliche Stimme. „Ja bitte“, antwortet Engelhardt und Sekunden später hat sie Christoph Voigt am Telefon.

Mit der natürlichsprachlichen Bedienung – erstmals im Audi TT verbaut – gibt es keine festen Kommandos mehr. „Der Kunde muss nicht mehr wissen, welchen Befehl die Maschine erwartet, sondern kann natürlich sprechen“, sagt Doreen Engelhardt, Entwicklerin für Bedienkonzepte der Sprachdialogsysteme.

130 Funktionen im Auto können über natürliche Sprache onboard gesteuert werden. „Für jeden Befehl haben wir hunderte unterschiedliche Varianten entwickelt“, sagt Manya Sahakyan, Entwicklerin für Spracherkennungstechnologien. Und jeder von ihnen ist an die Alltagssprache der Kunden angepasst. Denn im Vorfeld der Entwicklung wurden einige hundert Kunden gefragt, wie sie dem Auto das Kommando erteilen würden. Der daraus entstandene Datensatz umfasste 60.000 Äußerungen und diente als Basis für das statistische Modell, aus dem die Entwickler pro Befehl die häufigsten Kommandos herausfilterten.

Sprachbedienung

Bisher spricht das System britisches Englisch und Deutsch. Bald wird es aber auch eine italienische, französische, spanische und US-amerikanische Version geben

Audi befragte für die Entwicklung der Sprachbedienung mehr Kunden als je zuvor. Und auch bei der Zusammensetzung des Entwicklerteams ging das Unternehmen neue Wege. Die IT-Experten holten sich erstmals Computer-Linguisten ins Team und entwickelten in interdisziplinärer Zusammenarbeit das neue System mit dem Kürzel SLM (Statistic Language Model). „Im Entwicklungsteam hatten wir erstmals Kollegen an Bord, die mit einem ganz anderen Blickwinkel an die Sache herangehen“, sagt Christoph Voigt, Leiter der Entwicklung Sprachbedienung.

Beim TT haben die Entwickler die Zahl der Antwortvarianten von 1.000 auf 2.300 erhöht. Welche Antwort das System auswählt, entscheidet ein Algorithmus im Hintergrund. Insgesamt hat die Sprachausgabe nicht nur mehr Antworten zur Auswahl, sondern spricht sehr viel fließender. „Mit diesen Neuerungen wirkt das System natürlicher und wir nähern uns einem normalen Dialog an“, sagt Engelhardt.

Die natürlichsprachliche Bedienung wird zunehmend zum Wettbewerbsvorteil für Automobilhersteller: Immer mehr Kunden erwarten eine Sprachsteuerung im Auto. In den USA beispielsweise nutzen sie bereits zwei Drittel der Autofahrer tagtäglich. „Für die Kunden wird die Sprachbedienung im Auto so selbstverständlich wie eine Klimaanlage“, sagt Sahakyan.

Sprachbedienung

Am Gurt des Audi TT sind drei Mikrofone angebracht – dadurch ist für die Sprachbedienung ein möglichst geringer Abstand zum Sprecher gegeben

Den großen Vorteil sehen Kunden in der Schnelligkeit und dem Komfort, allem voran aber in der Sicherheit. „Mit der Sprachsteuerung können wir die Ablenkung des Fahrers deutlich reduzieren“, sagt Engelhardt. Er kann die Augen immer auf der Straße, die Hände immer am Lenkrad lassen und dennoch neben dem Autofahren telefonieren, ein Restaurant auswählen oder die nächste Tankstelle suchen. In stressigeren Fahrsituationen kann der Nutzer mit dem Befehl „Moment mal“ das Sprachsystem pausieren lassen und den Dialog später fortführend.

Die Toleranz bei der Erkennung der Phrasen ist sehr hoch, liegt jedoch nicht bei 100 Prozent. Etwa bei stark dialektaler Färbung oder sehr lauten Hintergrundgeräuschen ist die Trefferquote geringer. Sagt der Sprecher mit tiefbayrischen Dialekt „Fahr mi noch Minga“ erkennt das System in jedem Fall die Absicht des Sprechers, an einen Ort navigiert werden zu wollen. „Mit der Intentionserkennung erhöhen wir die Zufriedenheit des Kunden und helfen ihm unkompliziert das zu bekommen, was er möchte“, sagt Voigt.

Um die Kundenzufriedenheit in Zukunft noch weiter zu erhöhen, steht eine weitere Innovation schon in den Startlöchern. „Als nächstes werden wir unsere Sprachsteuerung auch auf Online-Dienste ausweiten“, sagt Voigt. Dann kann der Fahrer beispielsweise aus dem Auto twittern – und das nur mit Sprachbefehlen. Erstmals zu sehen und zu testen gibt es das Ganze auf der CES in Las Vegas.

Artikel kommentieren

Ihre E-Mail-Adresse wird nicht veröffentlicht.