Auf Kommando – Wie der Google Assistant hört, was Nutzer wollen

Ok, Google. Mit diesen Worten können derzeit bereits alle Android User (und auf Wunsch auch iPhone Nutzer) den persönlichen Sprachassistenten von Google ansteuern. Der Google Assistant verwandelt alles, was er hört, in ein direktes Kommando. Damit entfallen unnötige Klicks und Schwünge über den Touchscreen und jedes Wort wird zum Befehl.
Als Nachfolger des ehemaligen Service Google Now kann der Google Assistant Musik steuern, Lichter dämmen oder aber das Leben einfach ein Stück weit einfacher machen.

Am Anfang war das Wort – So funktioniert der Google Assistant

Das Prinzip hinter dem Google Assistant mag einfach klingen, doch in der tatsächlichen, technischen Ausführung erfordert der Sprachassistent ein höchst komplexes Gebilde aus Wissen und Onlinerecherche.
An erster Stelle steht die Spracherkennung, denn der Google Assistant muss das gesprochene Wort in für ihn lesbare Bausteine übersetzen. Dies erfordert im ersten Schritt die Verschriftlichung der Kommandos, ähnlich wie bei einem Diktat. Doch damit der Mensch den Google Assistenten nicht mit vorgefertigten Programmbefehlen ansprechen muss, ist ein tieferes syntaktisches Verständnis vonnöten.
Der Google Assistant muss Worte nicht nur hören und aufschreiben, sondern auch deren Sinn verstehen. Was für Menschen ganz selbstverständlich ist, ist für die Maschine mühselig. Denn sie muss den Sinn hinter verschiedenen Formulierungen und Umschreibungen erst lernen. Das Prinzip dahinter Implicit Discovery, dem Assistenten wird impliziert, was er genau machen soll. Anhand des Kontextes kann er etwa erahnen, dass es um die Wetter App geht, wenn der Nutzer nach einem Regenschirm fragt. Das ist für den User praktisch, denn er kann klar kommunizieren, was er/sie will. Technisches Know-How, Fachbegriffe oder auch nur der Name der Apps ist nicht weiter notwendig; Google Assistant wird sich aus dem sprachlichen Zusammenhang erschließen, was genau gefordert ist.
Der menschliche Verstand kann sich das herleiten, der Sprachassistent muss hierfür auf einen Katalog an bereits kategorisierten Phrasen zurückgreifen. Und lernt in der Nutzung weiter dazu und den User besser kennen.
Das Schlüsselwort für das bessere Kontextverständnis liegt in SSML-Befehlen. Speech Synthesis Markup Language ist gewissermaßen die native Sprache des Google Assistant, mit dem dieser Stichwörter zu einem passenden Kontext zusammensetzt. Das betrifft etwa Verabschiedungsformeln – wir als Mensch wissen auch, was ein „Auf Wiedersehen“ bedeutet.

Ein Assistent mit besonderen Fähigkeiten

Ein Sprachassistent auf dem Smartphone ist ein praktisches Utensil, mit dem User ihren Alltag regeln können. Zum einen dient der Google Assistant etwa dazu, Suchergebnisse und Daten aus Apps in Form natürlicher Sprache auszugeben. Dies kann etwa der Wetterbericht sein, das Ergebnis des Lieblingsteams oder ein anstehender Termin.
Der Assistent kann aber natürlich auch Notizen, Termine oder Nachrichten festhalten und damit in Schreibrichtung der Apps arbeiten.
Das ist aber noch längst nicht alles, mit dem der Google Assistant sich von der Konkurrenz abheben möchte. Noch in anderen Punkten hört der Google Assistant aufs Wort.

Licht und Stimmung

Der Lichtschalter gehört im modernen Smart Home zum alten Eisen. Längst lassen sich moderne LED-Lampen am Smartphone zu Lichtstimmungen zusammensetzen, dimmen oder sogar in der Farbqualität ändern. Besonders gut funktioniert das mit den Leuchten von Philips Hue, die der Google Assistant auf Kommando verstellen kann.

Keine Ausrede mehr für unpassende Geschenke

In den 50ern war Einkaufen für Männer noch einfach. Sie mussten nur ihrer Sekretärin sagen, dass ihre Frau ein Geschenk braucht. Solche Rollenbilder haben sich zum Glück geändert, den Job kann Google Assistant über den Zalando Geschenkefinder übernehmen.
Hier müssen User nicht einmal genau wissen, was sie suchen, sondern können einfach einige Fragen über den/die zu Beschenkende/n beantworten. Anschließend liegt direkt eine Auswahl an passenden Präsenten vor.

Wie heißt der Song noch gleich?

Jeder Musikliebhaber kennt das Problem halb im Kopf steckender Ohrwürmer. Doch wie sollen Nutzer diese loswerden, wenn sie den Titel nicht kennen? Sie können Google Assistant einfach fragen. Über das Mikrofon zeichnet der Assistent die Melodie auf und gleicht diese mit Googles Datenbank ab.
Name des Titels, Interpret und sogar der Songtext werden ebenso vorgeschlagen wie ähnliche Suchergebnisse. Ideal, um Songs im Radio oder in der Bar schnell zu identifizieren, ohne sie den Freunden vorsummen zu müssen.

Der persönliche Assistent in der Hosentasche

Mit seiner Anbindung an die Suchmaschine Google kann der Google Assistant natürlich auf eine riesige Datenbank zurückgreifen. Damit das aber überhaupt funktionieren kann, ist ein technischer Unterbau der Extraklasse vonnöten.
Die notwendige Spracherkennung und das Verständnis, mit dem der Google Assistant das gehörte Wort vom Smartphone aus (oder über Google Home) in maschinell lesbare Bausteine umwandelt ist beeindruckend. Das Resultat ist ein beeindruckendes Interface, das kaum wahrnehmbar ist, und ein Assistent, der vom Geschenkekaufen bis hin zur Bedienung der liebgewonnen Playlist, einfach persönlich ist.