Alexa spielt Musik, liest die Nachrichten vor, kennt die neuesten Fußballergebnisse, die besten Rezepte und merkt sich die Einkaufsliste. Und mit dem Wetterbericht von Alexa muss auch niemand im Regen stehen. Im Video verraten die Mitarbeiter des Amazon Development Centers, was hinter Amazons intelligentem Alltagshelfer steckt.
„Für den Nutzer ist das Bedienen von Alexa ganz einfach und intuitiv. Für Alexa sind es aber unzählige Schritte, die sie gehen muss."
Alexa ist ein in der Cloud verfügbarer Sprachdienst, der sein Zuhause unter anderem im Amazon Echo hat, einem unscheinbaren, schlanken Gerät, das neben der intelligenten Sprachsteuerung auch über einen Lautsprecher verfügt. Wer durch einen der frei definierbaren Sprachefehle ‚Alexa‘, ‚Amazon‘ oder ‚Echo‘ eine Interaktion mit der künstlichen Intelligenz in der Cloud beginnt, erhält Unterstützung bei der Organisation des Alltags und Antworten auf zahlreiche Fragen.
Wie alt ist Mario Götze? Die Frage klingt simpel. Für die Antwort muss Alexa jedoch eine ganze Reihe an Informationen finden und verarbeiten: „Erst einmal muss man wissen, wer Mario Götze ist“, erklärt uns Per Gyllensvärd, Senior User Experience Designer. „Das lernt Alexa von verschiedenen Informationsquellen im Internet. Auf der Wikipedia-Seite steht zum Beispiel das Geburtsdatum. Dann muss man wissen, welches Datum heute ist um das Alter ausrechnen zu können. Nicht zuletzt muss Alexa die Antwort sprachlich korrekt ausdrücken können.“
Trotz der komplexen Abläufe im Hintergrund kommt die Antwort prompt: „Mario Götze ist 24 Jahre, sechs Monate und vier Tage alt.“ Doch wie versteht die intelligente Lautsprecherbox überhaupt, was man von ihr will? „Wir sammeln sehr viele Sprachbeispiele und gleichen diese mit unseren Datenbanken ab“, erklärt Max Bisani, Manager Machine Learning. Dabei wird jede Silbe und jeder Buchstabe auf die Goldwaage gelegt, damit Alexa nicht ein „e“ mit einem „ä“ verwechselt.
Was auf den Laien wie wahr gewordene Science Fiction wirkt, ist für die Mitarbeiter des Amazon Development Centers Alltag. Ein Alltag aus Algorithmen, Mustern und Gesetzmäßigkeiten des maschinellen Lernens. Was im Umgang mit Alexa so einfach erscheint, basiert tatsächlich auf Tausenden von Lernprozessen, die Alexa bewältigen muss – damit sie zwischen englischer und deutscher Aussprache unterscheiden kann, Umgangssprache richtig interpretiert und zum Beispiel weiß, welches Stück denn nun gemeint ist: Ein Stück Pizza? Das neue Stück von Adele? Oder ob sie einfach ein Stück lauter sprechen soll? „Alexa lernt den Kontext aus kompletten Sätzen. So kann sie erkennen, dass die Kombination einer Musikanfrage mit einem Bandnamen und dem Wort ‚Stück’ vermutlich auf einen Song hindeutet, anders als in der Kombination der Begriffe ‚Stück’ und ‚Lautstärke’“, sagt Fabian Triefenbach, Speech Scientist.
Alexa weiß natürlich längst nicht alles. Aber durch die wiederholte Eingabe von Begriffen füllen sich ihre Wissenslücken. „Man kann sagen, Alexa lernt dazu, indem man sie ständig benutzt“, sagt Volker Leutnant, Speech Scientist. Jeder Kunde kann Alexa besser machen. So wie Nutzer für Smartphones neue Apps entwickeln, können technikbegeisterte Kunden für Alexa neue sogenannte Skills programmieren. „Ich habe mir den Spaß erlaubt und für meine Kinder einen Skill entwickelt, der jetzt auf unserem Amazon Echo läuft“, verrät Patrick Lehnen. „Alexa unterhält unsere Kinder beim Zähneputzen. Seither greifen sie wesentlich motivierter zur Zahnbürste.“ Apropos Spaß: Alexa beweist auch Humor, und der sollte im Alltag bekanntlich nicht zu kurz kommen. „Alexa, warum ist die Banane krumm?“ Alexa: „Weil niemand in den Urwald zog und die Banane grade bog.“