Allein der Befehl ‚Alexa, sprich Deutsch‘ reichte nicht, um der Sprachassistentin beizubringen, Deutsch zu sprechen. Ein Entwicklungsteam in Aachen beschäftigte sich gut ein Jahr mit den Besonderheiten der deutschen Sprache, bis die ersten Amazon Echos an deutsche Kunden ausgeliefert werden konnten. „Deutsch gehörte zu den ersten Sprachen, die Alexa lernte – nach ihrer Muttersprache Englisch. Um ihr das Lernen neuer Sprachen zukünftig zu erleichtern, starteten wir in Aachen damit, Vorgänge zu automatisieren“, erzählt Max Bisani. Der Senior Manager leitet das Entwicklungsteam in Aachen. Er ist Experte für Maschinelles Lernen und beschäftigt sich vor allem mit dem Verstehen natürlicher Sprache. „Als wir 2015 mit der Programmierung der deutschen Alexa begannen, konnten wir auf die Systeme der deutschen Sprachsuche im Fire TV zurückgreifen“, sagt der Entwickler. „Hier hatte Amazon für die Spracherkennung bereits maschinelles Lernen verwendet und wertvolle Erfahrungen gesammelt.“
500 Stunden mit Alexa reden
Alexa Sprachkenntnisse basieren auf sogenannten künstlichen neuronalen Netzen. Dabei handelt es sich um mathematische Modelle, deren Struktur von den Nervensystemen von Lebewesen inspiriert wurden. In einem solchen Netz arbeiten mehrere Schichten von zahlreichen künstlichen Neuronen zusammen. Für die Programmierung der deutschen Alexa, nutzten die Wissenschaftler das Wissen aus einigen der bestehenden Schichten der englischen Alexa. Dieses maschinelle Lernverfahren nennt sich „Transfer Learning“. „Transfer Learning fällt Menschen naturgegeben leicht. Wenn wir zum Beispiel das Wort ‚Brot‘ lernen, wissen wir, wie man die Buchstaben ‚B‘ und ‚r‘ ausspricht. Somit lernen wir auch, wie man diese Buchstaben in anderen Wörtern ausspricht. Wir transferieren unser Wissen. Genau so funktioniert es zwischen zwei Sprachen: Erkennt das System die Klangmuster des Buchstaben ‚m‘ oder ‚s‘ im Englischen, ist das ein guter Ausgangspunkt, den Klang dieser Buchstaben im Deutschen zu identifizieren“, erklärt Max.
Damit Alexa Buchstaben verstehen kann, deren Klangmuster sich nicht mit dem Englischen decken, setzten die Entwickler zusätzlich auf eine menschliche Note. In der Betaphase testeten Mitarbeiter die deutsche Alexa. „Wir nutzten die Betaphase, um einige Funktionen Schritt für Schritt auszubauen. Als wir starteten, sprachen die Mitarbeiter mit Alexa, bekamen aber noch keine Antwort. Nach der ersten Anpassung verstand Alexa die Frage, antwortete aber Alexa oft noch auf Englisch. Dank der vielen Unterhaltungen der Mitarbeiter konnten wir Alexa schließlich antrainieren, Sprachbefehle zu verstehen und in Aktionen umzusetzen oder zu antworten. Bei uns zu Hause fanden daran vor allem meine Kinder Gefallen, da Alexa nun auf ihre Bitte hin, Bibi Blocksberg-Hörspiele starten konnte.“
Mehr als 500 Stunden Beispielkonversationen wurden gesammelt, um Alexas erste Deutschkenntnisse aufzubauen. Die Unterhaltungen der Mitarbeiter erweiterten das Vokabular von Alexa und festigten ihr Verständnis häufig gestellter Fragen zu Kochrezepten oder Fußballergebnissen, aber auch typische Befehle wie den Wecker zu stellen. Sie halfen ihr auch die Nuancen deutscher Akzente aus verschiedenen Regionen zu verstehen. „Das Schöne an datengetriebenen Methoden wie dem maschinellen Lernen ist, dass das System alles lernt, was man ihm in den Trainingsdaten vorgibt. Damit Alexa alles vom norddeutschen bis hin zum fränkischen Dialekt versteht, achteten wir darauf, alle Regionen Deutschlands zu berücksichtigen. Je besser ein Dialekt repräsentiert ist, desto besser wird er trainiert und schließlich erkannt“, beschreibt Max die Herangehensweise des Teams.
Alexa, parle français, s’il te plaît!
Heute besteht Alexas Vokabular aus mehreren zehntausend Wörtern. Doch es gibt noch viel zu tun. „Wenn es darum geht, Alexa neue Sprachen beizubringen, ist immer noch Tag Eins – wir stehen wirklich am Anfang“, so Max. „Aktuell interessiert uns in Aachen besonders, wie wir Methoden der maschinellen Übersetzung nutzen können, um neue Funktionen möglichst schnell in allen Sprachen verfügbar zu machen.“ In Aachen arbeitet das Team als Teil der weltweiten Amazon Entwicklung weiterhin an Verbesserungen der Sprachfähigkeit von Alexa – über das Deutsche hinaus. Durch maschinelle Lernverfahren wie Transfer Learning konnten die Teams den Weg für eine französische, spanische, italienische und japanische Alexa bahnen.
Hier finden Sie weitere Informationen zu der Arbeit des Aachener Entwicklungsteams.