.st0{fill:#FFFFFF;}

Welcher Sprachassistent wird sich auf Dauer durchsetzen? 

von  Raphael Schaad

21.04.2020

sprachassistenten

Alexa, Google Assistant, Siri oder auch Bixby?

Jetzt habe ich eine große Frage gestellt. Welcher von den vier Sprachassistenten setzt sich durch. Um mal wieder Voice mit Mobile zu vergleichen, wie war es denn da? Blackberry, Microsoft, Android oder iOS? 

Oder ist die Analogie besser mit Browsern? Netscape Navigator, Internet Explorer, Firefox, Chrome, Opera oder Edge?

So gern wie diese Analogie eingesetzt wird, passt sie scheinbar nicht mehr zu neueren Entwicklungen in der Voice Landschaft.

Und zwar geht es um Ansätze unabhängig von den großen vier erstgenannten Sprachassistenten.

Um Dir die Entwicklungen zu erklären, nenne ich zunächst einmal mögliche Gründe, weshalb man sich von diesen lösen möchte:

  • Wakeword – Konzerne möchten ungern einen fremden Markennamen mit ihrer eigenen Nutzererfahrung koppeln. So hat sich Mercedes entschieden seinen mit Houndify entwickelten Sprachassistenten lieber mit „Hey Mercedes“ anstatt mit „Hey Google“ aufzuwecken.
  • Invocation Name – Man benötigt für das Erlebnis einer Marke immer einen Invocation Name vor einer bestimmten Funktion (einem Intent). Die natürliche Sprache funktioniert nicht so und implizite Aufrufe von Voice Apps ohne diesen Invocation Name kann man nicht garantieren.
  • Gerätespezifische Limitierung – Hat man einen Alexa Skill oder eine Google Action, so hilft einem dies überhaupt nicht als Sprachassistent auf der Website oder in Mobile Apps. Dann hat man etwas rein für bestimmte Touchpoints entwickelt. Zugegebenermaßen ist Amazons Strategie „Alexa everywhere“, mit Zahnbürsten, Autos, Hearables, Kühlschränken, Backöfen und vielem mehr, und auch Google versucht möglichst überall ansprechbar zu sein. Aber auf einer Website und in Deiner Smartphone App hilft Dir weder Alexa noch der Google Assistant. Es gibt daher inzwischen einige Hersteller, die Sprachassistenten rein für die Nutzung in Smartphone Apps anbieten. Und deshalb hat die Bank of America mit Erica einen Sprachassistenten entwickelt besonders auch für die Anwendung in der eigenen Smartphone App und hat bereits Millionen an Nutzern.
  • Chatbots – Ja, es gibt noch Menschen die Tippen. Und da die Logik hinter Chatbots und Sprachassistenten sehr ähnlich ist, sollte man Chatbots doch gleich auch anbieten, oder? Dies geht aber mit Alexa zum Beispiel überhaupt nicht.
  • Zahlungsanbieter – Will man eine Zahlung über den Google Assistant abwickeln, muss man Google Pay verwenden. Das gleiche gilt für Samsung Pay und Amazon Pay. Dies stört natürlich große Unternehmen. Man begibt sich in eine Abhängigkeit und lässt den Zahlungsanbieter mitverdienen. Was sich für kleinere Anbieter sowie Kunden komfortabel gestaltet, ist für Konzerne ein KO-Kriterium.
  • Sprachen – Hat Amazon oder Google nicht Deine Landessprache oder versteht nicht die typischen Dialekte, kannst Du diese Anbieter komplett vergessen. Bei zwei Vorträgen in Slowenien habe ich Ende 2019 persönlich spüren können, wie gering die Erwartungen an Voice Technologie selbst bei großen Unternehmen ausgefallen ist. Das Land hat zwar immerhin 2 Millionen Bewohner, aber auch sehr unterschiedlich klingende Dialekte.
  • Weitere Platformlimitierungen – Von Problemen mit Videoformaten, Qualität und Längen von Audio-Files, umständlichem Authentifizieren, belegten Invocation Names, teils willkürlich erscheinenden Algorithmen und Überlassen von Kundendaten hab ich noch gar nicht geschrieben.

Aufgrund dieser Limitierungen gibt es regionale Sprachassistenten, wie in Deutschland Magenta von der Telekom, White-Label Sprachassistenten wie von Houndify und Projekte mit künstlicher Intelligenz. 

Spannend wird in Zukunft zu beobachten, ob andere Hersteller bestimmte Probleme der Etablierten behoben bekommen, wie sich die Entwicklung für all diese Sprachassistenten gestaltet, ob Jovo noch eine der bekanntesten Sprachen der Welt wird oder ob wir Standards wie im Web bekommen.

Erste Bestrebungen dazu sind besonders von der von Amazon ins Leben gerufenen „Voice Interoperability Initiative“ zu erwarten. Obgleich für deren Start wohl, laut Bret Kinsella, Google so spät informiert wurde, dass sie nicht mehr reagieren konnten.

All diese Entwicklungen sind Ausdruck eines reifer werdenden Marktes. Investitionen werden größer, Unternehmensverkäufe steigen und schlussendlich dient hoffentlich alles uns, den Entwicklern, Marketing Verantwortlichen und Nutzern.