Das Voice Lexikon

Begriffe aus der Welt der Sprachassistenten verstehen

Was genau ist Sprachsuche? Was hat es mit Voice Apps auf sich? Und was unterscheidet VUI von GUI? All diese Begriffe erklären wir dir in unserem Voice Lexikon.

Alexa Skill

Eine Reihe von Aufgaben oder Aktionen, die von Alexa, dem Sprachassistenten von Amazon ausgeführt werden. Skills werden also die (Voice) Apps von Alexa genannt.

Automated Speech Recognition (ASR)

Computertechnologie, die die menschliche Stimme identifizieren und verarbeiten kann. Sie wird hauptsächlich verwendet, um gesprochene Wörter in Computertext umzuwandeln. ASR wird auch verwendet, um Benutzer über ihre Stimme zu authentifizieren und eine Aktion basierend auf den vom Benutzer definierten Anweisungen auszuführen. In der Regel erfordert die automatische Spracherkennung vorkonfigurierte oder gespeicherte Stimmen der primären Benutzer. Sie ist auch als automatische Spracherkennung (AVR) bekannt.

Bixby Capsule

Eine Reihe von Aufgaben oder Aktionen, die von Bixby, dem Sprachassistenten von Samsung ausgeführt werden. Capsules werden also die (Voice) Apps von Samsung Bixby genannt.

Chatbot

Programme, die Konversationen im Web oder Instant Messenger automatisieren.

Conversation Design

Bei Conversation Design geht es im Kern darum, Computern beizubringen, wie Menschen zu kommunizieren, und nicht umgekehrt. Es geht darum, dieses Erlebnis der Interaktion mit dem Computer einfach und intuitiv zu gestalten und Frustrationen zu reduzieren. Auf einer praktischeren Ebene geht es darum, Konversationsinteraktionen zu entwerfen, sei es über eine Sprachnutzeroberfläche, einen Bildschirm mit Sprachfunktion oder ein multimodales Gerät wie ein Mobiltelefon, welches auch Tippen und Wischen umfassen kann.

Flash Briefing Skill

Skills, die speziell für die Flash Briefing-Funktion von Amazon Alexa entwickelt wurden, mit welchen der Benutzer Nachrichten und Schlagzeilen, Ereignisinformationen, lokale Wetterberichte und andere Formen von Kurzinhalten erhalten.

Google Action

Eine Reihe von Aufgaben oder Aktionen, die vom Google Assistant, dem Sprachassistenten von Google ausgeführt werden. Actions werden also die (Voice) Apps von Google genannt.

In-Skill Purchase (ISP)

In-Skill Purchasing erlaubt es dem Nutzer eines Alexa Skills Premiuminhalte innerhalb des Skills zu erwerben. Die Zahlung erfolgt immer über das Amazon Konto des Nutzers.

Intent

Eine Absicht des Benutzers in einem bestimmten Satz oder Befehl gegenüber dem Sprachassistenten. Wenn der Benutzer beispielsweise "Bestelle mir einen großen Kaffee" sagte, wäre die Absicht hier, Kaffee zu bestellen. Eine Absicht bezieht sich nicht auf die spezifischen Wörter "Bestellung" und "Kaffee", sondern auf das Ziel, das sie anstreben, nämlich die Bestellung eines Kaffees.

Interaction Model

Basierend auf der Idee, dass ein Computer bestimmte Informationen benötigt, um die menschliche Sprache zu verstehen. Das Interaction Model (Interaktionsmodell) liefert die erforderlichen Informationen, damit ein Computer eine bestimmte Sprachanforderung oder einen bestimmten Befehl verstehen und verarbeiten kann. Dies beinhaltet die Verwendung von Utterances, Intents und Slots, die alle die gesprochenen Eingaben eines Benutzers abbilden.

Invocation

Aufrufname, mit dem ein Alexa Skill geöffnet/gestartet wird. Sagt man zum Beispiel "Alexa, starte Tatort Heute!", ist der Invocation Name "Tatort Heute".

Natural Language Processing (NLP)

Technologie, die Computern hilft, die natürliche Sprache des Menschen zu verstehen. Mit NLP können Menschen und Maschinen „natürlich“ miteinander sprechen. Ein effektives NLP-System ist in der Lage, das Gesagte aufzunehmen, es aufzuschlüsseln, seine Bedeutung zu verstehen, geeignete Maßnahmen zu bestimmen und in einer Sprache zu antworten, die der Benutzer versteht.

Natural Language Understanding (NLU)

NLU Kann als Teilfeld von NLP betrachtet werden. Die NLU befasst sich insbesondere mit maschinellem Lesen oder Leseverständnis. NLU geht über die Satzstruktur hinaus und zielt darauf ab, die beabsichtigte Bedeutung der Sprache zu verstehen. Während Menschen mühelos mit falschen Aussprachen, ausgetauschten Wörtern, Kontraktionen, Umgangssprachen und anderen Macken umgehen können, sind Maschinen weniger geschickt im Umgang mit unvorhersehbaren Eingaben. 

Slot

In vielen Szenarien reichen Intents alleine nicht aus, um eine Anfrage an einen Sprachassistenten zu erfüllen. Hier kommen "Slots" ins Spiel. Slots können als bestimmte Informationen betrachtet werden, nach denen der Assistent angewiesen wird, zu suchen, wenn der Benutzer seine Antwort gibt. In der Äußerung "Bestelle mir einen großen Mokka-Kaffee" möchten wir, dass unser Assistent auf die Größe und Art des Kaffees achtet. Dies sind die Slots, die wir aus der Äußerung des Benutzers erfassen möchten. In der obigen Äußerung würden wir einen Größenslot zum Erfassen von "groß" und einen Typslot zum Erfassen von "Mokka" zuweisen.

Smart Speaker

Ein intelligenter Lautsprecher ist eine Art Lautsprecher- und Sprachbefehlsgerät mit einem integrierten virtuellen Assistenten, der interaktive Aktionen und Freisprechaktivierung bietet.

Speech Synthesis Markup Language (SSML)

Einfach zu bedienender visueller Editor zur Verbesserung der Sprachausgabe von Sprachanwendungen (wie Alexa oder Google Assistant). In einfachen Worten kann SSML dazu beitragen, dass Alexa oder Google natürlicher klingen. Man kann beispielsweise längere Pausen zwischen Sätzen hinzufügen oder sogar ein bestimmtes Wort hervorheben.

Sprachassistent

Auch Voice Assistant genannt. Eine sprachaktivierte Software, die Informationen liefern und bestimmte Arten von Aufgaben ausführen kann.

Sprachsuche

Auch Voice Search genannt. Der Begriff bezeichnet das Finden von Informationen oder Produkten im Internet durch Sprachkommandos. Nutzer kommunizieren auf diese Weise mit intelligenten Geräten. Die Eingabe von Text entfällt.

Text-to-Speech (TTS)

Umwandlung menschlicher Sprache in künstlich erzeugte Sprache unter Verwendung spezieller Software. Es wird auch als "Vorlese" -Technologie bezeichnet und funktioniert heutzutage in fast jedem persönlichen digitalen Gerät, einschließlich Smartphones, Computern und Tablets.

User Persona

Eine User Persona (Nutzertyppersönlichkeit) ist eine spezifische, aber kurze Beschreibung des Benutzertyps, der mit einer Voice App interagiert. Für jede Voice App überlegt man sich einige Menschengruppen, für die diese App interessant ist. Dies hilft dabei, authentische Dialoge und ansprechendere Interkationen für Nutzer zu erstellen.

Utterance

Dies kann alles sein, was der Benutzer sagt, also eine Äußerung. Wenn der Benutzer beispielsweise "Bestelle mir einen großen Kaffee" sagte, wäre der gesamte Satz die Utterance.

Voice App

Eine Voice App ist eine Software, die Sprachassistenten um zusätzliche Dialoge und Funktionalitäten erweitert. Voice App ist dabei ein Hersteller-unabhängiger Oberbegriff. Beim Sprachassistent Amazon Alexa werden für Voice Apps die Bezeichnung Skill, beim Google Assistant die Bezeichnung Action sowie bei Samsung Bixby die Bezeichnung Capsule verwendet.

Voice Assistant

Auch Sprachassistent genannt. Eine sprachaktivierte Software, die Informationen liefern und bestimmte Arten von Aufgaben ausführen kann.

Voice Design

Beim Voice Design werden die möglichen Interaktionen entworfen, die zwischen einem Sprachassistenten und einem Endbenutzer auftreten können. Durch ein gutes Sprachdesign wird ein Gesprächsfluss erzielt, bei dem sich Interaktionen mit Sprachassistenten natürlich anfühlen.

Voice User Interface (VUI)

VUI ist das Sprachäquivalent der grafischen Benutzeroberfläche (GUI) und eine Art Benutzeroberfläche, mit der Benutzer mit elektronischen Geräten interagieren können, indem sie gesprochenen Text  sprechen und anhören.

Voice Bot 

Programme, die Konversationen auf Sprachassistenten oder am Telefon automatisieren.

Wake Word

Ein spezielles Wort oder eine spezielle Phrase, die ein bestimmtes Gerät aktivieren soll, wenn es einmal gesagt wurde. Beispiele für diese Wörter oder Sätze wären "Alexa", "Hey Siri" und "Hey Google". Diese werden auch als "Trigger Words" bezeichnet.