.st0{fill:#FFFFFF;}

Voiceflow – Das No-Code Tool für Voice Apps 

von  Sebastian Podesser

15.01.2022

alexa skills, google actions, nocode, tool, voice apps

Was ist Voiceflow?

Mit Voiceflow kann jeder Voice Apps bauen. Ganz ohne Programmierkenntnisse. IT-Kenntnisse und ein Verständnis für die Anwendungslogik von Sprachassistenten reichen aus. Voiceflow selbst beschreibt sich als Tool für das Design, die Prototyp-Entwicklung und Veröffentlichung von Voice-Anwendungen. 

Der Design Manager von Spotify, Doug DeMarco, sagt: „With Voiceflow we were able to quickly prototype real, personalized, user experiences that would have otherwise required our engineers to build them into production code.“

Wer steht hinter Voiceflow?

Von links nach rechts: Tyler Han (CTO), Michael Hood (CPO), Braden Ream (CEO), Andrew Lawrence (COO)(Quelle: Forbes)

Das Gründerteam besteht aus Tyler Han, Michael Hood, Braden Ream und Andrew Lawrence. Ihr ursprünglicher Plan war die Entwicklung von interaktiven Geschichten für Kinder. Ihr Projekt nannten sie „Storyflow“. Bei der Entwicklung dieser interaktiven Geschichten bemerken sie aber schnell, dass der ganze Prozess nur schwer skalierbar ist und die vielen verschiedenen Verzweigungen auch schnell unübersichtlich werden.

Von Storyflow zu Voiceflow

Das brachte sie zur Idee, das Problem mit einem simplen Drag-and-Drop System zu lösen. Als die Storyflow-Community das sieht, wollen sie das Tool sofort selbst nutzen um eigene Geschichten zu erfinden und umzusetzen. Die Gründer erkennen, dass diese Lösung das Potenzial für eine zentrale Plattform hat, mit der jegliche Voice Apps entwickelt werden können und nicht nur interaktive Geschichten. Und so kam es. Storyflow wurde zu Voiceflow und die wilde Reise begann. 2019 bekommen sie ein $3,5 Millionen Seed Funding von True Ventures. Kurz darauf investiert Amazon mit dem Alexa Fund. 2021 investiert Felicis Ventures $20 Millionen. Das kanadische Unternehmen hat mittlerweile 52 Beschäftigte und zählt über 75.000 Nutzer*innen.

Voiceflow Team (Quelle: voiceflow.com)

Wie funktioniert das No-Code Tool?

Die Funktionsweise des Tools ist sehr simpel aufgebaut. Sobald du ein Projekt erstellst, wählst du zu Beginn den gewünschten Kanal aus.

Du kannst die Sprachassistenten und Chatbots entweder für eigene Kanäle erstellen, oder du verbindest deinen Voiceflow-Account mit Amazon oder Google und veröffentlichst Voice Apps für Alexa oder den Google Assistant. Bei Alexa heißen Voice Apps übrigens Skills und bei Google heißen sie Actions. Sobald du eine Option ausgewählt hast, landest du auf einem sehr übersichtlichen Canvas.

Das Canvas

Auf der linken Seite findest du verschiedenste Blöcke. Diese kannst du einfach per Drag-and-Drop auf dein Canvas ziehen. Jeder dieser Blöcke hat eine andere Funktionalität. Der am häufigsten verwendete Basisblock ist zum Beispiel der Speak-Block. Den Text, der vom Sprachassistenten ausgegeben werden soll, tippst du ganz einfach hier ein. 

Ein Conversation Design besteht aus wechselseitigem Input vom User und Output vom Sprachassistenten. Für den Output hast du die eben erwähnte Möglichkeit, schriftlichen Text als TTS (Text-To-Speech) Format ausgeben zu lassen. Alternativ kannst du aber auch Audiofiles abspielen oder für Sprachassistenten mit Display (Smart Displays) visuelle Elemente anzeigen lassen.

Der Output vom Sprachassistenten

Der Input vom User

Für den Input des Users ist es wichtig Intents festzulegen. Ein Intent beschreibt die Absicht des Users und ist die Grundlage für den Choice oder Prompt Block. Beide Blöcke vereint die Grundfunktionalität, dass der Sprachassistent dem User zuhört und versucht, das Gesagte einer Absicht (=Intent) zuzuordnen.

Wenn der User zum Beispiel wissen möchte wie spät es ist, wäre eine passende Bennenung des Intents AskForTime. Damit der Sprachassistent allerdings den Input vom User richtig zuordnen kann, müssen für alle Intents sogenannte Utterances hinterlegt werden. Utterances sind Beispiele dafür, was der User sagen könnte.

Um beim Beispiel AskForTime zu bleiben, können Utterances folgendermaßen lauten:

Das sind jetzt nur drei beispielhafte Utterances. In einem echten Projekt solltest du so viele Utterances wie möglich formulieren. Wichtig ist auch umfangreich zu testen, um Formulierungen, an die man nicht gedacht hat, zu ergänzen. 

Die Anwendungslogik zwischen den Blöcken

Die Logik-Blöcke sorgen für die gewünschte Anwendungslogik zwischen Input und Output. 

Mithilfe von Variablen kannst du verschiedene Wege von äußeren Umständen abhängig machen. Mit dem Condition Block kannst du beispielsweise die Art der Begrüßung von der Uhrzeit abhängig machen:

Zuguter Letzt bietet Voiceflow auch verschiedenste Integrationen an. Auf diese Weise gelingt es die Funktionsdichte einer Voice App stark zu erhöhen. Du kannst API-Schnittstellen oder Google Sheets einbinden, eigenen Code hinzufügen oder auch bestimmte Inhalte klickbar machen.

Direkt auf deinen Geräten testen

Wenn du für Alexa oder den Google Assistant entwickelst, kannst du mit nur einem Klick dein Voice-Projekt in die jeweilige Konsole hochladen. So kannst du deine Voice Apps jederzeit mit deinen Smart Speakern und Displays zuhause testen. Wenn du sie dann für alle zugänglich veröffentlichen möchtest, kannst du das auch direkt aus Voiceflow heraus machen.

Für wen ist Voiceflow geeignet?

Voiceflow ist für alle Digital-Enthusiasten, die eine Begeisterung für Sprachassistenten mitbringen. Das Tool macht es dir wirklich leicht, Voice Apps und Chatbots schnell und professionell umzusetzen. Die ersten 2 Voiceflow Projekte sind übrigens kostenfrei. Also wenn du jetzt Lust bekommen hast es auch mal selbst auszuprobieren, hast du nichts zu verlieren. Für den Anfang kannst du dich auch einfach im Alexa Skill Store inspirieren lassen. Hier siehst du welche Voice Apps aktuell live und am beliebtesten sind.