Vorbei mit der monotonen Stimme

voice apps vui Apr 12, 2020

Ende 2019 hat Voicebot.ai mit einer Studie belegt, dass Nutzer von Sprachassistenten Aufnahmen von Menschen einer synthetischen Stimme bevorzugen.

Aber will man aus Aufwandsgründen oder weil man die Eingabe der Nutzer wiederholen will, doch gerne auf synthetisierte Stimmen zurückgreifen, muss die Stimme noch lange nicht monoton klingen. Du kannst Einfluss auf die Aussprache, die Betonungen, Pausen, Geschwindigkeit und vieles mehr nehmen. Dies geht dank der mehr als 15 Jahre alten Auszeichnungssprache SSML.

Wer schon Voice Apps für Amazon, Google oder Samsung entwickelt hat weiß, dass allerdings keineswegs alle Features unterstützt werden. Dass man dann ständig eine Mischung aus Code und eigentlichem Content hat, viele Begriffe von SSML nicht intuitiv sind und man sich auch nicht alle Ausdrücke so gut erschließen und merken kann.

Um diese Schwierigkeiten auszuräumen hat der Alexa Champion Mark Tucker ein Open Source Projekt namens ‘Speech Markdown‘ in die Welt gerufen, welches er auch bei Project Voice in Chattanooga 2020 präsentiert hat.

Du kannst dann Deine Inhalte im Editor von Speech Markdown schreiben und gleich für die verschiedenen Sprachassistenten umwandeln. Oder Du kannst Dir den reinen Text rauskopieren.

Genial ist der Ansatz, dass falls eine bestimmte Aussprache nicht existiert, aber sie nachzuahmen ist, dies Speech Markup übernimmt.

Beispielsweise existiert kein Flüstermodus beim Google Assistant, dennoch kann man die Stimme entsprechend beeinflussen, dass es so klingt.

In unseren Augen ist es ein lobenswerter Ansatz Ordnung in die gewachsenen Strukturen der unterschiedlichen Möglichkeiten von SSML zu bringen.

Machst Du schon Deine eigenen Voice Apps? Dann probier Speech Markdown doch gleich mal aus. Hier gehts lang:

https://www.speechmarkdown.org/try/

Close

50% Complete

Two Step

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.