Die diesjährigen VOICE Days plus haben es an den Tag gebracht: Der Trend geht zur frei gesprochenen Eingabe. Bestes Beispiel war die vorgestellte Sprachbox: Der Anrufer hinterlässt eine Nachricht wie auf einem Anrufbeantworter – dabei wird seine Äußerung nicht nur aufgezeichnet, sondern auch mithilfe von Speech2Text-Technologie verschriftet und anschließend analysiert und weiterverarbeitet. Aber nicht nur das Erstarken von Speech2Text unterstreicht diesen Trend, auch die klassischen Dialogsysteme setzen, wieder einmal, verstärkt auf die freie Eingabe.
Reine Speech2Text-Technologie ist für den Anrufer unsichtbar, vermag allerdings die Prozesse in der Regel nur zu teil- und nicht voll zu automatisieren. Dennoch: Findet sich in diesem Ansatz das Optimum im Spannungsfeld zwischen Kundenfreundlichkeit auf der einen und Kosteneinsparungen auf der anderen Seite? Oder werden auch die Dialogsysteme weiterhin bestehen – und wenn ja, wie? Ist der freie Dialog die Antwort auf kundenseitige Akzeptanzprobleme, vermag er die potentielle Kluft, die bei Dialogsystemen zwischen Schnelligkeit und (Erkennungs-)Sicherheit immer bestand, zu überwinden?
Der Vorteil von frei gestellten Fragen liegt auf der Hand: Der Nutzer kann sein Anliegen in eigenen Worten formulieren und muss sich nicht an den Vorgaben eines Dialogsystems orientieren. Zugleich gelangt er schneller, im Idealfall direkt, an sein Ziel und nicht über mehrstufige Etappen. Doch jeder, der sich einmal näher mit Dialogsystemen beschäftigt hat, weiß, wie viel investiert werden muss, damit ein solches System zuverlässig funktioniert. Der Aufwand liegt hier vor allem im Aufbau des Sprachmodells, bei statistischen Modellen im Sammeln und Verarbeiten von Daten. Und entgegen landläufiger Vermutungen wird immer noch ein Dialog-Design benötigt – um den Nutzer zum freien Sprechen zu animieren, für nachgelagerte Interaktionsschritte und für eine alternative Dialogstrategie, falls der freie Dialog misslingt. Der Aufwand ist also vergleichsweise hoch, dafür kann das System aufgrund der offenen Struktur sehr viele Anfragen abbilden. Und nicht zuletzt ist der freie Dialog, sofern er denn funktioniert, der kundenfreundlichste Weg.
Doch hält der freie Dialog, was er verspricht? Vor einigen Jahren ist der freie Dialog schon einmal verstärkt angewendet worden – teils mit gutem, teils mit mäßigem Erfolg. Hat sich die Technologie bzw. die Erhebung und Verarbeitung der zugrunde liegenden Daten inzwischen allgemein verbessert? Oder bergen Systeme mit offenen Fragen weiterhin zu viele Risiken?
Die Alternative wäre, den Dialog stärker zu führen – also mehr Sicherheit, dafür weniger Schnelligkeit. Hier können Design-Techniken in hohem Maße dazu beitragen, dass der Nutzer den Dialog nicht als langwierig empfindet – und auf diese Weise sowohl Sicherheit als auch Schnelligkeit gewährleisten. Trotz aller Versuche der letzten Jahre, die Wichtigkeit von Dialog-Design zu betonen, scheint heute wieder die Lösung in der Technologie gesucht zu werden. Woran liegt das? Wurde Dialog-Design nicht häufig genug professionell praktiziert? Oder ist die Technologie bzw. der Umgang mit der Technologie inzwischen so weit fortgeschritten, dass sie tatsächlich eine solide Lösung darstellt?
Werden Dialogsysteme neben modernen Lösungen wie Speech2Text weiter bestehen? Und wenn ja – wird sich der freie Dialog durchsetzen?
***