Ist der Einsatz versteckter Agenten Betrug oder ein probates Mittel halbautomatisierter Sprachservices?
Vor kurzem geriet das Unternehmen SpinVox und seine Technologie, mit deren Hilfe Mailbox-Nachrichten automatisch in Text konvertiert werden sollen, in die Kritik. Ein Journalist hatte aufgedeckt, dass Mitarbeiter in erheblichem Maße an der manuellen Konvertierungen der Voicemails beteiligt waren. Die Streitfrage wurde nie restlos aufgeklärt, das Image des Unternehmens jedoch stark beschädigt.
Das Unternehmen selbst gibt an, seine Nutzerschaft nie darüber im Unklaren gelassen zu haben, dass eine gewisse “menschliche” Unterstützung der automatischen Konvertierung nötig werden kann. Den Nutzern allerdings schien dieses Detail nicht wirklich präsent zu sein. Die weitaus meisten gingen wohl von einem vollautomatisierten Dienst aus, wenngleich sich bald Zweifel an den zumeist fehlerfreien “automatischen” Transkriptionen einstellten:
“Sprecherunabhängig sollte der Dienst Nachrichten, die in durchaus reduzierter Sprachqualität übers Telefon auf dem Anrufbeantworter unserer Mobilmailbox landeten, in geschriebene Texte wandeln. Und es funktionierte so gut, dass wir an der technischen Errungenschaft zweifelten, spätesten als uns ein Kollege aus dem Ruhrpott den ‘Prolog im Himmel’ aus Goethes Faust I auf den Anrufbeantworter zitierte. SpinVox transkribierte fehlerfrei [...] Wir konnten uns es nur so erklären, dass jemand händisch alles nachbearbeitet. Was die automatische Spracherkennung nicht versteht, wird von Mitarbeitern abgehört und eingetippt.”
(Technik-Blog von Raymond Wiseman)
Recht hatten sie. Heute gibt SpinVox auf seiner Seite an, dass die dem Dienst zugrunde liegende Spracherkennungstechnologie D2 zwar “pretty smart” sei, aber: “it also knows what it doesn’t know and it is able to call on human experts for assistance.” Doch wie weit geht dieser menschliche Einsatz?
Dem Journalisten Milo Yiannopoulos von TechCrunch zufolge so weit, dass von seiner Testnachricht während einer offiziellen SpinVox-Demo nicht ein einziges Wort korrekt erkannt wurde und die gesamte Nachricht von einem Mitarbeiter transkribiert werden musste. Die auf diese Veröffentlichung folgenden Vorwürfe an SpinVox gingen in verschiedene Richtungen. Zum einen wurde das Unternehmen beschuldigt, hinsichtlich der Sprachtechnologie gemogelt und ein automatisches System präsentiert zu haben, das es so gar nicht gibt. Zum anderen wurde gegen das vermeintliche Abhören privater Nachrichten protestiert.
Als der technische Überflieger kann SpinVox damit wohl nicht mehr gelten. Dem Dienst selbst aber und der Usability kommt der Einsatz von Hidden Agents eher entgegen (abgesehen von den Datenschutzproblemen, die allerdings auch bei einem vollautomatisierten Service auftreten). Eine fehlerfreie Transkription von Goethes’ Faust – was will der Nutzer mehr? Darüber hinaus trägt die manuelle Korrektur automatisch transkribierter Daten dazu bei, den Erkenner sukzessive zu verbessern.
“The idea of hidden agents in contact center automation is to improve results, not impress the caller.”
- erklärt auch Bill Meisel im Spoken Communications Blog.
Und solange sich der Einsatz von Agenten zur Unterstützung der Spracherkennung lohnt – für den Nutzer und für den Betreiber – wieso dann darauf verzichten? Aus Nutzersicht jedenfalls ist ein solider halbautomatisierter Service sicher komfortabler als ein vollautomatisierter Service der kein Wort versteht.
….Und es ist im ünrigen jedem selbst überlassen, ob er diesen “Dienst” nutzen möchte oder nicht. Dafür muss die Öffentlichkeit natürlich auch darüber aufgeklärt sein, dass dabei auch Menschen am Werk sind