Die Zukunft hat begonnen!

 
Interview mit Lars Stevenson, Geschäftsführer HMI Human Machine Intelligence GmbH

lars_stevenson_hmi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 
In unserem Interview präsentiert Lars Stevenson, Geschäftsführer des in Heidelberg ansässigen Unternehmens HMI – Human Machine Intelligence – u.a. die Produkte zur automatisierten und halbautomatisierten Bearbeitung von FAQs.

 
VOICE Community: Herr Stevenson, geben Sie uns doch zu Beginn einen kurzen Abriss: Wer ist HMI und welche Dienstleistungen bietet das Unternehmen?

Lars Stevenson: HMI ist in erster Linie ein Entwicklungshaus und im Bereich der Forschung und Entwicklung zum Thema Sprachverständnis angesiedelt. HMI entwickelt und vertreibt Produkte in Form von Applikationen zur Gerätesteuerung bis hin zur natursprachlichen Interaktion mit Anrufern, die in den Bereichen Callcenter, Automotive und Mobile zum Einsatz kommen.

VOICE Community: Im Bereich der Callcenter beispielsweise bietet HMI u.a. FAQ-Automatisierung. Was muss man sich darunter vorstellen?

Lars Stevenson: In jedem Servicecenter taucht in der Regel eine gewisse Anzahl an Fragen immer wieder auf, die inhaltlich auf das Gleiche abzielen – seien es nun Fragen nach der Rechnung, nach Mahnungen oder ob DSL für eine bestimmte Straße verfügbar ist. 80 Prozent aller Anrufe in einem Callcenter reflektieren auf 20 bis 120 Fragestellungen – je nach Komplexität des Anwendungsfalls. Für diese FAQs und deren automatisierte Bearbeitung stellt HMI zwei Produkte zur Verfügung: Den Silent-Agent und den Dialog-Agent.

Der Dialog-Agent ist ein für den Nutzer wahrnehmbares Dialogsystem, das seine Anfrage vollautomatisch bearbeitet. Der Silent-Agent unterstützt den Live-Agenten im Callcenter bei der Bearbeitung der Anfrage.

Beim Dialog-Agent erläutere ich am Telefon – ganz natursprachlich – mein Anliegen, oder stelle meine Frage, ohne darüber nachdenken zu müssen, bestimmte Kommandos oder Keywords zu verwenden bzw. bestimmte Tasten zu drücken. Das heißt unser Dialog-Agent macht einen intuitiven Mensch-Maschine-Dialog möglich.

VOICE Community: Das bedeutet, der Anrufer kann seine Frage frei äußern und das System matcht die Anfrage auf die FAQs, die beim Unternehmen hinterlegt sind?

Lars Stevenson: Genau! Und es matcht auf die Wissensdatenbanken, die wir mittlerweile dynamisch verarbeiten können – mit entsprechenden Parsern, die wir dafür gebaut haben. Denn wenn ich eine Wissens- oder Prozessdatenbank habe, die auch veränderlich ist, muss ich permanent dynamisch dieses Wissen zur Verfügung stellen.

VOICE Community: Durch den permanenten dynamischen Abgleich mit der Datenbank berücksichtigt das System alle Kanäle, über die etwas über den Kunden hereingekommen ist, beispielsweise auch über E-Mail? Das System ist also multichannelfähig?

Lars Stevenson: Ja genau. Neben dem Silent- und dem Dialog-Agent gibt es noch unseren so genannten Data-Agent. Der ist für alles rund um den Datenbereich zuständig. Für uns ist das Thema Spracherkennung – was wir jetzt zum Sprachverständnis veredeln – an sich nur ein Helfer, um ein Audio in einen Text umzuwandeln. Dort liegt die Hauptkompetenz unseres Unternehmens. Der Data-Agent ist im Prinzip der, der den Sinn einer Anfrage reflektiert. Damit lässt sich ermitteln, was der Kunde für ein Anliegen hat und vor allem, in welchem Kontext es steht.

Ein Beispiel: Ein Kunde ruft an und möchte sich nach einer Mahnung erkundigen, die ihm zugestellt wurde. Jetzt hat der Kunde aber nicht nur einen Festnetz-, sondern auch noch einen DSL-Anschluss bei diesem Anbieter. Da der Kunde seine Anfrage aber ganz allgemein formuliert hat, müsste das System hier nachfragen, ob es sich um den Festnetz- oder den DSL-Anschluss handelt. Es kann aber auch selbständig in den Daten nachschauen, ob irgendwo eine Mahnung vorliegt. Und wenn es dann feststellt, aha, es gibt nur eine Mahnung für den Festnetzanschluss, dann kann es automatisch schließen, welche Mahnung der Anrufer gemeint hat.

Das System füttert sich also nicht nur durch den User-Input, sondern auch durch den Datenbankabgleich. Das ist so eine typische Geschichte, die wir zur Veredelung von Datenbanksuchen einsetzen. Noch einmal auf den Punkt gebracht: Der Data-Agent ist eigentlich dafür zuständig, aus einem Text oder einer phonetischen Information, den Sinn, den Zusammenhang, den Kontext, die Relationen rauszuziehen und das mit dynamischen Datenbanken zu vergleichen.

VOICE Community: Ist der Data-Agent auch zuständig für die reine Erkennung, für die Verschriftung?

Lars Stevenson: Nein, die Spracherkennung ist dem vorgelagert. Den gesamten Prozess möchte ich jetzt hier nicht im Detail erläutern. Nur soviel: Wir durchlaufen einen rekursiven Erkennungsprozess und nutzen dafür unser umfangreiches Sprachlexikon mit phonetischer Information, in dem allein für die deutsche Sprache über 1,2 Millionen Varianten hinterlegt sind.

Das Erkennerergebnis wird parallel immer wieder gegen den Data-Agent abgeglichen. Damit wird das Ergebnis erheblich reduziert und verbessert. Im Data-Agent steckt eigentlich das Hauptknowhow, denn hier erfahren wir: Was meint der Anrufer eigentlich. Und dieses Wissen nutzen wir einerseits für den Dialog-Agent, der dann direkt antwortet oder aber andererseits für den Silent-Agent, der den Callcenter-Agenten unterstützt.

VOICE Community: Wie geht das System denn mit exotischen Fragen um, die zu den restlichen 20 Prozent gehören und keine FAQs sind?

Lars Stevenson: In der Regel, wenn die Erkennung unsicher ist, wird in einem zweiten Dialogschritt zuerst einmal nachgefragt, ganz klassisch: „Ich habe jetzt nicht genau verstanden, ob sich die Frage auf eine Gutschrift, eine Rechnung oder eine Mahnung bezieht.“ Damit wird das ganze eigentlich relativ schnell und relativ klar fokussiert.

Das heißt, das System ist am Anfang sehr offen, aber wenn es ein Problem gibt, so dass man noch einmal nachfragen muss, dann soll das so konkret wie möglich geschehen. Und wenn der Anrufer darauf mit einer konkreten Antwort reagiert, dann besteht nur noch eine sehr kleine mögliche Varianz – Gutschrift, Rechnung oder Mahnung – das kriegt man dann schon hin. Sollte es danach jedoch immer noch unklar sein, geben wir weiter an den Agenten. Der erhält auch das Audio des Anrufers, damit der Anrufer sein Anliegen nicht noch einmal vorbringen muss.

VOICE Community: Die zugrunde liegende Technologie des Silent-Agent ist im Grunde also die gleiche wie beim Dialog-Agent, nur die Oberfläche, also wie ich den Agenten einsetze, ist eine andere?

Lars Stevenson: Genau! Das eine – der Dialog-Agent – ist quasi vollautomatisch. Beim Silent-Agent hört der Nutzer nichts vom System. Der System-Output wird lediglich zur Unterstützung des Callcenter-Agenten eingesetzt. Ruft beispielsweise ein Kunde bei einer Event-Hotline an: „Ja hallo, ich würde ganz gern ein paar Konzertkarten buchen für das ACDC-Konzert nächste Woche“, dann poppt auf dem Agenten-Bildschirm ein Fenster auf: „Konzert von ACDC in der kommenden Woche komplett ausgebucht.“

Eine solche Anwendung hat ganz klare Vorteile: Ich spreche mit einem Menschen am Telefon – was für viele Endkunden noch immer ein sehr wichtiges Kriterium ist. Durch den Silent-Agent wird die Service-Qualität erheblich verbessert, denn der Callcenter-Mitarbeiter wird durch seine Arbeitsabläufe geführt, indem der Silent-Agent ihm die benötigten Informationen und die nächsten nötigen Schritte auf dem Bildschirm präsentiert. So weiß der Agent genau, was zu tun ist. Dadurch wird natürlich der Zeitaufwand auch erheblich reduziert: Wir haben jetzt gerade das erste größere Projekt in diesem Bereich abgeschlossen, und wir haben um über 32 Prozent kürzere Haltezeiten erreicht. Das ist eine hohe Effizienzsteigerung – über 32 Prozent – da waren wir selber überrascht!

VOICE Community: Will man also seinen Endkunden keine IVR „zumuten“, kann zur teilautomatisierten Bearbeitung der Silent-Agent eingesetzt werden?

Lars Stevenson: Richtig! Darüber hinaus kann der Silent-Agent zur internen Qualitätssicherung im Callcenter verwendet werden, Stichwort „Speech-Analytics“. Wir können zwar keine Emotionen erkennen – das ist nicht unser Business. Aber wir können beispielsweise extrahieren, was und wie schnell ein Agent geantwortet hat.

VOICE Community: Der Bedarf für derartige Systeme ist ja sicherlich groß. Jedes Unternehmen muss mit FAQs also mit Fragen, die häufig gestellt werden, umgehen. Gibt es denn spezielle Unternehmen oder Branchen, für die diese Dienstleistung besonders interessant ist?

Lars Stevenson: Unsere Systeme sind für jedes Dialog-orientierte Unternehmen interessant, besonders für Unternehmen, die im Servicebereich tätig sind, die mit Endkunden zu tun haben: Telekommunikation, Stromerzeuger usw. Aber auch der Bereich Human Resources – daran hat sich außer uns bisher noch keiner getraut, weil die Komplexität der Fragen hier recht hoch ist. Aber genau da liegt ja unsere Stärke: Die Erkennung verbessern durch die Betrachtung eines ganzen Satzes. Die Stärken der Lingua-Agent Produktreihe kommen nicht so sehr zum tragen, wenn ich nur ein einzelnes Wort sagen kann.

VOICE Community: Gibt es denn neben dem Silent-Agent und dem Dialog-Agent noch weitere Dienstleistungen auf die die Technologie von HMI angewendet werden könnte?

Lars Stevenson: Ja, auf das gesamte nicht-telefonische Kundenmanagement. Das betrifft eben vor allem die Abwicklung von E-Mail-Anfragen, das betrifft aber auch die Bearbeitung von Brief-Anfragen, die per OCR digitalisiert werden. Hier befinden wir uns gerade im Aufbau einer Partnerschaft mit Unternehmen, die im OCR-Bereich spezialisiert sind und das auch als Dienstleistung anbieten.

Aus digitalisierten Kündigungsschreiben beispielsweise lässt sich neben den entsprechenden persönlichen Daten wie Name und Adresse auch herausziehen: Warum wurde gekündigt und zu welchem Termin wurde gekündigt? Diese Informationen können dann automatisch mit den Datensätzen und der Prozesskette des Kunden abgeglichen werden. Dem Endkunden wird dann nur noch die Kündigungsbestätigung zugesandt. Es besteht ein sehr großes Interesse, diesen kompletten Prozess auch wirklich abzubilden. Und das ist eben auch ein Thema für unseren Data-Agent.

VOICE Community: Im Grunde ist HMI damit ein Fullservice-Dienstleister für alle Kundenkommunikationskanäle?

Lars Stevenson: Exakt. Weil das, was wir entwickelt haben, absolut generisch aufgesetzt ist. Unsere Produkte können problemlos in bestehende Landschaften eingebunden werden. Der Kunde muss nichts Neues anschaffen, sondern wir können bestehende IVRs durch Hinzunahme unserer Agent-Produktreihe hoch optimieren. Mittlerweile verfügen wir aber auch über eine eigene Sprachplattform.

VOICE Community: Zum Abschluss die Frage: Wo geht es zukünftig hin? Worauf arbeitet HMI zu? Welche Optimierungen sind geplant?

Lars Stevenson: Was wir in der zweiten Jahreshälfte nach draußen bringen wollen, ist das ganze Thema der parallel zur Eingabe stattfindenen Verarbeitung: Wir müssen also nicht mehr warten, bis der Kunde zu Ende gesprochen hat, sondern wir starten sofort mit der maschinellen Verarbeitung der Eingabe. Bei zeitgleicher Verarbeitung, noch während der User spricht, lässt sich zu jedem Zeitpunkt vorausbestimmen, was jetzt noch an Eingaben kommen kann oder muss. Das ganze verbessert die Erkennung enorm, denn es lassen sich so ganz gezielt Grammatiken vorladen oder generieren.

Momentan findet die Verarbeitung sequentiell statt. In Zukunft soll die Verarbeitung inkrementell durchgeführt werden – hin zu einer zeitgleichen Verarbeitung. Das ist sozusagen der nächste Evolutionsschritt.

Abgesehen von der Verbesserung des Erkennungsergebnisses, ergeben sich damit natürlich Vorteile für den Dialogablauf. Ich kann mich beispielsweise korrigieren, ohne noch einmal neu anfangen zu müssen. Das ist z.B. für die Adresseingabe sehr interessant oder aber für die Eingabe einer Kontonummer oder einer Bankleitzahl: „Ja, also meine Bankleitzahl ist 672 502, ach nee, das war ja 504 und dann die 00“. Das macht den Dialog noch intuitiver, noch natürlicher. So etwas geht aber eben nur dann, wenn man zeitgleich verarbeitet.

Die Korrektur einer Adresseingabe ist vor allem für Navigationssysteme interessant, wenn man beispielsweise sagt: „Ich möchte gern nach Leipzig zum Flughafen, äh quatsch, zum Bahnhof.“ Im Normalfall würde das System sagen: „Ich habe Sie leider nicht verstanden“ und man müsste noch einmal von vorn anfangen. Bei gleichzeitiger Verarbeitung nicht.
Das sind so Kleinigkeiten, wie sich diese Technologie im Handling auswirkt. Wo sich diese Technologie viel stärker auswirken wird – da haben wir gemeinsam mit einem Forschungspartner schon die ersten Versuche gemacht – ist eben das Thema der Erkennungsverbesserung.

VOICE Community: Ist noch viel Überzeugungsarbeit zu leisten? Sind Ihre Kunden noch ungläubig, das ein solches System funktioniert?

Lars Stevenson: Ja, das ist richtig. Das glaubt dir erst einmal keiner. (lacht) Aber man muss schon sagen, es gibt doch einige Kunden am Markt, die nicht so glücklich sind, mit ihren Sprachportalen und die sich auch nicht vorstellen können, wie man das verbessern kann. Insofern hilft es dabei immer zu sagen: Okay hier ist eine Nummer, ruf da einfach einmal an und probier das ganze aus. Oder aber man trifft entsprechende Vereinbarung: Wir garantieren dir, dass das System genau so funktioniert, ansonsten musst du keinen Pfennig bezahlen. Damit kommt man dann eigentlich wieder ganz gut voran.

Aber der Bedarf am Markt ist extrem hoch. Das Thema Effizienzsteigerung, Erreichbarkeit und Kundenzufriedenheit lassen sich mit unseren Produkten Silent-Agent und Data-Agent sehr gut angehen. Der Dialog-Agent geht eben eher in die Richtung der Standard-IVRs, die die meisten Kunden schon kennen. Da hört man dann öfter: „Ah, funktioniert das dann auch richtig?“ Während man beim Silent-Agent ganz cool sagen kann: „Also, wenn es mal nicht funktionieren sollte, kriegt der Endkunde davon nichts mit.“ Und ist der Kunde vom Silent-Agent überzeugt, kann man für bestimmte Bereiche dann auch in den Dialog-Agent umswitchen.

VOICE Community: Herr Stevenson, vielen Dank für das Gespräch.



Lars Stevenson ist seit 1989 selbstständig und in der IT Technologie quasi aufgewachsen. Nach 14 Jahren in der klassischen Hard- und Software-Technologie mit Unternehmen im In- und Ausland zog ihn seine Begeisterung für die Mensch-Maschine-Interaktion in die Welt der Sprachtechnologie. Als Gründer der HMI Human Machine Intelligence GmbH realisiert er seinen Traum die Bedienung von Technik und die digitale Kommunikation effektiv, emotional und menschlich zu gestalten – um dem Menschen mehr Zeit zu geben für die “wirklich wichtigen” Dinge im Leben.

Share and Enjoy:
  • Print
  • Facebook
  • LinkedIn
  • Twitter
  • del.icio.us
  • email

Kommentieren

Spam protection by WP Captcha-Free