08.03.2017, 10:00 Uhr

Die Grenzen von Alexa, Siri, Spitch Co.

Das Start-up Spitch hat eine Spracherkennungstechnologie für Schweizerdeutsch entwickelt. Apples Siri kann mit den Dialekten nichts anfangen, ist aber teils auch eine gute Wahl.
Die Spracherkennungstechnologien von Amazon, Apple, Google und Microsoft geben einen Vorgeschmack auf das Computer-Interface der Zukunft. Der Rechner wird nicht mehr mit Fingern, Maus oder Tastatur bedient, sondern per Sprachbefehl. Obgleich Alexa, Siri & Co. bereits auf dem Markt sind, steckt die Technologie noch in den Anfängen. Denn es gibt diverse mehr oder weniger grosse Herausforderungen.
Für den Schweizer Markt ist die Spracherkennung bei Dialekten eines der grössten Probleme. Das Start-up Spitchhat sich dieser Herausforderung angenommen. Die Technik erkennt nach einem Training jeden Schweizer Dialekt, sagt Country Manager Jürg Schleier. Das Training ist allerdings die Krux, denn der Aufwand ist sehr hoch. Spitch basiert auf einer Datenbank, die pro Kunde individuell erweitert werden kann. Das hat Vor- und Nachteile. Einerseits können die Daten beim Kunden selbst platziert werden, was bei sensiblen Inhalten zum Teil erforderlich ist. Ausserdem können die Datenbanken mit kundenspezifischen Begriffen erweitert werden – oder eben mit Dialektworten aus den typischen Kundenkreisen. Laut Schleier ist die Spitch-Technologie auch in der Lage, selbst Walliserditsch zu verstehen, wenn die Datenbank entsprechende Begriffe enthält.

Dialekt und Wortschatz

Die Herausforderung ist bei Spitch, dass die Datenbank für jeden Kunden erst individuell erweitert werden muss. Dafür seien 80 bis 100 Stunden Sprachaufnahme erforderlich, sagt Schleier. Die Recordings müssen manuell annotiert werden, damit die Software zu kontextbezogenen und semantischen Interpretation fähig ist. Die Annotationen leistet entweder Spitch oder eine Gruppe von Linguisten. Nach Aussage des Country Managers sei das Crowdsourcing zwar günstiger, könne aber auch nur bei unsensiblen Inhalten angewendet werden. In beiden Fällen kommen Kosten im fünfstelligen Bereich auf den Auftraggeber zu. Sprachverarbeitung lohnt sich entsprechend erst ab mittelgrossen Unternehmen oder beispielsweise Call Centern. Immerhin: Mit der Spitch-Lösung können dem Computer (und der Datenverarbeitung) der Dialekt und die Fachbegriffe erschlossen werden. Mit Alexa, Cortrana und Siri müssen die User hochdeutsch sprechen und sind auf den Wortschatz beschränkt, den der Anbieter bereits kennt. Ergänzungen sind (noch) nicht möglich. Nächste Seite: Protokoll auf Bünder Tüütsch Eine weitere Herausforderung von Sprachverarbeitungslösungen ist die Export-Seite. Die Maschinen führen in den meisten Fällen selbständig Aktionen aus. Davon muss kein Protokoll geschrieben werden. In einigen Anwendungsfällen, zum Beispiel bei Trainings im Call Center, kann aber eine Dokumentation noch nützlich sein. Bei Beratungsgesprächen in Banken sind detaillierte Protokolle sogar Pflicht.  Bei wortwörtlichen Sprach-Ausgaben in Schwiizerdütsch stösst auch Spitch an seine Grenzen, denn die Software liefert XML in Hochdeutsch. Hier können Anbieter wie Acapela oder Slowsoft aushelfen, indem sie eine Ausgabe auch auf Schweizerdeutsch ermöglichen. Bei der Ausgabe auf Schwiizerdütsch stellt sich vor allem die Frage, in welchem Dialekt man den Berner, Basler oder Zürcher bedienen will. Bündner Tüütsch sei der allgemein am besten akzeptierte, sagt Schleier auf Züridütsch. Kunden in Deutschland haben dagegen sehr wenig Bedarf an Dialekt. Ihnen genügt in der Geschäftskommunikation üblicherweise Hochdeutsch.

Big Brother im Call Center

Beim Einsatz von Spracherkennungs-Software im Call Center muss der Arbeitnehmerschutz abgeklärt werden. Die Agenten werden zu Ausbildungs- und Qualitätssicherungszwecken heute stichprobenartig kontrolliert. Sprich: Ein Vorgesetzter hört in einige Kundengespräche hinein.  Mit einer Anwendung wie Spitch ist das Mitschneiden, Protokollieren und Verstehen sämtlicher Telefonate möglich, sagt Schleier. Die Technologie sei leistungsfähig genug, die Gespräche in Echtzeit auszuwerten. Wenn ein Kunde einen der Agent auf ein Konkurrenzprodukt anspricht und das Unternehmen für diesen Fall eine Verkaufsstrategie definiert hat, kann der Computer die Performance des Agenten bewerten. Dann kann entweder dem Telefonverkäufer durch eine Einblendung auf seinem Monitor auf die Sprünge geholfen oder der Vorgesetzte umgehend alarmiert werden. 


Das könnte Sie auch interessieren