18.06.2019

„Sprachsteuerung ist ein Werkzeug ohne Erklärungsbedarf“

Immer mehr Unternehmen setzen auf digitale Sprachassistenten, die sich dank künstlicher Intelligenz (KI) rasant entwickelt haben. Über die Möglichkeiten, Anbieter, Gefahren und Chancen informieren die IoT Business Trends am 2. Juli in Düsseldorf. Dr. Andreas S. Rath, CEO und CTO der ONDEWO, wird dort genau darlegen, welche Sprachassistenten zurzeit angeboten werden und wie sie sich unterscheiden. Im Interview verrät er vorab, was sie so attraktiv macht und welche Risiken mit ihnen einhergehen.

Herr Dr. Rath, was macht Sprachsteuerung auf Basis von KI eigentlich so attraktiv?

Sprachsteuerung ist ein Werkzeug ohne Erklärungsbedarf. Sie ermöglicht uns Menschen, mit einem komplexen System so einfach zu interagieren wie mit einem Bekannten in einem lockeren Gespräch. Die große Herausforderung in der Sprachsteuerung ist das „richtige Verstehen“ und hier konnten mithilfe von KI in den letzten Jahren beträchtliche Fortschritte erzielt werden. Das gilt sowohl für den Bereich „Verstehen“ des Gesprochenen, sprich Transkription von Audio zu Text, als auch für die inhaltliche Interpretation des Textes.

Früher wurde in beiden Bereichen mit regelbasierten Ansätzen gearbeitet, das heißt, für jede Sprache wurden mit großem Arbeitsaufwand Regeln manuell erstellt. Heutzutage übernehmen neuronale Netze diese Arbeit und lernen aus großen Datenmengen die Regeln automatisch. Wir fokussieren uns bei ONDEWO auf die Entwicklung von KI-Algorithmen, die die besten Erkennungsraten zum „besseren Verstehen“ liefern.

Welche Risiken gibt es Ihrer Meinung nach beim Einsatz von Sprachassistenten?

Sprachassistenten bieten durch die einfache Handhabung viele Vorteile für Jung und Alt. Eines der Risiken ist das „Nichtverstehen“ beziehungsweise „Falschverstehen“. Dies sorgt für ein Schmunzeln, wenn der digitale Sprachassistent den Franz statt den Hans anruft oder Sie mit einem falschen Mitarbeiter eines Unternehmens im Call Center verbunden werden. Bei Anwendungen im Gesundheitsbereich, zum Beispiel in der Altenbetreuung, wenn ein Notruf abgesetzt werden soll, oder im Bankenbereich, wenn eine Transaktion durchgeführt werden soll, ist das schon etwas ganz anderes.

Ein weiteres Risiko ist natürlich die Privatsphäre. Allerdings wird diesbezüglich sehr intensiv an Möglichkeiten gearbeitet, die Erkennung auf dem Gerät selbst erfolgen zu lassen, sodass keine Daten mehr über das Internet an die Anbieter übertragen werden müssen.

Alexa, Siri und Co. – wo sehen Sie bei den Angeboten Gemeinsamkeiten, wo Unterschiede?

Sie alle sind digitale Sprachassistenten, die unser Leben leichter machen wollen und die sogenannte Skills anbieten, die uns Menschen den einen oder anderen Wunsch erfüllen können: vom Abspielen von Musik über das Einschalten des Lichts und des Vorlesens der News bis hin zum Stellen des Weckers.

Diese Aufgaben werden von allen schon sehr gut erledigt. Beim genaueren Hinsehen ist die Anzahl an Skills jedoch unterschiedlich groß und es wird sich in den nächsten Jahren noch zeigen, welche Plattform sich hier durchsetzen wird.

Zudem wird es spannend zu beobachten sein, wie Hardware-Hersteller von Mobiltelefonen oder Fernsehgeräten, die teilweise eigene digitale Assistenten bauen (zum Beispiel Bixie von Samsung), sich in dem derzeit von Google, Amazon und anderen dominierten Markt entwickeln und positionieren werden.

Wo oder bei welcher Gelegenheit würden Sie sich persönlich einen Sprachassistenten wünschen?

In jeder Gelegenheit, natürlich immer mit der Option, ihn ausschalten zu können.

Foto: Copyright ONDEWO GmbH

Dr. Andreas S. Rath