Sprache erobert die Mensch-Maschine-Schnittstelle

Sprachschnittstelle Sprache erobert die Mensch-Maschine-Schnittstelle

08.08.2022 Von Ines Stotz

Anbieter zum Thema

Turck_Your_Global_Automation_Partner.jpg ()

Sprache vereinfacht das Leben, spart Zeit und senkt Kosten – diese Vision hat Vivoka mit der Entwicklung einer intuitiven Sprachtechnologie umgesetzt. Das französische Start-up verspricht, dass damit jedes Unternehmen schnell und einfach eine Sprachlösung entwickeln kann, die sich an jede Maschine oder Gerät anpassen lässt.

Sprachkommunikation wird zunehmend Teil unseres täglichen Lebens – eine Technologie mit großem Potenzial, das gerade erst erkennbar wird. Start-up Vivoka richtet sich mit seiner Sprachtechnologie an alle Unternehmen, die ein Gerät mit einer Sprachschnittstelle ausstatten möchten, um die Mensch-Maschine-Interaktion zu erleichtern und zu vereinfachen.(Bild: ©peterschreiber.media – stock.adobe.com) — Sprachkommunikation wird zunehmend Teil unseres täglichen Lebens – eine Technologie mit großem Potenzial, das gerade erst erkennbar wird. Start-up Vivoka richtet sich mit seiner Sprachtechnologie an alle Unternehmen, die ein Gerät mit einer Sprachschnittstelle ausstatten möchten, um die Mensch-Maschine-Interaktion zu erleichtern und zu vereinfachen.
(Bild: ©peterschreiber.media – stock.adobe.com)

Technologien zur Sprach- und Stimmerkennung sollen bis 2026 einen Marktwert von 22 Milliarden Dollar erreichen und damit alle Branchen der Industrie revolutionieren – von der Fertigung, Robotik, Logistik bis hin zu Augmented Reality und das IoT.

Mit seiner spezialisierten Software, dem „Voice Development Kit“ ist Vivoka ein wichtiger Akteur im Bereich der Spracherkennung geworden. Das Sprachentwicklungskit soll es Unternehmen erleichtern, Sprache in ihre Geräte zu integrieren sowie unter anderem Fertigungs- und Logistikprozesse zu beschleunigen oder auch medizinische Geräte durch intuitive Sprachsteuerung und ohne den Einsatz der Hände zu bedienen. Sei es durch Text-to-Speech, Speech-to-Text oder Voice Biometry – das Unternehmen bietet auf dem Gebiet der Spracherkennung DSGVO-konforme Embedded-Lösungen an.

Bildergalerie

Das All-in-One-Softwareentwicklungskit, ist mit einer intuitiven grafischen Benutzeroberfläche kombiniert.(Bild: Vivoka)

Das Voice Development Kit unterstützt über 40 Sprachen.(Bild: Vivoka)

Über das Voice Development Kit

Das Voice Development Kit (VDK) ist ein All-in-One-Softwareentwicklungskit, das mit einer intuitiven grafischen Benutzeroberfläche kombiniert ist und entwickelt wurde, um Sprachschnittstellen zu schaffen. Entwickler können damit in kurzer Zeit, eine Offline-Sprachlösung konfigurieren, die aus einer oder mehreren sprachbasierten Technologien (z. B. Transkription, Synthese, Biometrie) besteht.

Die Vorteile gegenüber anderen Anwendungen bestehen vor allem, aber nicht nur, in der Offline-Nutzung, den Datenschutzvorkehrungen oder der niedrigen Latenz.

Die VDK-Technologien sind so konzipiert, dass sie auch an abgelegenen Standorten oder in Umgebungen mit schlechter Konnektivität funktionieren. Sie werden lokal und auf dem Gerät ausgeführt, ohne dass Sprachdaten der Endbenutzer in die Cloud übertragen werden. Sensible Daten gelangen also nicht ins Netz und die per Vivoka-Technologie sprachgesteuerte Maschinen und Geräte funktionieren auch ohne Konnektivität.

Ziel der Entwicklung war, jedem Unternehmen die Möglichkeit zu geben, Sprachschnittstellen einfach und schnell auf jedem Gerät einzusetzen.

„Schließlich ist heute Geschwindigkeit in der Ausführung die oberste Priorität für Unternehmen”, begründet William Simonin, CEO bei Vivoka, die Entwicklung. Deshalb würden sich immer mehr Unternehmen dynamische, eingebettete Spracherkennungsfunktionen wünschen, die über die Cloud-gebundenen Consumer-Angebote von Tech-Giganten wie Google oder Amazon hinausgehen, um ihr eigenes Spracherlebnis zu besitzen oder zu vermarkten.

Sprachentwicklungskit soll jetzt auch in Deutschland Fuß fassen

„Unsere neue Version des Voice Development Kits stellt einen wichtigen Meilenstein für unser Produkt dar. Mit der Version VDK 4.0 gibt es einen schnelleren, einfacheren und effizienteren Weg, eine Sprachschnittstelle zu entwickeln”, erklärt Simonin. Damit möchte der Pionier der Spracherkennung nun auch den deutschen Industriemarkt erobern und hatte das Kit bereits auf der Hannover Messe präsentiert.

Mit der Macht der Wort Maschinen steuern. (©ra2 studio - stock.adobe.com)

Das neue VDK V4.0

Das Update zum VDK 3.0 verfügt über eine noch intuitivere Benutzeroberfläche. So gibt es beispielsweise eine Funktion, mit der automatisch eine Reihe von Tests mit einer ASR (Automatic Speech Recognition) durchgeführt werden können, um zu sehen, ob sie sich wirklich wie erwartet verhält und die richtigen Sätze erkennt. Dies wird die Erstellung, aber auch die Pflege der Sprachschnittstelle erleichtern und unerwünschte Rückschritte vermeiden. Für die Anwender bedeutet dies eine schnellere Prüfung, Integration und Bereitstellung. So können sie ihren eigenen eingebetteten Sprachassistenten an einem einzigen Tag implementieren.

Vivoka hat auch das Backend verbessert und ein neues System implementiert, das die Wartung und Verbesserung der Lösung erleichtert und ermöglichen wird, VDK-Studio auf MacOsX verfügbar zu machen.

„Wir sind stolz auf unsere Entwicklung des ersten und einfachsten Sprachassistenten. Er bietet eine Abstraktionsebene, die es unseren Kunden ermöglicht, sich auf das zu konzentrieren, was sie tun wollen, und nicht darauf, wie sie es tun sollen. Die Erstellung einer Sprachschnittstelle wird so zum Kinderspiel”, fasst Simonin zusammen.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.

Ergänzendes zum Thema

Nachgefragt:

William Simonin, CEO bei Vivoka: „Alle unsere Technologien funktionieren offline.“(Bild: Vivoka) — William Simonin, CEO bei Vivoka: „Alle unsere Technologien funktionieren offline.“
(Bild: Vivoka)

Wie entwickelt sich generell der Markt für Sprachtechnologien und welche Zielgruppen haben Sie besonders im Blick?

Der globale Markt für Sprachtechnologien boomt, Sprache gibt es heute überall. In Anbetracht der Tatsache, dass Vivoka mit seinem VDK in der Lage ist, die gesamte technische Wertschöpfungskette in eingebetteter Form und in 40 Sprachen anzubieten, denken wir, dass es Schlüsselmärkte gibt, die wir ansprechen wollen und die ein wachsendes Potenzial haben: Smartglasses sowie Voice Picking & Appliance.

Welche Vision steckt hinter Vivoka?

Wir sehen Spracherkennungen überall um uns herum – im Auto, per Telefon, Computer, Fernbedienungen – und das ist nur die Spitze des Eisbergs. In Zukunft werden intelligentere Sprachassistenten einen noch einfacheren Zugang zu verschiedenen Systemen ermöglichen, unabhängig von der Sprache und dem Akzent des Benutzers. Zudem wird ihre Proaktivität ihnen ermöglichen, einen echten Platz als Assistenten im Alltag einzunehmen. So wird Zeit eingespart und unser Komfort drastisch verbessert werden.

Wo liegen die Vorteile Ihrer Technologie und was unterscheidet Sie von anderen Anbietern?

Erstens haben wir die erste Software entwickelt, mit der man auf die einfachste Weise, die es heute gibt, eine Sprachschnittstelle erstellen kann.

Zweitens sind alle unsere Technologien offline, was nicht nur bedeutet, dass die Daten unserer Nutzer und Kunden vollkommen geschützt sind, sondern auch, dass der Assistent immer funktioniert, selbst an Orten, an denen es keinen Internetzugang gibt.

Schließlich bieten wir 42 Sprachen an, was uns direkt eine internationale Reichweite ermöglicht, ohne dass zusätzliche Entwicklung oder Daten erforderlich sind.

Ausblick: Wo geht die Entwicklung hin?

Wir werden sehr bald eine neue Version unserer Technologie ankündigen, die auf künstlicher Intelligenz basiert und es ermöglicht, dass Assistenten ohne Internet genauso leistungsfähig sind wie Assistenten, die mit der Cloud verbunden sind!

Ergänzendes zum Thema

Die Entwicklung des gesprochenen Worts

William Simonin gehört im Jahr 2022 zu den französischen Forbes 30 unter 30. Er ist studierter Informatiker und Absolvent der Epitech sowie der University of Kent. 2015 gründete er das Start up Vivoka. Mittlerweile kann das Unternehmen auf sechs Jahre Erfahrung auf dem Gebiet der Sprachtechnologien zurückblicken. Es erhielt mehrere Auszeichnungen, darunter zwei CES Innovation Awards.

Die Sprachsteuerung ergänzt HMI-Systeme um eine neue Dimension. Parallel zum GUI gesellt sich das SUI – Speech User Interface. (©lassedesignen - stock.adobe.com)

(ID:48522573)