Sprachschnittstelle Sprache erobert die Mensch-Maschine-Schnittstelle

Von Ines Stotz

Anbieter zum Thema

Sprache vereinfacht das Leben, spart Zeit und senkt Kosten – diese Vision hat Vivoka mit der Entwicklung einer intuitiven Sprachtechnologie umgesetzt. Das französische Start-up verspricht, dass damit jedes Unternehmen schnell und einfach eine Sprachlösung entwickeln kann, die sich an jede Maschine oder Gerät anpassen lässt.

Sprachkommunikation wird zunehmend Teil unseres täglichen Lebens – eine Technologie mit großem Potenzial, das gerade erst erkennbar wird. Start-up Vivoka richtet sich mit seiner Sprachtechnologie an alle Unternehmen, die ein Gerät mit einer Sprachschnittstelle ausstatten möchten, um die Mensch-Maschine-Interaktion zu erleichtern und zu vereinfachen.
Sprachkommunikation wird zunehmend Teil unseres täglichen Lebens – eine Technologie mit großem Potenzial, das gerade erst erkennbar wird. Start-up Vivoka richtet sich mit seiner Sprachtechnologie an alle Unternehmen, die ein Gerät mit einer Sprachschnittstelle ausstatten möchten, um die Mensch-Maschine-Interaktion zu erleichtern und zu vereinfachen.
(Bild: ©peterschreiber.media – stock.adobe.com)

Technologien zur Sprach- und Stimmerkennung sollen bis 2026 einen Marktwert von 22 Milliarden Dollar erreichen und damit alle Branchen der Industrie revolutionieren – von der Fertigung, Robotik, Logistik bis hin zu Augmented Reality und das IoT.

Mit seiner spezialisierten Software, dem „Voice Development Kit“ ist Vivoka ein wichtiger Akteur im Bereich der Spracherkennung geworden. Das Sprachentwicklungskit soll es Unternehmen erleichtern, Sprache in ihre Geräte zu integrieren sowie unter anderem Fertigungs- und Logistikprozesse zu beschleunigen oder auch medizinische Geräte durch intuitive Sprachsteuerung und ohne den Einsatz der Hände zu bedienen. Sei es durch Text-to-Speech, Speech-to-Text oder Voice Biometry – das Unternehmen bietet auf dem Gebiet der Spracherkennung DSGVO-konforme Embedded-Lösungen an.

Bildergalerie

Über das Voice Development Kit

Das Voice Development Kit (VDK) ist ein All-in-One-Softwareentwicklungskit, das mit einer intuitiven grafischen Benutzeroberfläche kombiniert ist und entwickelt wurde, um Sprachschnittstellen zu schaffen. Entwickler können damit in kurzer Zeit, eine Offline-Sprachlösung konfigurieren, die aus einer oder mehreren sprachbasierten Technologien (z. B. Transkription, Synthese, Biometrie) besteht.

Die Vorteile gegenüber anderen Anwendungen bestehen vor allem, aber nicht nur, in der Offline-Nutzung, den Datenschutzvorkehrungen oder der niedrigen Latenz.

Die VDK-Technologien sind so konzipiert, dass sie auch an abgelegenen Standorten oder in Umgebungen mit schlechter Konnektivität funktionieren. Sie werden lokal und auf dem Gerät ausgeführt, ohne dass Sprachdaten der Endbenutzer in die Cloud übertragen werden. Sensible Daten gelangen also nicht ins Netz und die per Vivoka-Technologie sprachgesteuerte Maschinen und Geräte funktionieren auch ohne Konnektivität.

Ziel der Entwicklung war, jedem Unternehmen die Möglichkeit zu geben, Sprachschnittstellen einfach und schnell auf jedem Gerät einzusetzen.

„Schließlich ist heute Geschwindigkeit in der Ausführung die oberste Priorität für Unternehmen”, begründet William Simonin, CEO bei Vivoka, die Entwicklung. Deshalb würden sich immer mehr Unternehmen dynamische, eingebettete Spracherkennungsfunktionen wünschen, die über die Cloud-gebundenen Consumer-Angebote von Tech-Giganten wie Google oder Amazon hinausgehen, um ihr eigenes Spracherlebnis zu besitzen oder zu vermarkten.

Sprachentwicklungskit soll jetzt auch in Deutschland Fuß fassen

„Unsere neue Version des Voice Development Kits stellt einen wichtigen Meilenstein für unser Produkt dar. Mit der Version VDK 4.0 gibt es einen schnelleren, einfacheren und effizienteren Weg, eine Sprachschnittstelle zu entwickeln”, erklärt Simonin. Damit möchte der Pionier der Spracherkennung nun auch den deutschen Industriemarkt erobern und hatte das Kit bereits auf der Hannover Messe präsentiert.

Das neue VDK V4.0

Das Update zum VDK 3.0 verfügt über eine noch intuitivere Benutzeroberfläche. So gibt es beispielsweise eine Funktion, mit der automatisch eine Reihe von Tests mit einer ASR (Automatic Speech Recognition) durchgeführt werden können, um zu sehen, ob sie sich wirklich wie erwartet verhält und die richtigen Sätze erkennt. Dies wird die Erstellung, aber auch die Pflege der Sprachschnittstelle erleichtern und unerwünschte Rückschritte vermeiden. Für die Anwender bedeutet dies eine schnellere Prüfung, Integration und Bereitstellung. So können sie ihren eigenen eingebetteten Sprachassistenten an einem einzigen Tag implementieren.

Vivoka hat auch das Backend verbessert und ein neues System implementiert, das die Wartung und Verbesserung der Lösung erleichtert und ermöglichen wird, VDK-Studio auf MacOsX verfügbar zu machen.

„Wir sind stolz auf unsere Entwicklung des ersten und einfachsten Sprachassistenten. Er bietet eine Abstraktionsebene, die es unseren Kunden ermöglicht, sich auf das zu konzentrieren, was sie tun wollen, und nicht darauf, wie sie es tun sollen. Die Erstellung einer Sprachschnittstelle wird so zum Kinderspiel”, fasst Simonin zusammen.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Ergänzendes zum Thema
Nachgefragt:

Wie entwickelt sich generell der Markt für Sprachtechnologien und welche Zielgruppen haben Sie besonders im Blick?

Der globale Markt für Sprachtechnologien boomt, Sprache gibt es heute überall. In Anbetracht der Tatsache, dass Vivoka mit seinem VDK in der Lage ist, die gesamte technische Wertschöpfungskette in eingebetteter Form und in 40 Sprachen anzubieten, denken wir, dass es Schlüsselmärkte gibt, die wir ansprechen wollen und die ein wachsendes Potenzial haben: Smartglasses sowie Voice Picking & Appliance.

Welche Vision steckt hinter Vivoka?

Wir sehen Spracherkennungen überall um uns herum – im Auto, per Telefon, Computer, Fernbedienungen – und das ist nur die Spitze des Eisbergs. In Zukunft werden intelligentere Sprachassistenten einen noch einfacheren Zugang zu verschiedenen Systemen ermöglichen, unabhängig von der Sprache und dem Akzent des Benutzers. Zudem wird ihre Proaktivität ihnen ermöglichen, einen echten Platz als Assistenten im Alltag einzunehmen. So wird Zeit eingespart und unser Komfort drastisch verbessert werden.

Wo liegen die Vorteile Ihrer Technologie und was unterscheidet Sie von anderen Anbietern?

Erstens haben wir die erste Software entwickelt, mit der man auf die einfachste Weise, die es heute gibt, eine Sprachschnittstelle erstellen kann.

Zweitens sind alle unsere Technologien offline, was nicht nur bedeutet, dass die Daten unserer Nutzer und Kunden vollkommen geschützt sind, sondern auch, dass der Assistent immer funktioniert, selbst an Orten, an denen es keinen Internetzugang gibt.

Schließlich bieten wir 42 Sprachen an, was uns direkt eine internationale Reichweite ermöglicht, ohne dass zusätzliche Entwicklung oder Daten erforderlich sind.

Ausblick: Wo geht die Entwicklung hin?

Wir werden sehr bald eine neue Version unserer Technologie ankündigen, die auf künstlicher Intelligenz basiert und es ermöglicht, dass Assistenten ohne Internet genauso leistungsfähig sind wie Assistenten, die mit der Cloud verbunden sind!

Ergänzendes zum Thema
Die Entwicklung des gesprochenen Worts

William Simonin gehört im Jahr 2022 zu den französischen Forbes 30 unter 30. Er ist studierter Informatiker und Absolvent der Epitech sowie der University of Kent. 2015 gründete er das Start up Vivoka. Mittlerweile kann das Unternehmen auf sechs Jahre Erfahrung auf dem Gebiet der Sprachtechnologien zurückblicken. Es erhielt mehrere Auszeichnungen, darunter zwei CES Innovation Awards.

(ID:48522573)