Embedded Voice Control Die Macht der Worte: Per Sprachsteuerung Maschinen bedienen

Autor Sariana Kunze

Eine industrielle Sprachsteuerung verleiht der Mensch-Maschine-Interaktion eine neue Dimension. Sie eignet sich für Anwendungen, in denen eine dritte Hand hilfreich wäre. Industrie-PC Systeme in Kombination mit einem Sprachdialogsystem sind so in der Lage, die Maschinenbedienung zu vereinfachen.

Anbieter zum Thema

Maschinenbedienung per Sprachsteuerung: „Hallo Spectra, zeige mir den Füllstand an.“
Maschinenbedienung per Sprachsteuerung: „Hallo Spectra, zeige mir den Füllstand an.“
(Bild: Spectra)

Wir sprechen mit unseren Autos, Smartphones und Computern. Nahezu jeder Zweite nutzt einen smarten Sprachassistenten für den Dialog mit elektronischen Geräten. Aber wie sieht es im industriellen Umfeld aus? Wer spricht schon mit einer Maschine?

Ergänzendes zum Thema
Interview: „Sprache als dritte Hand bei der Maschinenbedienung“

Klaus Rottmayr ist Geschäftsführer bei Spectra.
Klaus Rottmayr ist Geschäftsführer bei Spectra.
( Bild: Spectra )

elektrotechnik AUTOMATISIERUNG: Mit Industrial Voice Control bieten Sie eine Sprachsteuerung für die Industrie an. Wie muss man sich diese Steuerung vorstellen? À la Siri oder Alexa?

Klaus Rottmayr: Sie dürfen sich unsere Industrial Voice Control Sprachsteuerung bezüglich der Bedienung gerne wie Siri oder Alexa vorstellen. Der große Unterschied liegt in der Funktionsweise: Es ist eine Embedded Lösung. Sie arbeitet offline, d.h. man benötigt keine Internetverbindung. Dadurch ist die Sicherheit und der Datenschutz gewährleistet. Es gibt auch keine zeitlichen Verzögerungen auf Grund der Verfügbarkeit und Bandbreite der Internetverbindung. Auch beim Dialog entscheidet der Kunde über die Funktionen, die per Sprache bedient werden. Sie beherrscht auch Umgangssprache – also NLU – Natural Language Understanding.

elektrotechnik AUTOMATISIERUNG: Können Sie Beispiele skizzieren, wann und wo eine Sprachsteuerung im industriellen Einsatz ideal wäre?

Klaus Rottmayr: Die Sprachsteuerung dürfen Sie als eine zusätzliche Dimension der Interaktion zwischen Mensch und Maschine verstehen. Der große Vorteil der Sprache im Vergleich zu einer Tastatur oder einem Touchscreen ist, dass es sich um eine gewohnte Art der Kommunikation handelt, die der Anwender nicht erst erlernen muss. Des Weiteren können komplexere Befehle über Sprache leichter eingegeben werden. Auch die Ausgabe von Informationen ist als gesprochener Text einfach zu erfassen, da wir automatisch zuhören. Ideal ist die Sprachsteuerung natürlich dort, wo der Anwender beide Hände für eine andere Tätigkeit benötigt. Hierbei fungiert die Sprache quasi als dritte Hand. Die berührungslose Bedienung hat zusätzliche Vorteile im schmutzigen Umfeld, bei Verwendung von Handschuhen oder auch im sterilen Bereich.

elektrotechnik AUTOMATISIERUNG: In welchen Umgebungen oder Anwendungen haben Sie Industrial Voice Control bereits getestet oder eingesetzt?

Klaus Rottmayr: Die Technologie der Sprachsteuerung ist grundlegend nichts Neues. Die Besonderheit der industriellen Sprachsteuerung ist die Interaktion mit der Maschine über MQTT – OPC UA in Vorbereitung. Unser Partner Voice Inter Connect hat bereits zahlreiche Anwendungen, wie z.B. Funktionssteuerung in Nutzfahrzeugen, Bedienung von Aufzügen oder Einstellung von medizinischen Geräten umgesetzt. Bei den Anwendungen unterscheiden wir zwischen den Embedded Lösungen, bei denen das Speech User Interface (SUI) bereits in der Entwicklung der Applikation eindesinged wird und den adaptiven Lösungen, bei denen die Sprachsteuerung nachträglich angedockt wird. In beiden Fällen ist die Geräuschkulisse wichtig, aber auch hierfür haben wir Lösungen, wie z.B. die automatische Spracherkennung (ASR – Automatic Speech Recognition) und die Geräuschunterdrückung.

elektrotechnik AUTOMATISIERUNG: Wie intelligent ist die Sprachsteuerung? Funktioniert die Spracheingabe nur mit vorgegebenen Befehlen?

Klaus Rottmayr: Zum einen ist die Sprachsteuerung für 30 Sprachen ausgelegt und für unterschiedliche Sprecher vorbereitet. Zum anderen gewährleistet die NLU-Technologie eine natürliche Spracherkennung, ohne dass eine genaue Syntax und Wortfolge eingehalten werden muss. Da aber mit einer Maschine kommuniziert wird, müssen bestimmte Wörter und deren Synonyme sowie die Interaktion mit der Maschine vorab definiert werden. Das kann der Anwender selbst mit einem Konfigurationstool vornehmen und jederzeit anpassen und erweitern. Dadurch ist gewährleistet, dass nur die Funktionen der Maschine per Sprache bedient werden können, die freigegeben wurden.

Spectra, Anbieter im Bereich Industrie-PC und Automation sowie Hersteller von Industrie-PC Systemen, und Voice Inter Connect, Spezialist für Intercom-Lösungen, industrielle Sprachsteuerungen sowie intelligente 3D Personensensorik, haben gemeinsam eine Lösung zur industriellen Sprachsteuerung entwickelt. Damit soll die Mensch-Maschine-Interaktion eine zusätzliche Dimension erhalten. Die Sprachsteuerung kann als dritte Hand eingesetzt werden sowie bei der Parallelisierung von manuellen Arbeits- oder Steuerungsprozessen mit Protokollierungsaufgaben. Besonders bei Applikationen, bei denen aus einer Vielzahl von Prozessparametern ausgewählt bzw. schnell oder in Echtzeit auf Funktionen zugegriffen werden muss, kann eine Sprachsteuerung die Arbeitsweise und Maschinenbedienung verbessern. Bei der Lösung, bestehend aus Spectra Powerbox PC bzw. Spectra Powertwin Panel PC und dem Viccontrol Sprachdialogsystem, erfolgt die Spracherfassung und -verarbeitung lokal und nicht in der Cloud. Die Definition des Wortschatzes erlaubt Genauigkeit sowie schnelle Sinnerfassung.

Industrial Usability Day Maschinen müssen einfach zu verstehen und bedienen sein – aber wie werden sie benutzerfreundlicher? Und was bringt die Usability? Auf dem Industrial Usability Day erfahren Anwender, wie sie die optimale Mensch-Maschine-Interaktion gestalten.
Mehr Infos: Industrial Usability Day

Sprachsteuerung für eine Applikation erstellen:

1. Anlernen

Die Erstellung der Sprachdiagnose erfolgt in einem webbasierten Entwicklungstool. Es wird die Landessprache und ein Aktivierungswort festgelegt. Für die Festlegung von Steuerungsaufgaben (Intents) und deren Wertebelegung (Slots) werden Beispiele definiert und die Schlüsselwörter sowie Slots manuell markiert.

2. Übersetzen

Das erstellte Projekt wird unter Verwendung von KI-basierten Verfahren kompiliert, auf Fehler geprüft und in einem Ressourcenpaket gespeichert. Zusätzlich werden Variationen der natürlichen Sprache hinzugefügt.

3. Übertragen

Das Ressourcenpaket wird auf den Industrie-PC übertragen.

4. Spracheingabe

Der Bediener kann angelernte Befehle in seiner natürlichen Sprache verwenden. Schlüsselworte dienen dazu, den Sprachdialog zu aktivieren. Erkannte Befehle werden dann über das Mikrofon weiterverarbeitet.

5. Steuern

Die Sprachkommandos sind mit einem MQTT-Kommando verknüpft, das entweder lokal durch die Maschinensteuerung verarbeitet oder über eine vorhandene Ethernetschnittstelle an die Maschine übertragen wird.

6. Sprachausgabe

Sobald von der Maschine ein MQTT-Event zurückkommt, kann das Event Funktionen im Dialog auslösen, z.B. als Bestätigung, Antwort oder Information zum Maschinenstatus.

(ID:45731916)