Optische Zeichenerkennung So lernen Maschinen lesen

Redakteur: Ines Stotz

Die maschinenbasierte, optische Erkennung von Text erlangt zunehmende Bedeutung in der Automatisierungsbranche: Entsprechende Technologien fördern im Rahmen einer selbstorganisierenden und digital vernetzten Produktion – Schlagwort Industrie 4.0 – den durchgängigen Informationsfluss in den Fertigungsprozessen. Einen besonderen Mehrwert für die optische Zeichenerkennung bietet hier die industrielle Bildverarbeitung.

Anbieter zum Thema

Automatische Syntaxprüfung und lexikon-basierte Korrekturen helfen, verschiedenste Zeichenfolgen noch zuverlässiger zu lesen.
Automatische Syntaxprüfung und lexikon-basierte Korrekturen helfen, verschiedenste Zeichenfolgen noch zuverlässiger zu lesen.
(Bild: MVTec)

Das gängigste Einsatzfeld der optischen Zeichenerkennung (Optical Character Recognition / OCR) war bisher die Bürokommunikation: „Dabei werden physische Dokumente wie Rechnungen, Belege oder handschriftliche Notizen eingescannt und innerhalb von Sekunden in ein digitales Format umgewandelt“, erklärt Johannes Hiltner, Product Manager Halcon bei MVTec in München. Dies verringert die Papierflut im Büro und ermöglicht einen durchgängigen, elektronischen Informationsfluss.

Doch mittlerweile ist OCR auch in der Automatisierung elektrotechnischer Produktionsprozesse angekommen, weiß der Experte: So lassen sich aufgedruckte Kennzahlen und Buchstaben-Codes auf Wafern, Chips, Prozessoren oder sonstigen elektronischen Bauteilen zuverlässig lesen. Dadurch können Komponenten schnell und automatisiert identifiziert, zugeordnet und für die Weiterverarbeitung oder Logistikprozesse bereitgestellt werden.

Aus Grafiken Text herauslesen

Für die optische Zeichenerkennung wird eine Kombination aus Hardware und Software benötigt: Bildeinzugsgeräte wie etwa Scanner oder Kameras nehmen zunächst Bilder auf und erstellen daraus digitale Rastergrafiken, die einer pixelgenauen digitalen Darstellung des Textes entsprechen. Zum Auslesen und Weiterverwenden der Informationen bedarf es einer OCR-Software, die in den Bildern Zahlenkombinationen oder Buchstaben erkennt und diese – je nach Anwendungsfall – zu Wörtern oder sogar ganzen Sätzen zusammensetzt.

„Am Markt ist eine kaum überschaubare Anzahl an OCR-Software-Lösungen erhältlich. Die meisten davon sind für die Digitalisierung von Geschäftsdokumenten und deren weitere digitale Bearbeitung in der Bürokommunikation ausgelegt. Johannes Hiltner stellt klar, dass sich für die sichere Erkennung von Buchstaben- oder Zahlenkombinationen in industriellen Fertigungsprozessen in erster Linie Systeme für die industrielle Bildverarbeitung, sprich Machine Vision, eignen. „Diese bieten spezielle Funktionen für die besonderen Anforderungen im Produktionsumfeld.“

OCR-Optimierung im Produktionsumfeld

MVTec etwa liefert mit der neuen Version 12 seiner Bildverarbeitungs-Software Halcon einen Funktions- und Leistungsumfang, der die optische Texterkennung in Produktionsprozessen der Elektrotechnik optimiert. Johannes Hiltner: „So ermöglicht eine Vielzahl von ausgefeilten Klassifikationstechniken performante Ergebnisse auch unter schwierigen Bedingungen.“ Problemlos machbar sei beispielsweise die Identifizierung von unscharfem, schräg gestelltem Text, verzerrten Buchstaben oder Zeichen, die auf reflektierenden Oberflächen oder stark strukturierten Farbhintergründen gedruckt oder geätzt wurden.

Die Software enthält eine Reihe von bereits vortrainierten Klassifikatoren für unterschiedliche Anwendungsfelder wie Punkt-Matrix-Schriften, Semi-Schriften, Industrie-Schriften und sogar Handschriften. Sie erlauben verlässliche Erkennungsraten ohne zusätzliches Training. „Realistisch ist eine Fehlerquote von 0,65 Prozent in einem Datensatz nach dem Standard der MNIST-Datenbank“, hebt der Produktmanager hervor. (MNIST: Mixed National Institute of Standards and Technology). Zudem bietet die Software-Lösung zeitsparende Tools und Assistenten für das Trainieren und Verwalten benutzerdefinierter Schriftarten.

Automatische Textsegmentierung vereinfacht Zeichenerkennung

Eine weitere wichtige Funktion von OCR-Anwendungen besteht darin, Zeichen aus dem Hintergrund des Bildes zu segmentieren. Besonders leistungsfähige Lösungen wie etwa die Software von MVTec enthalten performante Blob-Analyse-Werkzeuge kombiniert mit umfassenden Bildfilterungstechniken. Mit diesen können Entwickler wirkungsvoll Zeichen von komplexen Hintergründen isolieren und extrahieren. „So lassen sich Buchstaben und Zahlen jeglicher Größe meist sogar ohne Anpassung von Parametern zuverlässig segmentieren. Dadurch ist eine genauere Klassifizierung der Eigenschaften möglich, was zu besseren Leseraten führt“, verdeutlicht Hiltner.

Da keine Parametrisierung nötig ist, können in einem Aufruf auch ganz verschiedene Schriften vor variierenden Hintergründen gefunden werden. Die automatische Textsegmentierung vereinfacht die Erkennung unterschiedlichster Schriftinformationen wie Los-, Serien- und Teil-Nummern auf Elektronik-Bauteilen deutlich.

„OCR-Technologien erkennen verlässlich Zahlen- sowie Buchstabenkombinationen und unterstützen damit automatisierte Fertigungsprozesse in der Elektrotechnik. Moderne Machine-Vision-Lösungen enthalten Funktionen, die gerade unter harten Produktionsbedingungen treffsichere Ergebnisse und hohe Erkennungsraten ermöglichen. Dadurch lassen sich die Eigenschaften von Objekten sicher klassifizieren, was die Zuordnung von Komponenten und Bauteilen vereinfacht“, fasst Johannes Hiltner zusammen.

(ID:43305698)