Künstliche Intelligenz Neue Chip-Architektur verleiht Rechenperformance am Edge richtig Schub
Anbieter zum Thema
Mit einem AI-Chip des israelischen Start-ups Hailo stellt der Embedded- und IoT-Hersteller Kontron am Edge eine Rechenpower, die so bisher nur in der Cloud möglich war, zur Verfügung. Damit können Unternehmen jetzt auch sehr anspruchsvolle AI-Algorithmen in der Praxis nutzen.

Anwendungen rund um Künstliche Intelligenz (Artificial Intelligence; AI) werden sich in den kommenden Jahren weiter durchsetzen. Dazu führt auch der deutlich stärkere Fokus auf Nachhaltigkeit, der sich durch eine härtere Gangart in der Klimapolitik ergibt. AI trägt nicht nur zur Automatisierung bei, sondern auch zu besserer Planung, Wartung und Vorhersage. Die Technologie vermindert Ressourcenverschwendung oder Ausschuss und unterstützt neue Mobilitätskonzepte.
Selbstlernende Algorithmen haben Hochkonjunktur
Inferenz ist dabei ein wichtiges Stichwort: Es steht dafür, mit Hilfe trainierter neuronaler Netze aus Informationen zu lernen und neue Schlüsse abzuleiten. Allerdings benötigen Inferenz-Anwendungen rund um Artificial Intelligence in aller Regel eine erhebliche Rechenleistung.
Das gilt vor allem in Echtzeitszenarien wie zum Beispiel bei autonomen Fahrzeugen oder wenn es, wie in der Robotik, um das Thema Arbeitsschutz geht.
Diese Voraussetzungen lassen sich mit klassischen Standard-Prozessoren nicht effektiv erreichen, denn sie verbrauchen zu viel Strom oder erreichen nicht die benötigte Geschwindigkeit. Im Grunde wird am Edge, also im Device selbst, eine Rechenpower nötig, die bisher vor allem durch High Performance Computing im Rechenzentrum geliefert werden konnte – mit entsprechenden Nachteilen bezüglich der Latenz und Zuverlässigkeit der Cloud-Verbindung.
Als Embedded-Systems-Spezialist fokussiert sich Kontron daher jetzt auf neue Ansätze, um die nötige Performance auch am Edge zu ermöglichen. Mit der Integration des Hailo-8 Chips setzt Kontron auf eine Technologie, die den Anforderungen im AI-Umfeld mit einer spezifisch für das Rechnen von neuronalen Netzen entwickelten Chip-Architektur begegnet.
Mit dem Hailo-8 AI-Co-Prozessor können Edge-Geräte eine Performance erreichen, die bisher nur in der Cloud möglich war.
Neue Performance-Höhen erklimmen
Gemeinsam mit dem israelischen AI-Chip-Hersteller Hailo werden im Rahmen einer strategischen Technologiepartnerschaft AI-Edge-Inferenzlösungen der nächsten Generation entwickelt und auf den Markt gebracht.
Grundlage dafür ist der „best-in-class“ Hailo-8 AI-Co-Prozessor mit einer Leistung von 26 Tera-Operationen pro Sekunde (TOPS), der mit einem typischen Stromverbrauch von nur 2,5 W auskommt. So können Edge-Geräte eine Performance erreichen, die bisher nur in der Cloud möglich war.
Der Einsatz vor Ort, oft unter den restriktiven Bedingungen in Fertigung und Produktion oder im öffentlichen Raum, bringt hohe Anforderungen an die AI-Devices mit sich. Sie müssen nicht nur mit den teilweise rauen Umgebungen, sondern auch mit einem breiten Temperaturspektrum umgehen können. Zugleich sollte die Hardware im Praxiseinsatz besonders klein und stromsparend konzipiert sein, um sich auf engem Raum in Geräte oder in Produktionsanlagen einzufügen: Etwa für Assistenzsysteme in einem autonomen Fahrzeug, in einem Roboterkopf oder einem kleinen Kameragehäuse sind spezifische, kleine Formfaktoren erforderlich.
:quality(80)/images.vogel.de/vogelonline/bdb/1937000/1937054/original.jpg)
Software-Toolset
IIoT als Gesamtkonzept in der Wertschöpfungskette
Schnelle Entwicklung, ausgerichtet auf den Anwendungsfall
Je genauer sich AI-Algorithmen und Hardware aufeinander abstimmen lassen, desto besser die Performance und desto niedriger der Stromverbrauch. Das israelische Startup stellt in seiner „Developer Zone“ viele vortrainierte neuronale Netze (Model Zoo) zur Verfügung, auf deren Basis Unternehmen viel schneller neue AI-Anwendungen entwickeln und deren Time-to-Market deutlich verkürzen können.
Grundlage ist Hailos High-Performance Application Toolkit Tappas (Template APPlications And Solutions). Es gibt bereits eine Reihe von Lösungen mit diesem Ansatz am Markt. Um die Rechenpower zu erhöhen, kommen dort meist Accelerator-Devices für die Beschleunigung zum Tragen, oft maßgeschneidert für bestimmte AI-Anwendungsszenarien.
Allerdings unterscheidet sich die Hailo-Technologie darin, dass der Prozessor Domain-spezifisch gezielt für bestimmte Anwendungen optimierbar und in höherem Maß programmierbar ist. Dabei lassen sich nicht nur wie üblich die Parameter der trainierten Netzwerke in den Chip programmieren, sondern es besteht die Möglichkeit, die Hardware gezielt auf bestimmte gewünschte Eigenschaften zu optimieren.
Mit einem bitgenauen Simulator und dem Performance-Tool Hailo Dataflow Compiler kann von den Entwicklern individuell festlegt werden, welche Leistungsaspekte ihnen für einen spezifischen Use Case besonders wichtig sind. Aspekte, die sich austarieren lassen, sind beispielsweise Stromverbrauch, Latenz oder Geschwindigkeit. Das Trade-off erfolgt dann analog zum jeweils wichtigsten Anwendungsziel.
Perfekt an das jeweilige neuronale Netz anpassbar
Neuronale Netzwerke sind Strukturen mit vielen Layern, in denen Neuronen auf unterschiedliche Arten miteinander verknüpft sind. Je nachdem, welcher Output angestrebt wird, kommen unterschiedliche Netzarchitekturen zum Einsatz. Beispiele dafür sind Mobilenet, Resnet, Squeezenet oder Tiny-Yolo. In den letzten Jahren kamen neue Architekturen hinzu, die sich vor allem für den Einsatz auf mobilen und Egde-Geräten eignen.
Die Chip-Architektur wurde neu gedacht.
Der Hailo-Chip ist besonders gut auf das jeweils zu rechnende Netzwerk optimierbar, da die Kernels auf das jeweilige Netzwerk anpassbar sind. Durch den bitgenauen Simulator des Chips kann die Applikation außerhalb der Zielhardware zum Beispiel auf einem PC optimiert werden. So lassen sich neue Levels von Geschwindigkeit, Latenz und Leistungseffizienz erzielen.
Dafür wurde die Chip-Architektur neu gedacht. So ist beispielsweise kein externer Memory-Speicher nötig, sondern bereits im Chip integriert und eng an die konfigurierbaren Rechenkernels angebunden. Der Prozessor wird am PCIe-Bus der Host-CPU der Kontron Edge Computer betrieben. Mit der Lösung lassen sich selbst die strengen Sicherheitsvorgaben in der Automotive- und Industrial-Compliance einhalten. Nicht von ungefähr haben in der jüngeren Vergangenheit viele Automobilhersteller auf Kooperationen mit oder Übernahmen von israelischen Startups gesetzt, die beim Thema Artificial Intelligence international die Nase vorn haben.
Vision-Applikationen am Edge
In der Industrie sind aktuell Anwendungen rund um das Thema Computer Vision das wohl häufigste Einsatzszenario, insbesondere in der Objekterkennung, im Qualitätsmanagement oder der vorausschauenden Wartung.
Entscheidend sind dabei oft die Latenzzeit und Auflösung, die im Prozess benötigt wird, um auszurechnen, was auf einem Bild zu sehen ist. Je nachdem, wie schnell in einem Produktionsprozess Objekte wie Bauteile, Materialien oder Produkte dem Kamerasystem zum Beispiel auf einem Fließband präsentiert werden, oder wo Objekte in großer Entfernung schnell und exakt erkannt werden müssen, steigen die Erwartungen an die Performance.
Der Hailo-Chip ist mit Latenzen im Millisekundenbereich auch für die anspruchsvolle, schnelle Bilderkennung mit extrem hoher Auflösung ausgelegt. So kann die zur Verfügung stehende hohe Rechenleistung auch dazu verwendet werden, hochauflösende Bilder durch „Tiling“ in mehrere parallel gerechnete Video-Datenströme umzuwandeln, um kleinste Objekte korrekt zu erfassen.
Viele kamerabasierte Bilderfassungssysteme hingegen arbeiten mit limitierter Auflösung oder liefern die Ergebnisse mit vergleichsweise hoher zeitlicher Verzögerung, und sind somit für die oben genannten Einsätze nicht optimal einsetzbar.
Die Architektur mit der anpassbaren Struktur, die kurzen Latenzen und die hohe Performance machen den Hailo-Chip um eine Größenordnung schneller als bisherige marktübliche Beschleuniger.
Dank seiner hohen Geschwindigkeit eignet sich der AI-Chip auch für Szenarien, in denen schnell etwas gezählt oder sortiert werden soll; aber auch zum Beispiel für autonome Transportsysteme, die ihre Umgebung erkennen können sowie in Cobots, die direkt mit Menschen zusammenarbeiten.
Die Architektur mit der anpassbaren Struktur, die kurzen Latenzen und die hohe Performance machen den Hailo-Chip um eine Größenordnung schneller als bisherige marktübliche Beschleuniger. (in)
:quality(80)/images.vogel.de/vogelonline/bdb/1830900/1830930/original.jpg)
Big Data
Ohne Konnektivität für Produktionsdaten geht es nicht
* Christoph Neumann, VP Technology der Kontron Gruppe
(ID:48261101)