· 

Eine Intelligenz sucht ihren Körper

Körper der KI

Die Verkörperung der künstlichen Intelligenz in der Robotik


Embodied AI und die nächste Phase der Robotik | Dr. Wrede & Partner

Seit dem Durchbruch großer Sprachmodelle richtet sich ein erheblicher Teil der öffentlichen Aufmerksamkeit auf Systeme wie ChatGPT. Sie verfassen Texte, analysieren Daten und beantworten komplexe Fragen. In der öffentlichen Wahrnehmung entsteht dadurch leicht der Eindruck, die Revolution der künstlichen Intelligenz vollziehe sich vor allem auf dem Bildschirm.

In den Forschungslaboren der Robotik zeichnet sich jedoch eine andere Entwicklung ab. Die künstliche Intelligenz beginnt, die rein digitale Sphäre zu verlassen. Sie sucht den Übergang in die physische Welt.

In der Technikphilosophie wird diese Situation mit einer prägnanten Beobachtung beschrieben: Gesucht wird für die gegenwärtigen Systeme der künstlichen Intelligenz ein Körper, in dem sich ihre Fähigkeiten praktisch bewähren und weiterentwickeln können. 

Damit rückt eine Frage in das Zentrum der technologischen Entwicklung:
Welche Form von Körper benötigt eine künstliche Intelligenz, um ihre Fähigkeiten vollständig zu entfalten?


Die Grenze reiner Software


Die erste Generation moderner Systeme der künstlichen Intelligenz blieb im Kern ein System digitaler Informationsverarbeitung. Die großen Modelle analysierten Texte, Bilder oder Datenströme und reagierten auf Eingaben, ohne selbst in die physische Welt einzugreifen.

Zugleich besitzt diese Form maschineller Intelligenz eine strukturelle Begrenzung. Die Systeme verfügen über umfangreiches Wissen, jedoch über keine eigene Erfahrung.

Ein großes Sprachmodell kann etwa beschreiben, wie eine Tasse gegriffen wird. Ein Verständnis dafür, wie sich Gewicht, Reibung oder Schwerpunkt verändern, wenn ein Gegenstand tatsächlich bewegt wird, besitzt es jedoch nicht.

Die so entstehende Form künstlicher Intelligenz bleibt deshalb abstrakt, solange sie weder mit eigener Wahrnehmung noch mit Handlung in der realen Welt verbunden ist.

An diesem Punkt setzt ein Forschungsansatz der Robotik- und KI-Forschung an, der unter den Bezeichnungen Embodied AI oder Physical AI diskutiert wird. Seine Grundannahme lautet, dass Intelligenz erst dann vollständig entsteht, wenn ein System nicht nur seine Umgebung wahrnehmen kann, sondern auch in dieser Umgebung handelt, die Folgen seines Handelns erfährt und aus diesen Erfahrungen lernt. 

Intelligenz erscheint unter dieser Perspektive als ein fortlaufender Kreislauf von Wahrnehmung, Handlung und Rückkopplung.


Die neue Rolle der Robotik


Über viele Jahre galt die Robotik als ein schwieriges Feld technischer Entwicklung. Roboter konnten präzise arbeiten, jedoch nur in stark kontrollierten Umgebungen. Schon geringe Veränderungen führten häufig zu Fehlern.

Die Ursache lag weniger in der Mechanik der Maschinen als in der begrenzten Fähigkeit der Systeme, ihre Umgebung zu interpretieren.

Hier verändert die moderne KI die Ausgangslage grundlegend.

Multimodale Systeme aus den Laboren von OpenAI oder Google DeepMind können Bilder analysieren, Sprache verstehen und komplexe Handlungsabfolgen planen. Diese Fähigkeiten eröffnen der Robotik neue Möglichkeiten.

Ein Roboter kann nun visuelle Informationen interpretieren, sprachliche Anweisungen verstehen, Handlungspläne entwickeln und aus Fehlern lernen. 

Damit entsteht eine neue technische Architektur: die Verbindung von künstlicher Intelligenz, Sensorik und mechanischer Handlung.


Der Engpass der physischen Erfahrung


Während Sprachmodelle aus riesigen Textsammlungen trainiert werden konnten, fehlt der Robotik eine vergleichbare Datenbasis.

Die physische Welt produziert keine automatisch verfügbaren Datensätze. Jede Bewegung, jeder Griff und jede Interaktion mit der Umgebung muss real ausgeführt werden.

Ein Roboter muss beispielsweise lernen, eine Tasse zu greifen, eine Tür zu öffnen, ein Objekt zu stapeln oder sich durch einen Raum zu bewegen. Jede dieser Handlungen besitzt zahlreiche Varianten.

Die Position eines Gegenstandes verändert sich. Das Gewicht variiert. Materialien erzeugen unterschiedliche Reibungen. 

Deshalb experimentieren viele Unternehmen mit Robotern in realen Umgebungen. Haushalte, Logistikzentren oder Produktionsanlagen werden zu Lernräumen für künstliche Intelligenz. Dort sammeln die Systeme genau jene Erfahrungen, die bislang fehlten.


Die offene Frage der Körperform


In der öffentlichen Wahrnehmung erscheint der humanoide Roboter häufig als das naheliegende Ziel dieser technologischen Entwicklung.

Unternehmen wie Tesla entwickeln mit Projekten wie dem Roboter Optimus Maschinen, deren Körperbau sich bewusst am menschlichen Bewegungsapparat orientiert. Auch das Robotikunternehmen Boston Dynamics arbeitet an beweglichen Systemen mit komplexer Motorik und hoher Stabilität.

Innerhalb der Robotikforschung besteht jedoch keineswegs Einigkeit darüber, dass der menschliche Körper das optimale Modell darstellt. Der menschliche Bewegungsapparat bildet ein außerordentlich komplexes System. Gleichgewicht, Feinmotorik und Energieeffizienz greifen in einer Weise ineinander, die sich technisch nur mit erheblichem Aufwand nachbilden lässt.

Viele Robotiker vermuten deshalb, dass die passende Körperform intelligenter Maschinen ganz anders aussehen könnte. Für industrielle Anwendungen erweisen sich rollende Plattformen häufig als effizienter als zweibeinige Systeme. Für unwegsames Gelände bieten vierbeinige Maschinen größere Stabilität. In anderen Einsatzfeldern könnten Schwärme kleiner kooperierender Maschinen entstehen.

Auch im internationalen Wettbewerb zeigen sich unterschiedliche Entwicklungslogiken. Während ein Teil der westlichen Robotikentwicklung weiterhin vom humanoiden Modell ausgeht, verfolgt ein wachsender Teil der chinesischen Robotikindustrie einen stärker funktionalen Ansatz. Unternehmen wie Unitree Robotics entwickeln etwa vierbeinige Systeme, deren Bauform nicht dem menschlichen Körper nachempfunden ist, sondern gezielt auf Stabilität, Energieeffizienz und robuste Beweglichkeit ausgelegt wird. 

Die Form eines robotischen Körpers ergibt sich damit zunehmend aus der jeweiligen Aufgabe, die ein intelligentes System in Industrie, Infrastruktur oder Alltag erfüllen soll.


Der Eintritt der KI in die physische Wirtschaft


Sobald künstliche Intelligenz zuverlässig handeln kann, verändert sich die ökonomische Bedeutung dieser Technologie grundlegend.

Die Systeme bleiben dann nicht mehr auf digitale Dienstleistungen beschränkt. Sie können Maschinen steuern, Produktionsanlagen betreiben, Infrastruktur warten und logistische Prozesse organisieren.

Damit tritt die künstliche Intelligenz in den Kern industrieller Wertschöpfung ein. 

Für die Wirtschaft entsteht eine neue Phase technischer Entwicklung, in der nicht nur Softwareunternehmen im Mittelpunkt stehen, sondern auch Robotikhersteller, Sensorikproduzenten und Anbieter industrieller Automatisierung.


Schlussbetrachtung


Die Entwicklung künstlicher Intelligenz folgt einer klaren Abfolge:

  • Zunächst entstand die Fähigkeit zur Verarbeitung großer Informationsmengen.
  • Darauf folgte die Fähigkeit zur Analyse komplexer Datenstrukturen.
  • Der nächste Schritt besteht in der Fähigkeit zum Handeln.

Mit diesem Schritt erhält die künstliche Intelligenz einen Körper. Sie verlässt den Bildschirm und tritt ein in die physische Welt. Erst dort wird sich zeigen, welches Potential diese Technologie tatsächlich besitzt.


Glossar


Aktorik
Technische Komponenten, mit denen ein Roboter physische Handlungen ausführt. Aktoren bewegen Arme, Räder, Greifer oder andere mechanische Elemente.

Embodied AI
Forschungsansatz der künstlichen Intelligenz, der davon ausgeht, dass intelligentes Verhalten erst dann vollständig entsteht, wenn ein System über einen Körper verfügt, seine Umgebung wahrnimmt, in dieser Umgebung handelt und aus den Folgen seines Handelns lernt.

Humanoide Robotik
Teilgebiet der Robotik, das Maschinen entwickelt, deren Körperbau dem menschlichen Bewegungsapparat ähnelt. Ziel ist die Fähigkeit, in Umgebungen zu arbeiten, die ursprünglich für Menschen gestaltet wurden.

Multimodale KI
Künstliche Intelligenz, die unterschiedliche Informationsformen gleichzeitig verarbeiten kann, etwa Sprache, Bilder, Video oder Sensordaten.

Physical AI
Bezeichnung für Systeme, bei denen künstliche Intelligenz direkt mit physischen Maschinen verbunden ist. Die KI steuert Sensorik, Bewegung und Interaktion mit der realen Umwelt. 

Sensorik
Gesamtheit technischer Systeme, mit denen Maschinen ihre Umgebung wahrnehmen. Dazu gehören beispielsweise Kameras, Laserscanner, Drucksensoren oder Mikrofone.


Kommentiertes Quellenverzeichnis


Bendel, Oliver

Arbeiten zur Maschinenethik sowie zur gesellschaftlichen Einordnung von Robotik und künstlicher Intelligenz. Bendel beschäftigt sich insbesondere mit der Frage, wie autonome Systeme gestaltet werden müssen, damit sie verantwortungsvoll in Alltag und Wirtschaft eingesetzt werden können.

Boston Dynamics
Führendes Unternehmen der modernen Robotik. Die dort entwickelten Systeme demonstrieren Fortschritte in der Bewegungssteuerung, der Stabilität komplexer Maschinen und der praktischen Anwendung robotischer Systeme in Industrie, Logistik und Infrastruktur.

Google DeepMind
Forschungseinrichtung für künstliche Intelligenz, die grundlegende Arbeiten zur Verbindung von Sprachmodellen, visueller Wahrnehmung und robotischer Steuerung veröffentlicht. Die Arbeiten zeigen, wie multimodale KI-Systeme physische Maschinen steuern können.

OpenAI
Forschungseinrichtung hinter großen Sprachmodellen wie ChatGPT. Die dort entwickelten Modelle bilden eine wichtige Grundlage für die Steuerung robotischer Systeme durch natürliche Sprache und multimodale Wahrnehmung.  

Tesla
Entwickelt mit dem Projekt „Optimus“ humanoide Robotersysteme für industrielle Anwendungen. Die Initiative verdeutlicht das wachsende Interesse großer Technologieunternehmen an der Verbindung von KI und physischer Automatisierung.

Unitree Robotics
Chinesisches Robotikunternehmen, das insbesondere für seine vierbeinigen Robotersysteme bekannt ist. Die Entwicklungen stehen exemplarisch für einen funktionalen Ansatz der Robotik, bei dem Stabilität, Beweglichkeit und Energieeffizienz Vorrang vor einer humanoiden Bauform besitzen.