Die Arbeit mit dem Titel „Vision-Language-Action Models Transfer Web Knowledge to Robot Control“ zeigt neue Wege auf, wie Web-Wissen auf reale Roboter übertragen werden kann: „Hochleistungsfähige Modelle, die zuvor auf großen Datensätzen im Web trainiert wurden, bieten eine effektive und leistungsfähige Plattform für eine Vielzahl nachgelagerter Aufgaben“.
Insbesondere hat sich die starke Verlagerung von Arbeitsplätzen auf Geringqualifizierte und Berufsanfänger verdoppelt. Dies ist ein sehr hoher Prozentsatz der Gesamtbelegschaft und ein Ausbildungsplatz für junge Arbeitnehmer. Technokraten, die die Robotik fördern, kümmern sich nicht um die sozialen Auswirkungen. ⁃ TN-Redakteur
Googles Labor für künstliche Intelligenz hat ein neues Papier veröffentlicht, das die Entwicklung des „ersten seiner Art“ Vision-Language-Action (VLA)-Modells beschreibt, das aus der Verschrottung des Internets und anderer Daten lernt, um Robotern zu ermöglichen, einfache Sprachbefehle von Menschen zu verstehen, während sie sich in Umgebungen wie dem Roboter aus dem Dinsey-Film Wall-E oder dem Roboter aus dem Film Bicentennial Man aus den späten 1990er-Jahren bewegen.
„Wenn sich Menschen seit Jahrzehnten die ferne Zukunft vorstellen, spielen fast immer Roboter die Hauptrolle“, schreibt Vincent Vanhoucke, Leiter der Robotik bei Google DeepMind, in einem Blogbeitrag.
Erinnern Sie sich an den Science-Fiction-Film Bicentennial Man mit Robin Williams aus dem Jahr 1999?
Vanhoucke fährt fort: „Roboter wurden als zuverlässig, hilfsbereit und sogar charmant dargestellt. Aber in diesen Jahrzehnten blieb die Technologie schwer greifbar – sie blieb in der Fantasiewelt der Science Fiction stecken“.
Bis jetzt…
DeepMind stellte den Robotics Transformer 2 (RT-2) vor, der ein VLA-Modell verwendet, das aus Web- und Roboterdaten lernt und dieses Wissen in ein Verständnis seiner Umgebung und menschlicher Befehle umsetzt.
Bisher war es möglich, Roboter für einfache Aufgaben wie das Wegwerfen von Müll oder das Kochen von Pommes frites zu trainieren. Die Intelligenz der Roboter hat jedoch eine neue Stufe erreicht, da sie nun in der Lage sind, folgende Aufgaben auszuführen:
„Anders als Chatbots benötigen Roboter eine „Erdung“ in der realen Welt und ihren Fähigkeiten. Bei ihrer Ausbildung geht es nicht nur darum, unter anderem alles über einen Apfel zu lernen: wie er wächst, welche physikalischen Eigenschaften er hat oder auch, dass einer auf dem Kopf von Sir Isaac Newton gelandet sein soll. Ein Roboter muss in der Lage sein, einen Apfel im Kontext zu erkennen, ihn von einem roten Ball zu unterscheiden, zu verstehen, wie er aussieht, und vor allem zu wissen, wie er ihn greifen soll“, so Vanhoucke.
Das Entscheidende ist, dass Roboter viel intelligenter werden als je zuvor und gerade genug Verstand haben, um Menschen in gering qualifizierten Berufen zu ersetzen. Der Abbau des Dienstleistungssektors werde in den kommenden Jahren zum Verlust von Millionen von Arbeitsplätzen führen.