Gemini Robotics: l’intelligenza artificiale diventa reale
Quali sono le ultime innovazioni di Gemini Robotics? Attraverso i modelli più avanzati di intelligenza artificiale, il loro supporto può essere applicato anche nella vita reale.
Guarda il video

È ormai indiscusso il grande apporto che l’intelligenza artificiale ha sulla vita quotidiana di ognuno di noi. Ogni sistema, però, resta limitato al mondo digitale al punto che i diversi modelli a ora in uso riescono ad avvantaggiare solo lavori e processi che possono essere digitalizzati.
La sfida di Google, attraverso la tecnologia Gemini Robotics, è quella di implementare su larga scala un nuovo modello di intelligenza artificiale sviluppato attraverso Goole DeepMind e basato su Gemini 2.0. L’obiettivo è quello di portare il supporto dell’AI anche nel mondo fisico attraverso quello che viene definito “ragionamento incarnato”.
A questo scopo, sono state a ora sviluppate due varianti principali, la prima basata sul modello avanzato di visione-linguaggio-azione, la seconda di ragionamento spaziale avanzato.
Gemini Robotics: nuove implicazioni per il modello

La sfida di Gemini Robotics parte dal rendere davvero utile l’AI nel mondo fisico, rispondendo in modo mirato e dettagliato a tutte le richieste umane. A questo scopo, i modelli devono quindi avere tre principali, e fondamentali, caratteristiche, ovvero generalità, interattività e destrezza.
La generalità permette a Gemini Robotics di adattarsi a nuove situazioni, istruzioni e ambienti, migliorando le prestazioni rispetto ai modelli precedenti. In questo modo, infatti il modello è in grado di gestire nuovi oggetti, stimoli e ambienti raddoppiando le sue prestazioni.
Da non sottovalutare l’interattività del sistema. Questo deve infatti rispondere in modo intuitivo a istruzioni in linguaggio naturale, rilevare cambiamenti nell’ambiente e adattarsi. Il modello Gemini 2.0 ha permesso appunto di apportare questa interazione, sfruttando le capacità avanzate di comprensione e risposta.
Grazie alla destrezza, altra caratteristica essenziale, Gemini Robotics riesce a eseguire compiti complessi, come manipolare oggetti con precisione, per esempio per piegare origami. si tratta di compiti di abilità che, nel quotidiano, un umano riuscirebbe a svolgere senza sforzo, ma che a ora erano ancora troppo difficili per un robots. La sfida era appunto quella di abbattere questo limite per implementare l’utilità dei modelli.
Di fondamentale importanza sono state, per la realizzazione del modello Gemini Robotics basato sul modello avanzato di visione-linguaggio-azione, le collaborazioni ancora in corso con Apptronik e altri collaudatori fidati per lo sviluppo di robot umanoidi avanzati. Per rendere più interattivo il modello, Gemini Robotics è progettato per funzionare su diverse piattaforme robotiche, come ALOHA 2 e Apollo.
Gemini Robotics-ER e il ragionamento spaziale

Altro modello sviluppato è Gemini Robotics-ER, che introduce il ragionamento spaziale, migliorando la capacità del modello di comprendere e interagire con oggetti 3D. Questa tipologia di ragionamento consente ai robot di eseguire compiti complessi in modo autonomo, combinando percezione, pianificazione e generazione di codice.
In questo caso, trattandosi di un modello ancora più autonomo del precedente, la priorità è stata data alla sicurezza, con misure che includono controllo motorio, prevenzione delle collisioni e stabilità dinamica. È stato quindi introdotto un set di dati, chiamato ASIMOV, per valutare le implicazioni di sicurezza nelle azioni robotiche.
Per perfezionare il modello realizzato, Google DeepMind collabora con esperti per sviluppare l’IA in modo responsabile, allineando il comportamento dei robot ai valori umani. Con questo connubio, Gemini Robotics-ER apre la strada a nuove applicazioni nella robotica incarnata, rendendo i robot più utili per compiti reali. I prossimi sviluppi infatti includeranno ulteriori test sul campo e l’espansione del modello per un numero crescente di piattaforme.
Gemini Robotics: immagini e foto
Google DeepMind rivoluziona il modno dell’intelligenza artificiale portando la sua utilità nel mondo reale attraverso due nuovi modelli.