DeepMind revela avanços em robótica para tomada de decisões seguras
A equipe de robótica da DeepMind anunciou três inovações destinadas a aprimorar a rapidez, qualidade e segurança das decisões tomadas pelos robôs em ambientes variados. Um desses avanços inclui um sistema projetado para coletar dados de treinamento, apelidado de "Constituição do Robô", garantindo que robôs de escritório, por exemplo, possam buscar papel para impressora sem colidir com colegas humanos.
O sistema de coleta de dados, AutoRT, da Google, utiliza um modelo visual de linguagem (VLM) e um grande modelo de linguagem (LLM), permitindo ao robô compreender seu ambiente, adaptar-se a cenários desconhecidos e decidir sobre tarefas adequadas. A "Constituição do Robô", inspirada nas "Três Leis da Robótica" de Isaac Asimov, consiste em um conjunto de "instruções focadas na segurança" que direcionam o LLM a evitar tarefas envolvendo humanos, animais, objetos pontiagudos e até mesmo dispositivos elétricos.
Para reforçar a segurança, a DeepMind programou os robôs para pararem automaticamente se a força em suas articulações ultrapassar determinado limite e incluiu um interruptor físico de interrupção, permitindo que operadores humanos os desativem. Durante sete meses, o Google implantou 53 robôs AutoRT em quatro edifícios de escritórios diferentes, realizando mais de 77 mil testes. Alguns robôs eram controlados remotamente por humanos, enquanto outros operavam com base em scripts ou de forma totalmente autônoma usando o modelo de aprendizagem de IA do Robotic Transformer (RT-2) do Google.
Os robôs testados parecem ser mais práticos do que chamativos, equipados com câmeras, braços robóticos e bases móveis. O sistema utiliza o VLM para compreender o ambiente e os objetos visíveis, enquanto o LLM sugere tarefas que o robô pode realizar, como "colocar um lanche na bancada", servindo como o tomador de decisão para escolher a tarefa apropriada.
Outras novidades incluem o SARA-RT, uma arquitetura de rede neural para aprimorar a precisão e a velocidade do Robotic Transformer RT-2 existente, e o RT-Trajectory, que adiciona contornos 2D para melhorar a execução de tarefas físicas específicas, como a limpeza de mesas.
Embora ainda distantes dos robôs que servem bebidas ou arrumam almofadas de forma autônoma, esses avanços indicam uma direção futura na qual os robôs poderão aprender com sistemas como o AutoRT.
Inscreva-se no canal Geek TV, o canal oficial do Geek Fusion no YouTube e acompanhe nossos conteúdos e produções de parceiros. Siga-nos também no Facebook, Instagram e X, para ficar por dentro das novidades que preparamos especialemnte para você!
Tem uma dica de notícia ou quer entrar em contato conosco diretamente? Então faça contato através do e-mail