Google DeepMind lanza Gemini Robotics-ER 1.6, el robot Spot ya puede leer tableros de instrumentos automáticamente

robot
Generación de resúmenes en curso

ME News Noticias, 14 de abril (UTC+8), según la monitorización de 1M AI News, Google DeepMind lanzó Gemini Robotics-ER 1.6, posicionado como un modelo de razonamiento de alto nivel para robots, con mejoras significativas en razonamiento espacial y comprensión de múltiples perspectivas en comparación con las versiones anteriores ER 1.5 y Gemini 3.0 Flash. El modelo ya está disponible para desarrolladores a través de Gemini API y Google AI Studio. Las actualizaciones principales incluyen tres capacidades: 1. Mejora en la precisión de señalar (pointing): útil para detección precisa de objetos, conteo, razonamiento de relaciones espaciales (como “indicar todos los objetos que caben en una taza azul”) y planificación de trayectorias de movimiento, además de poder rechazar correctamente objetos que no están en la imagen 2. Detección exitosa desde múltiples perspectivas: el robot ahora puede evaluar si una tarea está completa combinando las imágenes de varias cámaras, manteniendo precisión incluso en entornos con obstáculos o en movimiento 3. Nueva capacidad de lectura de instrumentos: puede interpretar diversos instrumentos industriales como manómetros circulares, indicadores de nivel vertical y pantallas digitales, mediante agentic vision (razonamiento visual + ejecución de código) para realizar un razonamiento paso a paso, ampliando primero las áreas de detalle, luego usando señalamiento y cálculos de código para determinar proporciones y distancias, y finalmente combinando conocimientos del mundo para obtener la lectura La capacidad de lectura de instrumentos proviene de la colaboración entre DeepMind y Boston Dynamics. El mismo día, Boston Dynamics anunció que ha integrado Gemini y Gemini Robotics-ER 1.6 en su producto Orbit AIVI-Learning, lanzándolo a todos los clientes de AIVI-Learning el 8 de abril. Tras la integración, se añadió soporte para paneles de instrumentos (gauges), permitiendo que el robot cuadrúpedo Spot realice inspecciones autónomas en instalaciones industriales y lea datos de instrumentos como manómetros. Boston Dynamics afirmó que, gracias a la capacidad de razonamiento de Gemini, el rendimiento y la precisión en tareas como inspección visual, conteo de bandejas y detección de líquidos acumulados también han mejorado en la línea base. DeepMind afirma que ER 1.6 es su “modelo de robot más seguro”. En tareas de razonamiento espacial adversarial, cumple con instrucciones de seguridad mucho mejor que ER 1.5. En pruebas de identificación de riesgos de seguridad basadas en informes reales de lesiones, los modelos de la serie ER superaron en un 6% en escenarios de texto y en un 10% en escenarios de video en comparación con Gemini 3.0 Flash. (Fuente: BlockBeats)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado