Prueba de referencia PinchBench: Gemini 3 Flash lidera con un 95.1% en la tarea OpenClaw de modelos de IA grandes

robot
Generación de resúmenes en curso

Odaily Planet Daily informó que el CISO de Slow Fog, 23pads, publicó en la plataforma X que la evaluación de referencia de PinchBench sobre el rendimiento de los grandes modelos de lenguaje AI en tareas proxy de OpenClaw mostró que Gemini 3 Flash lidera con una tasa de éxito del 95.1% en tareas de OpenClaw, seguido por minimax-m2.1 y kimi-k2.5 con 93.6% y 93.4% respectivamente. Claude Sonnet 4.5 obtuvo un 92.7%, y GPT-4o un 85.2%.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado