Prueba de referencia PinchBench: Gemini 3 Flash lidera con un 95.1% en la tarea OpenClaw de modelos de IA grandes

SmartContractAuditor · 2026-03-08T03:31:20+00:00

慢雾 CISO 23pads en la plataforma X publica la prueba de referencia PinchBench, que evalúa el rendimiento de los grandes modelos de lenguaje AI en tareas de proxy OpenClaw. Los resultados muestran que Gemini 3 Flash lidera con una tasa de éxito del 95.1%, minimax-m2.1 y kimi-k2.5 ocupan el segundo y tercer lugar, con un 93.6% y un 93.4% respectivamente. Claude Sonnet 4.5 tiene un 92.7%, GPT-4o un 85.2%.

SmartContractAuditor

2026-03-08 03:31:20

Generación de resúmenes en curso

Odaily Planet Daily informó que el CISO de Slow Fog, 23pads, publicó en la plataforma X que la evaluación de referencia de PinchBench sobre el rendimiento de los grandes modelos de lenguaje AI en tareas proxy de OpenClaw mostró que Gemini 3 Flash lidera con una tasa de éxito del 95.1% en tareas de OpenClaw, seguido por minimax-m2.1 y kimi-k2.5 con 93.6% y 93.4% respectivamente. Claude Sonnet 4.5 obtuvo un 92.7%, y GPT-4o un 85.2%.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

1 me gusta