Sam Altman acaba de desatar GPT-5.2 Thinking en la naturaleza. Lo llama "un modelo muy inteligente" — y eso no es solo marketing. ¿Los números? Absolutamente aplastantes. Hablamos de saltos de rendimiento masivos respecto a la versión 5.1 anterior.
Lo que realmente destaca: está dejando atrás a Claude Opus 4.5 y Gemini 3 Pro en las pruebas críticas de referencia. El software SWE-Bench, que evalúa ingeniería de software, muestra que esto no es un juego. La diferencia entre esto y otros modelos competidores no es pequeña — es un abismo.
OpenAI claramente dedicó tiempo a perfeccionarlo. La etiqueta "Thinking" sugiere capacidades de razonamiento mejoradas, lo que podría revolucionar la forma en que los desarrolladores abordan tareas complejas de resolución de problemas. Ya sea que estés creando herramientas para auditoría de contratos inteligentes o impulsando la integración de IA en sistemas descentralizados, esta actualización importa.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
20 me gusta
Recompensa
20
8
Republicar
Compartir
Comentar
0/400
UnruggableChad
· hace2h
gpt又开始秀肌肉了,这次差距是真的大。claude那边得加油了
---
5.2模式 de pensamiento suena bien, pero ¿cuántos escenarios realmente se pueden usar...
---
opensai sigue con la misma rutina, si los números se ven bien, hay que alabar. Cuando los usuarios se vayan, volverán a arrepentirse
---
La capacidad de razonamiento, si realmente existe, la auditoría de contratos inteligentes puede ahorrar mucho trabajo, eso sería interesante
---
Otra vez opensai y alguien que vence a otro, ya me cansa... a ver qué más podrán presumir el próximo año
---
La palabra chasm está bien usada, pero solo quiero saber si realmente es caro en la práctica, esa es la verdadera cuestión
Ver originalesResponder0
TooScaredToSell
· hace15h
5.2 ha llegado, ¿y ahora otra vez a cortar las cebollas? Jaja
¿Claude va a fracasar? De todos modos, sigo observando...
Hablan tan fuerte, ¿puede realmente superar las expectativas? Hay muchas cosas que te dan en la cara
Mientras tenga buen razonamiento, lo importante es ganar dinero, esa es la clave
Por muy buena que sea la referencia, ¿de qué sirve si la experiencia del usuario no acompaña?
ngl, la etiqueta de "pensando" es solo marketing para decir "por fin solucionamos el problema de las alucinaciones... quizás". He visto esta película antes, la verdad. Los benchmarks parecen bien en papel, pero espera a que alguien implemente esto en la mainnet—ahí es cuando los casos límite reales salen a relucir. Ya te ahorré unos ETH mencionándolo.
Ver originalesResponder0
NoodlesOrTokens
· 12-11 22:52
¿Otra vez vendiendo a los ingenuos, Claude ha sido golpeado hasta dejarlo sin dientes?
---
5.2 salió y ya es prácticamente invencible, esta vez OpenAI realmente está siendo muy agresivo
---
¿Etiqueta "thinking"? En realidad, es solo pagar más para que el modelo piense unos segundos más, no hay problema
---
Aunque en benchmarks aplasta a todos, en la práctica todavía no es así
---
¿Esta vez podrán auditar smart contracts? Tal vez así pueda conservar la mitad de mis activos
---
SWE-Bench vuelve a ser tan potente... ¿Debería preocuparme por mi trabajo?
---
Claude hace unos días todavía era muy arrogante, ahora ya está en declive, la actualización del modelo realmente está llegando a límites insospechados
---
Si realmente podemos usar esa parte de web3, eso sería digno de atención, de lo contrario, solo es un juego de números
---
Este tipo de Altman solo sabe decir "muy inteligente", siempre usa la misma excusa en cada lanzamiento
---
¿El precio volverá a duplicarse...? Mi cartera va a sangrar otra vez
Ver originalesResponder0
NotGonnaMakeIt
· 12-11 22:49
¡Vaya, otro monstruo nuevo! Esta vez Claude seguramente será aplastado hasta el fondo.
Este gap es realmente absurdo, la competencia de SWE-Bench está aplastando a los demás de manera bastante dura.
5.2 todavía tiene algo, pero solo hay que ver cómo lo usan los desarrolladores en el futuro, si realmente puede cambiar algo.
¿OpenAI volverá a subir los precios? Ya están bastante familiarizados con esta estrategia.
Thinking suena genial, pero ¿puede realmente un auditor de contratos inteligentes arreglarlo con esto? Todavía hay que esperar y ver cómo funciona en la práctica.
Otra ronda de carrera armamentística ha comenzado, ¡ya tengo la cabeza hecha un lío!
Ver originalesResponder0
WhaleInTraining
· 12-11 22:48
Otra vez causando alboroto, esta vez realmente diferente, los datos de benchmark aplastan directamente a los demás...
---
Claude y Gemini van a ser claramente superados, la diferencia es realmente abismal
---
Tengo que probar la auditoría de contratos inteligentes, siento que la capacidad de razonamiento de esta versión es realmente potente
---
El nombre 5.2 thinking suena interesante, ¿es solo apariencia o realmente tiene habilidades? Solo sabrás usándolo
---
Sam vuelve a presumir, pero esta vez los datos están aquí, no puedo dejar de creerlo
---
SWE-Bench destruye a otros competidores, este loco va a empezar a cortar lechugas otra vez
---
Lo probé y la capacidad de razonamiento realmente mejoró mucho, la versión anterior ya debería retirarse
---
Me esforcé en el razonamiento profundo, seguramente tendrá utilidad en escenarios de integración Web3
---
Habla con tanta exageración, a ver cuántos de estos verdaderos talentos quedan en medio año
---
¿Tan grande es la brecha? Entonces tengo que actualizar mi cadena de herramientas, si no, me quedarán atrás
Ver originalesResponder0
AmateurDAOWatcher
· 12-11 22:44
¡Otra vez se ha actualizado, esta vez realmente es diferente!
Claude está siendo aplastado en el suelo, ¿por qué esta diferencia es tan grande?
Eh, espera, ¿solo emocionarse por los puntajes de rendimiento? Mejor pruebe realmente antes de decirlo.
Sam esta vez realmente ha puesto mucho esfuerzo, buen nombre el de "thinking".
En el tema de auditoría de contratos inteligentes, por fin hay herramientas que realmente funcionan bien.
¿Entonces esas plataformas que afirmaban ser las "más fuertes" antes solo eran una pérdida de dinero?
¿Realmente ha mejorado el razonamiento o solo están jugando con las palabras?
Si esto es solo otro truco de marketing, me muero de risa.
El rey ha regresado, y esta vez trajo una bestia.
Sam Altman acaba de desatar GPT-5.2 Thinking en la naturaleza. Lo llama "un modelo muy inteligente" — y eso no es solo marketing. ¿Los números? Absolutamente aplastantes. Hablamos de saltos de rendimiento masivos respecto a la versión 5.1 anterior.
Lo que realmente destaca: está dejando atrás a Claude Opus 4.5 y Gemini 3 Pro en las pruebas críticas de referencia. El software SWE-Bench, que evalúa ingeniería de software, muestra que esto no es un juego. La diferencia entre esto y otros modelos competidores no es pequeña — es un abismo.
OpenAI claramente dedicó tiempo a perfeccionarlo. La etiqueta "Thinking" sugiere capacidades de razonamiento mejoradas, lo que podría revolucionar la forma en que los desarrolladores abordan tareas complejas de resolución de problemas. Ya sea que estés creando herramientas para auditoría de contratos inteligentes o impulsando la integración de IA en sistemas descentralizados, esta actualización importa.