2025-12-11 22:24:38

El rey ha regresado, y esta vez trajo una bestia.

Sam Altman acaba de desatar GPT-5.2 Thinking en la naturaleza. Lo llama "un modelo muy inteligente" — y eso no es solo marketing. ¿Los números? Absolutamente aplastantes. Hablamos de saltos de rendimiento masivos respecto a la versión 5.1 anterior.

Lo que realmente destaca: está dejando atrás a Claude Opus 4.5 y Gemini 3 Pro en las pruebas críticas de referencia. El software SWE-Bench, que evalúa ingeniería de software, muestra que esto no es un juego. La diferencia entre esto y otros modelos competidores no es pequeña — es un abismo.

OpenAI claramente dedicó tiempo a perfeccionarlo. La etiqueta "Thinking" sugiere capacidades de razonamiento mejoradas, lo que podría revolucionar la forma en que los desarrolladores abordan tareas complejas de resolución de problemas. Ya sea que estés creando herramientas para auditoría de contratos inteligentes o impulsando la integración de IA en sistemas descentralizados, esta actualización importa.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

20 me gusta

Recompensa
20
8
Republicar
Compartir

Comentar

0/400

UnruggableChad

· hace2h

gpt又开始秀肌肉了，这次差距是真的大。claude那边得加油了 --- 5.2模式 de pensamiento suena bien, pero ¿cuántos escenarios realmente se pueden usar... --- opensai sigue con la misma rutina, si los números se ven bien, hay que alabar. Cuando los usuarios se vayan, volverán a arrepentirse --- La capacidad de razonamiento, si realmente existe, la auditoría de contratos inteligentes puede ahorrar mucho trabajo, eso sería interesante --- Otra vez opensai y alguien que vence a otro, ya me cansa... a ver qué más podrán presumir el próximo año --- La palabra chasm está bien usada, pero solo quiero saber si realmente es caro en la práctica, esa es la verdadera cuestión

Ver originalesResponder0

TooScaredToSell

· hace15h

5.2 ha llegado, ¿y ahora otra vez a cortar las cebollas? Jaja ¿Claude va a fracasar? De todos modos, sigo observando... Hablan tan fuerte, ¿puede realmente superar las expectativas? Hay muchas cosas que te dan en la cara Mientras tenga buen razonamiento, lo importante es ganar dinero, esa es la clave Por muy buena que sea la referencia, ¿de qué sirve si la experiencia del usuario no acompaña?

Ver originalesResponder0

GasGuru

· hace17h

gpt5.2一出，其他 modelos都得靠边站啊...不过benchmark数据漂亮归漂亮，真实场景怎么用还得看 claude还在打呼呢吧哈哈 sam又来割韭菜了，但这次好像真有点东西 reasoning能力升级确实有点意思，智能合约审计这块可能要重新洗牌了感觉openai又要涨价了...钱包君哭了 ¿差距这么大？那我之前用5.1白白花了那些钱啊

Ver originalesResponder0

TxFailed

· 12-11 22:54

ngl, la etiqueta de "pensando" es solo marketing para decir "por fin solucionamos el problema de las alucinaciones... quizás". He visto esta película antes, la verdad. Los benchmarks parecen bien en papel, pero espera a que alguien implemente esto en la mainnet—ahí es cuando los casos límite reales salen a relucir. Ya te ahorré unos ETH mencionándolo.

Ver originalesResponder0

NoodlesOrTokens

· 12-11 22:52

¿Otra vez vendiendo a los ingenuos, Claude ha sido golpeado hasta dejarlo sin dientes? --- 5.2 salió y ya es prácticamente invencible, esta vez OpenAI realmente está siendo muy agresivo --- ¿Etiqueta "thinking"? En realidad, es solo pagar más para que el modelo piense unos segundos más, no hay problema --- Aunque en benchmarks aplasta a todos, en la práctica todavía no es así --- ¿Esta vez podrán auditar smart contracts? Tal vez así pueda conservar la mitad de mis activos --- SWE-Bench vuelve a ser tan potente... ¿Debería preocuparme por mi trabajo? --- Claude hace unos días todavía era muy arrogante, ahora ya está en declive, la actualización del modelo realmente está llegando a límites insospechados --- Si realmente podemos usar esa parte de web3, eso sería digno de atención, de lo contrario, solo es un juego de números --- Este tipo de Altman solo sabe decir "muy inteligente", siempre usa la misma excusa en cada lanzamiento --- ¿El precio volverá a duplicarse...? Mi cartera va a sangrar otra vez

Ver originalesResponder0

NotGonnaMakeIt

· 12-11 22:49

¡Vaya, otro monstruo nuevo! Esta vez Claude seguramente será aplastado hasta el fondo. Este gap es realmente absurdo, la competencia de SWE-Bench está aplastando a los demás de manera bastante dura. 5.2 todavía tiene algo, pero solo hay que ver cómo lo usan los desarrolladores en el futuro, si realmente puede cambiar algo. ¿OpenAI volverá a subir los precios? Ya están bastante familiarizados con esta estrategia. Thinking suena genial, pero ¿puede realmente un auditor de contratos inteligentes arreglarlo con esto? Todavía hay que esperar y ver cómo funciona en la práctica. Otra ronda de carrera armamentística ha comenzado, ¡ya tengo la cabeza hecha un lío!

Ver originalesResponder0

WhaleInTraining

· 12-11 22:48

Otra vez causando alboroto, esta vez realmente diferente, los datos de benchmark aplastan directamente a los demás... --- Claude y Gemini van a ser claramente superados, la diferencia es realmente abismal --- Tengo que probar la auditoría de contratos inteligentes, siento que la capacidad de razonamiento de esta versión es realmente potente --- El nombre 5.2 thinking suena interesante, ¿es solo apariencia o realmente tiene habilidades? Solo sabrás usándolo --- Sam vuelve a presumir, pero esta vez los datos están aquí, no puedo dejar de creerlo --- SWE-Bench destruye a otros competidores, este loco va a empezar a cortar lechugas otra vez --- Lo probé y la capacidad de razonamiento realmente mejoró mucho, la versión anterior ya debería retirarse --- Me esforcé en el razonamiento profundo, seguramente tendrá utilidad en escenarios de integración Web3 --- Habla con tanta exageración, a ver cuántos de estos verdaderos talentos quedan en medio año --- ¿Tan grande es la brecha? Entonces tengo que actualizar mi cadena de herramientas, si no, me quedarán atrás

Ver originalesResponder0

AmateurDAOWatcher

· 12-11 22:44

¡Otra vez se ha actualizado, esta vez realmente es diferente! Claude está siendo aplastado en el suelo, ¿por qué esta diferencia es tan grande? Eh, espera, ¿solo emocionarse por los puntajes de rendimiento? Mejor pruebe realmente antes de decirlo. Sam esta vez realmente ha puesto mucho esfuerzo, buen nombre el de "thinking". En el tema de auditoría de contratos inteligentes, por fin hay herramientas que realmente funcionan bien. ¿Entonces esas plataformas que afirmaban ser las "más fuertes" antes solo eran una pérdida de dinero? ¿Realmente ha mejorado el razonamiento o solo están jugando con las palabras? Si esto es solo otro truco de marketing, me muero de risa.

Ver originalesResponder0

Temas de actualidadVer más
#GateNovTransparencyReportReleased
17.65K Popularidad
#FedRateCutComing
683.22K Popularidad
#PostonSquaretoEarn$50
63.7K Popularidad
#BitcoinActivityPicksUp
17.75K Popularidad
#CryptoMarketRebound
508.95K Popularidad

Gate Fun en tendenciaVer más

1
拼好饭拼好饭
Cap.M.:$3.69KHolders:2
0.00%
2
666拼好饭
Cap.M.:$3.64KHolders:2
0.04%
3
GWHALEGWhale
Cap.M.:$3.81KHolders:3
0.97%
4
BGOLDBGOLD
Cap.M.:$3.67KHolders:1
0.78%
5
HTBGHotBerg
Cap.M.:$3.7KHolders:2
0.02%

Anclado