OpenAI lança monitoramento CoT para impedir o comportamento malicioso de grandes modelos

Geração do resumo em andamento

Golden Finance informou que a OpenAI lançou a pesquisa mais recente, usando monitoramento CoT (cadeia de pensamento), pode prevenir comportamentos maliciosos, como grandes modelos falando bobagens e escondendo intenções verdadeiras, e também é uma das ferramentas eficazes para supervisionar super modelos. OpenAI usa o recém-lançado modelo de ponta o3-mini como o objeto monitorado, e o modelo GPT-4o mais fraco como o monitor. O ambiente de teste é uma tarefa de codificação que requer que a IA implemente a funcionalidade na base de código para passar nos testes de unidade. Os resultados mostraram que o monitor CoT teve um bom desempenho na deteção sistemática de comportamentos de "hacking de recompensa", com uma taxa de recordação de até 95%, excedendo em muito os 60% de comportamentos que foram apenas monitorados.

O31.29%

GPT-9.94%

Ver original

O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.

Recompensa
curtir
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
#BTC#
192k Postagens
#ETH#
120k Postagens
#PI#
96k Postagens
4#GateioInto11#
76k Postagens
5#ContentStar#
64k Postagens
6#BOME#
59k Postagens
7#GT#
56k Postagens
8#DOGE#
53k Postagens
9#MAGA#
52k Postagens
10#SLERF#
51k Postagens

Marcar

sitemap