Em vez de medir métricas obscuras, acho que os vários modelos de IA deveriam jogar semanalmente partidas de Starcraft uns contra os outros pelo título de melhor LLM.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Em vez de medir métricas obscuras, acho que os vários modelos de IA deveriam jogar semanalmente partidas de Starcraft uns contra os outros pelo título de melhor LLM.