Qual plataforma constrói os melhores agentes de IA? Testamos ChatGPT, Claude, Gemini e mais

iniciantes1/9/2025, 7:43:03 AM
Este artigo compara e testa cinco grandes plataformas de IA (ChatGPT, Google Gemini, HuggingChat, Claude e Mistral AI), avaliando sua facilidade de uso e a qualidade dos resultados na criação de agentes de IA.

Uma comparação prática de cinco plataformas líderes revela qual é a melhor para hospedar seus futuros agentes de IA para cenários do dia a dia.

Imagem criada pelo Decrypt usando IA

Você pode fazer qualquer coisa com agentes de IA: procurar informações em sua biblioteca de documentos, construir código, raspar a web, obter insights e análises incisivas de dados complexos e muito mais. Você pode até criar um escritório virtual com um grupo de agentes especializados em diferentes tarefas e fazê-los trabalhar de mãos dadas como sua própria equipe de funcionários digitais especializados.

Então, o quão difícil é fazer isso? Se uma pessoa comum quisesse construir seu próprio consultor financeiro de IA, por exemplo, qual plataforma seria a melhor para ela? Nenhuma API, nenhum código estranho, nenhum Github - apenas queríamos ver quão bem as melhores empresas de IA estão criando agentes de IA sem que o usuário possua um alto grau de habilidade técnica.

Claro, você obtém o que paga. Neste caso, também queríamos ver se havia uma correlação entre o quão fácil era para um leigo configurar um agente e a qualidade dos resultados entregues por cada um.

Nosso experimento colocou cinco pesos pesados um contra o outro: ChatGPT, Claude, Huggingface, Mistral AI e Gemini. Cada plataforma recebeu as mesmas instruções básicas para criar um consultor financeiro.

O teste focou exclusivamente nas capacidades prontas para uso. Se os agentes eram capazes de lidar com um cenário comum - neste caso, ajudar alguém a equilibrar $25,000 em investimentos contra $30,000 em dívidas. Também queríamos ver o quão bons eles eram em analisar um gráfico de negociação. Evitamos o uso de ferramentas adicionais que aumentariam a produtividade dos agentes e, em vez disso, tentamos adotar a abordagem mais simples.

TL;DR Aqui está o que descobrimos e como classificamos os modelos:

Classificação das plataformas

1) GPT da OpenAI (8.5/10)

  • Facilidade de Configuração: 4/5
  • Qualidade dos Resultados: 4.5/5

ChatGPT é a plataforma mais equilibrada, oferecendo criação sofisticada de agentes com opções guiadas e manuais para satisfazer as necessidades de novatos totais e usuários um pouco mais experientes.

Embora a recente atualização da interface tenha enterrado algumas funcionalidades em menus, a plataforma se destaca na tradução de requisitos complexos do usuário em agentes funcionais. Testamos o modelo construindo um consultor financeiro que demonstrou uma consciência contextual superior e capacidades estruturadas de resolução de problemas, fornecendo estratégias detalhadas e coerentes para gerenciamento de dívidas e alocação de investimentos.

2) Google Gemini (7/10)

  • Facilidade de configuração: 4/5
  • Qualidade dos resultados: 3/5

Gemini se destaca com sua interface polida e intuitiva e excelente tratamento de erros. Embora exija prompts mais detalhados para resultados ótimos, sua interpretação literal das instruções cria resultados consistentes e previsíveis.

A abordagem consultiva do agente para aconselhamento financeiro enfatizou a coleta de contexto antes das recomendações, espelhando práticas profissionais. No entanto, pode ser excessivamente conservador em suas respostas de zero-shot.

3) HuggingChat (6.5/10)

  • Facilidade de Configuração: 2/5
  • Qualidade dos Resultados: 4.5/5

A plataforma de código aberto oferece opções incomparáveis de personalização e seleção de modelos. Isso é ótimo para aqueles que buscam controle granular sobre cada aspecto, mas não é realmente para aqueles que buscam simplicidade. (Pense nisso como comparar um sistema Linux com um macOS). Seu sofisticado quadro de horizonte temporal e integração prática de ferramentas demonstram capacidades avançadas.

Construímos um agente puro sem nenhuma funcionalidade adicional. Utilizamos o Nemomotron da Nvidia como base LLM e foi bom o suficiente para corresponder à qualidade de saída do ChatGPT. Nada mal para o campo de código aberto.

4) Claude (5.5/10)

  • Facilidade de configuração: 2,5/5
  • Qualidade dos resultados: 3/5

A plataforma da Anthropic se destaca em nichos específicos, especialmente em tarefas que exigem processamento de contexto extensivo e interpretação de código. Sua interface minimalista mascara capacidades sofisticadas, mas o campo de instruções 'opcional' pode confundir os usuários.

Nosso agente permaneceu muito conservador e vago em seus conselhos, mas demonstrou sólida consciência de risco e pensamento estratégico. Requer mais incentivo cuidadoso para realmente extrair seu potencial, mas seria injusto para um teste adaptar um incentivo, negando a premissa de assumir condições semelhantes.

5) Mistral AI (5/10)

  • Facilidade de configuração: 2.5/5
  • Qualidade dos Resultados: 2.5/5

A plataforma francesa oferece aprendizado único baseado em exemplos e opções de personalização avançadas. No entanto, sua interface centrada no desenvolvedor e problemas ocasionais de troca de idioma criam barreiras para usuários não técnicos. Também requer modificar a configuração do agente para modelos diferentes a fim de realizar tarefas díspares, como analisar imagens ou lidar com código. Isso não é ideal.

O consultor financeiro mostrou promessa em design de interação, mas teve dificuldade com validação matemática básica e ofereceu o pior resultado. Isso não quer dizer que o resultado foi ruim, mas em um teste de zero-shot, isso foi o menos satisfatório.

Mergulho mais profundo

Considerando a classificação anterior, não há uma solução única e todas as plataformas têm seus próprios prós e contras. Com dedicação e personalização cuidadosa das sugestões, os resultados de uma plataforma podem variar e superar até mesmo as demais. No final, todos os LLMs têm seus próprios estilos de sugestão respectivos.

Se quiser saber mais sobre a lógica por trás da nossa classificação, aqui está uma análise mais aprofundada da nossa experiência e dos resultados que obtivemos com os nossos agentes. Configuramos todos os nossos agentes com o mesmo prompt do sistema, sem parâmetros ou funcionalidades adicionais, e perguntamos a eles a mesma pergunta básica: 'Tenho $25K para investir e estou com uma dívida de $30K. Faça um plano financeiro para mim.'

OpenAI

A interface do ChatGPT recentemente passou por uma reformulação que na verdade tornou as coisas mais complicadas. A opção de criação do GPT agora se esconde atrás de menus, mas uma vez encontrada, oferece dois caminhos: uma configuração conversacional onde a IA ajuda a construir seu agente, e uma configuração manual para aqueles que sabem exatamente o que querem.

A plataforma GPT da OpenAI é uma verdadeira navaja suíça de capacidades - ela lê código, pesquisa na web e lida tanto com geração quanto com análise de imagens. O processo de configuração guiado por IA torna-o particularmente adequado para iniciantes, embora possa parecer restritivo para usuários avançados em busca de controle granular. (Por exemplo, se você solicitar ao modelo que seja mais específico ou mais detalhado, ele pode alterar todo o prompt do sistema, fornecendo resultados piores).

Quando se trata de realmente usar o agente, o ChatGPT é muito direto e a interface é limpa e fácil de entender.

Os agentes podem ler documentos nativamente e entender imagens, o que proporciona uma vantagem sobre outras plataformas.

Agora, vamos falar sobre a qualidade dos agentes que você pode criar com as orientações básicas. Nosso consultor financeiro chamado MoneyGPTfoi bastante impressionante, nos dando uma aula magistral em resolução estruturada de problemas.

Além de suas alocações precisas—“$20,000 para dívidas de alto interesse” e detalhamentos específicos do portfólio—o agente demonstrou raciocínio financeiro sofisticado. Ele forneceu um plano de cinco etapas que não era apenas uma lista, mas uma estratégia coerente que considerava tanto as necessidades imediatas quanto as considerações de longo prazo.

A força do agente estava em sua capacidade de equilibrar detalhes com contexto. Enquanto recomendava investimentos específicos (40% S&P 500, 30% títulos), também explicava a lógica por trás de suas respostas: 'Pagar dívidas com juros altos é como obter um retorno garantido do investimento.' Essa consciência contextual se estendia ao planejamento de longo prazo, sugerindo ciclos de revisão periódicos e estratégias adaptativas baseadas em circunstâncias em constante mudança.

No entanto, essa abundância de informações revelou uma fraqueza potencial: o risco de sobrecarregar os usuários com muitos detalhes de uma só vez. Embora tecnicamente abrangente, a entrega rápida de alocações específicas, estratégias de investimento e planos de monitoramento pode ser assustadora para iniciantes financeiros.

Você pode ler seu plano completo aqui, e você pode usá-lo clicando em este linkNós realmente recomendamos isso.

Google

No geral, a plataforma de criação de agentes Gemini do Google ganha o concurso de beleza com uma interface polida e intuitiva que torna a criação de agentes quase fácil demais. O sistema segue as instruções ao pé da letra, o que ajuda a evitar confusões, e sua interface limpa elimina o fator de intimidação do desenvolvimento de IA.

No entanto, é necessário um comando mais detalhado para espremer um bom suco dele. Não dá as coisas como garantidas: um comando curto lhe dará uma resposta de baixa qualidade.

Por baixo do capô, ele possui um poderoso mecanismo de pesquisa na web baseado no Google, análise de código e capacidades de processamento de imagem que rivalizam com as ofertas do ChatGPT, mas principalmente dependem da tecnologia da Microsoft.

A interface da Gemini parece ter sido projetada por pessoas que realmente entendem de experiência do usuário. A interface orienta os usuários com rótulos claros e tudo é exibido em apenas uma tela.

Esta abordagem polida torna-a particularmente atraente para os recém-chegados, embora os usuários experientes possam sentir vontade de ter mais controle granular.

Chamamos nosso agenteMoneyGeme pediu um plano financeiro. Sua abordagem consultiva mostrou a metodologia distinta de resolução de problemas do Google. Em vez de dar uma resposta direta, ele começou com perguntas como "Que tipo de dívida é?" e "Quais são suas taxas de juros?" - mostrando uma compreensão de que o conselho financeiro não é único para todos.

Sua ênfase em reunir contexto antes de fornecer recomendações está alinhada com as práticas profissionais de planejamento financeiro, embora possa frustrar usuários que buscam respostas imediatas.

Uma resposta de zero-shot não foi útil. O agente basicamente disse que não conhecia o usuário o suficiente para fornecer bons conselhos financeiros. Após pedir para fazer suposições e forçá-lo a fornecer um plano que pudesse se adequar à maioria dos cenários, o agente gerou um rascunho muito conservador de um plano sem dar sugestões específicas sobre quais investimentos considerar.

MoneyGem, no entanto, encerrou sua resposta com uma recomendação para maximizar contas com vantagens fiscais, como um 401(k) ou Roth IRA, para reduzir sua carga tributária. Legal.

Você pode clicar aquipara ler nossa interação com a MoneyGem e experimentar o modelo você mesmo clicandoeste link.

Mistral AI

A abordagem da Mistral para o processo de configuração do agente é um tanto distante da simplicidade. A ferramenta de criação de agente está escondida em seu console de desenvolvedor, com opções de personalização profundas que podem assustar os iniciantes, mas encantar os experimentadores.

Sua interface de construção de agente não faz parte do LeChat (a interface do chatbot), mas aparecerá lá assim que o agente for criado.

Uma coisa que realmente gostamos é a capacidade de alimentar a ferramenta com exemplos que moldam o comportamento do agente e o estilo de resposta - algo que nenhuma outra plataforma oferece atualmente. Além disso, aqui está um bug estranho: ao criar nosso agente, a interface do usuário de repente mudou para o francês, possivelmente porque a empresa é francesa. Independentemente disso, não conseguimos voltar para o inglês ou espanhol.

Uma vez que o agente é criado, os usuários devem invocá-lo na interface normal do chatbot para trabalhar com ele. Eles devem sair de Le Plateforme e ir para Le Chat, o que não é a coisa mais intuitiva a se fazer. No entanto, a interface do usuário para usar o agente é bastante simples e parece com qualquer outro chatbot de IA.

Construímos nosso agente e o chamamos de Le Moneypara honrar as raízes francesas da Mistral. Seu desempenho mostrou claramente a abordagem generalista da Mistral para a solução de problemas. Sua sugestão de "reservar $10.000 para emergências, $15.000 para pagamento de dívidas e $10.000 para investimentos" parecia direta, mas mostrou que os agentes careciam de alguma validação matemática básica.

O total de $35.000 excedeu os fundos disponíveis em $10.000, o que é um erro básico que alguns modelos de linguagem exibem ao priorizar a correção conceitual sobre a precisão numérica.

No entanto, devemos observar que os melhores LLMs têm melhorado muito e não falham nessa tarefa - pelo menos não com tanta frequência quanto os da Mistral.

Além disso, seu plano não era realmente detalhado, mas era o único que fornecia perguntas de acompanhamento que poderiam tornar a interação mais fluida e poderiam ajudar a entender melhor as necessidades do usuário.

O plano completo do LeMoney está disponívelaquie o agente está disponível para testeaqui.

Anthropic

Os projetos de Claude parecem menos uma plataforma de criação de agentes e mais um sistema sofisticado de execução de tarefas. A interface é minimalista, quase demais, e não parece intuitiva.

Esta interface minimalista pode deixar alguns usuários coçando a cabeça. A plataforma apresenta uma configuração básica com um campo de instruções 'opcional' que de alguma forma parece tanto não importante quanto crucial ao mesmo tempo: se as instruções são rotuladas como opcionais, então como o agente de IA saberá o que deve fazer?

Sua interface minimalista parece estranha, mas a Anthropic nunca foi conhecida por seu gosto em escolhas de UI. A mesma janela para configurar o modelo é a que você usa para promovê-lo. Suas capacidades se concentram principalmente na interpretação de códigos de texto, nada mais. Pesquisas na web e processamento e geração de imagens são coisas sofisticadas que a Anthropic deixa para seus concorrentes.

Nosso agente, chamado MoneyClaude, não está disponível para testes públicos porque a Anthropic não permite. Ele adotou uma postura muito conservadora ao fornecer conselhos financeiros com respostas tecnicamente precisas, porém vagas - como "manter uma abordagem equilibrada entre a redução da dívida e as economias essenciais", por exemplo.

Solicitou informações adicionais, mas pelo menos garantiu fornecer uma estratégia muito genérica na ausência delas, sem exigir interação adicional, o que parece mais otimizado do que a abordagem do Google.

Clique aqui para ler seu plano completo.

Hugging Face

O repositório de código aberto é um paraíso para usuários avançados - e um pesadelo em potencial para iniciantes. É a única plataforma que permite aos usuários escolher o modelo de idioma preferido, oferecendo controle sem precedentes sobre a base do agente.

Além disso, os usuários têm dezenas de ferramentas diferentes para integrar com seus agentes, mas só podem ativar três delas simultaneamente. Essa limitação força uma consideração cuidadosa sobre quais recursos são mais importantes para cada caso de uso específico, mas é algo que nenhum outro modelo pode oferecer.

É a experiência mais personalizável de todas as interfaces, no entanto, com muitos botões para ajustar. O resultado é uma plataforma que pode criar agentes mais poderosos e especializados do que seus concorrentes, mas apenas nas mãos de alguém que saiba exatamente o que está fazendo.

Os usuários podem testar seus agentes emHuggingChat—sem dúvida, o sonho do usuário avançado. Depois de criar o agente, usá-lo é muito simples. A interface mostra um grande cartão com o nome, descrição e foto do agente. Também permite aos usuários compartilhar o link do agente e ajustar suas configurações, tudo diretamente do cartão.

Colocando nossa HuggingMoneyO agente ao teste mostra que lida com uma estrutura de horizonte de tempo, mostrando uma compreensão mais sofisticada da psicologia do planejamento financeiro. Sua divisão em “Curto prazo (0-24 meses), Médio prazo (24-60 meses) e Longo prazo (mais de 60 meses)” espelha as práticas profissionais de planejamento financeiro.

O agente sugeriu alocar "$0-$5,000 em veículos líquidos e de baixo risco" enquanto mantém pagamentos agressivos de dívidas de "$1,000-$1,500 mensais." Isso é, à primeira vista, um sinal de entendimento sutil da gestão do fluxo de caixa.

Outra característica interessante foi a integração de ferramentas práticas com conselhos teóricos. Além de sugerir apenas o 50/30/20regra, ele recomendou aplicativos específicos de orçamento e enfatizou a otimização fiscal - criando uma ponte entre estratégia de alto nível e execução diária. A principal desvantagem? Ele inclui suposições sobre as taxas de juros da dívida sem buscar esclarecimentos.

Num esforço para fornecer conselhos úteis, muitas coisas são dadas como certas. Esta urgência em fornecer uma resposta, seja qual for, pode ser corrigida com estímulo, mas é algo a se considerar.

Você pode ler o plano completo da HuggingMoneyaqui. Além disso, você pode tentar clicando emeste link.

Isenção de responsabilidade:

  1. Este artigo é reproduzido a partir de [ Descriptografar]. Todos os direitos autorais pertencem ao autor original [Jose Antonio Lanz]. Se houver objeções a esta reimpressão, entre em contato com o Gate Learnequipe e eles cuidarão disso prontamente.
  2. Isenção de responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem aconselhamento de investimento.
  3. A equipe do Gate Learn traduziu o artigo para outros idiomas. A cópia, distribuição ou plágio dos artigos traduzidos é proibida, a menos que mencionado.

Qual plataforma constrói os melhores agentes de IA? Testamos ChatGPT, Claude, Gemini e mais

iniciantes1/9/2025, 7:43:03 AM
Este artigo compara e testa cinco grandes plataformas de IA (ChatGPT, Google Gemini, HuggingChat, Claude e Mistral AI), avaliando sua facilidade de uso e a qualidade dos resultados na criação de agentes de IA.

Uma comparação prática de cinco plataformas líderes revela qual é a melhor para hospedar seus futuros agentes de IA para cenários do dia a dia.

Imagem criada pelo Decrypt usando IA

Você pode fazer qualquer coisa com agentes de IA: procurar informações em sua biblioteca de documentos, construir código, raspar a web, obter insights e análises incisivas de dados complexos e muito mais. Você pode até criar um escritório virtual com um grupo de agentes especializados em diferentes tarefas e fazê-los trabalhar de mãos dadas como sua própria equipe de funcionários digitais especializados.

Então, o quão difícil é fazer isso? Se uma pessoa comum quisesse construir seu próprio consultor financeiro de IA, por exemplo, qual plataforma seria a melhor para ela? Nenhuma API, nenhum código estranho, nenhum Github - apenas queríamos ver quão bem as melhores empresas de IA estão criando agentes de IA sem que o usuário possua um alto grau de habilidade técnica.

Claro, você obtém o que paga. Neste caso, também queríamos ver se havia uma correlação entre o quão fácil era para um leigo configurar um agente e a qualidade dos resultados entregues por cada um.

Nosso experimento colocou cinco pesos pesados um contra o outro: ChatGPT, Claude, Huggingface, Mistral AI e Gemini. Cada plataforma recebeu as mesmas instruções básicas para criar um consultor financeiro.

O teste focou exclusivamente nas capacidades prontas para uso. Se os agentes eram capazes de lidar com um cenário comum - neste caso, ajudar alguém a equilibrar $25,000 em investimentos contra $30,000 em dívidas. Também queríamos ver o quão bons eles eram em analisar um gráfico de negociação. Evitamos o uso de ferramentas adicionais que aumentariam a produtividade dos agentes e, em vez disso, tentamos adotar a abordagem mais simples.

TL;DR Aqui está o que descobrimos e como classificamos os modelos:

Classificação das plataformas

1) GPT da OpenAI (8.5/10)

  • Facilidade de Configuração: 4/5
  • Qualidade dos Resultados: 4.5/5

ChatGPT é a plataforma mais equilibrada, oferecendo criação sofisticada de agentes com opções guiadas e manuais para satisfazer as necessidades de novatos totais e usuários um pouco mais experientes.

Embora a recente atualização da interface tenha enterrado algumas funcionalidades em menus, a plataforma se destaca na tradução de requisitos complexos do usuário em agentes funcionais. Testamos o modelo construindo um consultor financeiro que demonstrou uma consciência contextual superior e capacidades estruturadas de resolução de problemas, fornecendo estratégias detalhadas e coerentes para gerenciamento de dívidas e alocação de investimentos.

2) Google Gemini (7/10)

  • Facilidade de configuração: 4/5
  • Qualidade dos resultados: 3/5

Gemini se destaca com sua interface polida e intuitiva e excelente tratamento de erros. Embora exija prompts mais detalhados para resultados ótimos, sua interpretação literal das instruções cria resultados consistentes e previsíveis.

A abordagem consultiva do agente para aconselhamento financeiro enfatizou a coleta de contexto antes das recomendações, espelhando práticas profissionais. No entanto, pode ser excessivamente conservador em suas respostas de zero-shot.

3) HuggingChat (6.5/10)

  • Facilidade de Configuração: 2/5
  • Qualidade dos Resultados: 4.5/5

A plataforma de código aberto oferece opções incomparáveis de personalização e seleção de modelos. Isso é ótimo para aqueles que buscam controle granular sobre cada aspecto, mas não é realmente para aqueles que buscam simplicidade. (Pense nisso como comparar um sistema Linux com um macOS). Seu sofisticado quadro de horizonte temporal e integração prática de ferramentas demonstram capacidades avançadas.

Construímos um agente puro sem nenhuma funcionalidade adicional. Utilizamos o Nemomotron da Nvidia como base LLM e foi bom o suficiente para corresponder à qualidade de saída do ChatGPT. Nada mal para o campo de código aberto.

4) Claude (5.5/10)

  • Facilidade de configuração: 2,5/5
  • Qualidade dos resultados: 3/5

A plataforma da Anthropic se destaca em nichos específicos, especialmente em tarefas que exigem processamento de contexto extensivo e interpretação de código. Sua interface minimalista mascara capacidades sofisticadas, mas o campo de instruções 'opcional' pode confundir os usuários.

Nosso agente permaneceu muito conservador e vago em seus conselhos, mas demonstrou sólida consciência de risco e pensamento estratégico. Requer mais incentivo cuidadoso para realmente extrair seu potencial, mas seria injusto para um teste adaptar um incentivo, negando a premissa de assumir condições semelhantes.

5) Mistral AI (5/10)

  • Facilidade de configuração: 2.5/5
  • Qualidade dos Resultados: 2.5/5

A plataforma francesa oferece aprendizado único baseado em exemplos e opções de personalização avançadas. No entanto, sua interface centrada no desenvolvedor e problemas ocasionais de troca de idioma criam barreiras para usuários não técnicos. Também requer modificar a configuração do agente para modelos diferentes a fim de realizar tarefas díspares, como analisar imagens ou lidar com código. Isso não é ideal.

O consultor financeiro mostrou promessa em design de interação, mas teve dificuldade com validação matemática básica e ofereceu o pior resultado. Isso não quer dizer que o resultado foi ruim, mas em um teste de zero-shot, isso foi o menos satisfatório.

Mergulho mais profundo

Considerando a classificação anterior, não há uma solução única e todas as plataformas têm seus próprios prós e contras. Com dedicação e personalização cuidadosa das sugestões, os resultados de uma plataforma podem variar e superar até mesmo as demais. No final, todos os LLMs têm seus próprios estilos de sugestão respectivos.

Se quiser saber mais sobre a lógica por trás da nossa classificação, aqui está uma análise mais aprofundada da nossa experiência e dos resultados que obtivemos com os nossos agentes. Configuramos todos os nossos agentes com o mesmo prompt do sistema, sem parâmetros ou funcionalidades adicionais, e perguntamos a eles a mesma pergunta básica: 'Tenho $25K para investir e estou com uma dívida de $30K. Faça um plano financeiro para mim.'

OpenAI

A interface do ChatGPT recentemente passou por uma reformulação que na verdade tornou as coisas mais complicadas. A opção de criação do GPT agora se esconde atrás de menus, mas uma vez encontrada, oferece dois caminhos: uma configuração conversacional onde a IA ajuda a construir seu agente, e uma configuração manual para aqueles que sabem exatamente o que querem.

A plataforma GPT da OpenAI é uma verdadeira navaja suíça de capacidades - ela lê código, pesquisa na web e lida tanto com geração quanto com análise de imagens. O processo de configuração guiado por IA torna-o particularmente adequado para iniciantes, embora possa parecer restritivo para usuários avançados em busca de controle granular. (Por exemplo, se você solicitar ao modelo que seja mais específico ou mais detalhado, ele pode alterar todo o prompt do sistema, fornecendo resultados piores).

Quando se trata de realmente usar o agente, o ChatGPT é muito direto e a interface é limpa e fácil de entender.

Os agentes podem ler documentos nativamente e entender imagens, o que proporciona uma vantagem sobre outras plataformas.

Agora, vamos falar sobre a qualidade dos agentes que você pode criar com as orientações básicas. Nosso consultor financeiro chamado MoneyGPTfoi bastante impressionante, nos dando uma aula magistral em resolução estruturada de problemas.

Além de suas alocações precisas—“$20,000 para dívidas de alto interesse” e detalhamentos específicos do portfólio—o agente demonstrou raciocínio financeiro sofisticado. Ele forneceu um plano de cinco etapas que não era apenas uma lista, mas uma estratégia coerente que considerava tanto as necessidades imediatas quanto as considerações de longo prazo.

A força do agente estava em sua capacidade de equilibrar detalhes com contexto. Enquanto recomendava investimentos específicos (40% S&P 500, 30% títulos), também explicava a lógica por trás de suas respostas: 'Pagar dívidas com juros altos é como obter um retorno garantido do investimento.' Essa consciência contextual se estendia ao planejamento de longo prazo, sugerindo ciclos de revisão periódicos e estratégias adaptativas baseadas em circunstâncias em constante mudança.

No entanto, essa abundância de informações revelou uma fraqueza potencial: o risco de sobrecarregar os usuários com muitos detalhes de uma só vez. Embora tecnicamente abrangente, a entrega rápida de alocações específicas, estratégias de investimento e planos de monitoramento pode ser assustadora para iniciantes financeiros.

Você pode ler seu plano completo aqui, e você pode usá-lo clicando em este linkNós realmente recomendamos isso.

Google

No geral, a plataforma de criação de agentes Gemini do Google ganha o concurso de beleza com uma interface polida e intuitiva que torna a criação de agentes quase fácil demais. O sistema segue as instruções ao pé da letra, o que ajuda a evitar confusões, e sua interface limpa elimina o fator de intimidação do desenvolvimento de IA.

No entanto, é necessário um comando mais detalhado para espremer um bom suco dele. Não dá as coisas como garantidas: um comando curto lhe dará uma resposta de baixa qualidade.

Por baixo do capô, ele possui um poderoso mecanismo de pesquisa na web baseado no Google, análise de código e capacidades de processamento de imagem que rivalizam com as ofertas do ChatGPT, mas principalmente dependem da tecnologia da Microsoft.

A interface da Gemini parece ter sido projetada por pessoas que realmente entendem de experiência do usuário. A interface orienta os usuários com rótulos claros e tudo é exibido em apenas uma tela.

Esta abordagem polida torna-a particularmente atraente para os recém-chegados, embora os usuários experientes possam sentir vontade de ter mais controle granular.

Chamamos nosso agenteMoneyGeme pediu um plano financeiro. Sua abordagem consultiva mostrou a metodologia distinta de resolução de problemas do Google. Em vez de dar uma resposta direta, ele começou com perguntas como "Que tipo de dívida é?" e "Quais são suas taxas de juros?" - mostrando uma compreensão de que o conselho financeiro não é único para todos.

Sua ênfase em reunir contexto antes de fornecer recomendações está alinhada com as práticas profissionais de planejamento financeiro, embora possa frustrar usuários que buscam respostas imediatas.

Uma resposta de zero-shot não foi útil. O agente basicamente disse que não conhecia o usuário o suficiente para fornecer bons conselhos financeiros. Após pedir para fazer suposições e forçá-lo a fornecer um plano que pudesse se adequar à maioria dos cenários, o agente gerou um rascunho muito conservador de um plano sem dar sugestões específicas sobre quais investimentos considerar.

MoneyGem, no entanto, encerrou sua resposta com uma recomendação para maximizar contas com vantagens fiscais, como um 401(k) ou Roth IRA, para reduzir sua carga tributária. Legal.

Você pode clicar aquipara ler nossa interação com a MoneyGem e experimentar o modelo você mesmo clicandoeste link.

Mistral AI

A abordagem da Mistral para o processo de configuração do agente é um tanto distante da simplicidade. A ferramenta de criação de agente está escondida em seu console de desenvolvedor, com opções de personalização profundas que podem assustar os iniciantes, mas encantar os experimentadores.

Sua interface de construção de agente não faz parte do LeChat (a interface do chatbot), mas aparecerá lá assim que o agente for criado.

Uma coisa que realmente gostamos é a capacidade de alimentar a ferramenta com exemplos que moldam o comportamento do agente e o estilo de resposta - algo que nenhuma outra plataforma oferece atualmente. Além disso, aqui está um bug estranho: ao criar nosso agente, a interface do usuário de repente mudou para o francês, possivelmente porque a empresa é francesa. Independentemente disso, não conseguimos voltar para o inglês ou espanhol.

Uma vez que o agente é criado, os usuários devem invocá-lo na interface normal do chatbot para trabalhar com ele. Eles devem sair de Le Plateforme e ir para Le Chat, o que não é a coisa mais intuitiva a se fazer. No entanto, a interface do usuário para usar o agente é bastante simples e parece com qualquer outro chatbot de IA.

Construímos nosso agente e o chamamos de Le Moneypara honrar as raízes francesas da Mistral. Seu desempenho mostrou claramente a abordagem generalista da Mistral para a solução de problemas. Sua sugestão de "reservar $10.000 para emergências, $15.000 para pagamento de dívidas e $10.000 para investimentos" parecia direta, mas mostrou que os agentes careciam de alguma validação matemática básica.

O total de $35.000 excedeu os fundos disponíveis em $10.000, o que é um erro básico que alguns modelos de linguagem exibem ao priorizar a correção conceitual sobre a precisão numérica.

No entanto, devemos observar que os melhores LLMs têm melhorado muito e não falham nessa tarefa - pelo menos não com tanta frequência quanto os da Mistral.

Além disso, seu plano não era realmente detalhado, mas era o único que fornecia perguntas de acompanhamento que poderiam tornar a interação mais fluida e poderiam ajudar a entender melhor as necessidades do usuário.

O plano completo do LeMoney está disponívelaquie o agente está disponível para testeaqui.

Anthropic

Os projetos de Claude parecem menos uma plataforma de criação de agentes e mais um sistema sofisticado de execução de tarefas. A interface é minimalista, quase demais, e não parece intuitiva.

Esta interface minimalista pode deixar alguns usuários coçando a cabeça. A plataforma apresenta uma configuração básica com um campo de instruções 'opcional' que de alguma forma parece tanto não importante quanto crucial ao mesmo tempo: se as instruções são rotuladas como opcionais, então como o agente de IA saberá o que deve fazer?

Sua interface minimalista parece estranha, mas a Anthropic nunca foi conhecida por seu gosto em escolhas de UI. A mesma janela para configurar o modelo é a que você usa para promovê-lo. Suas capacidades se concentram principalmente na interpretação de códigos de texto, nada mais. Pesquisas na web e processamento e geração de imagens são coisas sofisticadas que a Anthropic deixa para seus concorrentes.

Nosso agente, chamado MoneyClaude, não está disponível para testes públicos porque a Anthropic não permite. Ele adotou uma postura muito conservadora ao fornecer conselhos financeiros com respostas tecnicamente precisas, porém vagas - como "manter uma abordagem equilibrada entre a redução da dívida e as economias essenciais", por exemplo.

Solicitou informações adicionais, mas pelo menos garantiu fornecer uma estratégia muito genérica na ausência delas, sem exigir interação adicional, o que parece mais otimizado do que a abordagem do Google.

Clique aqui para ler seu plano completo.

Hugging Face

O repositório de código aberto é um paraíso para usuários avançados - e um pesadelo em potencial para iniciantes. É a única plataforma que permite aos usuários escolher o modelo de idioma preferido, oferecendo controle sem precedentes sobre a base do agente.

Além disso, os usuários têm dezenas de ferramentas diferentes para integrar com seus agentes, mas só podem ativar três delas simultaneamente. Essa limitação força uma consideração cuidadosa sobre quais recursos são mais importantes para cada caso de uso específico, mas é algo que nenhum outro modelo pode oferecer.

É a experiência mais personalizável de todas as interfaces, no entanto, com muitos botões para ajustar. O resultado é uma plataforma que pode criar agentes mais poderosos e especializados do que seus concorrentes, mas apenas nas mãos de alguém que saiba exatamente o que está fazendo.

Os usuários podem testar seus agentes emHuggingChat—sem dúvida, o sonho do usuário avançado. Depois de criar o agente, usá-lo é muito simples. A interface mostra um grande cartão com o nome, descrição e foto do agente. Também permite aos usuários compartilhar o link do agente e ajustar suas configurações, tudo diretamente do cartão.

Colocando nossa HuggingMoneyO agente ao teste mostra que lida com uma estrutura de horizonte de tempo, mostrando uma compreensão mais sofisticada da psicologia do planejamento financeiro. Sua divisão em “Curto prazo (0-24 meses), Médio prazo (24-60 meses) e Longo prazo (mais de 60 meses)” espelha as práticas profissionais de planejamento financeiro.

O agente sugeriu alocar "$0-$5,000 em veículos líquidos e de baixo risco" enquanto mantém pagamentos agressivos de dívidas de "$1,000-$1,500 mensais." Isso é, à primeira vista, um sinal de entendimento sutil da gestão do fluxo de caixa.

Outra característica interessante foi a integração de ferramentas práticas com conselhos teóricos. Além de sugerir apenas o 50/30/20regra, ele recomendou aplicativos específicos de orçamento e enfatizou a otimização fiscal - criando uma ponte entre estratégia de alto nível e execução diária. A principal desvantagem? Ele inclui suposições sobre as taxas de juros da dívida sem buscar esclarecimentos.

Num esforço para fornecer conselhos úteis, muitas coisas são dadas como certas. Esta urgência em fornecer uma resposta, seja qual for, pode ser corrigida com estímulo, mas é algo a se considerar.

Você pode ler o plano completo da HuggingMoneyaqui. Além disso, você pode tentar clicando emeste link.

Isenção de responsabilidade:

  1. Este artigo é reproduzido a partir de [ Descriptografar]. Todos os direitos autorais pertencem ao autor original [Jose Antonio Lanz]. Se houver objeções a esta reimpressão, entre em contato com o Gate Learnequipe e eles cuidarão disso prontamente.
  2. Isenção de responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem aconselhamento de investimento.
  3. A equipe do Gate Learn traduziu o artigo para outros idiomas. A cópia, distribuição ou plágio dos artigos traduzidos é proibida, a menos que mencionado.
今すぐ始める
登録して、
$100
のボーナスを獲得しよう!