Resultados da pesquisa de "CLIPS"
2025-09-15
06:39

ADIVINHE A LOCALIZAÇÃO OLHANDO PARA A IMAGEM: O MAIS RECENTE POMBO MODELO DE IA DE STANFORD TEM UMA TAXA DE PRECISÃO DE MAIS DE 90%

Recentemente, uma equipe de pesquisadores da Universidade de Stanford colaborou para desenvolver uma ferramenta de IA, PIGEON, que combina a criação semântica de geocélulas com suavização de rótulos, imagens pré-treinadas do Street View com transformadores de visão CLIP e usa ProtoNets para refinar previsões de localização em um conjunto de unidades geográficas candidatas. O PIGEON alcançou uma taxa de precisão de 91,96% e um palpite de 40,36% dentro de 25 quilômetros da meta na subtarefa "Adivinhe o País por Foto", que é o primeiro papel de geolocalização de imagem de última geração nos últimos cinco anos sem financiamento militar.
Mais
07:33

ADIVINHE A LOCALIZAÇÃO OLHANDO PARA A IMAGEM: O MAIS RECENTE POMBO MODELO DE IA DE STANFORD TEM UMA TAXA DE PRECISÃO DE MAIS DE 90%

Recentemente, uma equipe de pesquisa da Universidade de Stanford colaborou para desenvolver uma ferramenta de IA, PIGEON, que combina a criação semântica de geocélulas com suavização de rótulos, imagens pré-treinadas do Street View com transformadores de visão CLIP e usa ProtoNets para refinar as previsões de localização em um conjunto de unidades geográficas candidatas, conforme relatado por Xinzhiyuan em 14 de janeiro. O PIGEON alcançou uma taxa de precisão de 91,96% e um palpite de 40,36% dentro de 25 quilômetros da meta na subtarefa "Adivinhe o País por Foto", que é o primeiro papel de geolocalização de imagem de última geração nos últimos cinco anos sem financiamento militar.
Mais
09:26

A Universidade de Tsinghua e a equipe de Harvard lançaram o LangSplat, um sistema de IA que pode descrever cenas 3D com mais precisão, 199 vezes mais rápido do que o LERF

A Universidade de Tsinghua e a Universidade de Harvard desenvolveram em conjunto um novo sistema de IA chamado LangSplat que pode pesquisar palavras abertas de forma eficiente e precisa no espaço tridimensional. É relatado que LangSplat é o primeiro método de campo linguístico 3D baseado em 3DGS, com a introdução especial de SAM e CLIP, que supera os métodos mais avançados em tarefas de localização de objetos 3D de vocabulário aberto e segmentação semântica, sendo 199 vezes mais rápido do que o LERF.
Mais
04:31

A Universidade de Tsinghua e a equipe de Harvard lançaram o LangSplat, um sistema de IA que pode descrever cenas 3D com mais precisão, 199 vezes mais rápido do que o LERF

De acordo com o IT Home em 2 de janeiro, a Universidade Tsinghua e a Universidade de Harvard desenvolveram em conjunto um novo sistema de IA chamado LangSplat, que pode pesquisar palavras abertas de forma eficiente e precisa no espaço tridimensional. É relatado que LangSplat é o primeiro método de campo linguístico 3D baseado em 3DGS, com a introdução especial de SAM e CLIP, que supera os métodos mais avançados em tarefas de localização de objetos 3D de vocabulário aberto e segmentação semântica, sendo 199 vezes mais rápido do que o LERF.
Mais
22:57

Pudgy Penguins lança 'caixa de presente exclusiva para celebridades' no Walmart

Em comemoração ao festival de compras norte-americano Cyber Monday, a Pudgy Penguins lançou uma "caixa de presente exclusiva para celebridades" no Walmart a um preço com desconto de US$ 25, que contém brinquedos e itens colecionáveis que só podem ser comprados através de Walmart.com. A caixa de presente inclui um brinquedo de pelúcia de 12 polegadas, uma figura de ação, um brinquedo de pelúcia clip-on menor, um brinquedo iglu e um certificado para os compradores reivindicarem um NFT gratuito (cunhado em zkSync Era) para a plataforma de jogos Pudgy World.
Mais
CYBER-1,09%
01:04

A plataforma de desenvolvimento em nuvem Azure AI da Microsoft adicionou 40 novos modelos, incluindo Falcon e Stable Diffusion

De acordo com a comunidade aberta da AIGC, a Microsoft anunciou a adição de 40 novos modelos à plataforma de desenvolvimento de nuvem Azure AI, como Falcon, Phi, Jais, Code Llama, CLIP, Whisper V3, Stable Diffusion, etc., abrangendo texto, imagens, código, fala e outras gerações de conteúdo. Os desenvolvedores só precisam usar APIs ou SDKs para integrar rapidamente modelos em seus aplicativos, ao mesmo tempo em que suportam funções personalizadas, como ajuste fino de dados e otimização de instruções. Além disso, os desenvolvedores podem encontrar rapidamente o produto certo no Model Mall da IA do Azure pesquisando por palavra-chave, por exemplo, digitando a palavra "código" para exibir o modelo correspondente.
Mais
04:14

A versão não oficial do Big Eye Clip está na Microsoft Store, que pode funcionar como um robô de bate-papo ChatGPT

De acordo com notícias da IT House em 29 de junho, o Microsoft Office Assistant Clippy (Clippy) é, de certa forma, o precursor de ferramentas de IA generativas, como o Bing Chat, que a Microsoft está lançando agora. Recentemente, o desenvolvedor terceirizado FireCube Studios lançou uma versão não oficial do Big Eye Clip, por meio da qual os usuários podem usar o ChatGPT. A FireCube Studios lançou uma versão de visualização gratuita do clipe ocular na Microsoft Store (Microsoft Store) esta semana, disponível para usuários do Windows 10 e 11. O Big Eye Clip pode obter respostas do chatbot ChatGPT da OpenAI, usando o modelo GPT 3.5. O desenvolvedor apontou que os usuários podem fixar o clipe de olho grande na área de trabalho para obter rapidamente respostas às perguntas da inteligência artificial generativa. Este aplicativo de clipe de olho grande está disponível gratuitamente, mas atualmente há uma grande limitação, ou seja, os usuários precisam comprar uma chave OpenAI para usá-lo. Os desenvolvedores disseram que estão tentando lançar uma nova versão, que pode usar o clipe de olho sem comprar uma chave. O aplicativo em si é de código aberto e o código está disponível no GitHub.
Mais