No dia 23 de maio, o gigante dos chips, Nvidia, divulgou o relatório financeiro do primeiro trimestre do ano fiscal de 2025. O relatório mostra que a receita do primeiro trimestre da Nvidia foi de 26 bilhões de dólares. Dessa quantia, a receita do centro de dados cresceu impressionantes 427% em relação ao ano anterior, atingindo incríveis 22,6 bilhões de dólares. A capacidade da Nvidia de salvar o desempenho financeiro do mercado de ações dos EUA por conta própria reflete a demanda explosiva de poder de computação das empresas de tecnologia globais para competir na corrida de IA. Quanto mais ambiciosas são as principais empresas de tecnologia na corrida da IA, maior é a demanda exponencial por poder de computação. De acordo com as previsões da TrendForce, em 2024, os quatro principais provedores de serviços de nuvem dos EUA - Microsoft, Google, AWS e Meta - devem representar 20,2%, 16,6%, 16% e 10,8% da demanda global por servidores de IA de ponta, totalizando mais de 60%.
Fonte da imagem:
"Escassez de chips" tem sido um termo quente nos últimos anos. Por um lado, o treinamento e a inferência de grandes modelos de linguagem (LLM) requerem muito poder de computação; e à medida que o modelo itera, os custos e a demanda por poder de computação aumentam exponencialmente. Por outro lado, grandes empresas como o Meta compram uma grande quantidade de chips, levando todos os recursos de computação do mundo a se inclinarem para esses gigantes da tecnologia, tornando cada vez mais difícil para pequenas empresas obter os recursos de computação necessários. O dilema enfrentado pelas pequenas empresas não se deve apenas à escassez de oferta de chips causada pelo aumento da demanda, mas também a contradições estruturais na oferta. Atualmente, ainda há muitas GPUs ociosas do lado da oferta, por exemplo, alguns data centers têm uma grande quantidade de poder de computação ocioso (taxa de utilização de apenas 12% - 18%), e devido à redução dos lucros na mineração de criptomoedas, também há uma grande quantidade de recursos de computação ociosos. Embora nem todo esse poder de computação seja adequado para aplicativos profissionais como treinamento de IA, hardware de consumo ainda pode desempenhar um papel significativo em outras áreas, como inferência de IA, renderização de jogos em nuvem, telefones em nuvem, entre outros. A oportunidade de integrar e aproveitar esses recursos de computação é enorme.
Desvie o olhar da IA para a cripto e, depois de três anos de silêncio no mercado criptográfico, finalmente chegou outro período de alta, com o preço do Bitcoin atingindo repetidamente novos patamares e uma infinidade de mememoedas surgindo. Embora a IA e a Cripto tenham sido as palavras da moda nos últimos anos, a inteligência artificial e a blockchain, como duas tecnologias importantes, parecem ser como linhas paralelas, sem encontrar um 'ponto de interseção'. No início deste ano, Vitalik publicou um artigo intitulado 'A promessa e os desafios das aplicações de cripto + IA', discutindo os cenários futuros da combinação de IA e cripto. Vitalik mencionou muitas visões, incluindo o uso de tecnologias de criptografia como blockchain e MPC para descentralizar o treinamento e a inferência da IA, abrindo a caixa preta do aprendizado de máquina para tornar os modelos de IA mais confiáveis, entre outros. A realização dessas visões ainda tem um longo caminho a percorrer. No entanto, um dos casos de uso mencionados por Vitalik - capacitar a IA com incentivos econômicos criptográficos - é uma direção importante e realizável em um curto espaço de tempo. A rede de capacidade de computação descentralizada é atualmente um dos cenários mais adequados para a combinação de IA + cripto.
2 Descentralização Poder de computação rede
Atualmente, vários projetos estão se desenvolvendo na área de redes de poder de computação descentralizadas. A lógica subjacente a esses projetos é semelhante e pode ser resumida como: usar tokens para incentivar os detentores de poder de computação a fornecer serviços de poder de computação à rede, permitindo que recursos dispersos de poder de computação sejam reunidos em uma rede descentralizada de poder de computação de escala razoável. Isso aumenta a taxa de utilização de poder de computação ocioso e atende às necessidades de poder de computação dos clientes a um custo mais baixo, resultando em uma situação vantajosa para compradores e vendedores.
Para que os leitores obtenham uma compreensão geral deste campo em um curto espaço de tempo, este artigo irá deconstruir os projetos específicos e todo o campo de uma perspectiva micro-macro, com o objetivo de fornecer aos leitores uma perspectiva analítica para entender as vantagens competitivas de cada projeto e o desenvolvimento geral do campo de poder de computação descentralizado. O autor apresentará e analisará cinco projetos: Aethir, io.net, Render Network, Akash Network, Gensyn, e fará um resumo e avaliação da situação dos projetos e do desenvolvimento do campo.
Do ponto de vista da estrutura analítica, se nos concentrarmos em uma rede de poder de computação descentralizada específica, podemos dividi-la em quatro componentes principais:
Rede de hardware : Integrar recursos de computação dispersos, compartilhar e equilibrar a carga dos recursos de computação por meio de nós distribuídos globalmente, é a camada de base da rede de computação descentralizada.
Mercado bilateral: corresponde a um mercado seguro de transações onde os fornecedores de poder de computação são correspondidos com os demandantes através de um mecanismo de precificação e descoberta justo, garantindo transparência, igualdade e confiabilidade das transações.
Mecanismo de consenso:usado para garantir que os nós na rede estejam funcionando corretamente e completando o trabalho. O mecanismo de consenso é principalmente usado para monitorar dois aspectos: 1) monitorar se os nós estão online e em um estado ativo para aceitar tarefas a qualquer momento; 2) prova do trabalho do nó: o nó recebeu a tarefa e a concluiu corretamente de forma válida, sem que o poder de computação tenha sido usado para outros fins, ocupando processos e threads.
Incentivo de token: O modelo de token é usado para incentivar mais participantes a fornecer / usar serviços e capturar esse efeito de rede com tokens para realizar o compartilhamento de lucros da comunidade.
Se olharmos para a pista de potência de computação descentralizada de cima, o relatório de pesquisa da Blockworks oferece uma boa estrutura de análise e podemos dividir a posição dos projetos nessa pista em três camadas diferentes.
Camada de metal nu: A camada básica que compõe a pilha de computação descentralizada, cuja principal tarefa é coletar os recursos de poder de computação brutos e permitir que sejam chamados por API.
Camada de Orquestração: A camada intermediária que compõe a pilha de computação descentralizada, cuja principal tarefa é coordenar e abstrair, responsável pelo agendamento, expansão, operação, balanceamento de carga e tolerância a falhas da capacidade de computação, etc. O principal objetivo é "abstrair" a complexidade da gestão de hardware de baixo nível, fornecendo uma interface de usuário mais avançada para os usuários finais, atendendo a um público-alvo específico.
Camada de Agregação: O topo da pilha de computação descentralizada, cuja principal tarefa é a integração, responsável por fornecer uma interface unificada para que os usuários possam realizar uma variedade de tarefas de computação em um só lugar, como treinamento de IA, renderização, zkML e muito mais. Equivalente a uma camada de orquestração e distribuição de vários serviços de computação descentralizada.
Fonte da imagem: Youbi Capital
Com base nos dois quadros de análise acima, faremos uma comparação horizontal dos cinco projetos selecionados e avaliaremos-los em quatro aspectos - negócio principal, posicionamento de mercado, instalações de hardware e desempenho financeiro.
2.1 Negócio Principal
Do ponto de vista da lógica subjacente, a rede de poder de computação descentralizada é altamente homogênea, ou seja, usa tokens para incentivar os suportes de poder de computação ocioso a fornecer serviços de poder de computação. Com base nessa lógica subjacente, podemos entender as diferenças no núcleo do negócio do projeto a partir de três aspectos:
Fonte de poder de computação ocioso:
Existem duas fontes principais de energia de computação ociosa no mercado: 1) data centers, empresas mineiras e outras empresas têm energia de computação ociosa; 2) energia de computação ociosa nas mãos dos utilizadores individuais. A energia de computação dos centros de dados geralmente consiste em hardware de nível profissional, enquanto os utilizadores individuais geralmente compram chips de nível de consumo.
Aethir, Akash Network e Gensyn obtêm principalmente o poder de computação de empresas. As vantagens de obter poder de computação de empresas são: 1) As empresas e centros de dados geralmente possuem hardware de maior qualidade e equipes de manutenção especializadas, resultando em um desempenho e confiabilidade mais elevados dos recursos de poder de computação; 2) Os recursos de poder de computação das empresas e centros de dados tendem a ser mais homogêneos, e a gestão e monitorização centralizadas tornam o agendamento e manutenção dos recursos mais eficientes. No entanto, este método exige requisitos mais elevados por parte do projeto, sendo necessário que o projeto tenha ligações comerciais com empresas que possuem e controlam o poder de computação. Ao mesmo tempo, a escalabilidade e o grau de descentralização serão afetados em certa medida.
Render Network e io.net são principalmente incentivadores para os usuários individuais fornecerem sua capacidade de computação ociosa. As vantagens de coletar capacidade de computação dos usuários individuais são: 1) A capacidade de computação ociosa dos usuários individuais tem um custo explícito mais baixo e pode fornecer recursos de computação mais econômicos; 2) A escalabilidade da rede e o nível de descentralização são maiores, o que aumenta a resiliência e robustez do sistema. No entanto, as desvantagens são que os recursos dos usuários individuais estão amplamente distribuídos e não unificados, o que torna a gestão e o agendamento mais complexos e aumenta a dificuldade operacional. Além disso, é mais difícil (mais difícil de iniciar) formar efeitos de rede preliminares com base na capacidade de computação dos usuários individuais. Por fim, os dispositivos dos usuários individuais podem ter mais riscos de segurança, o que pode levar a vazamento de dados e riscos de uso indevido da capacidade de computação.
Consumidor de Poder de computação
Para os consumidores de poder de computação, os principais clientes-alvo da Aethir, io.net e Gensyn são empresas. Para os clientes do lado B, a inteligência artificial e a renderização em tempo real de jogos exigem alta demanda de desempenho de computação. Essas cargas de trabalho têm requisitos extremamente altos para recursos de computação e geralmente requerem GPUs de ponta ou hardware de nível profissional. Além disso, os clientes do lado B têm alta exigência de estabilidade e confiabilidade dos recursos de computação, portanto, é necessário fornecer um acordo de nível de serviço de alta qualidade para garantir a operação adequada do projeto e fornecer suporte técnico oportuno. Ao mesmo tempo, o custo de migração para os clientes do lado B é alto. Se a rede descentralizada não tiver um SDK maduro que permita que o projeto seja implantado rapidamente (por exemplo, a Akash Network requer que os usuários desenvolvam com base em portas remotas), é difícil fazer com que os clientes migrem. A menos que haja uma vantagem de preço significativa, a disposição dos clientes para migrar é muito baixa.
Render Network e Akash Network fornecem principalmente serviços de poder de computação para usuários individuais. Eles fornecem serviços para usuários finais, e o projeto precisa projetar uma interface e ferramentas simples e fáceis de usar para fornecer uma boa experiência de consumo aos consumidores. Além disso, os consumidores são sensíveis aos preços, portanto, o projeto precisa oferecer preços competitivos.
Tipo de hardware
Os recursos de hardware de computação comuns incluem CPU, FPGA, GPU, ASIC e SoC. Esses hardwares têm diferenças significativas em termos de metas de design, características de desempenho e áreas de aplicação. Em resumo, a CPU é melhor em tarefas de computação geral, a FPGA tem vantagens em processamento altamente paralelo e programabilidade, a GPU tem um desempenho excelente em computação paralela, o ASIC tem a eficiência mais alta em tarefas específicas e o SoC integra várias funções em um único chip, adequado para aplicativos altamente integrados. A escolha do hardware depende das necessidades específicas do aplicativo, requisitos de desempenho e considerações de custo. Os projetos de poder de computação descentralizado que discutimos geralmente coletam o poder de computação da GPU, o que é determinado pelo tipo de negócio do projeto e pelas características da GPU. Isso ocorre porque a GPU tem vantagens únicas em treinamento de IA, computação paralela, renderização de multimídia, etc.
Embora a maioria desses projetos envolva a integração de GPUs, diferentes aplicações têm requisitos de especificações de hardware diferentes, resultando em otimizações heterogêneas de núcleos e parâmetros. Esses parâmetros incluem paralelismo / dependências seriais, memória, latência, entre outros. Por exemplo, a carga de trabalho de renderização é realmente mais adequada para GPUs de consumo do que para GPUs de data center com maior desempenho, porque a renderização tem alta demanda em tarefas como rastreamento de raios, e chips de consumo como o 4090s foram aprimorados com RT cores, otimizados especificamente para cálculos de rastreamento de raios. O treinamento e a inferência de IA, por outro lado, exigem GPUs de nível profissional. Assim, a Render Network pode reunir GPUs de consumo como RTX 3090s e 4090s de varejistas, enquanto a IO.NET precisa de mais GPUs de nível profissional, como H100s, A100s, para atender às necessidades de startups de IA.
2.2 Posicionamento de mercado
Em termos de posicionamento do projeto, as camadas bare metal, orquestração e agregação precisam resolver problemas centrais, otimizar pontos-chave e capturar valor de maneiras diferentes.
A camada de metal bruto concentra-se na coleta e utilização de recursos físicos, a camada de orquestração concentra-se no agendamento e otimização da potência de computação, e o design é otimizado de acordo com as necessidades do público-alvo. A camada de agregação é geral e concentra-se na integração e abstração de diferentes recursos. Em termos de cadeia de valor, cada projeto deve começar a subir a partir da camada de metal bruto.
Do ponto de vista da captura de valor, a capacidade de captura de valor aumenta em cada camada, desde a camada de metal nu, a camada de orquestração até a camada de agregação. A camada de agregação é capaz de capturar a maior quantidade de valor, porque a plataforma de agregação pode obter os maiores efeitos de rede e também alcançar diretamente o maior número de usuários, funcionando como a entrada de tráfego para a rede descentralizada, ocupando assim a posição de maior captura de valor em toda a pilha de gerenciamento de recursos de poder de computação.
Da mesma forma, a construção de uma plataforma de agregação é a mais difícil, e o projeto precisa resolver uma série de problemas em várias áreas, tais como complexidade técnica, gerenciamento de recursos heterogêneos, confiabilidade e escalabilidade do sistema, implementação de efeitos de rede, segurança e privacidade e operações complexas. Esses desafios não favorecem o início frio do projeto e dependem do desenvolvimento e do momento do mercado da pista. Não é muito realista fazer uma camada de agregação quando a camada de orquestração ainda não desenvolveu uma participação de mercado significativa.
Atualmente, Aethir, Render Network, Akash Network e Gensyn pertencem à camada de Orchestration, eles visam fornecer serviços para objetivos e grupos de clientes específicos. O principal negócio da Aethir atualmente é o renderização em tempo real para jogos em nuvem e fornecer um ambiente e ferramentas de desenvolvimento e implantação para clientes B; O principal negócio da Render Network é a renderização de vídeos, a missão da Akash Network é fornecer uma plataforma de negociação semelhante ao Taobao, enquanto a Gensyn se concentra no campo de treinamento de IA. A posição do io.net é a camada de Aggregation, mas atualmente a funcionalidade implementada pelo io ainda está um pouco distante da funcionalidade completa da camada de agregação, embora já tenhamos coletado hardware da Render Network e Filecoin, a abstração e integração de recursos de hardware ainda não estão concluídas.
2.3 Instalações de hardware
Atualmente, nem todos os projetos publicam dados detalhados da rede, relativamente falando, a interface do usuário do explorador io.net é a melhor, e você pode ver o número de GPUs / CPUs, tipos, preços, distribuição, uso da rede, Nó receita, e assim por diante. No entanto, no final de abril, o front-end do io.net foi atacado, e os dados do front-end Hacker adulterados porque o io não auth a interface PUT/POST. Este é também um alerta para a privacidade e fiabilidade dos dados de rede de outros projetos.
Em termos de quantidade e modelo de GPU, a quantidade de hardware coletada pela io.net como a camada de agregação deve ser a maior. Aethir vem em segundo lugar, e a situação do hardware de outros projetos não é tão transparente. Em termos de modelo de GPU, a io possui uma variedade, incluindo GPUs profissionais como o A 100 e GPUs de consumo como o 4090, o que está alinhado com a posição de agregação da io.net. A io pode escolher as GPUs mais adequadas de acordo com as necessidades específicas das tarefas. No entanto, diferentes modelos e marcas de GPU podem exigir drivers e configurações diferentes, e o software também precisa de otimizações complexas, o que aumenta a complexidade da gestão e manutenção. Atualmente, a alocação de tarefas na io é principalmente feita pela escolha independente dos usuários.
Aethir lançou seu próprio equipamento de mineração, e em maio, Aethir Edge, desenvolvido com suporte da Qualcomm, foi oficialmente lançado. Ele vai quebrar a forma centralizada de implantação de clusters de GPU, longe dos usuários, e implantará o poder de computação na borda. Aethir Edge combinará o poder de computação do cluster H 100 para servir cenários de IA, ele pode implantar modelos treinados para fornecer serviços de inferência aos usuários com o melhor custo. Esta solução está mais próxima dos usuários, mais rápida e com melhor custo-benefício.
Do ponto de vista da oferta e da procura, tomando a Akash Network como exemplo, os seus dados estatísticos mostram que a quantidade total de CPU é de cerca de 16 k e o número de GPUs é de 378, de acordo com a procura de aluguer de rede, a taxa de utilização da CPU e da GPU é de 11,1% e 19,3%, respectivamente. Apenas a taxa de aluguer da GPU profissional H 100 é relativamente alta, a maioria dos outros modelos está em estado ocioso. A situação enfrentada por outras redes é em grande parte semelhante à da Akash, a demanda total por redes não é alta, exceto por chips populares como A 100, H 100, a maior parte da potência de computação está ociosa.
Do ponto de vista da vantagem de preço, em comparação com outras empresas de serviços tradicionais, exceto os gigantes do mercado de computação em nuvem, a vantagem de custo não é proeminente.
2.4 Desempenho financeiro
Independentemente do modelo de token, uma economia de token saudável precisa satisfazer as seguintes condições básicas: 1) A demanda dos usuários pela rede precisa ser refletida no preço do token, ou seja, o token pode capturar valor; 2) Todos os participantes, sejam desenvolvedores, nós, ou usuários, precisam receber incentivos justos a longo prazo; 3) Garantir uma governança descentralizada para evitar a concentração excessiva de poder interno; 4) Mecanismos razoáveis de inflação, deflação, liberação de tokens e ciclos de liberação de tokens para evitar que a flutuação significativa do preço do token afete a robustez e sustentabilidade da rede.
Se dividirmos vagamente o modelo de token em equilíbrio de queima e emissão (BME) e stake para acesso (SFA), as fontes de pressão deflacionária desses dois modelos de token são diferentes: o modelo BME queima tokens quando os usuários compram serviços, portanto, a pressão deflacionária do sistema é determinada pela demanda. Já o SFA exige que os provedores de serviços / nós apostem tokens para obter a qualificação para fornecer serviços, portanto, a pressão deflacionária é determinada pela oferta. A vantagem do BME é que é mais adequado para mercadorias não padronizadas. Mas se a demanda da rede for insuficiente, pode enfrentar pressão inflacionária contínua. Embora haja diferenças nos detalhes do modelo de token de cada projeto, em geral, Aethir é mais inclinado ao SFA, enquanto io.net, Render Network e Akash Network são mais inclinados ao BME, e Gensyn ainda é desconhecido.
Em termos de receita, a demanda da rede será refletida diretamente na receita total da rede (não discutiremos a receita dos mineiros aqui, porque os mineiros recebem não apenas as recompensas por concluir as tarefas, mas também subsídios do projeto). Olhando para os dados públicos, o valor do io.net é o mais alto. Embora a receita da Aethir ainda não tenha sido divulgada, informações públicas indicam que eles anunciaram ter assinado pedidos com muitos clientes B2B.
Em termos de preço de criptomoedas, atualmente apenas Render Network e Akash Network realizaram ICO. Aethir e io.net também lançaram moedas recentemente, mas o desempenho dos preços precisa ser observado, e não faremos muita discussão sobre isso aqui. O plano da Gensyn ainda não está claro. Em geral, levando em consideração os dois projetos que emitiram moedas e outros projetos que já emitiram moedas, mas que não estão incluídos no escopo desta discussão, as redes de computação descentralizadas têm um desempenho de preço muito impressionante, refletindo em certa medida o grande potencial de mercado e as altas expectativas da comunidade.
2.5 Resumo
A rede de poder de computação descentralizada está a desenvolver-se rapidamente, com muitos projetos já capazes de servir os clientes com os seus produtos e gerar receitas. O setor já transcendeu a mera narrativa e entrou numa fase de desenvolvimento que permite fornecer serviços iniciais.
A fraqueza da demanda é um problema comum enfrentado pela rede de poder de computação descentralizada, e a demanda de longo prazo dos clientes não foi bem validada e explorada. No entanto, o lado da demanda não teve um grande impacto no preço da moeda, e vários projetos que já emitiram moedas tiveram um desempenho impressionante.
AI é a principal narrativa da rede de poder de computação descentralizado, mas não é o único negócio. Além de ser usado para treinamento e inferência de AI, o poder de computação também pode ser usado para renderização em tempo real de jogos em nuvem, serviços de telefone em nuvem, etc.
O grau de heterogeneidade de hardware na rede de poder de computação é alto, e a qualidade e escala da rede de poder de computação precisam ser aprimoradas.
Para usuários do tipo C, a vantagem de custo não é muito evidente. Para usuários do tipo B, além de economizar custos, é necessário considerar a estabilidade, confiabilidade, suporte técnico, conformidade e suporte legal dos serviços, mas os projetos Web3 geralmente não são muito bons nesses aspectos.
3 Pensamentos finais
O crescimento explosivo da IA trouxe uma demanda massiva por poder de computação, sem dúvida. Desde 2012, a potência computacional usada em tarefas de treinamento de inteligência artificial tem crescido exponencialmente, dobrando a cada 3,5 meses (em comparação, a Lei de Moore dobra a cada 18 meses). Desde 2012, a demanda por poder de computação aumentou mais de 300.000 vezes, superando em muito o crescimento de 12 vezes previsto pela Lei de Moore. Estima-se que o mercado de GPU crescerá a uma taxa composta anual de 32% nos próximos cinco anos, ultrapassando os 200 bilhões de dólares. A AMD prevê um valor ainda maior, com a empresa projetando que o mercado de chips de GPU atingirá 400 bilhões de dólares até 2027.
Fonte da imagem:
Devido ao crescimento explosivo da inteligência artificial e de outras cargas de trabalho intensivas em computação (como renderização de AR/VR), foram expostos problemas estruturais de eficiência nos mercados tradicionais de computação em nuvem e de computação de ponta. Teoricamente, redes descentralizadas de poder de computação podem oferecer soluções mais flexíveis, de baixo custo e eficientes ao aproveitar recursos computacionais ociosos distribuídos, atendendo assim à enorme demanda do mercado por recursos computacionais. Portanto, a combinação de criptografia e inteligência artificial tem um enorme potencial de mercado, mas também enfrenta uma competição acirrada com empresas tradicionais, altas barreiras de entrada e um ambiente de mercado complexo. No geral, entre todas as verticais no campo da criptografia, as redes descentralizadas de poder de computação são uma das áreas verticais mais promissoras em termos de demanda real.
Fonte da imagem:
O futuro é brilhante, mas o caminho é sinuoso. Para alcançar a visão acima mencionada, ainda precisamos resolver muitos problemas e desafios. Em resumo, no estágio atual, se fornecermos apenas serviços de nuvem tradicionais, a margem de lucro do projeto é muito pequena. Do lado da demanda, as grandes empresas geralmente constroem sua própria capacidade de computação, a maioria dos desenvolvedores C de varejo escolherá os serviços em nuvem, e ainda precisamos explorar e validar se as pequenas e médias empresas que realmente utilizam recursos de computação descentralizados terão uma demanda estável. Por outro lado, a IA é um mercado amplo com um alto potencial e espaço para imaginação. Para um mercado mais amplo, os provedores de serviços de computação descentralizada no futuro também precisarão se transformar em serviços de modelo / IA, explorar mais cenários de uso de cripto + IA e expandir o valor que o projeto pode criar. No entanto, atualmente, há muitos problemas e desafios a serem superados para avançar para o campo da IA.
No destaque na vantagem de preço: A comparação dos dados anteriores mostra que a vantagem de custo da rede de poder de computação descentralizada não foi refletida. Possíveis razões para isso são que, para chips profissionais de alta demanda, como H 100, A 100, o mecanismo de mercado determina que o preço desses hardwares não será barato. Além disso, embora a rede descentralizada possa coletar recursos ociosos de poder de computação, a falta de efeitos de escala econômica, altos custos de rede e largura de banda, além de custos invisíveis como a complexidade da gestão e operação, aumentarão ainda mais os custos de energia.
A especificidade do treinamento de IA: O uso da descentralização para o treinamento de IA está atualmente enfrentando grandes gargalos tecnológicos. Esses gargalos podem ser visualizados de forma clara no fluxo de trabalho da GPU. No treinamento de modelos de linguagem grandes, a GPU primeiro recebe lotes de dados pré-processados, realiza cálculos de propagação direta e retropropagação para gerar gradientes. Em seguida, todas as GPUs agregam os gradientes e atualizam os parâmetros do modelo para garantir a sincronização de todas as GPUs. Esse processo é repetido continuamente até que todo o treinamento seja concluído para todos os lotes ou atinja o número de épocas especificado. Esse processo envolve uma grande quantidade de transferência e sincronização de dados. Atualmente, questões como que tipo de estratégias de paralelismo e sincronização utilizar, como otimizar largura de banda de rede e latência, e como reduzir custos de comunicação ainda não foram bem resolvidas. Atualmente, ainda não é muito prático utilizar redes de computação descentralizadas para treinar IA.
Segurança de dados e privacidade: Durante o processo de treinamento de grandes modelos de linguagem, vários aspectos relacionados ao processamento e transmissão de dados, como alocação de dados, treinamento de modelos, agregação de parâmetros e gradientes, podem afetar a segurança de dados e privacidade. Além disso, a privacidade do modelo é ainda mais importante para moedas de privacidade. Se não conseguirmos resolver os problemas de privacidade dos dados, não poderemos escalar adequadamente no lado da demanda.
Do ponto de vista mais realista, uma rede de poder de computação descentralizada precisa levar em consideração as demandas atuais e o espaço de mercado futuro. Identificar claramente a posição do produto e o público-alvo, como mirar inicialmente em projetos não nativos de IA ou Web3, começando com demandas mais periféricas, estabelecendo uma base de usuários inicial. Ao mesmo tempo, explorar continuamente várias cenas de combinação de IA e criptomoeda, explorar a vanguarda tecnológica, e realizar a transformação e atualização dos serviços.
Referência
caff.com/zh/archives/17351?ref=1554
Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
Nascido na borda: Como a rede de poder de computação descentralizada capacita Crypto e AI?
Autores originais: Jane Doe, Chen Li
Fonte original: Youbi Capital
1 Interseção entre AI e Crypto
No dia 23 de maio, o gigante dos chips, Nvidia, divulgou o relatório financeiro do primeiro trimestre do ano fiscal de 2025. O relatório mostra que a receita do primeiro trimestre da Nvidia foi de 26 bilhões de dólares. Dessa quantia, a receita do centro de dados cresceu impressionantes 427% em relação ao ano anterior, atingindo incríveis 22,6 bilhões de dólares. A capacidade da Nvidia de salvar o desempenho financeiro do mercado de ações dos EUA por conta própria reflete a demanda explosiva de poder de computação das empresas de tecnologia globais para competir na corrida de IA. Quanto mais ambiciosas são as principais empresas de tecnologia na corrida da IA, maior é a demanda exponencial por poder de computação. De acordo com as previsões da TrendForce, em 2024, os quatro principais provedores de serviços de nuvem dos EUA - Microsoft, Google, AWS e Meta - devem representar 20,2%, 16,6%, 16% e 10,8% da demanda global por servidores de IA de ponta, totalizando mais de 60%.
Fonte da imagem:
"Escassez de chips" tem sido um termo quente nos últimos anos. Por um lado, o treinamento e a inferência de grandes modelos de linguagem (LLM) requerem muito poder de computação; e à medida que o modelo itera, os custos e a demanda por poder de computação aumentam exponencialmente. Por outro lado, grandes empresas como o Meta compram uma grande quantidade de chips, levando todos os recursos de computação do mundo a se inclinarem para esses gigantes da tecnologia, tornando cada vez mais difícil para pequenas empresas obter os recursos de computação necessários. O dilema enfrentado pelas pequenas empresas não se deve apenas à escassez de oferta de chips causada pelo aumento da demanda, mas também a contradições estruturais na oferta. Atualmente, ainda há muitas GPUs ociosas do lado da oferta, por exemplo, alguns data centers têm uma grande quantidade de poder de computação ocioso (taxa de utilização de apenas 12% - 18%), e devido à redução dos lucros na mineração de criptomoedas, também há uma grande quantidade de recursos de computação ociosos. Embora nem todo esse poder de computação seja adequado para aplicativos profissionais como treinamento de IA, hardware de consumo ainda pode desempenhar um papel significativo em outras áreas, como inferência de IA, renderização de jogos em nuvem, telefones em nuvem, entre outros. A oportunidade de integrar e aproveitar esses recursos de computação é enorme.
Desvie o olhar da IA para a cripto e, depois de três anos de silêncio no mercado criptográfico, finalmente chegou outro período de alta, com o preço do Bitcoin atingindo repetidamente novos patamares e uma infinidade de mememoedas surgindo. Embora a IA e a Cripto tenham sido as palavras da moda nos últimos anos, a inteligência artificial e a blockchain, como duas tecnologias importantes, parecem ser como linhas paralelas, sem encontrar um 'ponto de interseção'. No início deste ano, Vitalik publicou um artigo intitulado 'A promessa e os desafios das aplicações de cripto + IA', discutindo os cenários futuros da combinação de IA e cripto. Vitalik mencionou muitas visões, incluindo o uso de tecnologias de criptografia como blockchain e MPC para descentralizar o treinamento e a inferência da IA, abrindo a caixa preta do aprendizado de máquina para tornar os modelos de IA mais confiáveis, entre outros. A realização dessas visões ainda tem um longo caminho a percorrer. No entanto, um dos casos de uso mencionados por Vitalik - capacitar a IA com incentivos econômicos criptográficos - é uma direção importante e realizável em um curto espaço de tempo. A rede de capacidade de computação descentralizada é atualmente um dos cenários mais adequados para a combinação de IA + cripto.
2 Descentralização Poder de computação rede
Atualmente, vários projetos estão se desenvolvendo na área de redes de poder de computação descentralizadas. A lógica subjacente a esses projetos é semelhante e pode ser resumida como: usar tokens para incentivar os detentores de poder de computação a fornecer serviços de poder de computação à rede, permitindo que recursos dispersos de poder de computação sejam reunidos em uma rede descentralizada de poder de computação de escala razoável. Isso aumenta a taxa de utilização de poder de computação ocioso e atende às necessidades de poder de computação dos clientes a um custo mais baixo, resultando em uma situação vantajosa para compradores e vendedores.
Para que os leitores obtenham uma compreensão geral deste campo em um curto espaço de tempo, este artigo irá deconstruir os projetos específicos e todo o campo de uma perspectiva micro-macro, com o objetivo de fornecer aos leitores uma perspectiva analítica para entender as vantagens competitivas de cada projeto e o desenvolvimento geral do campo de poder de computação descentralizado. O autor apresentará e analisará cinco projetos: Aethir, io.net, Render Network, Akash Network, Gensyn, e fará um resumo e avaliação da situação dos projetos e do desenvolvimento do campo.
Do ponto de vista da estrutura analítica, se nos concentrarmos em uma rede de poder de computação descentralizada específica, podemos dividi-la em quatro componentes principais:
Se olharmos para a pista de potência de computação descentralizada de cima, o relatório de pesquisa da Blockworks oferece uma boa estrutura de análise e podemos dividir a posição dos projetos nessa pista em três camadas diferentes.
Fonte da imagem: Youbi Capital
Com base nos dois quadros de análise acima, faremos uma comparação horizontal dos cinco projetos selecionados e avaliaremos-los em quatro aspectos - negócio principal, posicionamento de mercado, instalações de hardware e desempenho financeiro.
2.1 Negócio Principal
Do ponto de vista da lógica subjacente, a rede de poder de computação descentralizada é altamente homogênea, ou seja, usa tokens para incentivar os suportes de poder de computação ocioso a fornecer serviços de poder de computação. Com base nessa lógica subjacente, podemos entender as diferenças no núcleo do negócio do projeto a partir de três aspectos:
2.2 Posicionamento de mercado
Em termos de posicionamento do projeto, as camadas bare metal, orquestração e agregação precisam resolver problemas centrais, otimizar pontos-chave e capturar valor de maneiras diferentes.
2.3 Instalações de hardware
2.4 Desempenho financeiro
2.5 Resumo
3 Pensamentos finais
O crescimento explosivo da IA trouxe uma demanda massiva por poder de computação, sem dúvida. Desde 2012, a potência computacional usada em tarefas de treinamento de inteligência artificial tem crescido exponencialmente, dobrando a cada 3,5 meses (em comparação, a Lei de Moore dobra a cada 18 meses). Desde 2012, a demanda por poder de computação aumentou mais de 300.000 vezes, superando em muito o crescimento de 12 vezes previsto pela Lei de Moore. Estima-se que o mercado de GPU crescerá a uma taxa composta anual de 32% nos próximos cinco anos, ultrapassando os 200 bilhões de dólares. A AMD prevê um valor ainda maior, com a empresa projetando que o mercado de chips de GPU atingirá 400 bilhões de dólares até 2027.
Fonte da imagem:
Devido ao crescimento explosivo da inteligência artificial e de outras cargas de trabalho intensivas em computação (como renderização de AR/VR), foram expostos problemas estruturais de eficiência nos mercados tradicionais de computação em nuvem e de computação de ponta. Teoricamente, redes descentralizadas de poder de computação podem oferecer soluções mais flexíveis, de baixo custo e eficientes ao aproveitar recursos computacionais ociosos distribuídos, atendendo assim à enorme demanda do mercado por recursos computacionais. Portanto, a combinação de criptografia e inteligência artificial tem um enorme potencial de mercado, mas também enfrenta uma competição acirrada com empresas tradicionais, altas barreiras de entrada e um ambiente de mercado complexo. No geral, entre todas as verticais no campo da criptografia, as redes descentralizadas de poder de computação são uma das áreas verticais mais promissoras em termos de demanda real.
Fonte da imagem:
O futuro é brilhante, mas o caminho é sinuoso. Para alcançar a visão acima mencionada, ainda precisamos resolver muitos problemas e desafios. Em resumo, no estágio atual, se fornecermos apenas serviços de nuvem tradicionais, a margem de lucro do projeto é muito pequena. Do lado da demanda, as grandes empresas geralmente constroem sua própria capacidade de computação, a maioria dos desenvolvedores C de varejo escolherá os serviços em nuvem, e ainda precisamos explorar e validar se as pequenas e médias empresas que realmente utilizam recursos de computação descentralizados terão uma demanda estável. Por outro lado, a IA é um mercado amplo com um alto potencial e espaço para imaginação. Para um mercado mais amplo, os provedores de serviços de computação descentralizada no futuro também precisarão se transformar em serviços de modelo / IA, explorar mais cenários de uso de cripto + IA e expandir o valor que o projeto pode criar. No entanto, atualmente, há muitos problemas e desafios a serem superados para avançar para o campo da IA.
Do ponto de vista mais realista, uma rede de poder de computação descentralizada precisa levar em consideração as demandas atuais e o espaço de mercado futuro. Identificar claramente a posição do produto e o público-alvo, como mirar inicialmente em projetos não nativos de IA ou Web3, começando com demandas mais periféricas, estabelecendo uma base de usuários inicial. Ao mesmo tempo, explorar continuamente várias cenas de combinação de IA e criptomoeda, explorar a vanguarda tecnológica, e realizar a transformação e atualização dos serviços.
Referência
caff.com/zh/archives/17351?ref=1554