Este artigo foi publicado originalmente em Decentralised.co. Nós da GCR traremos para você formulários longos do Descentralizado duas vezes por mês – todas as quintas-feiras alternadas! Decentralised.co conta com a confiança da administração de mais de 200 empresas para se manter atualizado sobre as tendências, dados e insights que importam. Inscreva-se para receber o boletim informativo abaixo – mais sobre esta colaboração para nossos membros mais ativos no Discord.
Inscreva-se em Decentralised.co
Ei,
Escrevemos um precursor para este artigo em 18 de julho , se você quiser um contexto que vá além do que está escrito aqui.
Todas as coisas vivas mantêm algum registro. Os animais monitoram as estações para saber quando caçar. Roedores e pássaros armazenam alimentos em locais únicos. Eles precisam se lembrar onde o armazenaram ao acessá-lo para seu sustento meses depois. Os lobos criam marcas ao redor do perímetro de seu território para sinalizar a outros animais para ficarem afastados. Até as árvores controlam o tempo. Todos os anos, um anel se forma nos troncos. Pode-se estimar a idade de uma árvore com base no número de anéis.
Embora as árvores e os animais controlem o tempo, eles não podem recuperar ou narrar o passado. Eles não têm acesso à memória. É o que torna a manutenção de registros humanos diferente. Graças às nossas habilidades de comunicação, sabemos que os sumérios na Mesopotâmia (3.400 aC) e os antigos egípcios (3.200 aC) usavam escrita cuneiforme e hieróglifos para registrar informações.
A humanidade evoluiu quando o conhecimento pôde ser transmitido sem a necessidade do envolvimento físico da fonte. Lemos e apreciamos as obras de Platão ou Sócrates muito depois de terem desaparecido porque temos os meios para armazenar os seus ensinamentos. Escrever era a plataforma AR original.
Escrevendo do Irã acompanhando os grãos. Fonte: Ligação
Enquanto a escrita deixava as coisas à imaginação, os dados ajudavam a manter as coisas objetivas. Reduziu a necessidade de os indivíduos armazenarem coisas na memória. Em parte, é por isso que alguns dos textos humanos mais antigos envolvem dívidas, rendimentos ou registos comerciais.
Na era pós-industrial, as empresas construíram fossos competitivos para fortalecer a sua posição no mercado, tornando os seus registos de vendas digitais. Um exemplo disso é uma empresa indiana chamada Asian Paints. A sua tinta pode não ser a melhor do mercado, mas eles controlam uma quota de mercado superior a 50% da indústria de tintas de 8 mil milhões de dólares da Índia.
Por que? A resposta fácil é que se trata de uma marca familiar e que a empresa tem economias de escala. Mas a forma como chegaram lá tem raízes nos dados. Investiram fortemente na recolha e processamento de dados para otimizar a sua cadeia de abastecimento.
Para contextualizar, as ações da Asian Paints tiveram um CAGR impressionante de 25% nos últimos 30 anos. Apoiando esse crescimento estava um investimento em um computador mainframe na década de 1970. O dispositivo era mais poderoso do que os usados nas melhores organizações de pesquisa da Índia na época. Ele coletou dados de hora em hora sobre a cor e a quantidade de tinta vendida na Índia. Isso permitiu que a Asian Paints construísse um modelo que prevê a demanda de tintas em toda a Índia com 98% de precisão.
Esse poder preditivo permitiu que a Asian Paints capturasse o valor máximo, pois poderia reduzir drasticamente o tempo de reposição. Na época, a norma para vender produtos como tintas era vendê-los a um atacadista, que depois os entregava a um distribuidor, que, por sua vez, os venderia a um revendedor. O revendedor interagiria diretamente com o consumidor. A razão para uma cadeia de abastecimento tão complexa era que cada parte mantinha um inventário de activos e controlava dados sobre a oferta e a procura de tintas.
Choksey – o fundador das tintas asiáticas, retirou grossistas e distribuidores da cadeia de abastecimento, estudando os padrões de consumo do utilizador final e reduzindo a dependência dos intermediários. Ao eliminar os intermediários, a Asian Paints capturou 97% do MRP (3% para os revendedores) em comparação com os 60% capturados pelos seus concorrentes.
O valor extraível do Telegraph seria a transmissão de fitas de ticker retransmitidas pelo Telegraph.
A transição para o digital não aconteceu da noite para o dia. Parte do que tornou a recolha de dados interessante foi o mundo das finanças e a forma como este se tornou lentamente interligado. Por exemplo, no final do século 20, os dados do mercado de ações eram transmitidos por telégrafo usando dispositivos como o acima. Já em 1835, comerciantes treinavam pombos para carregar pedaços de papel com informações sobre o que acontecia na Europa. Quando os barcos a vapor que transportavam mercadorias chegavam a 80 quilômetros de terra, os pombos voavam para locais designados com as informações. Os comerciantes costumavam pagar até US$ 500 por cada hora de antecedência para receber as notícias.
Em 1867, os comerciantes começaram a competir para otimizar a rapidez com que as informações eram transmitidas pelo telégrafo. Um funcionário da Western Union chamado E. A Calahan pagou mais de US$ 200 mil à NYSE pela capacidade de enviar funcionários ao seu pregão para transmitir dados de tickers a seus clientes. Uma das pessoas que trabalhou diligentemente na otimização do sistema foi um jovem cientista chamado Thomas Alva Edison. Um século mais tarde, ferramentas como o terminal Bloomberg aumentariam exponencialmente o ritmo e a quantidade de dados financeiros transmitidos num determinado dia.
Os dados, tal como o petróleo bruto, têm de passar por vários passos de refinamento antes de poderem ser utilizados. Aprender como a Bloomberg cresceu esclarece como todo o cenário de dados evoluiu e qual processo. A Bloomberg não foi a primeira tentativa de utilizar a tecnologia para melhorar os mecanismos de negociação e de relatórios. A NASDAQ usou terminais Bunker Ramo para divulgar informações e fazer pedidos de compra/venda. No entanto, depender das antigas redes de comunicação telefónica significava que a expansão deste modelo seria sempre um desafio.
Fonte – NASDAQ – A evolução da negociação automatizada de balcão
Em 1981, Michael Bloomberg, sócio do banco de investimentos Solomon Brothers, foi demitido com US$ 10 milhões por seu patrimônio quando a Phibro Corporation adquiriu o banco. Ele percebeu que os investidores estão dispostos a pagar por informações financeiras simplificadas com a crescente eletrificação dos mercados financeiros, de Nova Iorque ao Japão. Ele fundou uma empresa de serviços de dados chamada Innovative Market System, que foi rebatizada como Bloomberg em 1986.
Antes de a internet decolar, o Terminal Bloomberg era acessado usando o The Chiclet. Este foi conectado ao controlador da Bloomberg por meio de um cabo especial conectado ao hub local por meio de linhas telefônicas dedicadas. A Bloomberg coletou dados por meio de parcerias de dados, agências de notícias e comunicados de imprensa, métodos proprietários, como entrada manual de dados e coleta de dados por telefone.
Com a internet, as comportas da informação se abriram. Hoje, a Bloomberg adquire, processa e entrega 200 mil milhões de informações financeiras quase em tempo real. Isso equivale a aproximadamente 23 milhões de pontos de dados por segundo. Algumas das informações disponíveis na Bloomberg são públicas. Dados como demonstrações financeiras de empresas e preços de ações e títulos podem ser encontrados em fóruns públicos.
Mas e se você for um analista de petróleo e gás e quiser entender o movimento dos contêineres de petróleo bruto? É improvável que você obtenha essas informações em tempo real se não assinar uma fonte de dados como a Bloomberg. Nem todos os dados na Internet estão disponíveis gratuitamente.
Normalmente existem duas restrições para os indivíduos quando se trata de dados na Web2: acesso autorizado e uma grande barreira para o processamento de grandes quantidades de dados. Ao longo dos anos, fornecedores como a Bloomberg construíram efeitos de rede suficientemente fortes para obter dados através das suas afiliadas, algo que os analistas ou investidores não se podem dar ao luxo de fazer.
É melhor pagar US$ 20 mil à Bloomberg por uma assinatura anual do que tentar obter os dados de uma combinação de plataformas de dados, cada uma com níveis de preços variados. Mesmo que você se esforce o suficiente para obter os dados, não poderá processar e executar análises em tempo real sem gastos significativos com infraestrutura. No lado do varejo, muitas plataformas que eventualmente foram escaladas eram mecanismos de correspondência de dados.
Pense desta forma: o Google (o mecanismo de busca) é uma empresa de dados que oferece às empresas acesso aos usuários em troca de verbas publicitárias. Quando um restaurante ou uma newsletter (como a nossa) pretende atingir utilizadores que procuram informações no Google, eles combinam a oferta e a procura de informações semelhantes. Alguém que procura informações sobre uma newsletter específica da Web3 está nos procurando. E estamos procurando por essa pessoa. (Estou resistindo à tentação de divulgar nosso programa de indicações aqui.)
O Google construiu um monopólio devido à economia de escala em que funciona. Seu inventário de usuários e o número de consultas que seus usuários fazem a cada dia permanecem incomparáveis. O Google construiu essa posição lançando um mecanismo de busca que não tinha anúncios em uma época em que os anúncios eram a norma, depois adquirindo o YouTube e o Android e, eventualmente, pagando a pares como a Apple para tornar o Google o mecanismo de busca padrão. Só para a Apple, o Google paga US$ 20 bilhões por ano para continuar sendo o mecanismo de busca padrão no Safari.
O Google paga esse prêmio porque, em sua essência, sua oferta é um mecanismo de correspondência. O mecanismo de correspondência coloca os usuários com necessidade em contato com empresas que oferecem uma oferta. A maioria dos monopólios da web são, em sua essência, mecanismos de correspondência. A Amazon combina vendedores de produtos com compradores. O Instagram combina um público com os criadores. Esses mecanismos de correspondência funcionam porque as interações nesses produtos deixam trilhas ricas a partir das quais o contexto pode ser orientado.
Ben Evans escreveu em 2022 que não existem dados. Conhecer meu conteúdo, alimentação ou preferências de viagem não vale muito para terceiros. Torna-se valioso – para comércio ou investigação – apenas quando é agregado ou enriquecido com contexto.
Contexto no sentido de que minhas preferências por comer biriyani em uma sexta-feira à noite poderiam ser usadas para anunciar a entrega de biriyani para mim precisamente quando a probabilidade de eu comprá-lo for maior. No geral, comparar a probabilidade de minha compra com a de um colega na mesma região ajuda a atingir melhor os usuários.
Os dados precisam de escala (em grandes números) ou de contexto para serem valiosos. Historicamente, os produtos Web3 e Web2 diferem nos rastros que deixam. Apenas a Amazon sabe quantos controladores de Xbox seriam vendidos em uma determinada semana. Mas você pode ver os padrões pelos quais os comerciantes compram ou vendem NFTs no OpenSea em qualquer dia. A razão é que cada uma dessas transações deixa um rastro público.
Os produtos de dados no Web3 usam essas trilhas para construir contexto.
Blockchains como Ethereum e Bitcoin produzem blocos a cada 12 segundos e aproximadamente 10 minutos, respectivamente. Cada bloco contém transações que alteram o estado do blockchain. Exploradores de blocos como o Etherscan capturam dados relacionados a todas as transações. Por exemplo, se você for ao Etherscan e vir um bloco, a imagem abaixo é o que você poderá ver.
As transações no blockchain são ricas em contexto. Produtos como Arkham e Nansen são mecanismos de interpretação para que os pesquisadores entendam o que está acontecendo quando ocorre uma transação.
Você pode ver todos os blocos desde o início do Ethereum. Mas o que você pode fazer com essas informações? Quase nada. Então, você precisa de uma forma de capturar esses dados em diversas tabelas. Por exemplo, sempre que um contrato NFT de um mercado é chamado em um bloco, os dados relacionados a essa transação devem ser anexados às tabelas relacionadas ao NFT, ou quando um contrato Uniswap é chamado, os dados relacionados devem ser armazenados em tabelas relacionadas ao DEX. . (Dune faz isso como um serviço.)
Não é possível analisar os dados brutos sem incorrer em custos significativos de infraestrutura. Portanto, embora os dados estejam disponíveis gratuitamente, você enfrenta os mesmos problemas. Você confia em dados externos como investidor ou construtor de dApp. Mas a sua função principal não está relacionada com a recolha e gestão de dados. Despender recursos em atividades essenciais, mas não essenciais, não é um luxo que todas as organizações possam desfrutar.
Para produtos de dados, o contexto em torno dos dados torna o produto único. A Bloomberg aplica seu conhecimento financeiro e transforma os dados em um formato que inventores e comerciantes podem consumir facilmente. Sites como Similarweb ou publicações de pesquisa como Newzoo usam suas competências essenciais para aplicar contexto social ou relacionado a jogos aos dados que rastreiam.
Os produtos de dados nativos do Blockchain se diferenciam ao fornecer contexto do usuário por meio de consultas que respondem a perguntas relevantes para subconjuntos específicos de usuários. Por exemplo, o TokenTerminal calcula os fundamentos econômicos dos protocolos. Nansen ajuda os participantes do mercado a rotular e compreender a movimentação de ativos. Parsec consulta dados on-chain para ajudar os traders a analisar melhor as posições DeFi.
Todos esses produtos funcionam com um bem público: dados on-chain. A diferença é a forma como esses produtos apresentam seus dados, o que os torna atraentes para diferentes públicos.
A divisão da categoria de produtos em nossa indústria é baseada nos dados que vão para a rede e nas informações derivadas de fontes fora da rede. (Alguns costumam usar ambos.) Os provedores de dados usam seus filtros de contexto para criar produtos. Assim como os dados Web2 têm seus nichos, as empresas de dados Web3 construíram ou estão construindo gradualmente fossos usando suas competências essenciais.
Como tal, os antecedentes dos fundadores muitas vezes ditam a natureza dos produtos lançados. Quando uma equipe principal passou um tempo significativo nos mercados de capitais antes da criptografia, seus produtos tendem a imitar a Bloomberg, enquanto os produtos cripto nativos se parecem com Nansen. Produtos diferentes atendem a necessidades diferentes, mesmo quando consultam os mesmos dados.
Por exemplo, as exchanges normalmente descartam dados após intervalos fixos. Eles não estão no negócio de dados e o armazenamento de dados antigos exige servidores e gerenciamento adicionais. Alguns provedores de dados, como Kaiko e Amberdata, mantêm dados históricos da carteira de pedidos das bolsas. Esses dados permitem que traders e investidores construam modelos para testar suas hipóteses. Mas se você quiser entender quais contratos DeFi estão sendo liberados com um influxo de ETH ou stablecoins ou analisar o comportamento na cadeia de endereços ou entidades específicas, você precisará de um produto da Nansen ou Arkham.
O mapa de mercado não é representativo de todos os participantes em todas as categorias.
Uma maneira de entender como os produtos foram posicionados nos mercados é através das lentes das personas dos consumidores na criptografia. Essas personas podem ser classificadas nas quatro categorias principais a seguir.
A maior parte dos dólares que fluem através de produtos de dados criptográficos vem de instituições financeiras durante um mercado em baixa. Esses são clientes importantes, com ciclos de vendas mais longos e requisitos de dados muito mais complexos. Uma forma de saber se um produto é voltado para instituições financeiras é se o cliente precisa passar por uma ligação de vendas para saber quanto custa. No mundo Web2, você não consegue descobrir quanto custa o PitchBook ou o CB Insights. Na criptografia, você não sabe quanto custaria um produto como o Chainalysis.
Brincadeiras à parte, parte do motivo desse processo de vendas é o serviço prático oferecido por produtos de dados voltados para esse segmento de consumo. Esses usuários geralmente optam por dados altamente granulares e frequentes. Eles exigem dados não apenas para decisões pré-negociação, mas também para usos pós-negociação, a fim de cumprir os requisitos de conformidade e tributação.
Por exemplo, eles precisam de produtos que lhes digam qual era historicamente o valor de seu portfólio, os ajudem com cálculos de impostos e assim por diante. Empresas como Amberdata, Kaiko, CoinMetrics, CryptoCompare e, até certo ponto, Nansen atendem esses clientes.
Na minha experiência, apenas fundadores com experiência em instituições ou equipes com grandes rodadas de financiamento conseguiram abrir o mercado institucional de dados. A barreira à entrada é relativamente alta aqui, como seria o caso de qualquer produto empresarial.
Freqüentemente nos deparamos com o recurso de composição do Web3, o que significa que os aplicativos Web3 podem ser interdependentes. Eles poderiam exigir dados um do outro. Portanto, eles precisam ler constantemente os dados uns dos outros. Por exemplo, uma plataforma como o Yearn Finance precisa ler dados do Aave e Compound, e um agregador NFT como o Tensor precisa ler dados do Magic Eden e de outros mercados.
Mas esses dados são armazenados em blocos de cadeias como Ethereum e Solana. Ethereum cria um bloco em 12 segundos e Solana faz isso em 400 ms. Classificar dados de blockchain em tabelas e armazená-los para acesso rápido não é uma tarefa trivial. É aqui que entram em cena indexadores como Covalent, Graph, Chainlink e Powerloom. Eles garantem que os dados brutos do blockchain sejam armazenados no formato desejado para que os desenvolvedores possam buscá-los por meio de simples chamadas de API.
Um segmento emergente nesta persona do consumidor envolve ferramentas usadas para compreender o comportamento do usuário. Por exemplo, o ARCx permite aos desenvolvedores mapear dados fora da cadeia (como o comportamento do navegador) com dados na cadeia (como endereços de carteira) para capturar as informações demográficas dos usuários que interagem com um dApp. Eles estão em um nicho relativamente pequeno, mas relevante, pois ajudam os desenvolvedores a identificar quem são seus usuários.
Os produtos de dados em criptografia geralmente são distribuídos por meio da colaboração com pesquisadores e publicações. CCData, por exemplo, é frequentemente citado na Bloomberg. Os pesquisadores são incentivados a recorrer a produtos de dados, pois eles ajudam a economizar tempo e esforço ao coletar, limpar ou curar dados. Produtos como Dune construíram um fosso ao construir uma comunidade de analistas que competem entre si para obter uma classificação mais elevada em sua lista.
Publicações como The Block e Delphi apresentam painéis construídos com dados de fornecedores terceirizados. Aqui na Decentralised.co, contamos inteiramente com fornecedores de dados externos, pois eles ajudam a manter a equipe enxuta enquanto usamos recursos externos na coleta de dados.
O desafio de atender a este segmento de consumidores é que os investigadores mais pequenos podem não ter o orçamento necessário para justificar o gasto de enormes recursos para revelar insights de nicho que podem ser relevantes apenas para uma única pessoa. Por outro lado, as empresas são bem incentivadas a despender esforços e recursos em parcerias com publicações importantes como o Financial Times, uma vez que isso ajuda na distribuição.
Os produtos orientados para investidores de varejo geralmente apresentam menor granularidade e frequência de dados. Mas são nichos altamente lucrativos para construir, à medida que vêem economias de escala. Dez mil usuários pagando US$ 100 cada é um negócio de ARR de US$ 1 milhão em um mundo onde a rotatividade não existe. É mais fácil falar do que fazer, mas essa economia explica por que temos tantos produtos de cripto-dados voltados para o varejo.
Uma grande parte dos produtos voltados para o varejo é gratuita ou suportada por anúncios. Por exemplo, um recurso gratuito como o DefiLlama não lhe dirá como você pode encaminhar seu pedido por meio de diferentes exchanges (CEXs e DEXs) para evitar derrapagens, pois não tira instantâneos do livro de pedidos, mas mostra informações sobre desbloqueios de tokens ou desbloqueios de rendimento.
Uma mudança nesse segmento de consumo é a forma como o meio de entrega abre uma nova categoria de mercado – por exemplo, a Cielo entrega dados na forma de notificações por meio do Telegram. Ele atingiu mais de 40.000 usuários, retransmitindo informações de uma forma fácil de consumir para um segmento de consumidores que prefere não lidar com interfaces de desktop. Quando bem feitos, até mesmo os meios de distribuição podem ser diferenciais para empreendimentos em estágio inicial. Mesmo em dados.
Embora a classificação seja confusa em alguns pontos, as empresas de dados podem ser divididas em orientações B2B ou B2C.
Empresas como Amberdata e Kaiko possuem produtos que atendem a atores sofisticados. Esses produtos são mais granulares (detalhes em que os dados estão disponíveis) e frequentes (por exemplo, dados tick-by-tick e da carteira de pedidos em tempo real) e atendem a demandas como construção e teste de modelos, análise pré-negociação, relatórios pós-negociação, tributação e conformidade. Os dados são fornecidos em um formato que permite aos clientes realizar análises proprietárias e criar visualizações de acordo com suas preferências. Essas empresas normalmente oferecem seus produtos por meio de um acesso pago.
O custo geralmente é uma função da granularidade devido aos requisitos de infraestrutura, à natureza da clientela envolvida e à duração do ciclo de vendas.
A imagem acima mapeia diferentes produtos em dois eixos – profundidade e granularidade versus preços dos produtos. Observe que esses gráficos não são exatos. Alguns pontos podem estar errados. A ideia é desenvolver um modelo mental para pensar nos diversos produtos e sua posição no mercado.
Produtos voltados para o varejo, como Dune ou CoinGecko, exibem quase todos os dados gratuitamente. Os clientes devem pagar para acessar alguns dados ou se desejarem dados via APIs para executar suas análises. Por exemplo, você pode visualizar todos os gráficos criados por vários assistentes do Dune, mas eles limitam quantas linhas você pode baixar no formato CSV. Você pode baixar arquivos CSV maiores e visualizar consultas privadas à medida que paga mais.
As empresas focadas no varejo tendem a ter baixa receita por cliente e poucos clientes pagantes como porcentagem de usuários gratuitos. Compare isso com as taxas de conversão dos modelos freemium de empresas de Internet. Normalmente, a taxa de conversão é 2%–5%. Uma taxa de conversão de 10% seria uma exceção. Seu manual é ter o maior número possível de clientes gratuitos para que uma taxa de conversão de 4% contribua significativamente para a receita. Isso é o que chamamos de topo do funil.
Portanto, as empresas de dados precisam que o topo do funil seja grande o suficiente para gerar receita suficiente para se sustentarem com uma taxa de conversão mais baixa. As empresas também podem considerar a geração de receita com anúncios quando o site tiver muitos visitantes. A CoinGecko usa a receita publicitária como alavanca para continuar fornecendo a maior parte dos dados gratuitamente.
Ao longo dos anos, as empresas preencheram vagas em ambos os extremos do espectro (B2B e B2C), deixando algumas lacunas entre eles. Se alguém quiser ver como as carteiras de pedidos estão mudando nas bolsas centralizadas ou como as taxas de opção de venda, IVs e distorções estão mudando, não há muitos produtos que ajudem nas visualizações. Há espaço para um produto mais granular do que os CoinGeckos do mundo, mas menos granular do que produtos de players B2B puros.
Encontrar fossos em empresas onde a matéria-prima é gratuita não é fácil. Os dados Blockchain estão disponíveis gratuitamente. Não há nada proprietário nos dados que você pode coletar. Portanto, os obstáculos nos negócios de dados não se baseiam apenas no fato de você ter alguns dados que outros não têm. Em vez disso, baseiam-se na capacidade da equipe de fornecer os dados em um formato criterioso e consumível, dentro do prazo e sem erros.
Muitas empresas afirmam ter os mesmos dados, mas a qualidade dos dados e a sua apresentação são diferentes. Por exemplo, muitas empresas afirmam ter dados de carteiras de pedidos fora da rede. No entanto, fatores como o número de ordens de compra/venda, a duração da série temporal e o número de exchanges e pares disponíveis diferem de provedor para provedor. Amberdata e Kaiko possuem os dados de carteira de pedidos mais abrangentes para mercados de criptografia.
Por que, porém, apenas alguns provedores podem fornecer esse tipo de dados? A explicação de onde surgem os fossos nos dados da Web3 está aqui.
Talento – Correndo o risco de dizer o óbvio, quando a matéria-prima é gratuita, a forma como você a molda determina o valor do produto. Transformar dados brutos em informações úteis requer experiência de domínio em muitos nichos nos mercados criptográficos e financeiros tradicionais. Equipes como a Velo Data, com experiência em mercados tradicionais, têm vantagem sobre outras que tentam construir produtos B2C semelhantes. É raro encontrar desenvolvedores talentosos que entendam as estruturas de dados de blockchain e tenham experiência relevante nos mercados financeiros.
Infraestrutura – Coletar e entregar grandes quantidades de dados requer infraestrutura que não é fácil. Esse tipo de operação requer capital e talento. Por que a infraestrutura é um fosso? Pense nos dados do pool de memória. Os blocos contêm dados para transações confirmadas. E quanto às transações não confirmadas?
Diferentes nós de rede (por exemplo, nós conectados ao mesmo pool) veem diferentes transações não confirmadas. A execução de apenas um nó não proporcionará uma visão global das transações concorrentes. A manutenção de vários nós em vários blockchains aumenta os custos de infraestrutura. Tal como aconteceu com a IA (e as redes de conteúdo no passado), a capacidade de manter baixos os custos de hardware enquanto o dimensionamento determinará os vencedores e os perdedores no setor ao longo do tempo.
Efeitos de rede –Pode-se levantar a hipótese de que existem efeitos de rede em muitos produtos de dados criptográficos. Veja o Chainlink como exemplo. Foi um dos primeiros oráculos que permitiu que aplicativos lessem dados de outros aplicativos ou cadeias. Conseguiu angariar o apoio da comunidade e tem uma das comunidades mais fortes. Outro exemplo é Nansen. Sua fama foram as etiquetas de endereço que lhe permitiram atribuir a movimentação de ativos a entidades reais em vez de endereços hexanuméricos.
Posteriormente, lançou recursos como NFT Paradise e Token God Mode, permitindo aos usuários rastrear NFTs e tokens de forma mais eficaz. Arkham lançou um produto semelhante aos rótulos de Nansen, mas o investimento em painéis e pesquisas permitiu que Nansen se aproximasse de clientes empresariais e oferecesse produtos sob medida para eles. Vale ressaltar que os efeitos de rede não são possíveis sem os dois primeiros pontos (talento e infraestrutura).
Um lugar onde isso funciona é com indexadores. Quanto maior o número de cadeias que um produto suporta, maior a probabilidade de um desenvolvedor usar o produto em vez de depender de múltiplas fontes. Equipes como a Covalent têm uma vantagem aqui, pois vêm otimizando a amplitude das cadeias suportadas há algum tempo. Mas lembre-se de que a profundidade é tão importante quanto a amplitude.
É muito cedo para dizer se algum produto tem um fosso significativo na criptografia. Testemunhamos vantagens dos pioneiros no grande esquema das coisas. À medida que categorias como Web3 social e a sobreposição entre IA e criptografia continuam a crescer, os produtos de dados na indústria podem crescer e se tornar o próximo Alfabeto. Mas esta será uma história de várias décadas; ainda estamos em seus primeiros anos.
Muitos dos casos de uso que mencionamos neste artigo analisam a especulação financeira de uma forma ou de outra. Até mesmo os desenvolvedores que usam APIs para consultar dados estão construindo produtos financeiros. Pode parecer estranho, mas as blockchains (como uma nova rede) seguem a mesma tendência que o Telegraph e a Internet seguiram.
A chegada de um novo meio e o surgimento de uma nova rede aceleram os casos de utilização financeira. Com a Internet, demorou até o início dos anos 2000 para que as pessoas percebessem que os usuários poderiam ser direcionados com base em sua localização. Com blockchains, ainda estamos descobrindo como construir modelos de negócios a partir de trilhas de dados disponíveis publicamente.
Vimos uma mudança importante em nosso uso diário dessas plataformas: Dune Analytics incorporando IA em seus produtos. Dune fornece uma interface baseada em SQL para os usuários consultarem dados de blockchains como Ethereum e Solana. O mercado para esse tipo de produto geralmente é restrito a usuários que entendem como escrever consultas SQL. Recentemente, eles começaram a usar IA para ajudar analistas a gerar consultas sem serem especialistas em SQL. Não é tão funcional quanto se esperaria. Mas ainda é um passo em direção ao futuro. Pode não demorar muito para que peçamos à IA (como ChatGPT) que consulte dados de um blockchain e ofereça sua análise.
Uma maneira de pensar em “dados” no contexto da Web3 é através das lentes do Google Maps. O GPS existe pelo menos desde a década de 1980. O Google fez o trabalho necessário para mapear o mundo. Ao disponibilizar sobreposições de mapas para aplicativos de terceiros (usando APIs), a empresa permitiu a construção de uma nova geração de aplicativos. Tudo, desde a entrega até o transporte por aplicativo, cresceu porque um único player especializado em dados assumiu esse fardo dos desenvolvedores.
Os produtos de dados na Web3 desempenham um papel semelhante. Ainda não sabemos a natureza exacta das aplicações que poderiam ser construídas sobre este recurso disponível publicamente, mas está a tornar-se evidente que existe uma oportunidade do tamanho da Alphabet no panorama dos dados.
Este artigo foi publicado originalmente em Decentralised.co. Nós da GCR traremos para você formulários longos do Descentralizado duas vezes por mês – todas as quintas-feiras alternadas! Decentralised.co conta com a confiança da administração de mais de 200 empresas para se manter atualizado sobre as tendências, dados e insights que importam. Inscreva-se para receber o boletim informativo abaixo – mais sobre esta colaboração para nossos membros mais ativos no Discord.
Inscreva-se em Decentralised.co
Ei,
Escrevemos um precursor para este artigo em 18 de julho , se você quiser um contexto que vá além do que está escrito aqui.
Todas as coisas vivas mantêm algum registro. Os animais monitoram as estações para saber quando caçar. Roedores e pássaros armazenam alimentos em locais únicos. Eles precisam se lembrar onde o armazenaram ao acessá-lo para seu sustento meses depois. Os lobos criam marcas ao redor do perímetro de seu território para sinalizar a outros animais para ficarem afastados. Até as árvores controlam o tempo. Todos os anos, um anel se forma nos troncos. Pode-se estimar a idade de uma árvore com base no número de anéis.
Embora as árvores e os animais controlem o tempo, eles não podem recuperar ou narrar o passado. Eles não têm acesso à memória. É o que torna a manutenção de registros humanos diferente. Graças às nossas habilidades de comunicação, sabemos que os sumérios na Mesopotâmia (3.400 aC) e os antigos egípcios (3.200 aC) usavam escrita cuneiforme e hieróglifos para registrar informações.
A humanidade evoluiu quando o conhecimento pôde ser transmitido sem a necessidade do envolvimento físico da fonte. Lemos e apreciamos as obras de Platão ou Sócrates muito depois de terem desaparecido porque temos os meios para armazenar os seus ensinamentos. Escrever era a plataforma AR original.
Escrevendo do Irã acompanhando os grãos. Fonte: Ligação
Enquanto a escrita deixava as coisas à imaginação, os dados ajudavam a manter as coisas objetivas. Reduziu a necessidade de os indivíduos armazenarem coisas na memória. Em parte, é por isso que alguns dos textos humanos mais antigos envolvem dívidas, rendimentos ou registos comerciais.
Na era pós-industrial, as empresas construíram fossos competitivos para fortalecer a sua posição no mercado, tornando os seus registos de vendas digitais. Um exemplo disso é uma empresa indiana chamada Asian Paints. A sua tinta pode não ser a melhor do mercado, mas eles controlam uma quota de mercado superior a 50% da indústria de tintas de 8 mil milhões de dólares da Índia.
Por que? A resposta fácil é que se trata de uma marca familiar e que a empresa tem economias de escala. Mas a forma como chegaram lá tem raízes nos dados. Investiram fortemente na recolha e processamento de dados para otimizar a sua cadeia de abastecimento.
Para contextualizar, as ações da Asian Paints tiveram um CAGR impressionante de 25% nos últimos 30 anos. Apoiando esse crescimento estava um investimento em um computador mainframe na década de 1970. O dispositivo era mais poderoso do que os usados nas melhores organizações de pesquisa da Índia na época. Ele coletou dados de hora em hora sobre a cor e a quantidade de tinta vendida na Índia. Isso permitiu que a Asian Paints construísse um modelo que prevê a demanda de tintas em toda a Índia com 98% de precisão.
Esse poder preditivo permitiu que a Asian Paints capturasse o valor máximo, pois poderia reduzir drasticamente o tempo de reposição. Na época, a norma para vender produtos como tintas era vendê-los a um atacadista, que depois os entregava a um distribuidor, que, por sua vez, os venderia a um revendedor. O revendedor interagiria diretamente com o consumidor. A razão para uma cadeia de abastecimento tão complexa era que cada parte mantinha um inventário de activos e controlava dados sobre a oferta e a procura de tintas.
Choksey – o fundador das tintas asiáticas, retirou grossistas e distribuidores da cadeia de abastecimento, estudando os padrões de consumo do utilizador final e reduzindo a dependência dos intermediários. Ao eliminar os intermediários, a Asian Paints capturou 97% do MRP (3% para os revendedores) em comparação com os 60% capturados pelos seus concorrentes.
O valor extraível do Telegraph seria a transmissão de fitas de ticker retransmitidas pelo Telegraph.
A transição para o digital não aconteceu da noite para o dia. Parte do que tornou a recolha de dados interessante foi o mundo das finanças e a forma como este se tornou lentamente interligado. Por exemplo, no final do século 20, os dados do mercado de ações eram transmitidos por telégrafo usando dispositivos como o acima. Já em 1835, comerciantes treinavam pombos para carregar pedaços de papel com informações sobre o que acontecia na Europa. Quando os barcos a vapor que transportavam mercadorias chegavam a 80 quilômetros de terra, os pombos voavam para locais designados com as informações. Os comerciantes costumavam pagar até US$ 500 por cada hora de antecedência para receber as notícias.
Em 1867, os comerciantes começaram a competir para otimizar a rapidez com que as informações eram transmitidas pelo telégrafo. Um funcionário da Western Union chamado E. A Calahan pagou mais de US$ 200 mil à NYSE pela capacidade de enviar funcionários ao seu pregão para transmitir dados de tickers a seus clientes. Uma das pessoas que trabalhou diligentemente na otimização do sistema foi um jovem cientista chamado Thomas Alva Edison. Um século mais tarde, ferramentas como o terminal Bloomberg aumentariam exponencialmente o ritmo e a quantidade de dados financeiros transmitidos num determinado dia.
Os dados, tal como o petróleo bruto, têm de passar por vários passos de refinamento antes de poderem ser utilizados. Aprender como a Bloomberg cresceu esclarece como todo o cenário de dados evoluiu e qual processo. A Bloomberg não foi a primeira tentativa de utilizar a tecnologia para melhorar os mecanismos de negociação e de relatórios. A NASDAQ usou terminais Bunker Ramo para divulgar informações e fazer pedidos de compra/venda. No entanto, depender das antigas redes de comunicação telefónica significava que a expansão deste modelo seria sempre um desafio.
Fonte – NASDAQ – A evolução da negociação automatizada de balcão
Em 1981, Michael Bloomberg, sócio do banco de investimentos Solomon Brothers, foi demitido com US$ 10 milhões por seu patrimônio quando a Phibro Corporation adquiriu o banco. Ele percebeu que os investidores estão dispostos a pagar por informações financeiras simplificadas com a crescente eletrificação dos mercados financeiros, de Nova Iorque ao Japão. Ele fundou uma empresa de serviços de dados chamada Innovative Market System, que foi rebatizada como Bloomberg em 1986.
Antes de a internet decolar, o Terminal Bloomberg era acessado usando o The Chiclet. Este foi conectado ao controlador da Bloomberg por meio de um cabo especial conectado ao hub local por meio de linhas telefônicas dedicadas. A Bloomberg coletou dados por meio de parcerias de dados, agências de notícias e comunicados de imprensa, métodos proprietários, como entrada manual de dados e coleta de dados por telefone.
Com a internet, as comportas da informação se abriram. Hoje, a Bloomberg adquire, processa e entrega 200 mil milhões de informações financeiras quase em tempo real. Isso equivale a aproximadamente 23 milhões de pontos de dados por segundo. Algumas das informações disponíveis na Bloomberg são públicas. Dados como demonstrações financeiras de empresas e preços de ações e títulos podem ser encontrados em fóruns públicos.
Mas e se você for um analista de petróleo e gás e quiser entender o movimento dos contêineres de petróleo bruto? É improvável que você obtenha essas informações em tempo real se não assinar uma fonte de dados como a Bloomberg. Nem todos os dados na Internet estão disponíveis gratuitamente.
Normalmente existem duas restrições para os indivíduos quando se trata de dados na Web2: acesso autorizado e uma grande barreira para o processamento de grandes quantidades de dados. Ao longo dos anos, fornecedores como a Bloomberg construíram efeitos de rede suficientemente fortes para obter dados através das suas afiliadas, algo que os analistas ou investidores não se podem dar ao luxo de fazer.
É melhor pagar US$ 20 mil à Bloomberg por uma assinatura anual do que tentar obter os dados de uma combinação de plataformas de dados, cada uma com níveis de preços variados. Mesmo que você se esforce o suficiente para obter os dados, não poderá processar e executar análises em tempo real sem gastos significativos com infraestrutura. No lado do varejo, muitas plataformas que eventualmente foram escaladas eram mecanismos de correspondência de dados.
Pense desta forma: o Google (o mecanismo de busca) é uma empresa de dados que oferece às empresas acesso aos usuários em troca de verbas publicitárias. Quando um restaurante ou uma newsletter (como a nossa) pretende atingir utilizadores que procuram informações no Google, eles combinam a oferta e a procura de informações semelhantes. Alguém que procura informações sobre uma newsletter específica da Web3 está nos procurando. E estamos procurando por essa pessoa. (Estou resistindo à tentação de divulgar nosso programa de indicações aqui.)
O Google construiu um monopólio devido à economia de escala em que funciona. Seu inventário de usuários e o número de consultas que seus usuários fazem a cada dia permanecem incomparáveis. O Google construiu essa posição lançando um mecanismo de busca que não tinha anúncios em uma época em que os anúncios eram a norma, depois adquirindo o YouTube e o Android e, eventualmente, pagando a pares como a Apple para tornar o Google o mecanismo de busca padrão. Só para a Apple, o Google paga US$ 20 bilhões por ano para continuar sendo o mecanismo de busca padrão no Safari.
O Google paga esse prêmio porque, em sua essência, sua oferta é um mecanismo de correspondência. O mecanismo de correspondência coloca os usuários com necessidade em contato com empresas que oferecem uma oferta. A maioria dos monopólios da web são, em sua essência, mecanismos de correspondência. A Amazon combina vendedores de produtos com compradores. O Instagram combina um público com os criadores. Esses mecanismos de correspondência funcionam porque as interações nesses produtos deixam trilhas ricas a partir das quais o contexto pode ser orientado.
Ben Evans escreveu em 2022 que não existem dados. Conhecer meu conteúdo, alimentação ou preferências de viagem não vale muito para terceiros. Torna-se valioso – para comércio ou investigação – apenas quando é agregado ou enriquecido com contexto.
Contexto no sentido de que minhas preferências por comer biriyani em uma sexta-feira à noite poderiam ser usadas para anunciar a entrega de biriyani para mim precisamente quando a probabilidade de eu comprá-lo for maior. No geral, comparar a probabilidade de minha compra com a de um colega na mesma região ajuda a atingir melhor os usuários.
Os dados precisam de escala (em grandes números) ou de contexto para serem valiosos. Historicamente, os produtos Web3 e Web2 diferem nos rastros que deixam. Apenas a Amazon sabe quantos controladores de Xbox seriam vendidos em uma determinada semana. Mas você pode ver os padrões pelos quais os comerciantes compram ou vendem NFTs no OpenSea em qualquer dia. A razão é que cada uma dessas transações deixa um rastro público.
Os produtos de dados no Web3 usam essas trilhas para construir contexto.
Blockchains como Ethereum e Bitcoin produzem blocos a cada 12 segundos e aproximadamente 10 minutos, respectivamente. Cada bloco contém transações que alteram o estado do blockchain. Exploradores de blocos como o Etherscan capturam dados relacionados a todas as transações. Por exemplo, se você for ao Etherscan e vir um bloco, a imagem abaixo é o que você poderá ver.
As transações no blockchain são ricas em contexto. Produtos como Arkham e Nansen são mecanismos de interpretação para que os pesquisadores entendam o que está acontecendo quando ocorre uma transação.
Você pode ver todos os blocos desde o início do Ethereum. Mas o que você pode fazer com essas informações? Quase nada. Então, você precisa de uma forma de capturar esses dados em diversas tabelas. Por exemplo, sempre que um contrato NFT de um mercado é chamado em um bloco, os dados relacionados a essa transação devem ser anexados às tabelas relacionadas ao NFT, ou quando um contrato Uniswap é chamado, os dados relacionados devem ser armazenados em tabelas relacionadas ao DEX. . (Dune faz isso como um serviço.)
Não é possível analisar os dados brutos sem incorrer em custos significativos de infraestrutura. Portanto, embora os dados estejam disponíveis gratuitamente, você enfrenta os mesmos problemas. Você confia em dados externos como investidor ou construtor de dApp. Mas a sua função principal não está relacionada com a recolha e gestão de dados. Despender recursos em atividades essenciais, mas não essenciais, não é um luxo que todas as organizações possam desfrutar.
Para produtos de dados, o contexto em torno dos dados torna o produto único. A Bloomberg aplica seu conhecimento financeiro e transforma os dados em um formato que inventores e comerciantes podem consumir facilmente. Sites como Similarweb ou publicações de pesquisa como Newzoo usam suas competências essenciais para aplicar contexto social ou relacionado a jogos aos dados que rastreiam.
Os produtos de dados nativos do Blockchain se diferenciam ao fornecer contexto do usuário por meio de consultas que respondem a perguntas relevantes para subconjuntos específicos de usuários. Por exemplo, o TokenTerminal calcula os fundamentos econômicos dos protocolos. Nansen ajuda os participantes do mercado a rotular e compreender a movimentação de ativos. Parsec consulta dados on-chain para ajudar os traders a analisar melhor as posições DeFi.
Todos esses produtos funcionam com um bem público: dados on-chain. A diferença é a forma como esses produtos apresentam seus dados, o que os torna atraentes para diferentes públicos.
A divisão da categoria de produtos em nossa indústria é baseada nos dados que vão para a rede e nas informações derivadas de fontes fora da rede. (Alguns costumam usar ambos.) Os provedores de dados usam seus filtros de contexto para criar produtos. Assim como os dados Web2 têm seus nichos, as empresas de dados Web3 construíram ou estão construindo gradualmente fossos usando suas competências essenciais.
Como tal, os antecedentes dos fundadores muitas vezes ditam a natureza dos produtos lançados. Quando uma equipe principal passou um tempo significativo nos mercados de capitais antes da criptografia, seus produtos tendem a imitar a Bloomberg, enquanto os produtos cripto nativos se parecem com Nansen. Produtos diferentes atendem a necessidades diferentes, mesmo quando consultam os mesmos dados.
Por exemplo, as exchanges normalmente descartam dados após intervalos fixos. Eles não estão no negócio de dados e o armazenamento de dados antigos exige servidores e gerenciamento adicionais. Alguns provedores de dados, como Kaiko e Amberdata, mantêm dados históricos da carteira de pedidos das bolsas. Esses dados permitem que traders e investidores construam modelos para testar suas hipóteses. Mas se você quiser entender quais contratos DeFi estão sendo liberados com um influxo de ETH ou stablecoins ou analisar o comportamento na cadeia de endereços ou entidades específicas, você precisará de um produto da Nansen ou Arkham.
O mapa de mercado não é representativo de todos os participantes em todas as categorias.
Uma maneira de entender como os produtos foram posicionados nos mercados é através das lentes das personas dos consumidores na criptografia. Essas personas podem ser classificadas nas quatro categorias principais a seguir.
A maior parte dos dólares que fluem através de produtos de dados criptográficos vem de instituições financeiras durante um mercado em baixa. Esses são clientes importantes, com ciclos de vendas mais longos e requisitos de dados muito mais complexos. Uma forma de saber se um produto é voltado para instituições financeiras é se o cliente precisa passar por uma ligação de vendas para saber quanto custa. No mundo Web2, você não consegue descobrir quanto custa o PitchBook ou o CB Insights. Na criptografia, você não sabe quanto custaria um produto como o Chainalysis.
Brincadeiras à parte, parte do motivo desse processo de vendas é o serviço prático oferecido por produtos de dados voltados para esse segmento de consumo. Esses usuários geralmente optam por dados altamente granulares e frequentes. Eles exigem dados não apenas para decisões pré-negociação, mas também para usos pós-negociação, a fim de cumprir os requisitos de conformidade e tributação.
Por exemplo, eles precisam de produtos que lhes digam qual era historicamente o valor de seu portfólio, os ajudem com cálculos de impostos e assim por diante. Empresas como Amberdata, Kaiko, CoinMetrics, CryptoCompare e, até certo ponto, Nansen atendem esses clientes.
Na minha experiência, apenas fundadores com experiência em instituições ou equipes com grandes rodadas de financiamento conseguiram abrir o mercado institucional de dados. A barreira à entrada é relativamente alta aqui, como seria o caso de qualquer produto empresarial.
Freqüentemente nos deparamos com o recurso de composição do Web3, o que significa que os aplicativos Web3 podem ser interdependentes. Eles poderiam exigir dados um do outro. Portanto, eles precisam ler constantemente os dados uns dos outros. Por exemplo, uma plataforma como o Yearn Finance precisa ler dados do Aave e Compound, e um agregador NFT como o Tensor precisa ler dados do Magic Eden e de outros mercados.
Mas esses dados são armazenados em blocos de cadeias como Ethereum e Solana. Ethereum cria um bloco em 12 segundos e Solana faz isso em 400 ms. Classificar dados de blockchain em tabelas e armazená-los para acesso rápido não é uma tarefa trivial. É aqui que entram em cena indexadores como Covalent, Graph, Chainlink e Powerloom. Eles garantem que os dados brutos do blockchain sejam armazenados no formato desejado para que os desenvolvedores possam buscá-los por meio de simples chamadas de API.
Um segmento emergente nesta persona do consumidor envolve ferramentas usadas para compreender o comportamento do usuário. Por exemplo, o ARCx permite aos desenvolvedores mapear dados fora da cadeia (como o comportamento do navegador) com dados na cadeia (como endereços de carteira) para capturar as informações demográficas dos usuários que interagem com um dApp. Eles estão em um nicho relativamente pequeno, mas relevante, pois ajudam os desenvolvedores a identificar quem são seus usuários.
Os produtos de dados em criptografia geralmente são distribuídos por meio da colaboração com pesquisadores e publicações. CCData, por exemplo, é frequentemente citado na Bloomberg. Os pesquisadores são incentivados a recorrer a produtos de dados, pois eles ajudam a economizar tempo e esforço ao coletar, limpar ou curar dados. Produtos como Dune construíram um fosso ao construir uma comunidade de analistas que competem entre si para obter uma classificação mais elevada em sua lista.
Publicações como The Block e Delphi apresentam painéis construídos com dados de fornecedores terceirizados. Aqui na Decentralised.co, contamos inteiramente com fornecedores de dados externos, pois eles ajudam a manter a equipe enxuta enquanto usamos recursos externos na coleta de dados.
O desafio de atender a este segmento de consumidores é que os investigadores mais pequenos podem não ter o orçamento necessário para justificar o gasto de enormes recursos para revelar insights de nicho que podem ser relevantes apenas para uma única pessoa. Por outro lado, as empresas são bem incentivadas a despender esforços e recursos em parcerias com publicações importantes como o Financial Times, uma vez que isso ajuda na distribuição.
Os produtos orientados para investidores de varejo geralmente apresentam menor granularidade e frequência de dados. Mas são nichos altamente lucrativos para construir, à medida que vêem economias de escala. Dez mil usuários pagando US$ 100 cada é um negócio de ARR de US$ 1 milhão em um mundo onde a rotatividade não existe. É mais fácil falar do que fazer, mas essa economia explica por que temos tantos produtos de cripto-dados voltados para o varejo.
Uma grande parte dos produtos voltados para o varejo é gratuita ou suportada por anúncios. Por exemplo, um recurso gratuito como o DefiLlama não lhe dirá como você pode encaminhar seu pedido por meio de diferentes exchanges (CEXs e DEXs) para evitar derrapagens, pois não tira instantâneos do livro de pedidos, mas mostra informações sobre desbloqueios de tokens ou desbloqueios de rendimento.
Uma mudança nesse segmento de consumo é a forma como o meio de entrega abre uma nova categoria de mercado – por exemplo, a Cielo entrega dados na forma de notificações por meio do Telegram. Ele atingiu mais de 40.000 usuários, retransmitindo informações de uma forma fácil de consumir para um segmento de consumidores que prefere não lidar com interfaces de desktop. Quando bem feitos, até mesmo os meios de distribuição podem ser diferenciais para empreendimentos em estágio inicial. Mesmo em dados.
Embora a classificação seja confusa em alguns pontos, as empresas de dados podem ser divididas em orientações B2B ou B2C.
Empresas como Amberdata e Kaiko possuem produtos que atendem a atores sofisticados. Esses produtos são mais granulares (detalhes em que os dados estão disponíveis) e frequentes (por exemplo, dados tick-by-tick e da carteira de pedidos em tempo real) e atendem a demandas como construção e teste de modelos, análise pré-negociação, relatórios pós-negociação, tributação e conformidade. Os dados são fornecidos em um formato que permite aos clientes realizar análises proprietárias e criar visualizações de acordo com suas preferências. Essas empresas normalmente oferecem seus produtos por meio de um acesso pago.
O custo geralmente é uma função da granularidade devido aos requisitos de infraestrutura, à natureza da clientela envolvida e à duração do ciclo de vendas.
A imagem acima mapeia diferentes produtos em dois eixos – profundidade e granularidade versus preços dos produtos. Observe que esses gráficos não são exatos. Alguns pontos podem estar errados. A ideia é desenvolver um modelo mental para pensar nos diversos produtos e sua posição no mercado.
Produtos voltados para o varejo, como Dune ou CoinGecko, exibem quase todos os dados gratuitamente. Os clientes devem pagar para acessar alguns dados ou se desejarem dados via APIs para executar suas análises. Por exemplo, você pode visualizar todos os gráficos criados por vários assistentes do Dune, mas eles limitam quantas linhas você pode baixar no formato CSV. Você pode baixar arquivos CSV maiores e visualizar consultas privadas à medida que paga mais.
As empresas focadas no varejo tendem a ter baixa receita por cliente e poucos clientes pagantes como porcentagem de usuários gratuitos. Compare isso com as taxas de conversão dos modelos freemium de empresas de Internet. Normalmente, a taxa de conversão é 2%–5%. Uma taxa de conversão de 10% seria uma exceção. Seu manual é ter o maior número possível de clientes gratuitos para que uma taxa de conversão de 4% contribua significativamente para a receita. Isso é o que chamamos de topo do funil.
Portanto, as empresas de dados precisam que o topo do funil seja grande o suficiente para gerar receita suficiente para se sustentarem com uma taxa de conversão mais baixa. As empresas também podem considerar a geração de receita com anúncios quando o site tiver muitos visitantes. A CoinGecko usa a receita publicitária como alavanca para continuar fornecendo a maior parte dos dados gratuitamente.
Ao longo dos anos, as empresas preencheram vagas em ambos os extremos do espectro (B2B e B2C), deixando algumas lacunas entre eles. Se alguém quiser ver como as carteiras de pedidos estão mudando nas bolsas centralizadas ou como as taxas de opção de venda, IVs e distorções estão mudando, não há muitos produtos que ajudem nas visualizações. Há espaço para um produto mais granular do que os CoinGeckos do mundo, mas menos granular do que produtos de players B2B puros.
Encontrar fossos em empresas onde a matéria-prima é gratuita não é fácil. Os dados Blockchain estão disponíveis gratuitamente. Não há nada proprietário nos dados que você pode coletar. Portanto, os obstáculos nos negócios de dados não se baseiam apenas no fato de você ter alguns dados que outros não têm. Em vez disso, baseiam-se na capacidade da equipe de fornecer os dados em um formato criterioso e consumível, dentro do prazo e sem erros.
Muitas empresas afirmam ter os mesmos dados, mas a qualidade dos dados e a sua apresentação são diferentes. Por exemplo, muitas empresas afirmam ter dados de carteiras de pedidos fora da rede. No entanto, fatores como o número de ordens de compra/venda, a duração da série temporal e o número de exchanges e pares disponíveis diferem de provedor para provedor. Amberdata e Kaiko possuem os dados de carteira de pedidos mais abrangentes para mercados de criptografia.
Por que, porém, apenas alguns provedores podem fornecer esse tipo de dados? A explicação de onde surgem os fossos nos dados da Web3 está aqui.
Talento – Correndo o risco de dizer o óbvio, quando a matéria-prima é gratuita, a forma como você a molda determina o valor do produto. Transformar dados brutos em informações úteis requer experiência de domínio em muitos nichos nos mercados criptográficos e financeiros tradicionais. Equipes como a Velo Data, com experiência em mercados tradicionais, têm vantagem sobre outras que tentam construir produtos B2C semelhantes. É raro encontrar desenvolvedores talentosos que entendam as estruturas de dados de blockchain e tenham experiência relevante nos mercados financeiros.
Infraestrutura – Coletar e entregar grandes quantidades de dados requer infraestrutura que não é fácil. Esse tipo de operação requer capital e talento. Por que a infraestrutura é um fosso? Pense nos dados do pool de memória. Os blocos contêm dados para transações confirmadas. E quanto às transações não confirmadas?
Diferentes nós de rede (por exemplo, nós conectados ao mesmo pool) veem diferentes transações não confirmadas. A execução de apenas um nó não proporcionará uma visão global das transações concorrentes. A manutenção de vários nós em vários blockchains aumenta os custos de infraestrutura. Tal como aconteceu com a IA (e as redes de conteúdo no passado), a capacidade de manter baixos os custos de hardware enquanto o dimensionamento determinará os vencedores e os perdedores no setor ao longo do tempo.
Efeitos de rede –Pode-se levantar a hipótese de que existem efeitos de rede em muitos produtos de dados criptográficos. Veja o Chainlink como exemplo. Foi um dos primeiros oráculos que permitiu que aplicativos lessem dados de outros aplicativos ou cadeias. Conseguiu angariar o apoio da comunidade e tem uma das comunidades mais fortes. Outro exemplo é Nansen. Sua fama foram as etiquetas de endereço que lhe permitiram atribuir a movimentação de ativos a entidades reais em vez de endereços hexanuméricos.
Posteriormente, lançou recursos como NFT Paradise e Token God Mode, permitindo aos usuários rastrear NFTs e tokens de forma mais eficaz. Arkham lançou um produto semelhante aos rótulos de Nansen, mas o investimento em painéis e pesquisas permitiu que Nansen se aproximasse de clientes empresariais e oferecesse produtos sob medida para eles. Vale ressaltar que os efeitos de rede não são possíveis sem os dois primeiros pontos (talento e infraestrutura).
Um lugar onde isso funciona é com indexadores. Quanto maior o número de cadeias que um produto suporta, maior a probabilidade de um desenvolvedor usar o produto em vez de depender de múltiplas fontes. Equipes como a Covalent têm uma vantagem aqui, pois vêm otimizando a amplitude das cadeias suportadas há algum tempo. Mas lembre-se de que a profundidade é tão importante quanto a amplitude.
É muito cedo para dizer se algum produto tem um fosso significativo na criptografia. Testemunhamos vantagens dos pioneiros no grande esquema das coisas. À medida que categorias como Web3 social e a sobreposição entre IA e criptografia continuam a crescer, os produtos de dados na indústria podem crescer e se tornar o próximo Alfabeto. Mas esta será uma história de várias décadas; ainda estamos em seus primeiros anos.
Muitos dos casos de uso que mencionamos neste artigo analisam a especulação financeira de uma forma ou de outra. Até mesmo os desenvolvedores que usam APIs para consultar dados estão construindo produtos financeiros. Pode parecer estranho, mas as blockchains (como uma nova rede) seguem a mesma tendência que o Telegraph e a Internet seguiram.
A chegada de um novo meio e o surgimento de uma nova rede aceleram os casos de utilização financeira. Com a Internet, demorou até o início dos anos 2000 para que as pessoas percebessem que os usuários poderiam ser direcionados com base em sua localização. Com blockchains, ainda estamos descobrindo como construir modelos de negócios a partir de trilhas de dados disponíveis publicamente.
Vimos uma mudança importante em nosso uso diário dessas plataformas: Dune Analytics incorporando IA em seus produtos. Dune fornece uma interface baseada em SQL para os usuários consultarem dados de blockchains como Ethereum e Solana. O mercado para esse tipo de produto geralmente é restrito a usuários que entendem como escrever consultas SQL. Recentemente, eles começaram a usar IA para ajudar analistas a gerar consultas sem serem especialistas em SQL. Não é tão funcional quanto se esperaria. Mas ainda é um passo em direção ao futuro. Pode não demorar muito para que peçamos à IA (como ChatGPT) que consulte dados de um blockchain e ofereça sua análise.
Uma maneira de pensar em “dados” no contexto da Web3 é através das lentes do Google Maps. O GPS existe pelo menos desde a década de 1980. O Google fez o trabalho necessário para mapear o mundo. Ao disponibilizar sobreposições de mapas para aplicativos de terceiros (usando APIs), a empresa permitiu a construção de uma nova geração de aplicativos. Tudo, desde a entrega até o transporte por aplicativo, cresceu porque um único player especializado em dados assumiu esse fardo dos desenvolvedores.
Os produtos de dados na Web3 desempenham um papel semelhante. Ainda não sabemos a natureza exacta das aplicações que poderiam ser construídas sobre este recurso disponível publicamente, mas está a tornar-se evidente que existe uma oportunidade do tamanho da Alphabet no panorama dos dados.