Estamos en 2024 y uno pensaría que obtener datos criptográficos es fácil porque tienes Etherscan, Dune y Nansen que te permiten ver los datos que deseas todo el tiempo. Bueno, algo así.
Verá, en el mundo web2 regular, cuando tiene una empresa con 10 empleados y 100.000 clientes, la cantidad de datos que está produciendo probablemente no supere los cientos de gigabytes (en la parte superior). Esa escala de datos es lo suficientemente pequeña como para que tu iPhone pueda resolver cualquier pregunta que tengas y almacenarlo todo. Sin embargo, una vez que tenga 1.000 empleados y 100.000.000 de clientes, la cantidad de datos con la que probablemente esté tratando ahora sea de cientos de terabytes, si no de petabytes.
Este es fundamentalmente un desafío completamente diferente ya que la escala con la que estás tratando requiere muchas más consideraciones. Para procesar cientos de terabytes de datos, se necesita un grupo distribuido de computadoras al que enviar los trabajos. A la hora de enviar estos trabajos hay que pensar en:
¿Qué pasa si un trabajador no hace su trabajo?
¿Qué pasa si un trabajador tarda mucho más que los demás?
¿Cómo se calcula qué trabajo darle a qué trabajador?
¿Cómo se combinan todos sus resultados y se garantiza que el cálculo se haya realizado correctamente?
Todas estas son consideraciones en las que debe pensar cuando se trata de computación de huge information en varias máquinas. La escala genera problemas que son invisibles para quienes no trabajan con ella. Los datos son uno de esos dominios en los que cuanto más se escala, más infraestructura se necesita para gestionarlos correctamente. Problemas invisibles para la mayoría de la gente. Para manejar esta escala también tienes desafíos adicionales:
Talento extremadamente especializado que sabe manejar máquinas a esta escala.
El costo de almacenar y calcular todos los datos.
Planificación y arquitectura anticipadas para garantizar que sus necesidades puedan ser respaldadas
Es curioso, en web2 todos querían que los datos fueran públicos. En web3, finalmente, muy pocos saben cómo hacer el trabajo necesario para darle sentido. Un hecho engañoso acerca de esto es que con un poco de ayuda, puede obtener su conjunto de datos del conjunto de datos world con cierta facilidad, lo que significa que los datos “locales” son fáciles, sin embargo, los datos “globales” son difíciles de obtener (cosas que pertenecen a todos). y todo).
Como si las cosas no fueran ya un desafío con la escala con la que tienes que trabajar. Hay una nueva dimensión que hace que los datos criptográficos sean un desafío y es el hecho de que existe una fragmentación continua debido a los incentivos financieros del mercado. Por ejemplo:
Surgimiento de nuevas blockchains. Hay cerca de 50 vidas de L2, 50 se sabe que estarán próximas y cientos más en proceso. Cada L2 es efectivamente una nueva fuente de base de datos que debe indexarse y configurarse. ¡Ojalá estén estandarizados pero no siempre puedes estar seguro!
Auge de las nuevas máquinas virtuales. EVM es solo un dominio. SVM, Transfer VM y muchos otros están llegando al mercado. Cada nuevo tipo de máquina digital significa un esquema de datos completamente nuevo que debe considerarse desde los primeros principios y una comprensión profunda. ¿Cuántas máquinas virtuales hay? Bueno, ¡los inversores incentivarán una novedad por una suma de miles de millones de dólares!
Aumento de los primitivos de las nuevas cuentas. Las carteras de contratos inteligentes, las carteras alojadas y la abstracción de cuentas plantean una nueva complicación en la forma en que realmente se interpretan los datos. Es posible que la dirección de origen no sea en realidad el usuario actual porque fue enviada por un retransmitido y el usuario actual está en algún lugar de la mezcla (si miras lo suficiente).
La fragmentación puede ser particularmente desafiante dado que no se puede cuantificar lo que no se sabe. Nunca sabrás todas las L2 que existen en el mundo y las máquinas virtuales que saldrán en complete. Podrás seguir el ritmo una vez que alcancen una escala suficiente, pero esa es una historia para otro momento.
Creo que esto último toma a mucha gente por sorpresa y es el hecho de que sí, los datos están abiertos, pero no, no son interoperables fácilmente. Verá, todos los contratos inteligentes que se crean en equipo son como una pequeña base de datos dentro de una base de datos más grande. Me gusta pensar en ellos como esquemas. Todos los datos están ahí, pero el equipo que desarrolló los contratos inteligentes suele comprender cómo se combinan. Puede dedicar tiempo a comprenderlo usted mismo si lo desea, pero tendrá que hacerlo cientos de veces para todos los esquemas potenciales, y ¿cómo va a permitirse el lujo de hacerlo sin gastar grandes sumas de dinero sin un comprador al otro lado de la transacción?
En caso de que esto parezca demasiado abstracto, permítanme darles un ejemplo. Usted cube “¿Cuánto utiliza puentes este usuario?”. Aunque esto se presenta como una pregunta, tiene muchos problemas anidados. Vamos a desglosarlo:
Primero necesitas conocer todos los puentes que existen. También en las cadenas que te importan. Si se trata de todas las cadenas, ya mencionamos anteriormente por qué esto es un desafío.
Luego, para cada puente es necesario comprender cómo funcionan sus contratos inteligentes.
Una vez que haya entendido todas las permutaciones, ahora necesita razonar a través de un modelo que pueda unificar todos estos esquemas individuales.
Cada uno de los desafíos anteriores es muy difícil de resolver y requiere muchos recursos.
Entonces, ¿a qué conduce todo esto? Bueno, el estado del ecosistema que tenemos hoy donde…
Ecosistema donde nadie sabe realmente lo que está pasando realmente. Simplemente existe una noción de actividad que es difícil de cuantificar adecuadamente.
Recuentos de usuarios inflados y difícil detectar sybils. ¡Las métricas comienzan a volverse irrelevantes y poco confiables! Lo que es actual o falso ni siquiera les importa a los participantes del mercado porque todo parece igual.
Principales problemas para hacer realidad la identidad en cadena. Si desea tener un fuerte sentido de identidad, los datos precisos son fundamentales; de lo contrario, su identidad se tergiversará.
Espero que este artículo le haya ayudado a abrir los ojos a la realidad del panorama de datos en criptografía. Si se enfrenta a alguno de estos problemas o desea aprender cómo superarlos, comuníquese con nosotros: mi equipo y yo los estamos abordando.