banner

Blog

Dec 10, 2023

Cómo explicar las mallas de datos, las estructuras y las nubes

Por Isaac Sacolick

Editor colaborador, InfoWorld |

Su director ejecutivo sabe qué es una base de datos y probablemente piense que un almacén de datos es una gran bóveda de datos que se utiliza para generar informes y análisis. Saben poco sobre los almacenes de datos NoSQL, por qué necesitan un clúster Spark o cómo se utilizan los lagos de datos para ingerir datos estructurados y no estructurados.

Los directores ejecutivos y líderes empresariales se centran en el valor empresarial de los datos, el análisis y el aprendizaje automático y se preocupan menos por las tecnologías subyacentes.

Pero ahí radica una paradoja, porque sí quieren comprender el valor de invertir tiempo y dinero en nuevas tecnologías. Intente explicar las últimas tecnologías de gestión de datos, incluidas las mallas de datos, las estructuras de datos y las nubes de datos distribuidas, y observe cómo le da vueltas la cabeza a su director ejecutivo.

Tampoco se trata sólo de los directores ejecutivos. La tecnología de datos se ha disparado desde los primeros días de la web, cuando el debate principal era si construir su almacén de datos sobre Oracle, Microsoft o código abierto. Hoy en día, muchos líderes ajenos al sector de TI se contentan con creer que los datos están “en la nube” y que la integración, la calidad y el rendimiento de los datos son “cuestiones de TI”.

Cualquiera que trabaje con datos debe estar preparado para explicar las tecnologías y prácticas más críticas en un lenguaje accesible. En mi libro, Digital Trailblazer, comparto una historia sobre cómo explicar qué es una cookie de navegador a los miembros de la junta directiva de nuestra startup cuando la web era nueva. Nunca se sabe cuándo le entregarán el micrófono para responder una pregunta técnica. Responder con palabrería tecnológica puede fácilmente disuadir o ralentizar inversiones clave.

Gordon Allott, presidente y director ejecutivo de K3, sugiere comenzar con una respuesta simple: "El lago de datos, el almacén de datos, la malla y la estructura simplemente se refieren a la estrategia general de datos de la empresa".

Mantener sus respuestas simples es importante, pero a menudo no es suficiente. Cuando un ejecutivo me pregunta sobre un término técnico, quiero responder la pregunta de una manera que fomente la curiosidad y las preguntas de seguimiento.

Empecemos explicando qué es una malla de datos. Steven Lin, gerente de marketing de productos de Semarchy, compartió esta respuesta concisa: "Una malla de datos es un enfoque descentralizado para administrar datos, donde varios equipos dentro de una empresa son responsables de sus propios datos, lo que promueve la colaboración y la flexibilidad", dijo.

No hay palabras complejas en esta definición e introduce los problemas que las mallas de datos pretenden resolver, el tipo de solución y por qué es importante.

Sin embargo, espere que le pidan más detalles técnicos, especialmente si el ejecutivo tiene conocimiento previo de otras tecnologías de gestión de datos. Por ejemplo, "¿No se suponía que los almacenes y lagos de datos resolverían el problema de la gestión de datos?"

Esta pregunta puede ser una trampa si se responde con las diferencias técnicas entre almacenes de datos, lagos y mallas. En su lugar, centre su respuesta en el objetivo empresarial.

Satish Jayanthi, cofundador y CTO de Coalesce, ofrece esta sugerencia: “La calidad de los datos a menudo afecta la precisión del análisis empresarial y la toma de decisiones. Al implementar paradigmas de malla de datos, se puede mejorar la calidad y precisión de los datos, lo que resulta en una mayor confianza entre las empresas para utilizar los datos más ampliamente para la toma de decisiones informadas”.

Me gusta esta respuesta y espero que el ejecutivo quiera profundizar en cómo los paradigmas de malla de datos ayudan a mejorar la calidad de los datos. Jayanthi responde: “Uno de los principios básicos, la propiedad del dominio, garantiza que el equipo que produce los datos es responsable de la calidad y la precisión. Este principio de los datos como producto garantiza que los datos compartidos con otros grupos sean precisos, reutilizables, autodocumentados y cumplan con altos estándares”.

Si es nuevo en el mundo de las mallas de datos y desea profundizar en los detalles técnicos, le sugiero revisar el artículo fundamental de Zhamak Dehghani sobre cómo ir más allá de un lago de datos monolítico a una malla de datos distribuida.

El director financiero escuchó la conversación sobre mallas de datos y ahora quiere saber por qué el director de datos prefiere invertir en un tejido de datos en lugar de una malla de datos.

En realidad, el director financiero hace tres preguntas:

Cuando me enfrente a una pregunta compuesta, sugiero reducir la velocidad, respirar profundamente, considerar el contexto de quién hace la pregunta y brindar una respuesta deconstruida. Podría comenzar diciendo: "Primero hablemos del tejido de datos y su importancia".

Ross Stuart, arquitecto senior de soluciones de AHEAD, sugiere ayudar al director financiero a analizar cómo se ve una tela y cómo funciona. "Un tejido de datos es un término utilizado para describir la arquitectura que consiste en tomar sistemas dispares y entrelazarlos, como un tejido, para crear una capa consistente sobre los datos de una organización", afirma.

Ivan Batanov, vicepresidente senior de ingeniería de Crux, añade: "Una arquitectura de estructura de datos puede ofrecer conocimientos y análisis mejorados de manera eficiente y respalda la naturaleza interconectada de los datos de fuentes dispares".

En este punto, debe hacer una pausa y darle a su audiencia unos segundos para comprender la relación entre las mallas de datos y las estructuras de datos, incluido el aparente conflicto entre los dos enfoques. ¿Cómo podrías unirlos? Sugiero decir algo como esto:

Lo que analizamos en estas preguntas y respuestas son diferentes roles organizacionales y sus responsabilidades en materia de datos. Queremos que los equipos empresariales adopten la ciencia de datos ciudadana y los utilicen para la toma de decisiones, mientras que las organizaciones necesitan que el director de datos se centre en la gobernanza proactiva de los datos, con el objetivo de reducir las fricciones y los riesgos al democratizar los datos.

Ahora llegamos a un tercer grupo de gestión de datos, que tiene la tarea de almacenar y estructurar datos para respaldar las necesidades de uso, los objetivos de rendimiento y los requisitos de seguridad. “¿Dónde deberíamos almacenar el conjunto de datos X?” es el desafío que tenemos entre manos y la respuesta no es sencilla. En la mayoría de las empresas, no existe una arquitectura única para almacenar, administrar y utilizar datos.

James Malone, director de gestión de productos de Snowflake, afirma: "En lugar de especificar el 'cómo' detrás del almacenamiento de información, una nube de datos representa el 'qué' que alguien obtiene con la combinación adecuada de tecnologías", afirma. “La nube de datos permite a las organizaciones elegir lo que les funciona en lugar de prescribir e impulsar sólo una forma de hacer las cosas. Los casos de uso cambian, las necesidades cambian y los cambios tecnológicos; es por eso que la nube de datos se centra en la flexibilidad y la utilidad”.

Hillary Ashton, directora de producto de Teradata, añade un detalle importante para compartir con el director financiero. "Las nubes de datos se pueden implementar en cualquier combinación de nubes públicas, nubes privadas locales, nubes híbridas y nubes múltiples", afirma. “Pero el 'cerebro' de cualquier nube de datos es la plataforma de análisis de la nube que procesa y conecta datos de cada fuente y arquitectura. Para obtener el máximo valor de sus datos, lo que más importa es la capacidad de escalar su motor analítico y sus capacidades en toda la organización, permitiendo a equipos más allá de los científicos de datos acceder, consultar y transformar datos en conocimientos”.

En este punto, el CEO y el CFO pueden estar buscando un botón fácil de presionar, así que les recuerdo la habilidad que se requiere en las cosas más simples. “Para hacer una gran barra de pan, necesitas cinco ingredientes: harina, agua, levadura, sal y azúcar, en las proporciones correctas, elaborados con las técnicas adecuadas, cocinados durante el tiempo correcto y presentados elegantemente para brindar la experiencia deseada. .”

Cualquiera que haya probado a hacer pan sabe lo difícil que es hornear una hogaza excelente de manera constante. Los libros de pan tienen cientos de recetas y las técnicas siguen evolucionando.

Almacenar, gestionar, integrar, gobernar y utilizar datos parece sencillo, pero se necesitan los ingredientes, las herramientas y las prácticas adecuadas para potenciar la organización basada en datos.

A continuación lee esto:

Isaac Sacolick es presidente de StarCIO y autor del bestseller de Amazon Driving Digital: The Leader's Guide to Business Transformation Through Technology y Digital Trailblazer: Essential Lessons to Jumpstart Transformation and Accelerate Your Technology Leadership. Cubre planificación ágil, devops, ciencia de datos, gestión de productos y otras mejores prácticas de transformación digital. Sacolick es un reconocido CIO social e influyente en la transformación digital. Ha publicado más de 900 artículos en InfoWorld.com, CIO.com, su blog Social, Agile, and Transformation y otros sitios.

Copyright © 2023 IDG Communications, Inc.

A continuación lee esto:
COMPARTIR