banner

Blog

Oct 21, 2023

Análisis: SAP comienza a tejer su propio tejido de datos

ACTUALIZADO A LAS 11:00 EDT / 8 DE MARZO DE 2023

ANÁLISIS por Tony Baer

Casi cualquier empresa, grande o pequeña, que utiliza tecnología suele tener un proveedor estratégico que, de hecho, es el primero entre iguales. Se convierte en la plataforma que impulsa las opciones para aplicaciones, herramientas o bases de datos de terceros. En las pequeñas empresas, ese proveedor de plataforma estratégica probablemente sea Microsoft Corp. o Apple Inc., con la opción de elegir entre Android de Google LLC o iOS de Apple en el lado móvil. En las empresas medianas y grandes, es más probable que las plataformas sean multipolares, lo que refleja el hecho de que pocas o ninguna de ellas probablemente se estandarizarán en un único proveedor central.

Como proveedor preeminente de aplicaciones empresariales, SAP SE a menudo asume el papel de proveedor estratégico. Hay muchos datos divertidos que respaldan esto, y uno de los más comunes es que el 77% de los ingresos por transacciones del mundo afectan a un sistema SAP. El uso de SAP influye en gran medida en las decisiones que toman en cuanto a bases de datos, análisis y aplicaciones de soporte.

Pero en esas mismas organizaciones también es probable que haya grupos que trabajen fuera del entorno SAP. Tal vez partes de la organización utilicen e-Business Suite de Oracle Corp. o Microsoft Dynamics, o grupos de analistas de negocios que trabajan con análisis, o científicos de datos que construyen modelos a partir de lagos de datos. La mayoría de las veces, las vistas de los datos pueden estar determinadas por si se trabaja dentro o fuera del jardín amurallado de la aplicación empresarial.

Sostenga ese pensamiento.

Para la gestión de datos, los problemas más apremiantes que estamos viendo tienen que ver con que las empresas puedan manejar mejor su vasta y creciente extensión de datos. Los datos no sólo se están volviendo más diversos, sino que cada vez están más distribuidos. La tormenta perfecta de la computación en la nube, la conectividad y el alcance del 5G ha ampliado el alcance de los datos. Y con la conectividad ubicua surgen preocupaciones sobre la privacidad y la soberanía de los datos que, literalmente, están estableciendo los límites de qué datos pueden ser consumidos por quién, en qué forma y dónde. Para los clientes de SAP, el mundo de los datos se ha disparado fuera de sus aplicaciones SAP.

Un subproducto de esto ha sido el interés en la malla de datos, donde la propiedad y la gestión del ciclo de vida están claramente delimitadas por las unidades de negocio, los expertos en la materia o los dominios que tienen el mayor conocimiento y participación en los datos. En el otro extremo del espectro está la construcción de una infraestructura lógica para garantizar que se descubran y entreguen los datos correctos, y a partir de ahí hemos visto un creciente interés en el tejido de datos. En nuestra opinión, ambos deberían complementarse y no anularse.

El desafío es definir qué es un tejido de datos. Como hemos visto en algunos informes de firmas de analistas, una estructura de datos es lo que solíamos denominar una cartera de integración de datos que abarca catálogo, herramientas de orquestación y transformación de datos, calidad de datos, linaje de datos, etc. Esa definición funcional es un poco vaga para nosotros.

Para nosotros, una estructura de datos debe comenzar con un backplane de metadatos común. Como mínimo, rastrea fuentes de datos y recopila metadatos. Los tejidos de datos más avanzados utilizan el aprendizaje automático para enriquecer los metadatos basándose en inferencias detectadas a partir de patrones de actividad de los sistemas de origen y de destino, como a qué conjuntos de datos o entidades se accede con frecuencia juntos. La estructura debe enterrar bajo el capó las complejidades de descubrir, acceder, transformar, gobernar y proteger los datos.

El tejido de datos no necesariamente realiza esas tareas, pero proporciona la superestructura lógica para orquestar la cadena de herramientas que expone los datos, regula el acceso, los limpia, los transforma, los enmascara en tiempo de ejecución y determina cómo se accede a los datos: ¿Al motor de consultas (mediante replicación) o viceversa (mediante virtualización)? Se necesita un tejido de datos, no cuando simplemente se obtienen datos de un único sistema de transacciones, sino de una variedad de fuentes.

SAP no es nuevo en el juego de la integración de datos, ya que ha ofrecido una serie de herramientas y servicios en la nube para la virtualización y replicación de datos. Pero la noción de salir del jardín amurallado de datos de SAP podría ser nueva para gran parte de la base instalada. Hoy, SAP está finalizando lo que consideramos un viaje hacia la construcción de un tejido de datos: el nuevo servicio en la nube SAP Datasphere.

Datasphere combina y se basa en dos ofertas de SAP existentes, incluida Data Warehouse Cloud, que se utilizó para análisis, y Data Intelligence Cloud, que era un centro de integración de datos. Aprovecha la capa semántica empresarial, que fue lo que originalmente distinguió a SAP Data Warehouse Cloud de otros servicios de almacenamiento de datos en la nube. Además de la pila de tecnología combinada existente, Datasphere agrega un catálogo de datos para el descubrimiento de datos junto con nuevas capacidades de calidad de datos, orquestación de canalización de datos y modelado de datos. El resultado es una experiencia unificada para la integración de datos, catalogación de datos, modelado semántico, almacenamiento de datos, federación de datos y virtualización de datos.

El objetivo de SAP no es simplemente combinar una fábrica de transformación de datos con un almacén de datos, sino ofrecer un servicio que preserve el contexto de los datos de origen. Como puedes imaginar, mantener el contexto depende de los metadatos. El desafío es que cuando se utilizan herramientas existentes para replicar, mover y transformar datos, los metadatos generalmente no los acompañan.

Es cierto que, si bien el esquema puede estar implícito en los datos movidos, los metadatos o la semántica a nivel empresarial probablemente no serán obvios. Hay que añadir el hecho de que las aplicaciones de SAP son un rico tesoro de datos empresariales y la semántica de procesos que los acompañan. Por lo tanto, es lógico que SAP haya ampliado la capa semántica empresarial de su nube DW para ofrecer un tejido de datos que muestre los metadatos en términos empresariales.

Otro objetivo clave del diseño es un motor que debería proporcionar una experiencia guiada o barreras de seguridad para determinar la mejor manera de acceder a los datos, como por ejemplo si es mejor moverlos o virtualizarlos. Ahí es donde entra en juego tener inteligencia integrada en la estructura, donde entra en juego las prioridades de costo versus nivel de servicio, consideradas junto con los permisos sobre si los datos se pueden mover. Las herramientas tradicionales de integración de datos requieren que la elección esté en la cabeza del usuario o ingeniero de datos.

Es cierto que, dentro de su propia cartera, SAP puede ejercer control sobre el flujo de metadatos. Por ejemplo, las suites modernas como S/4HANA ya han unificado los metadatos. En todo el portafolio de aplicaciones empresariales de SAP, la unificación de metadatos es un trabajo en progreso dada la larga serie de adquisiciones de la compañía, desde Ariba hasta Qualtrics y otras. Lo interesante es observar sus aplicaciones NextGen que están uniendo algunos de esos silos, como Buying 360 que unifica flujos de trabajo superpuestos que abarcan algunas de esas aplicaciones heredadas. Por ejemplo, al incorporar a un nuevo empleado en SuccessFactors, podría iniciarse un flujo de trabajo para equipos de oficina a través de Ariba o viajes de negocios a través de Concur.

Preservar el contexto se vuelve más difícil cuando se trata de sistemas externos. Ahí es donde hay que depender de la amabilidad de los extraños y, para SAP, es donde comienza un nuevo impulso para las asociaciones. SAP está lanzando asociaciones con cuatro nombres conocidos en el espacio de análisis, gobernanza de datos y ciencia de datos: Databricks Inc., que integrará los datos de SAP con su lago Delta Lake; Collibra NV, para el gobierno de datos; DataRobot Inc., por gestionar el ciclo de vida de proyectos de ciencia de datos e inteligencia artificial; y Confluent Inc., para la integración con transmisión de datos.

El beneficio clave radica en la preservación del contexto de los metadatos cuando se trabaja en entornos de socios. Por ejemplo, Collibra, que se posiciona como un catálogo de catálogos de datos, mostrará metadatos de gobernanza y linaje en Datasphere, y se asegurará de que cuestiones como la cadena de custodia de los datos sean cuidadosamente rastreadas y aplicadas. O con DataRobot, un científico de datos que ha creado un modelo y luego lo ejecuta en SAP debe tener una conexión bidireccional que transmita el rendimiento del modelo y las características de los datos a la herramienta de ciencia de datos.

En este punto, todavía no tenemos los detalles de lo que SAP está entregando desde el primer día con Datasphere, pero pueden estar seguros de que las estructuras de datos no se construyen de la noche a la mañana. Este será un viaje que implicará un desarrollo significativo de un motor de orquestación inteligente que, por ejemplo, recomiende, en función de parámetros como el costo, el rendimiento y el tiempo de respuesta, y la soberanía de los datos, cómo y dónde ejecutar la consulta, y si se está ejecutando. momento en que los datos deben enmascararse dinámicamente.

El éxito de SAP Datasphere, como cualquier tejido de datos, dependerá de la profundidad y amplitud del soporte del ecosistema de socios. Y en la batalla por la mentalidad compartida, se tratará de persuadir a los usuarios que no son de SAP de que trabajar dentro de Datasphere no limitará su capacidad para explorar y modelar datos dondequiera que estén.

Pero volvamos a la cuestión de la complejidad. Cuando se presentó Datasphere ante un grupo de analistas, uno de nuestros colegas del lado de las aplicaciones preguntó si esta nueva capa de datos complicaría la vida a los usuarios de ERP. En broma pensamos en la metáfora de que la gente de aplicaciones es de Venus y la gente de datos es de Marte.

Para los usuarios de la aplicación, esto es una preocupación real. Para el usuario de planificación de recursos empresariales o de almacén empresarial, el catálogo de datos es una capa adicional. Idealmente, le gustaría ver análisis integrados en su entorno para no tener que cambiar de pantalla a un catálogo de datos. SAP BW se desarrolló precisamente para esas preocupaciones, ya que fue concebido como un almacén de datos para los usuarios de aplicaciones empresariales de SAP. El SAP Data Warehouse Cloud original fue concebido como el nivel de análisis de S/4HANA y, con su capa semántica empresarial, permitió a los usuarios de S/4 trabajar en su idioma nativo.

Pero se trata de que SAP se conecte con el resto del mundo de los datos. Si bien la mayor parte de los ingresos por transacciones del mundo afectan a un sistema SAP, eso no significa que la mayoría de los datos del mundo afectan a él. El desafío de SAP con su nuevo tejido de datos es triple. El primero es construir la infraestructura lógica que simplifique la conexión de los usuarios a los datos. El segundo consiste en reclutar un ecosistema de socios para obtener no solo visibilidad de los datos, sino también un intercambio bidireccional de metadatos para mantener los datos conectados. Y en tercer lugar, será hacer que los datos no parezcan territorio extraño para el vasto caso de usuario final de aplicaciones de SAP.

Tony Baer es director de dbInsight LLC, que proporciona una visión independiente del ecosistema de tecnología de análisis y bases de datos. Baer es un experto de la industria en la ampliación de las prácticas de gestión de datos, la gobernanza y el análisis avanzado para abordar el deseo de las empresas de generar valor significativo a partir de la transformación basada en datos. Escribió este artículo para SiliconANGLE.

GRACIAS

Enfrentamiento entre la nube y las instalaciones: el futuro campo de batalla para el dominio de la IA generativa

Cómo superar los desafíos de la actual escasez de talento en ciberseguridad

Esta semana en la empresa: la consolidación cibernética se acelera, la IA transforma la programación y se amplían las divisiones en materia de código abierto

Informe de Black Hat: muchas preguntas, pocas respuestas mientras el mundo de la ciberseguridad se enfrenta a las amenazas de la IA

Cisco adquiere la startup de software de telecomunicaciones Working Group Two por 150 millones de dólares

Analizando el estado de las aplicaciones nativas de la nube

Enfrentamiento entre la nube y las instalaciones: el futuro campo de batalla para el dominio de la IA generativa

AI - POR DAVE VELLANTE . HACE 17 HORAS

Cómo superar los desafíos de la actual escasez de talento en ciberseguridad

SEGURIDAD - POR AUTOR INVITADO. HACE 20 HORAS

Esta semana en la empresa: la consolidación cibernética se acelera, la IA transforma la programación y se amplían las divisiones en materia de código abierto

AI - POR ROBERT HOF . HACE 1 DÍA

Informe de Black Hat: muchas preguntas, pocas respuestas mientras el mundo de la ciberseguridad se enfrenta a las amenazas de la IA

SEGURIDAD - POR MARK ALBERTSON. HACE 1 DÍA

Cisco adquiere la startup de software de telecomunicaciones Working Group Two por 150 millones de dólares

INFRA - POR MARIA DEUTSCHER . HACE 2 DÍAS

Analizando el estado de las aplicaciones nativas de la nube

NUBE - POR AUTOR INVITADO. HACE 2 DÍAS

“TheCUBE es un socio importante para la industria. Ustedes realmente son parte de nuestros eventos y realmente apreciamos que vengan y sé que la gente también aprecia el contenido que crean” – Andy JassyGRACIAS
COMPARTIR