Skip to content

Descubriendo Microsoft Fabric

Descubriendo Microsoft Fabric

Introducción

En la actualidad, el volumen de datos generado en los entornos empresariales crece de manera exponencial, por lo que las empresas buscan soluciones analíticas completas, que permitan poner en valor grandes volúmenes de datos reduciendo al máximo la latencia.

Estas soluciones suelen derivar en proyectos cada vez más complicados que necesitan muchos subsistemas de diferentes proveedores para cubrir sus necesidades, lo que suele derivar en integraciones complejas, frágiles y costosas.

Aunque en la oferta de Microsoft ya existan productos que puedan cumplir con todas las necesidades de manera independiente, sigue siendo necesario integrar muchos productos diferentes en aspectos como las curvas de aprendizaje, UX o la seguridad.

Microsoft Fabric combina características y funcionalidades de varias aplicaciones diferentes y las reúne en diferentes flujos de trabajo sobre un único Data lake con un único gobierno y administración para las apps y datos dentro de una organización.

Descubriendo Microsoft Fabric

Componentes de Microsoft Fabric

Microsoft Fabric basa su estructura y seguridad en el servicio de Power BI e incluye toda su funcionalidad.

Data Factory

Data Factory ofrece un amplio conjunto de conectores con diferentes tipos de orígenes de datos y permite crear canalizaciones para orquestar  el movimiento y la transformación de datos. También permite crear flujos de datos proporcionando una interfaz  low-code para ingerir y transformar datos. Data factory integra funcionalidades de IA para automatizar operaciones comunes y Copilots para trabajar en lenguaje natural.

Synapse data Engineering

Synapse data Engineering incluye la opción de crear Lakehouses que están alojados en espacios de trabajo y contienen archivos en varios formatos que pueden estar estructurados o no estructurados, organizados en carpetas y sub carpetas.

Desde Synapse Data Engineering también se puede transformar datos fácilmente como parte de una actividad de canalización orquestada, desarrollar notebooks o incluir definiciones de trabajos de Spark.  

Synapse Data Science

El entorno de Synapse Data Science permite identificar patrones y generar información a partir de grandes cantidades de datos. Esta opción de flujo de trabajo proporciona herramientas con las que se puede entrenar modelos y notebooks de ML y realizar un seguimiento de ellos en experimentos.

Synapse Data warehousing

Synapse Data warehousing permite crear almacenes de datos que admiten todas las capacidades transaccionales de T SQL que esperaría de un DWH empresarial y están diseñados para trabajar con más de 1 TB de datos.

Synapse Real Time Analytics

Synapse Real Time Analytics proporciona una solución de streaming end-to-end para análisis de datos de alta velocidad en todo el servicio Fabric. Está optimizado para datos de series temporales y admite la partición e indexación automática de cualquier formato de datos. Ofrece un alto rendimiento para datos de diversos tamaños, desde unos pocos gigabytes hasta varios petabytes.

Estos componentes están perfectamente integrados entre sí y no requieren de ninguna configuración adicional para poder ser utilizados.

Visión General de Microsoft Fabric

Fabric proporciona una plataforma de análisis completa centralizando los datos en OneLake como único centro de verdad, con una única seguridad y gobierno.

Microsoft Fabric reúne componentes existentes y nuevos de Power BI, Azure Synapse, Azure Data Factory y Data Activator, que se presentan en varios módulos personalizados.

Descubriendo Microsoft Fabric

Fabric es una plataforma multiperfil en la que pueden colaborar todos los perfiles analíticos en una única plataforma, desde los ingenieros y científicos de datos hasta los usuarios de negocio.

El modelo centralizado de Fabric busca unificar aspectos tan diversos como el inicio de sesión, onboarding, modelo de UX, Data Lake o incluso el formato de almacenamiento.

La elección de implementar este producto como un Software como Servicio (SaaS) viene dada por la rapidez de implementación, la centralización de la administración y la simplificación de aspectos como la optimización, integración o escalado. Este modelo permite a los desarrolladores centrarse en producir su trabajo, librándose de la necesidad de integrar, gestionar o comprender todo lo que hay en la infraestructura subyacente que respalda la experiencia.

La seguridad de Fabric se basa en la de Power BI, imitando su modelo de roles (administrador, miembro, colaborador o visor) dentro de las distintas áreas de trabajo.

Con el modelo de seguridad unificado, One Security, la seguridad se definirá una vez y se aplicará en todos los elementos de Fabric, pudiendo también definir permisos, acceso a tablas, archivos o carpetas individuales.

OneLake

Microsft Fabric es una plataforma “Lago-Céntrica”, cuyo hub de almacenamiento es OneLake.

OneLake viene automáticamente aprovisionado con cada tenant de Microsoft Fabric y está diseñado para ser el único lugar para todos los datos analíticos. Solo hay un OneLake para la organización y una única copia de los datos con múltiples motores analíticos y es la base para todos los servicios de Fabric.

OneLake elimina los silos de datos actuales, que los desarrolladores individuales crean cuando aprovisionan y configuran sus propias cuentas de almacenamiento asilado, proporcionando un sistema unificado que incentiva el descubrimiento e intercambio de datos. Además, centraliza la gestión de las políticas de compliance, la seguridad y la configuración.

Con Fabric, los diferentes motores analíticos como T-SQL, Spark o Analysis Services almacenan sus datos en el formato abierto Delta Parquet para permitir utilizar los mismos datos en varios motores, eliminando la necesidad de mover datos solo para usarlos con otro motor pudiendo, elegir el mejor motor para el trabajo que se quiera realizar.

Descubriendo Microsoft Fabric

OneLake cuenta con una naturaleza jerárquica para simplificar la gestión en toda su organización. Los diferentes elementos de Fabric se organizan en Áreas de Trabajo similares a las de Power BI.

Se puede crear cualquier cantidad de Áreas de Trabajo dentro de un inquilino, que pueden considerarse como carpetas, con múltiples lakehouses en cada uno de estos espacios de trabajo.

Lakehouse

Un Lakehouse de Microsoft Fabric es una plataforma de arquitectura de datos para almacenar, administrar y analizar datos estructurados y no estructurados en una única ubicación. Es una solución flexible y escalable que permite a las organizaciones manejar grandes volúmenes de datos utilizando diversas herramientas y frameworks para procesar y analizar esos datos.

El uso de estructuras de datos de código abierto para el contenido almacenado en un Lakehouse permite que los datos estén altamente comprimidos y sean accesibles para herramientas SQL. Microsoft Fabric utiliza puntos de conexión SQL para proporcionar esta funcionalidad.

Los datos almacenados en OneLake se pueden conectar con Power BI mediante el nuevo modo Direct Lake. Es una nueva capacidad del conjunto de datos que permite analizar grandes volúmenes de datos dinámicos dentro de Power BI.

El modo Direct Lake elimina la necesidad de importar al cargar los datos directamente desde OneLake y, a diferencia de Direct Query, el rendimiento con Direct Lake es muy similar al modo Importar.

Descubriendo Microsoft Fabric

Debido a que no existe un proceso de importación explícito, es posible recibir cambios en la fuente de datos a medida que ocurren combinando las ventajas de los modos Importación y DirectQuery y, a su vez, evitando sus desventajas.

Con la función de Accesos directos se puede acceder a los datos almacenados tanto en Azure Data Lake como en OneDrive, sin necesidad de mover ni duplicar información. Proporcionan una forma de conectarse a datos existentes sin tener que copiarlos directamente.

Descubriendo Microsoft Fabric

Los accesos directos permiten enlazar datos existentes en Azure y otras nubes sin necesidad de duplicación, lo que convierte a OneLake en el primer Data Lake multi-nube.

Microsoft Fabric empodera al usuario de negocio con un modelo familiar e intuitivo completamente integrado con Microsoft 365.

Descubriendo Microsoft Fabric

Microsoft Fabric cuenta además con Data Activator, el cual está diseñado para ayudar a las empresas detectando el estado de sus datos. Es una experiencia de sin código que permite al analista de negocios impulsar acciones automáticamente a partir de sus datos.

Data Activator puede actuar sobre cualquier tipo de datos en Microsoft Fabric, desde datos que se mueven relativamente lentamente en almacenes de datos hasta datos en streaming.

Descubriendo Microsoft Fabric

Trabajando con Fabric

Microsoft Fabric incorpora espacios de trabajo como contenedores. De manera similar a cómo Power BI usa las áreas de trabajo, los usuarios deberán tener acceso para usar cualquiera de los recursos dentro de un área de trabajo.

Hay cuatro opciones de roles diferentes para el espacio de trabajo: Administrador, Miembro, Colaborador y Visor de espacios de trabajo, que funcionan de manera análoga a Power BI. También se puede conceder acceso a usuarios a elementos concretos del Área de Trabajo.

El Centro de datos de OneLake facilita la búsqueda, exploración y uso de los elementos de datos de Fabric en su organización a los que se tenga acceso.

Descubriendo Microsoft Fabric

Dominio

Fabric introduce un nuevo concepto llamado Dominio que  brinda la capacidad de agrupar recursos de Fabric para un conjunto de usuarios, clasificando el contenido como perteneciente a un área temática específica, agregando las áreas de trabajo a los diferentes dominios de la organización. Uno de los usos más comunes de los dominios es agrupar datos por unidad de negocio, lo que permite a los departamentos administrar sus datos de acuerdo con sus regulaciones, restricciones y necesidades específicas. Esto es posible, ya que algunas configuraciones a nivel de inquilino para administrar y gobernar datos se pueden delegar al nivel de dominio.

Promoción y Certificación de elementos

Fabric ofrece dos formas de respaldar  los elementos valiosos y de alta calidad para aumentar su visibilidad mediante 2 métodos: promoción y certificación, que funcionan de manera similar a Power BI.

Siendo los administradores capaces de:

  • El escaneo de metadatos facilita el gobierno de los datos habilitados, catalogados y reportando todos los metadatos de los elementos de la organización.
  • El seguimiento del linaje, ayudando a entender los datos disponibles en fabric, y cómo se están utilizando.

Administrador

El administrador de Fabric, es responsable de una amplia gama de tareas para mantener la plataforma funcionando sin problemas. Estas tareas incluyen la seguridad y control de acceso, el gobierno de los datos, la personalización y configuración de la plataforma, la monitorización del rendimiento y el uso de la plataforma, la optimización de recursos y la solución de problemas.

Los administradores de Fabric pueden realizar la mayoría de las tareas administrativas utilizando el portal de administración de Fabric (similar al de Power BI), los comandos de PowerShell, las API y SDKS de administración y el espacio de trabajo de supervisión de administración.

Descubriendo Microsoft Fabric

Confidencialidad

Microsoft Fabric incluye también etiquetas de confidencialidad de Microsoft en diferentes elementos que pueden proteger su contenido confidencial contra el acceso y la fuga de datos no autorizados.

IA Generativa

Microsoft ha apostado por la IA en Fabric explotando la potencia de Chat GPt en sus datos, permitiendo que Fabric escriba una parte del código gracias a los Copilots y acelere el análisis mediante el desarrollo de modelos de IA en una base única sin movimiento de datos.

Conclusión

Microsoft Fabric es una solución de fácil adopción por su naturaleza Saas y proporciona un rendimiento optimizado para las distintas cargas de trabajo analíticas.

Microsoft Fabric pretende cambiar las reglas de juego ofreciendo una plataforma en la que destacan los siguientes aspectos:

  • Solución unificada que elimina la necesidad de integraciones entre sus distintos componentes
  • Producto único con un licenciamiento único, con una seguridad y un gobierno centralizado
  • Plataforma multiperfil lo que aumenta la colaboración en las compañías.
  • One Lake, como única fuente de verdad que elimina los silos y las duplicaciones de datos.
  • Apuesta por las soluciones Low-Code, los Copilots y la IA generativa.
  • Experiencia familiar y accesible.

Post relacionados