Grandes datos

Microsoft Azure Purview está listo para ayudarlo a administrar sus datos y ya no está en versión preliminar

La herramienta de clasificación de datos de Microsoft ya no está en versión preliminar. Discutimos su futuro con Mike Flasko de Microsoft.

Como comenzar con Azure Purview de Microsoft
Fuente de la imagen: HJBC/Shutterstock

Azure Purview es la herramienta de gobierno de datos de Microsoft diseñada para ayudar a las organizaciones a comprender y administrar sus crecientes activos de datos. Escale automáticamente los servicios de datos en la nube con solo unos pocos clics, lo que permitirá que los datos se salgan de control en lugar de depender del aprovisionamiento de almacenamiento en el centro de datos. Esto significa que los desarrolladores pueden conectarse más fácilmente a los puntos finales y utilizar esos datos, lo que aumenta el riesgo de fuga de datos o, lo que es más peligroso, de uso incontrolado en modelos de aprendizaje automático.

mirar: Plataforma de almacenamiento de datos Snowflake: hoja de referencia (PDF gratuito) (República Tecnológica)

Cobertura de lectura obligada sobre Windows

Este último riesgo está aumentando porque el uso de datos no supervisados ​​puede incorporar sesgos peligrosos en los modelos. También existe el impacto adicional de regulaciones de protección de datos cada vez más estrictas, que regulan cómo se utilizan los datos personales y conllevan la amenaza de multas significativas por uso indebido o violaciones de datos.

Tiene sentido utilizar una herramienta como Purview, que puede proporcionar la estructura necesaria para crear un gobierno de datos en bases de datos y aplicaciones de línea de negocio y automatizar muchos procesos que alguna vez fueron manuales, asegurando que todos los sistemas de registro sean administrados y controlados y al mismo tiempo permitiéndoles capaz de funcionar eficazmente.

Nueva función lanzada: compatibilidad con S3

Microsoft actualizó recientemente Azure Purview desde la versión preliminar a la disponibilidad general, agregando nuevas características y herramientas, incluido un conjunto de servicios y extensiones adicionales que lo llevan más allá de la nube de Microsoft y hacia las nubes de Amazon y Google. Nos sentamos con Mike Flasko, director general de Azure Data Governance Platform, para analizar la transición a la disponibilidad universal y el futuro del gobierno de datos basado en la nube en Purview.

LEER  Vincular la gestión de datos a la inteligencia empresarial

Una de las nuevas características más importantes es la compatibilidad con el escaneo de depósitos de Amazon S3. Si bien otros proveedores de almacenamiento también utilizan la API S3 de Amazon, la herramienta Purview actualmente se limita a funcionar dentro de AWS. Debe tener un rol de AWS para el servicio y tener las credenciales adecuadas para utilizar el depósito cifrado. Esta función requiere muy pocos permisos, en realidad menos que los permisos mínimos de S3 de Amazon, por lo que deberá crear sus propios permisos y utilizar reglas independientes para escanear un depósito específico o trabajar en todos los recursos de AWS S3.

Otras nuevas fuentes de datos incluyen Big Query de Google y la integración con la plataforma de gobierno de datos Erwin. Flasko señaló que otras plataformas de almacenamiento empresarial populares pronto recibirán soporte de Purview, incluida la base de datos Snowflake a escala de nube. Como lo describe Flasko, el propósito es «tener un conjunto de fuentes de datos y hemos extendido el escaneo a fuentes locales y otras fuentes de múltiples nubes para automatizar aún más. Usted sabe lo que puede ver y comprender».

Aproveche el descubrimiento de datos inteligente

Quizás el elemento más importante de una versión de Azure Purview sea el mapa de datos. En lugar de utilizar herramientas independientes para catalogar y explorar datos, este mapa reúne todo en un solo lugar y agrega una capa visual. Flask lo describe como «proporcionar una plataforma inteligente sobre activos de datos». Esto se diferencia de otras herramientas de gestión de datos porque un enfoque visual le ayuda a comprender el flujo entre diferentes fuentes de datos y cómo se comparten y utilizan los datos en toda la organización. La idea aquí es utilizar esta información para «aumentar la agilidad de los datos y al mismo tiempo garantizar un uso adecuado», dijo Flasko.

mirar: AWS Lambda, un marco informático sin servidor: hoja de referencia (PDF gratuito) (República Tecnológica)

La gobernanza de datos es cada vez más importante, especialmente cuando se utiliza para análisis a gran escala o para crear modelos de aprendizaje automático. Con herramientas como Purview Data Maps, puede ver dónde se almacenan los datos confidenciales y cómo se utilizan. Este enfoque apunta a un enfoque en tiempo real para la gobernanza de datos. La gobernanza de datos solía ser reactiva, creando e implementando políticas después de que los datos se almacenaban y utilizaban. Al combinar la automatización con el mapeo dinámico, herramientas como Purview ofrecen un nuevo enfoque para la gobernanza basada en conocimientos.

«Creo que algunas de las inversiones que estamos haciendo en torno al escaneo automatizado están conectando a los usuarios de datos con la conversación de los administradores de datos. Personas que administran el estado de sus datos». Flasko dijo sobre la importancia de este enfoque para Purview. «Será cada vez más importante. Esta es una de las áreas clave para Purview, ya que reúne a todos estos usuarios a través de la plataforma. Creemos que existe una oportunidad para crear más agilidad en la forma en que se utilizan los datos y se aprovechan más en la organización».

El futuro de Azure Purview

El futuro de la plataforma es la mejora continua, agregando más fuentes de datos y más automatización. Cuanto más pueda agregar, más pueda automatizar y más valor agregará Purview. Flasko dijo que esta es una ventaja de usar la cadencia de la nube: «con el tiempo, verá que se agrega más y más soporte de fuentes de datos a Purview. Uno de los beneficios del modelo de entrega en la nube que tenemos es que una vez que esté listo, se harán públicos. «.

Microsoft utilizó una versión preliminar de Purview para comprender qué quieren los usuarios de una plataforma de gobierno de datos, ver qué metadatos necesitan y cómo los usan. Flasko encontró el proceso interesante: «Estábamos realmente emocionados y sorprendidos por la cantidad de casos de uso diferentes con los que regresaron algunos de nuestros clientes». Esto llevó a discusiones con los clientes sobre lo que estaban viendo y cómo mejorar su proceso de descubrimiento. Flasko lo describe como clientes que se preguntan «¿Qué pasaría si seleccionara más, o si activara estos clasificadores, o si hiciera X? Ya sabes, podría usar los datos y aprovecharlos de más maneras».

Ese es el valor real de una herramienta como esta, no tanto lo que los diseñadores y desarrolladores esperan que hagan los usuarios, sino para qué la usan realmente. Como dijo Flasko: «Esa es la parte emocionante para mí: ver cómo esta plataforma realmente puede permitir el uso de datos y el uso apropiado de los datos en toda la organización, e impulsar esas conversaciones y lluvias de ideas con los clientes».

Si hay algo que surgió al hablar con Flasko, es que estas conversaciones con los clientes claramente serán duraderas a medida que Microsoft trabaje con ellos para implementar nuevas fuentes de datos y nuevas capacidades para ayudarlos a tomar el control de sus negocios. Explosión de datos. La propia experiencia interna de Microsoft entra en juego aquí, ya que Flasko describe el uso de Purview dentro de su organización financiera para «proporcionar a todos una comprensión de estos datos». [the] equipo y luego convertir a todos, por así decirlo, en consumidores de datos que realicen tareas en la organización. «

LEER  La asociación entre AWS y Matterport mejora los gemelos digitales con un panel conjunto

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba