Nube

Las 10 principales prioridades para una implementación exitosa de Hadoop

10 hot

Encuesta de mejores prácticas de TDWI Aumento significativo de informes Cuántas empresas planean usar clústeres de Hadoop en producciónPara el primer trimestre de 2023, el 60 % de los encuestados estará en producción, frente al 16 % cuando se publicó el informe a principios de este año. Fortaleciendo aún más el futuro de Hadoop como herramienta empresarial, solo el 6 % de las organizaciones excluye Hadoop, frente al 27 % en 2012.

A estas tasas, TDWI predice que Hadoop se convertirá en una «práctica convencional» dentro de cinco años.como su resumen clave Hadoop para empresas En el informe, TDWI proporciona una lista de 10 prioridades (a las que llama recomendaciones, requisitos o reglas) que pueden ayudar a las organizaciones nuevas en Hadoop a aprovecharlo al máximo.

fuente abierta apache hadoop es un «marco que permite el procesamiento distribuido de grandes conjuntos de datos en grupos de computadoras utilizando un modelo de programación simple». En otras palabras, es una herramienta de análisis de big data, data warehouse y big data.

Con sede en el área de Seattle, TDWI brinda educación empresarial e investigación sobre «Datos de todo». Para la encuesta Hadoop 2014, TDWI realizó una encuesta telefónica de 247 encuestados desde noviembre de 2014.

Las 10 principales prioridades de TDWI para las empresas que utilizan Hadoop

1: Esté abierto a Hadoop y otras opciones nuevas.

Las empresas deben adoptar el código abierto, nuevas formas de análisis, estructuras y fuentes de datos, y nuevos enfoques corporativos para aprovechar los grandes datos. «Puede adoptar y liderar el cambio, lo que conduce a la mejora, o puede mantener el statu quo a medida que pasan las oportunidades», escribió TDWI.

2: Innove con Big Data en Enterprise Hadoop.

LEER  Automatización en la nube: todo lo que necesita saber sobre la creación de servicios web

El 89% de los encuestados de TDWI ven a Hadoop como una oportunidad para la innovación. Los autores del informe recomiendan usar Hadoop para expandir las muestras de datos para la extracción de datos y el análisis estadístico, usar datos sociales para obtener una visión más completa del cliente y aprovechar el bajo costo de Hadoop para innovar en el presupuesto corporativo, el aprovisionamiento de infraestructura y los métodos de financiación.

3: Adopte Hadoop en función de los requisitos comerciales y técnicos.

Según TDWI, cualquiera de los principales beneficios de Hadoop (análisis avanzado, utilización de big data, exploración de datos, escalado de plataformas de administración de datos heredadas, archivado, control de costos) es «lo suficientemente convincente» como para merecer una consideración seria. Agregan que si «su organización tiene todos estos requisitos, lo llevarán a los amplios usos empresariales de Hadoop descritos en el informe».

4: Entiende los obstáculos para poder superarlos.

Las barreras descritas en el informe incluyen: apoyo comercial débil, problemas de seguridad y codificación manual excesiva. «Nunca dejes que esto te detenga», escribió TDWI. Los encuestados tienen soluciones para todos estos problemas y el crecimiento continuo del ecosistema Hadoop está trabajando para reducir estas barreras.

5: Capacitado en Hadoop y Big Data Management (y posiblemente nuevas contrataciones).

Las empresas deben centrarse en capacitar y contratar expertos en datos (analistas de datos, científicos de datos y arquitectos de datos) que puedan desarrollar aplicaciones para la exploración, el análisis, el archivo y la gestión de contenido de datos. «En caso de duda, contrate y capacite a expertos en datos, no a expertos en aplicaciones, para administrar big data”, escribieron los autores del informe. Cuando TDWI preguntó a los encuestados cómo dotar de personal a Hadoop, el 73 % estaba capacitando a los empleados existentes; el 41 % está contratando nuevos empleados con conocimientos relevantes. experiencia; 36% están usando consultores.

6: Elija Hadoop para repensar la economía de la arquitectura de datos y contenido.

Los encuestados del informe describieron cómo desarrollaron múltiples tipos de plataforma en su entorno, cada uno de los cuales era la mejor plataforma para cargas de trabajo específicas y necesidades de los usuarios. Esto también ha llevado a un nuevo modelo de costos en el que la TI empresarial puede dirigir los datos y el procesamiento a la plataforma de menor costo para realizar el trabajo. «El bajo costo de Hadoop es un importante impulsor de los cambios en toda la empresa en la combinación y arquitectura de productos de TI», escribió TDWI.

7: Prepárese para un ecosistema de datos híbrido definiendo la ubicación de Hadoop en su arquitectura.

TDWI aconseja a los nuevos usuarios que entiendan más fácilmente los casos de uso del «valor de toda la empresa» de Hadoop. Los casos de uso «iniciales» beneficiosos incluyen: puesta en escena en un entorno de almacenamiento de datos, uso de Hadoop como un punto de alojamiento para grandes conjuntos de datos para facilitar la exploración extensa de datos, procesamiento de datos para análisis avanzados, como reemplazo de archivos obsoletos y como un sistema de gestión de contenido.

8: Considere los casos de uso de Hadoop más allá de las aplicaciones analíticas y de BI/DW habituales.

BI/DW significa Business Intelligence y Data Warehousing. «Los sistemas de archivo y respaldo de la mayoría de las empresas están desactualizados y son ineficientes», escribieron los autores. El bajo costo y la escalabilidad de Hadoop lo hacen atractivo para este caso de uso. Según los encuestados, otros casos de uso incluyen: gestión de contenido, gestión de documentos y gestión de registros.

9: Busque características que hagan que los datos de Hadoop parezcan relevantes.

Las funciones relacionales, incluido el análisis basado en SQL, son fundamentales para la adopción empresarial de Hadoop porque los casos de uso de alto perfil las requieren. Varios proveedores y organizaciones de código abierto están desarrollando un mejor soporte de SQL para Hadoop, y los autores del informe enfatizan que estas mejoras no disminuirán las «capacidades únicas» de Hadoop como plataforma NoSQL. «Parte del poder de Hadoop es su capacidad para admitir múltiples métodos para múltiples tipos de datos», escribió TDWI, y agregó que «Hadoop se vuelve más diverso casi todos los días».

10: Desarrollar y aplicar una estrategia para la empresa Hadoop.

Por último, pero no menos importante, las organizaciones nuevas en Hadoop deben iniciar un proyecto de prueba de concepto (POC) para evaluar el valor comercial de múltiples casos de uso. Los puntos de partida pueden incluir la recopilación de big data para exploración, descubrimiento y formas específicas de análisis. Los equipos de POC también pueden probar la expansión, el archivado, la gestión de contenido y la configuración de almacenamiento del almacén de datos. Los autores escriben que el objetivo final del proyecto POC es «crear una lista priorizada de aplicaciones basadas en Hadoop que eventualmente escalarán en toda la empresa».

LEER  Amazon: he aquí por qué el modelo de base de datos relacional único para todos está muerto

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba