Grandes datos

Supere el software de la Edad de Piedra, obtenga rendimiento con Big Data Analytics

El camino hacia un uso más eficiente de los servidores en un centro de datos se encuentra en el software.

Grandes datos
– y todos los datos – mantén la apuesta inicial para acelerar las cosas.Camino
La solución tradicional de la industria a este problema ha sido crear chips más rápidos
CPU y otras funciones de procesamiento en hardware.del centro de datos
Desde una perspectiva, los gerentes quieren ver toda la capacidad utilizada y en big data
No es raro que un entorno tenga una utilización del servidor superior al 90 %.
Pero en un entorno transaccional, la utilización del servidor puede caer a
Tan bajo como 20-30%, esta no es una optimización eficiente para el hardware.

Más allá de la edad de piedra

«a nosotros
Supere implacablemente al hardware en rendimiento y eficiencia energética
En el centro de datos», dijo Mike Hoskins, jefe
Oficial Técnico Actian
un proveedor de soluciones de análisis de big data, «ha
Ponga tanto, y los resultados son terribles. «

Hoskins piensa
El camino hacia un uso más eficiente de los servidores en el centro de datos se encuentra en
software, tomó como ejemplo un servidor de dos procesadores y dieciséis núcleos
Expresar su punto de vista.

«una
Se puede decir que el software se encuentra en una especie de «edad de piedra» porque simplemente
no mantenerse al día con el ritmo de la innovación de hardware «, dijo Hoskins. «Dentro
Tome un servidor de dos procesadores, 16 núcleos, software de subproceso único, la mayoría de los cuales
El software actual es que solo uno o dos núcleos se mantienen ocupados y los otros 14 núcleos se ejecutan
No utilizado.Experimentamos un gran avance cuando virtualizamos la tecnología
Esté presente porque en un entorno como VMware es posible que necesite 8
Procese los núcleos y distribúyalos en cuatro máquinas virtuales usando dos máquinas virtuales
por núcleo. Esto compensa las limitaciones del software de un solo subproceso
Porque el software se puede distribuir en cuatro motores de servidor diferentes
El sector central proporcionado por la virtualización.

LEER  Cómo crear una tabla de fechas en Power BI

Desafortunadamente,
Cuando hablamos de big data y análisis, los «trucos»
Las tecnologías de virtualización que mejoran el rendimiento del software simplemente no
Trabajar.La razón es que los grandes datos con procesamiento paralelo masivo no son
Ideal para virtualización.Por lo tanto, el sitio puede permanecer
El desafío de manejar una gran cantidad de datos en una pequeña cantidad de datos
tiempo – y pueden chocar con las limitaciones del software que están usando.existir
Al mismo tiempo, sus presupuestos les impiden invertir más
Potente poder de procesamiento más allá de lo que pueden usar: todo tipo de
La encarnación de la tecnología de servidor basada en x86.

Hoskins
Cree que el sitio puede superar el límite de utilización del núcleo de subproceso único
La mayoría del software, si de alguna manera pueden agrupar los núcleos de procesamiento
Motor de transmisión de datos en memoria puro y armonioso que puede procesar datos entrantes en paralelo
y abordar los diversos pasos del procesamiento de big data que se deben realizar,
Tales como limpieza de datos, agregación, ingesta y, finalmente, análisis.

capa de datos

la idea
Es mover la capa de datos en memoria más cerca de la CPU para mejorar el rendimiento general.
Así es como funciona.

p 18 1280px CRAY X MP IMG 9135Ahí
es un almacén de datos en memoria de tres niveles en la memoria caché: L1, L2 y L3.cualquiera
Proporcionan resultados de procesamiento más rápidos que tener que usar una memoria externa.
La capa L1 es la primera capa que examina los datos en memoria, pero es
Tamaño pequeño, bloques de datos más pequeños y menos bloques de datos.como
El acceso se mueve a las capas L2 y L3 de este almacén de memoria, bloques de datos
Más grandes y más bloques de datos. El nivel L3 tiene especialmente
Tamaño de bloque (y número de bloques) para procesar grandes datos en paralelo
tratar con.Si los datos son, no hay necesidad de salir a la memoria externa
Residir en la memoria caché de datos L3.

«existir
En este entorno, el motor de procesamiento puede saber dónde se ejecutan los datos y luego
Empuje los datos requeridos en el caché L3 «, dijo Hoskins. «Esto
es una forma en que podemos eludir las limitaciones del software y aprovechar al máximo
hardware. «

Este
La tecnología es prometedora y emocionante para los sitios que desean apegarse a la mercadería.
servidor x86
(PDF) para su procesamiento de big data.A medida que comienza el caso de uso
emerge, también puede agregar combustible al debate arquitectónico actual
¿Es x86, basado en Unix u otras plataformas mixtas las más adecuadas?
Enterprise HPC (Computación de alto rendimiento).

LEER  Procesamiento del lenguaje natural: una hoja de trucos

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba