Grandes datos

NoSQL continúa aumentando, pero las bases de datos relacionales aún dominan el big data

Si bien MongoDB y Cassandra continúan ganando seguidores, las empresas mantienen sus RDBMS y lo seguirán haciendo durante bastante tiempo.

datamanage

Imagen: iStockphoto/Sergey Nivens

NoSQL promete alterar el mercado de las bases de datos, ya que Big Data fuerza un cambio radical en la forma en que pensamos y administramos los datos. La revolución de los grandes datos ha estado en marcha durante varios años, pero la promesa sigue sin cumplirse.

Ah, y por supuesto que NoSQL está teniendo un impacto en el mercado de bases de datos de 46.000 millones de dólares: aún representa solo el 3 % del mercado, pero crece rápidamente, en comparación con el 5,4 % de crecimiento de las bases de datos relacionales más tradicionales, según IDC. Pero, según los mismos criterios, y las clasificaciones de popularidad de bases de datos DB-Engines más recientes, las bases de datos relacionales aún dominan los grandes datos.

VER: Investigación: Big Data e IoT: pros, contras, tendencias de uso (Tech Pro Research)

Entonces, con las tendencias actuales, podemos esperar que NoSQL y las bases de datos relacionales compartan el podio de los ganadores de big data durante muchos años por venir.

Auge de NoSQL

NoSQL es la respuesta al crecimiento explosivo de los datos no estructurados dentro de la empresa y promete ser el mayor desafío para la hegemonía establecida de los sistemas de administración de bases de datos relacionales (RDBMS). Aunque Oracle actualmente controla el 40% del mercado de bases de datos pagas, el analista Curt Monash advierte que NoSQL es una de las mayores amenazas para su corona:

LEER  Las nuevas pantallas plegables de Samsung y cómo se diferencian de la competencia

«[T]Estas son básicamente tres cosas que podrían amenazar seriamente la posición de mercado de Oracle, [the first of which is] El tipo de crecimiento de aplicaciones para el que el RDBMS de Oracle no es adecuado. Gran parte de los «grandes datos» se ajusta a esta descripción. «

Aun así, NoSQL todavía tiene un largo camino por recorrer, como lo destacan los datos de IDC:

asdb1.jpg

Imagen: IDC

Aunque es una batalla cuesta arriba, la visión amplia de DB-Engines de la popularidad de la base de datos muestra una brecha cada vez menor con las principales bases de datos NoSQL, incluidas MongoDB, Apache Cassandra patrocinada por Datastax y Redis:

asdb2.jpg

Imagen: motor de base de datos

Este crecimiento se produce en el contexto de una desaceleración del mercado RDBMS. Oracle, que se encuentra en la cima de la popularidad de la base de datos y de los gráficos de ingresos, obtiene cada vez menos ingresos de las ventas de nuevas licencias, como capturó el analista de Redmonk Stephen O’Grady:

asdb3.jpg

Imagen: Redmonk

Sin embargo, el otro lado de los libros del líder del mercado muestra un gran crecimiento para MySQL, el RDBMS de código abierto que Oracle adquirió mediante la adquisición de Sun Microsystems (las bases de datos de código abierto crecieron un 31 %, según IDC). Si bien Oracle obtiene muchos menos ingresos de las ventas de suscripciones de MySQL que su base de datos homónima, podría decirse que MySQL está haciendo más para mantener su relevancia para las cargas de trabajo modernas (y los desarrolladores que las aman).

Los RDBMS se mantienen al día

Sin embargo, a pesar del auge de NoSQL, el declive de RDBMS no ha sido completo. Hay varias razones para esta situación.

La primera es que, si bien las empresas pueden querer adoptar NoSQL para controlar volúmenes cada vez mayores de datos no estructurados, la mayoría de sus cargas de trabajo siguen siendo de naturaleza transaccional, lo que hace que los RDBMS sean la mejor opción.

Informes de big data de lectura obligada

Otra razón es que las herramientas de análisis de NoSQL todavía están en pañales. Las herramientas de análisis compatibles con NoSQL no son herramientas de análisis fáciles de usar, como señala Lynn Robison, analista de Gartner: «Las herramientas de análisis tardarán años en madurar y ser utilizables por personas que no son científicos de datos».

La tercera razón es la más difícil de cuantificar y superar: la cultura. Las empresas han estado utilizando bases de datos relacionales durante más de 30 años. Es difícil cambiar eso de la noche a la mañana.

Finalmente, una cuarta razón: resulta que un RDBMS a veces es la mejor solución para un problema en particular. Simplemente pregúntele a Ken Rudin, jefe de datos de Facebook:

«Si observamos la granularidad de los datos, mantenemos el nivel más bajo de granularidad en el sistema Hadoop. Entonces, siempre que quiera ver el nivel más bajo de detalle, Hadoop está optimizado para eso. Sin embargo, si queremos ver los datos transformados y los datos agregados, los datos relacionales hacen que sea más fácil hacerlo».

Por lo tanto, el monitoreo en tiempo real se realiza en Hadoop y bases de datos NoSQL relacionadas, pero para el análisis de tendencias a largo plazo, es RDBMS.

VER: La privacidad de Big Data debe corregirse antes de que comience la revolución (ZDNet)

Dos «cambios de juego completos»

El profesor Michael Franklin, uno de los principales expertos en bases de datos de la industria, elogia a NoSQL como un «cambio de juego completo», en gran parte debido a la flexibilidad de su esquema. Pero esta flexibilidad también abre la puerta a las bases de datos relacionales, que pueden realizar consultas rápidas y potentes sobre datos cuidadosamente empaquetados en filas y columnas.

En otras palabras, tanto RDBMS como NoSQL son «cambios de juego completos» que juntos pueden respaldar una estrategia ganadora de Big Data.

LEER  Cómo la NFL y Amazon están liberando 'estadísticas de próxima generación' para explorar los juegos de fútbol

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba