Nube

Las operaciones en la nube de guardia cuestan a las organizaciones un promedio de 2,5 millones de dólares al año

Según un nuevo informe de Dimensional Research y Shoreline.io, los datos de emisión de boletos son la clave para obtener información sobre las operaciones de guardia y descubrir oportunidades para mejorar la productividad.

Imagen: Adobe Stock

Según un informe de Dimensional Research y el proveedor de automatización Shoreline.io, las organizaciones gastan una media de 2,5 millones de dólares al año en operaciones de guardia.También sufrieron un promedio de 8,7 incidentes importantes por año, de los cuales el 62% se escalaron a la C-suite, es decir, Informe de operaciones de producción de referencia establecido.

El informe destaca los muchos desafíos y oportunidades que enfrenta la industria de las operaciones en la nube, e insiste en que incluso cuando las organizaciones gastan millones de dólares cada año en operaciones en espera, continúan experimentando interrupciones significativas que afectan la productividad de los clientes y los empleados.

Desafíos de confiabilidad en la nube

Alrededor del 97 por ciento de los líderes organizacionales dicen que priorizan la confiabilidad de la nube. Sin embargo, a pesar de esto, la empresa destacó varias barreras importantes para mejorar la confiabilidad. En la parte superior de la lista está la complejidad de los entornos que administran.

“A medida que las empresas aumentan la complejidad del producto, se vuelve más difícil encontrar SRE [site reliability engineering] Y profesionales de DevOps con la experiencia requerida”, dice el informe.

LEER  OpenShift.io de Red Hat tiene como objetivo proporcionar una plataforma de desarrollo de código abierto completa

Mirar: Kit de herramientas de contratación: ingeniero de la nube (República Tecnológica Premium)

El segundo mayor problema mencionado por los encuestados fue no tener tiempo para concentrarse en prevenir incidentes o automatizar soluciones. «Realmente se convierte en un círculo vicioso en el que cuanto menos tiempo tiene el equipo, menos invierten en mejorar, mientras que el producto continúa creciendo y se vuelve más complejo”, afirma el informe. «A medida que aumenta la carga del equipo de operaciones, la gente se va y la carga es compartida por menos personas».

El informe brinda a las organizaciones una razón para comenzar a invertir en la automatización de la prevención y reparación de accidentes ahora, sin importar en qué parte del viaje se encuentren.

Otros hallazgos clave incluyen:

  • El 72% de los incidentes mayores son causados ​​por proveedores de servicios y errores humanos
  • El error humano tiene 5 veces más probabilidades de causar un tiempo de inactividad importante que el error automatizado
  • El tiempo medio para resolver un incidente de escalamiento fue de 10,7 horas
  • El 55 % de los incidentes se derivan a personal de respuesta de segunda línea o expertos fuera del equipo de reserva
  • 48% de los eventos son de bajo valor, repetitivos, laboriosos

A medida que más y más organizaciones priorizan la reducción del número total de incidentes, la reducción de costos y la reducción del tiempo de recuperación, la encuesta muestra la importancia de la confiabilidad:

  • El 98 % de las organizaciones enfrentan desafíos para ofrecer aplicaciones en la nube altamente confiables
  • Los equipos de SRE han crecido un 26% en los últimos 12 meses
  • La huella de la nube creció un 38 % en los últimos 12 meses
  • La tecnología moderna hace que la gestión de la infraestructura sea más difícil, el 73 % informa que las nubes múltiples dificultan su trabajo, el 52 % informa que Kubernetes y los microservicios dificultan su trabajo

«La huella de la nube está creciendo más rápido que el equipo de guardia”, dijo Diane Hagglund, directora de Dimensional Research, en un comunicado. «El entorno de la nube se está volviendo más complejo y hay una búsqueda de personal con experiencia para cumplir con las guardias. Es especialmente desafiante, lo que dificulta que los equipos de respuesta a incidentes cumplan con los requisitos de confiabilidad”.

Mirar: iCloud vs OneDrive: ¿Cuál es mejor para usuarios de Mac, iPad y iPhone? (PDF gratuito) (República tecnológica)

Cómo mejorar la productividad de guardia

El informe detalla varias recomendaciones para mejorar el modo de espera, que incluyen:

Garantizar que los sistemas de gestión de incidentes proporcionen información

El 98% de las organizaciones reportan dificultades con su enfoque de gestión de incidentes. El uso de datos de emisión de boletos para obtener información sobre las operaciones de guardia es clave para descubrir oportunidades para mejorar la productividad.

Actualización de ataque

La mayor oportunidad para mejorar la productividad de guardia es reducir la escalada de eventos, que representa el 78 % del tiempo de guardia. Invertir en herramientas de autoservicio para empoderar a los equipos de soporte no solo reducirá el número total de escalamientos, sino que proporcionará datos de diagnóstico más completos.

Ataque el trabajo o la fatiga repetitivos y de bajo valor

El 48 % de los incidentes son repetitivos, lo que crea una oportunidad para crear una reparación automática de incidentes, liberando a los equipos de tareas repetitivas para que puedan dedicar más tiempo a mejorar la resiliencia, proteger el medio ambiente y reducir los costos para aumentar aún más la productividad.

«El enfoque actual de guardia es insostenible, y el rápido crecimiento de la infraestructura en la nube está exponiendo a los equipos de SRE a miles de horas de trabajo cada mes», dijo en un comunicado Anurag Gupta, fundador y director ejecutivo de Shoreline.io. Resolver los problemas de escalamiento y eliminar el trabajo repetitivo y de bajo valor mejorará significativamente la productividad del equipo y la experiencia general del cliente».

Dimensional Research dijo que encuestó a más de 300 profesionales, gerentes y ejecutivos de guardia para comprender la respuesta a incidentes en entornos de nube de producción. Los participantes de la encuesta eran responsables de administrar negocios con menos de 20 a 10,000 nodos, dijo la compañía.

LEER  IBM se asocia con la startup de inteligencia artificial will.i.am en Davos

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba