Monitorizar con Vmware vRealize
Fantástica herramienta para monitorizar, realmente es una suite con las siguientes funcionalidades:
vRealize Operations. Para monitorización y gestion del CPD ( es lo que incluye el vSphere with Operations)
vRealize Automation. Para automatizar la distribución de la infraestructura, aplicaciones y servicios de TI personalizados
vRealize Business http://www.vmware.com/es/products/vrealize-business/
vRealize Suite ( incluye las anteriores)
Tiene tres apartados fundamentales HEALTH, RISK y EFFICIENCY, con health podemos ver rápidamente el estado de nuestro entorno, pudiendo rápidamente determinar los problemas de acción inmediata, un pequeño mapa nos da ésta información tal y como vemos:
En la imagen anterior vemos la parte de Health con el pequeño mapa de los problemas inmediatos, (rojo, amarillo), en verde correcto.
Risk nos indica los problemas futuros que podran sobrevenir si no aplicamos las recomendaciones necesarias. Son riesgos que debemos evitar.
Eficiencia, nos da la oportunidad de “optimizar” nuestra infraestructura, por ejemplo localizando “desperdicios rehusables”, esto quiere decir que podemos detectar, discos no usados, ram y cpu sobredimensionados, etc.
Un ejemplo de problema reportado, vemos en la siguiente imagen:
En este caso en algun vmware esxi de la infraestructura hay problemas con los sensores del hardware, o bien el hardware tiene un problema.
Ejemplo de Riesgo:
Aqui podemos ver riesgos de mayor o menor escala, por ejemplo tenemos riesgos en rojo en donde nos dice que hay una máquina con un uso continuo de cpu alto, o que un esxi está violando alguna norma de seguridad importante (hardening guide), asimismo en color naranja y amarillo de criticidad menor , nos muestra otras alertas de hardening en máquinas o recomendaciones en el switch distribuido.
Ejemplo de Eficiencia:
Pulsariamos sobre el objeto eficiencia y, después nos lleva a una serie de pestañas donde pulsariamos en ANALYSIS.
En la parte izquierda tendremos los diferentes objetos del análisis, nosotros sobre “all objects”, nos situamos en el objeto para el análisis.
Pero primero vamos a una pestaña que se llama “reclaimable capacity”, tal y como vemos:
En el inventario de objetos que tenemos a la izquierda, nos aseguramos de situarnos en el lugar adecuado, podemos pinchar en la flecha para por ejemplo ir al objeto “vsphere hosts and clusters”.
De esta manera el seleccionar ese objeto, nos aparecerán nuestros datacenters, clusters…. y podremos monitorizar los desperdicios reclamables.
Si nos situamos por ejemplo sobre el objeto vcenter que en este caso abarca un datacenter y 3 clusters, vemos el siguiente desperdicio:
Como podemos observar hay 132 vcpus que se pueden quitar, y 333 gb de ram desperdiciados, asimismo vemos 3.37 tb de almacenamiento sin utilizar.
Esto es muy importante para aprovechar nuestros recursos.
Troubleshooting
Un problema que hayamos podido tener nos lo reporta inmediatamente en la pestaña Troubleshooting, sabiendo el punto exacto.
Por ejemplo en la imagen superior vemos como tenemos un problema de alta disponibilidad en cuanto a recursos insuficientes para satisfacer el failover.
Reportes
Se dispone por supuesto de la posibilidad de generar reports y generar nuevas plantillas de reportes personalizados.
Capacity Remaining
Podemos mostrar datos de capacidad, es decir, cuánto tiempo nos queda para seguir dando servicio sin problemas o escalar, en función de si hacemos caso a no desperdiciar o controlar el desperdicio.
Nos da %, si ajustamos los desperdicios, ese % aumentara, pudiendo por tanto tener mas capacidad en nuestra infraestructura al estar mas optimizada.
Los datos que nos muestra son completos y estructurados:
Por cada apartado podemos obtener mas información (ejemplo CPU), y saber cual es nuestra capacidad total, usada y lo que nos queda, asi como la recomendación , o los promedios.
También tenemos la parte de “time remaining”.
Se calcula el time remaining , la puntuación de % de tiempo que nos queda en función de los recursos, nosotros hemos aprovisionado y el sistema calcula lo que le queda al recurso de computo con lo aprovisionado.
Densidad
Nos va a decir cómo tenemos los ratios de consolidacion, si aumenta o disminuye, tiene lógicamente relación con el número de máquinas, desperdicios rehusados etc.
Imagen superior con ratios de consolidación
Stress
Analisis de datos de stress, por ejemplo de Memoria:
Anomalias
El s istema de anomalias trata de detectar una caida rara en las métricas que se salen del rango estimado como normal.
Nos sacará un valor en % que nos indicara el % de anomalia en alguna métrica.
Workload
Capacidad de carga es el % de capacidad consumida por los recursos. Como la capacidad de carga varia, es por eso por lo que se configuran varios ciclos de carga en las alertas.
Proyects
La pestaña proyects nos permite generar “un modelado”, esto nos va a servir para saber si por ejemplo necesitamos aumentar la infraestructura con 50 máquinas virtuales adicionales, con una serie de recursos de cpu y ram concretos, y ver si el sistema puede aguantar esa carga adicional, manteniendo ok todos los apartados anteriores.
En la imagen vemos como hemos realizado un proyecto para añadir 50 nuevas máquinas con 1 vcpu y 60 gb de disco, no se ve en la imagen, pero tienen 4 gb de ram.
Una vez creado el proyecto lo podemos “añadir al grafico y verlo” (boton verde con un + que hay a la derecha:
Con este cambio la gráfica nos dice que se incrementa un 71% la demanda.
Tenemos asimismo la posibilidad de comparar proyectos y combinarlos, todo esto lo podemos hacer añadiendo proyectos al gráfico, para despues en el desplegable en la parte de “project view”, seleccionar la comparación o combinación.
Sumarios
Los sumarios son también muy interesantes, ya que nos permiten por poner un ejemplo, saber en nuestra infraestructura el % de máquinas que no tienen las vmware tools instaladas, en estado old, o excesivamente old, corriendo o no…
Asimismo podemos ver los % de configuración de memoria y de cpu. Asi tenemos una idea de los % de asignaciones.
También podemos ver las “tendencias” de crecimiento en cuanto al número de máquinas, y la distribución de sistemas operativos que corren en esas máquinas:
En la infraestructura pueden existir máquinas apagadas desde hace tiempo, esto puede o no ser necesario, (nos aparecerá en desperdicios rehusables), podemos ver la distribución de máquinas encendidas y apagadas:
Otro aspecto muy importante es controlar los snapshot, y para ello tenemos una vista de “top 25” snapshots disk usage.
Tendremos un índice de utilización y el nombre del objeto (la máquina virtual).
Por supuesto tenemos un apartado de métricas sobre las cuales podemos posicionarnos para obtener datos de rendimiento sobre el objeto deseado:
Si vamos a HOME, alerts, podemos ver todas las alertas que existen, normalmente las primeras en rojo son las mas urgentes.
Las alertas que nos mostrara las podemos filtrar en función si queremos que sean alertas de Health o de Risk, (o de efficiency).
Por tanto una herramienta increible para monitorizar nuestro entorno, creo que imprescindible en cualquier entorno en el que se superen 100 máquinas virtuales.
Existen varias versiones, STANDARD, ADVANCED y ENTERPRISE. Se licencia en packs de 25 VM.
La instalación además es muy sencilla, únicamente necesitamos importar la appliance a nuestro vcenter.
Hablaré mas sobre este producto sobre temas mas especificos en otra ocasión,
un saludo,