Changes

daniel.vinar · f69334eb
--- a/Plan-y-procedimiento-de-actualización-del-cluster-Proxmox-5.X-a-6.md
+++ b/Plan-y-procedimiento-de-actualización-del-cluster-Proxmox-5.X-a-6.md
@@ -6,11 +6,25 @@ El procedimiento se basa en la [recomendación oficial de Proxmox](https://pve.p

 Los pasos finales se realizan manualmente ya que son más críticos y cada nodo puede tener detalles particulares, no del todo previsibles.

-## Paso 0: respaldos
+Decidimos priorizar la minimización del riesgo de pérdida de datos respecto a la interrupción de servicios, que prevemos de menos de un día. Procedemos según los pasos siguientes:
+- eventualmente (estimar tiempos): migrar todos los servidores con datos dinámicos críticos a uno de los dos servidores aplicativos, `Botija` y `Gurí`. Digamos `Botija`, que ya tiene a `Gödel`, el más voluminoso, 
+- detención de servicios de madrugada y respaldos en frío de los servidores críticos,
+- pasos iniciales de la actualización Proxmox (pve 5.4-13, corosync 3,  reboot hardware para tomar en cuenta los nuevos kernel
+- actualización pve5.4->pve6 de `Mate`, como primer prueba. verificaciones, en particular alguna migración. 
+- actualización pve5.4->pve6 de `Gurí`, el servidor madre que tiene los virtuales menos críticos,
+- encendido de virtuales, verificaciones.
+- actualización pve5.4->pve6 de `Redota` (acá debe funcionar sí o sí....). Encendido, verificaciones. 
+- eventualmente: Migración de los servicios más críticos de `Botija` a `Gurí` (esto vale de verificación antes de actualizar el último pve5)
+- actualización pve5.4->pve6 de `Botija`. Encendido, verificaciones. 
+- verificaciones globales (en particular re-establecer los respaldos periódicos que sin duda vamos a desactivar)

-Se planea hacer resplados "Proxmox" completos a todos los hosts (VMs y containers) que son considerados críticos por contener datos y/o configuraciones no recuperables a través de los playbooks y roles desarrollados hasta el momento.
+## Paso 0: detención de servicios y respaldos

-Los servidores considerados críticos (al 13 de Enero de 2020) son: 
+Se planea detener y hacer resplados "Proxmox" completos en frío a todos los hosts (VMs y containers) que son considerados críticos por contener datos dinámicos no recuperables desde los últimos respaldos. Se dejan de lado todos los hosts que sólo requieren configuraciones a través de los playbooks y roles desarrollados hasta el momento.
+
+Debemos considerar las herramientas para orquestar la detención de servicios y los respaldos la madrugada anterior.  
+
+Los servidores considerados críticos ([al 13 de Enero de 2020](https://pad.interior.edu.uy/p/adminsys2019)) son: 

 En Botija:
 - Asado (AlternC. alternc.interior)
@@ -34,7 +48,9 @@ En Guri:
 En Redota:
 - Che (Respaldos. che.interior)

-Al momento de realizar los respaldos, **es importante estar atentos a los hosts que contienen puntos de montaje adicionales** (Asado, Chingolo, Sabiá). En dichos puntos de montaje, es necesario que se active el flag `backup` ![backup flag](uploads/c26146e55d308ba2fdcacfc8c94815ba/image.png)
+Quizás convenga previamente migrar los servidores más críticos a uno de los servidores Botija o Gurí. 
+
+Al momento de realizar los respaldos, **es importante estar atentos a los hosts que contienen puntos de montaje adicionales** (Asado ok, Chingolo ok, Sabiá ok). En dichos puntos de montaje, es necesario que se active el flag `backup` ![backup flag](uploads/c26146e55d308ba2fdcacfc8c94815ba/image.png)

 El destino de los respaldos será el storage correspondiente al segundo RAID de discos de `Redota`. Este storage se encuentra compartido con los demás nodos del cluster a través de NFS, con nombre de recurso `respaldosEnRedota`.