Saltar al contenido principal
Los procedimientos confiables de respaldo y recuperación son esenciales para mantener la disponibilidad del nodo y proteger contra la pérdida de datos. Esta sección describe qué respaldar, con qué frecuencia, dónde almacenarlo y cómo restaurar después de una falla.
Planifica un almacenamiento de respaldo de 1,5 a 2× el tamaño actual de los datos de tu cadena. Las operaciones de respaldo típicamente añaden entre 10% y 20% de carga de I/O durante la ejecución.

Qué respaldar

Los nodos no validadores almacenan datos críticos de estado y configuración requeridos para la operación continua. Los componentes clave incluyen:
  • Base de datos blockchain
    Almacena el estado completo de la cadena Plasma. Los respaldos son significativamente más rápidos que las resincronizaciones completas.
  • Archivos de configuración
    Incluye archivos Docker Compose, variables .env y cualquier script personalizado.
  • Keystores y estado de peers
    Habilita reinicios limpios sin reconfiguración manual. Puede incluir tokens de autenticación y metadatos de red.

Estrategia de respaldo

Frecuencia

Establece los intervalos de respaldo según el uso y el perfil de riesgo. Las instantáneas diarias son suficientes para la mayoría de los nodos no validadores. Los despliegues de alto throughput pueden requerir respaldos más frecuentes para minimizar la pérdida de datos durante una falla.

Consideraciones de almacenamiento

Almacena los respaldos en infraestructura separada: buckets en la nube, hosts remotos o discos offline. Evita colocar los respaldos junto al nodo principal.
No almacenes los respaldos en la misma máquina física que tu nodo en ejecución. Una sola falla de hardware puede resultar en pérdida total de datos.
Implementa cifrado de respaldos para proteger datos sensibles, especialmente al usar proveedores de almacenamiento externos. Asegúrate de que el almacenamiento de respaldos tenga capacidad adecuada para tus requisitos de retención y proyecciones de crecimiento.

Escenarios de recuperación

Recuperación parcial

Usa restauraciones dirigidas cuando solo ciertos archivos están afectados:
  • Restaura archivos de configuración después de ediciones accidentales
  • Recupera una base de datos corrupta sin reiniciar el progreso de sincronización
  • Reaplica el estado de peers para preservar la configuración de red existente
La recuperación parcial reduce el tiempo de inactividad y evita resincronizaciones completas.

Recuperación total

Requerida cuando se pierde el nodo o el sistema host:
  1. Provisiona una nueva máquina o VM
  2. Restaura la base de datos blockchain y las configs desde el respaldo
  3. Inicia el nodo y reincorpórate a la red
  4. Confirma la sincronización con el último bloque finalizado
Espera que el tiempo de recuperación dependa del tamaño de los datos, el ancho de banda y el almacenamiento.

Validación

Verifica regularmente la integridad de los respaldos:
  • Ejecuta verificación de checksums en los archivos almacenados
  • Realiza periódicamente restauraciones de prueba en infraestructura no crítica
  • Monitorea el éxito, la duración y el tamaño de los respaldos

Buenas prácticas

  • Automatiza los respaldos y alerta sobre fallas
  • Usa control de versiones para los archivos de configuración
  • Prueba los procedimientos de restauración trimestralmente
  • Rastrea el tiempo de recuperación para evaluar los objetivos de RTO/RPO

Solución de problemas

Fallos de respaldo

  • Revisa el espacio en disco, los permisos y la conectividad de almacenamiento
  • Revisa los logs en busca de errores de I/O o timeouts

Detección de corrupción

  • Valida los checksums regularmente
  • Monitorea los logs de sincronización en busca de señales de inconsistencia en la base de datos

Rendimiento de la recuperación

  • Optimiza la restauración usando almacenamiento rápido y discos locales
  • Usa I/O paralelo si lo soporta el backend de almacenamiento
Un plan robusto de respaldo y recuperación protege contra la pérdida de datos y minimiza el tiempo de inactividad. Realiza pruebas regularmente, almacena los respaldos de forma segura y sigue un proceso de recuperación estructurado para mantener operaciones de nodo confiables.