La plupart des problèmes proviennent des limites de ressources système, de la connectivité réseau avec les endpoints de consensus ou d’une mauvaise configuration. Commencez toujours par des vérifications de santé basiques avant d’enquêter sur des cas limites spécifiques à Plasma.
Problèmes de synchronisation
Le nœud accuse du retard
Le nœud accuse du retard
Si votre nœud prend du retard par rapport à la tête du réseau :
- Vérifiez la charge système : CPU, mémoire et I/O doivent être suffisants pour la production haute fréquence de blocs de Plasma.
- Vérifiez la latence des endpoints de consensus : Une latence élevée impacte la vitesse d’ingestion des blocs.
- Surveillez les performances de la base de données : Les requêtes lentes ou la contention de verrous peuvent créer un goulot d’étranglement.
block_height vs tête de réseau, temps d’application d’état par bloc et latence vers chaque endpoint de consensus.La synchronisation s'arrête complètement
La synchronisation s'arrête complètement
Si la synchronisation s’arrête :
- Vérifiez l’espace disque : Les disques pleins arrêtent les écritures de la base de données.
- Vérifiez la connectivité des endpoints : Assurez-vous que la résolution DNS, les règles de pare-feu et le routage ne bloquent pas le trafic de consensus.
- Vérifiez les limites de ressources du conteneur : Une mémoire ou un CPU insuffisant peut faire planter les processus de synchronisation.
Mauvaise connectivité avec les pairs
Mauvaise connectivité avec les pairs
Des connexions limitées ou instables aux endpoints de consensus réduisent la fraîcheur des données pour les consommateurs RPC.Vérifiez : restrictions IP ou politiques de routage, nombre de connexions et uptime des endpoints, comportement de basculement sur plusieurs endpoints.Métriques clés : Connexions actives, taux de déconnexion et retard d’arrivée des blocs.
Connectivité réseau
Accès aux ports et au pare-feu
Assurez-vous que les ports requis sont ouverts pour :- La communication de consensus
- Le service RPC aux applications
- L’accessibilité des ports depuis l’extérieur et l’intérieur du conteneur
- Le trafic sortant autorisé pour la synchronisation du consensus
Échecs DNS
Les domaines de consensus non résolus interrompent la synchronisation.- Confirmez la résolution DNS pour tous les domaines de services Plasma
- Surveillez la latence et la fiabilité du résolveur
- Ajoutez des résolveurs de secours si nécessaire
Problèmes de proxy et NAT
Les environnements réseau complexes (VPN, proxys, NAT) peuvent interférer avec :- La synchronisation du consensus
- L’accès entrant RPC
- Les règles d’authentification des proxys
- Le port forwarding NAT pour l’accès RPC entrant
- Les chemins de routage vers l’infrastructure Plasma
Erreurs de configuration
Configuration non-validateur invalide
Configuration non-validateur invalide
Les erreurs de démarrage sont souvent causées par des endpoints de consensus incorrects ou manquants, des URLs ou tokens JWT mal formés ou des drapeaux dépréciés.Vérifiez dans les logs : Erreurs d’analyse de configuration, décalages de chain ID et drapeaux ou options inconnus.
Problèmes Docker
Problèmes Docker
Des conteneurs mal configurés peuvent empêcher le fonctionnement normal.Validez : Les montages de volumes pour la persistance de la base de données, l’accès réseau dans le conteneur, les limites de ressources (CPU, mémoire) et la compatibilité des versions d’images.
Conflits de variables d'environnement
Conflits de variables d'environnement
Des variables d’environnement conflictuelles ou mal ordonnées peuvent remplacer les paramètres prévus.Vérifiez : Les URLs et tokens des endpoints de consensus, le réseau et le chain ID, et les drapeaux de fonctionnalités (par exemple le support de gas personnalisé). Documentez l’utilisation des variables d’environnement pour éviter la dérive entre les déploiements.
Limites de ressources
Espace disque
Surveillez la croissance de l’utilisation du disque due à :- Données de la blockchain
- Logs et fichiers temporaires
- Mettez en place la rotation des logs
- Planifiez des tâches de nettoyage
- Surveillez les alertes d’utilisation
Descripteurs de fichiers
De faibles ulimits peuvent rompre :- Les connexions de consensus
- Les sessions RPC
ulimit, systemd ou la configuration du runtime de conteneur.
Diagnostics
Analyse des logs
Utilisez les logs pour tracer :- La progression de la synchronisation
- Les erreurs RPC
- La connectivité au consensus
- Les plantages liés aux ressources
- Logs de synchronisation du consensus : Suivez la connectivité et la progression de la synchronisation avec Plasma.
- Logs de traitement des transactions : Surveillez la gestion et les erreurs des transactions.
- Logs de requêtes RPC : Analysez les modèles de requêtes et la performance des applications de paiement.
- Logs d’utilisation des ressources : Identifiez les goulots d’étranglement affectant le traitement des paiements.
Profilage des performances
Profilez les charges de travail non validateur pour identifier les goulots d’étranglement dans :- La performance RPC
- La latence des requêtes DB
- L’application de l’état du consensus
- Débit de vérification des soldes
- Latence de confirmation des transferts
- Utilisation des ressources sous charge