Les tableaux de bord OpenSearch continuent d'afficher un état rouge sur mon domaine Amazon OpenSearch Service.
Brève description
Les tableaux de bord OpenSearch affichent un état vert lorsque toutes les surveillances de l'état ont été réalisées avec succès pour chaque nœud du cluster OpenSearch Service. Si une surveillance de l'état échoue, les tableaux de bord OpenSearch passent à l'état rouge. Les tableaux de bord OpenSearch affichent également un état rouge lorsque OpenSearch Service est en état de cluster rouge. L'état des tableaux de bord OpenSearch peut devenir rouge pour les raisons suivantes :
- Défaillance d'un nœud provoquée par un problème lié à une instance Amazon Elastic Compute Cloud (Amazon EC2) ou à un volume Amazon Elastic Block Store (Amazon EBS). Pour plus d'informations sur les pannes de nœuds, consultez Pourquoi mon nœud OpenSearch Service est en panne ?
- Mémoire insuffisante pour vos nœuds.
- Mise à niveau d'OpenSearch Service vers une version plus récente.
- Incompatibilité entre les versions des tableaux de bord OpenSearch et d'OpenSearch Service.
- Un cluster de nœud unique fonctionne avec une charge importante et aucun nœud principal dédié. Le nœud principal dédié peut également être inaccessible. Pour plus d'informations sur la manière dont OpenSearch Service améliore la stabilité du cluster, consultez la section Nœuds principaux dédiés.
Résolution
Utilisez une ou plusieurs des méthodes suivantes pour résoudre l'état rouge des tableaux de bord OpenSearch pour votre domaine OpenSearch Service.
Remarque : Si votre cluster présente une exception liée à un disjoncteur, augmentez d'abord la limite des disjoncteurs. Si vous n'avez pas d'exception liée à un disjoncteur, essayez les autres méthodes avant d'augmenter la limite des disjoncteurs.
Régler les requêtes
Si vous exécutez des requêtes complexes (telles que des agrégations volumineuses), réglez les requêtes pour obtenir des performances optimales. Les pics soudains de consommation de la mémoire de stockage peuvent être provoqués par les données de terrain ou les structures de données utilisées pour les requêtes d'agrégation.
Passez en revue les appels d'API suivants pour identifier la cause du pic, en remplaçant os-endpoint par le point de terminaison de votre domaine :
$curl os-endpoint/_nodes/stats/breaker?pretty
$curl "os-endpoint/_nodes/stats/indices/fielddata?level=indices&fields=*"
Pour plus d'informations sur la gestion de l'utilisation de la mémoire, voir Optimiser la vitesse de recherche sur le site Web d'Elasticsearch.
Utilisez des nœuds principaux dédiés
Il est recommandé d'allouer trois nœuds principaux dédiés à chaque domaine d'OpenSearch Service. Pour plus d'informations sur l'amélioration de la stabilité du cluster, voir Démarrez avec OpenSearch Service : Utilisez des instances principales dédiées pour améliorer la stabilité du cluster.
Extension
Pour étendre votre domaine, augmentez le nombre de nœuds ou choisissez un type d'instance Amazon EC2 qui contient plus de mémoire. Pour plus d'informations sur l'extension, consultez l'article Comment puis-je augmenter ou faire monter en puissance mon domaine OpenSearch Service ?
Vérifiez la distribution de vos partitions
Vérifiez les index dans lesquels vos partitions sont ingérées pour vous assurer qu'elles sont réparties uniformément sur tous les nœuds de données. Si vos partitions sont réparties de manière inégale, un ou plusieurs nœuds de données risquent de manquer d'espace de stockage.
Utilisez la formule suivante pour vérifier que les partitions sont réparties de manière uniforme :
Total number of shards = shards per node * number of data nodes
Par exemple, si l'index contient 24 partitions et qu'il y a huit nœuds de données, vous avez trois partitions par nœud. Pour plus d'informations sur le nombre de partitions nécessaires, voir Démarrez avec OpenSearch Service : De combien de partitions ai-je besoin ?
Vérifiez vos versions
Important : Vos versions des tableaux de bord OpenSearch et d'OpenSearch Service doivent être compatibles.
Exécutez l'appel d'API suivant pour confirmer la compatibilité de vos versions, en remplaçant os-endpoint par le point de terminaison de votre domaine :
$curl os-endpoint/.kibana/config/_search?pretty
Remarque : Une commande infructueuse peut indiquer des problèmes de compatibilité entre les tableaux de bord OpenSearch et des versions d'OpenSearch Service prises en charge. Pour plus d'informations sur les versions compatibles des tableaux de bord OpenSearch et d'Elasticsearch, consultez la section Configuration sur le site Web d'Elasticsearch.
Surveiller les ressources
Configurez des alarmes Amazon CloudWatch qui vous avertissent lorsque des ressources sont utilisées au-delà d'un certain seuil. Par exemple, si vous définissez une alarme concernant la pression de la mémoire JVM, prenez les mesures nécessaires avant que la pression n'atteigne 100 %. Pour plus d'informations sur les alarmes CloudWatch, consultez les sections Alarmes CloudWatch recommandées et Améliorez l'efficacité opérationnelle des domaines d'OpenSearch Service grâce à des alarmes automatisées à l'aide de CloudWatch.
Augmentez la limite du disjoncteur
Pour éviter que le cluster ne manque de mémoire, essayez d'augmenter la limite des disjoncteurs de données parent ou de terrain. Pour plus d'informations sur les limites des disjoncteurs de données de terrain, consultez la section Paramètres des disjoncteurs sur le site Web d'Elasticsearch.
Informations connexes
Impossible d'accéder aux tableaux de bord OpenSearch
Comment résoudre l'erreur « Courier fetch: n of m shards failed » dans les tableaux de bord OpenSearch sur Amazon OpenSearch Service ?
Comment résoudre l'erreur « cannot restore index [.kibana] because it's open » dans Amazon OpenSearch Service ?
Résolution des problèmes liés à une mise à niveau