
MUSCIA FRÉDÉRIC
Electricité De France
Présentation de l'entreprise
L’entreprise EDF est le principal producteur d’électricité dans le monde. Le groupe rassemble tous les métiers des réseaux d’électricité, de la production et du commerce. EDF possède 38,5 millions de clients à travers le monde pour un chiffre d’affaire de 73 milliards d’euros.
La région Corse tout comme les autres régions françaises insulaires, appartient au groupe SEI. EDF SEI est une direction d’EDF qui a en charge le service public de l’électricité dans ces régions.
Dans ces territoires la mission d’EDF SEI est :
-
De produire de l’électricité en concurrence avec d’autres producteurs
-
D’acheter l’ensemble de l’électricité produite sur le territoire
-
De gérer en continu l’équilibre entre l’offre et la demande d’électricité
-
D’assurer le transport et la distribution d’électricité auprès des clients
Ces territoires sont peu ou pas interconnectés avec les réseaux continentaux.
Contexte
Arrivé le lundi 11 janvier 2016 dans l’entreprise, j’ai tout d’abord pu me familiariser avec l’équipe présente à Aspretto qui m’a fait une topologie du fonctionnement du service informatique et télécom. J’ai pu visiter les infrastructures mises en place sur le site ainsi que les stratégies de fonctionnement établies.
Problématique
L'enjeu principal est la question de la synchronisation de serveurs afin de les mettre en haute disponibilité et de réagir aux pannes pouvant survenir. A cela, s’ajoute la gestion des incidents qui peut être embêtant selon les problèmes rencontrés. De plus, le service est en train de passer du réseau X25 au réseau MPLS. Le réseau MPLS permet de mutualiser les réseaux sur un seul gros réseau.
Besoin(s)
Au sein de l'entreprise EDF, la haute disponibilité de certains serveurs n’étant pas effective (pour les serveurs de supervision par exemple). L’entreprise qui souhaite donc réagir avant que des pannes (de serveurs) ne se produisent, et l'administrateur réseau m’a fait part de sa volonté de synchroniser le serveur de la supervision NAGIOS ainsi que du serveur de gestion des adresses IP, PHPIPAM. De plus, comme le basculement sur le réseau MPLS est en cours, les architectures doivent être revues sur certains sites (Ajout d'éléments d'interconnexion, configuration d'éléments...)
Intervention principale
L'intervention principale fut la configuration de la supervision des éléments d'interconnexion via NAGIOS, de l'ensemble de la région Corse ainsi que la mise en haute disponibilité du serveur de supervision.
Mission 1
Description de la productivité
La supervision est nécessaire à Aspretto pour observer en temps réel les pannes qui touchent le réseau et la télécommunication. C’est pourquoi, nous avons dû, avec l’aide de l’administrateur réseau, effectuer une réplication d’un serveur sur un PC. Le serveur que l’on a répliqué ne contient que les outils de supervision (NAGIOS, NAGVIS…) sur des machines virtuelles via VirtualBox.
La réplication du serveur permet la haute disponibilité. En cas de panne, les machines virtuelles sont stockées sur un PC spécifique à la supervision. La réplication a pour objectif d’écrire sur les deux éléments pour qu’en cas de pannes, l’autre puisse prendre le relais en étant mis à jour automatiquement.
NAGIOS comprend un pack de logiciel à savoir NAGVIS qui permet d’observer une supervision via un schéma (de la Corse), CENTREON qui permet la configuration de NAGIOS. NAGIOS peut aussi être un outil de configuration mais seulement en mode terminal, ce qui est moins agréable et plus long.
J’ai, tout d'abord, fait remonter les ping et les interfaces pour voir si elles sont up ou down.
Pour cela, j’ai :
-
Remplacé le système d’exploitation Debian par XUbuntu (et non pas Windows en raison de la licence)
-
Installé VirtualBox sur le PC qui devait accueillir les machines virtuelles répliquées
-
Importé l’OVA sur ce PC
-
Créé un répertoire contenant le disque dur de la machine virtuelle
Ensuite, j’ai modifié les paramètres réseaux car ils sont (le serveur et le PC) situés sur un réseau distinct. J’ai par la suite installé SyncThing, qui permet la synchronisation des deux éléments facilement et rapidement. La configuration de ce logiciel n’est pas très compliquée. Après avoir synchronisé les deux machines par le biais de clés que l’on insère sur chaque serveur (Afin que ceux-ci se reconnaissent), il suffit de :
-
Créer un répertoire
-
Renseigner le chemin où se trouve la ou les machine(s) virtuelle(s)
-
Indiquer qui est le maître et de viser l’ordinateur avec lequel on synchronise le serveur
Une fois la manipulation effectuée, on teste en lançant la machine virtuelle sur le poste « esclave » tout en laissant la machine « maître » éteinte. Si la synchronisation est effectuée correctement, on peut accéder à l’adresse IP de NAGIOS via l’URL du navigateur.
Erreurs rencontrées
Dans notre cas, nous avons rencontré des problèmes avec la nouvelle version de NAGIOS :
Lorsque la machine de secours a pris le relais, tout a fonctionné et l’on pouvait encore atteindre NAGIOS par l’URL à l’adresse http://10.7.101.31/
Mais sur un des services de NAGIOS, NAGVIS, un message d’erreur apparaît et on ne peut pas observer la supervision.
Après le redémarrage de la machine esclave, l’erreur est toujours présente. J’essaye donc de démarrer la machine virtuelle du serveur et me rend sur NAGVIS. L’erreur persiste.
Après des recherches approfondies notamment sur :
-
Les paramètres entrés
-
Les chemins indiqués sur SyncThing
L’administrateur réseau m’indique qu’il y a un problème sur la version que l’on a synchronisé. Nous décidons donc qu’il faudra installer la version antérieure, bien qu’elle soit incomplète car plus ancienne.
J’ai dû alors reproduire l'ensemble des sites manquants avec NAGVIS et CENTREON (Ajout des infrastructures sur les différents sites) après avoir synchronisé la version antérieure et cela a fonctionné correctement.
Mission 2
Description de la productivité
Durant les premières semaines de stage, l’administrateur du réseau m’a confié la mission de synchroniser deux serveurs afin de mettre l’outil de supervision NAGIOS en haute disponibilité. Une fois ceci réalisée, j’ai eu la tâche de configurer la supervision des infrastructures réseaux à travers la région.
Une supervision était déjà effective mais incomplète. J’ai donc dû y contribuer en ajoutant les sites manquants tels que :
-
Caldaniccia
-
Sovenzia usine
-
Corscia usine
-
Castirla usine
Mais avant de réaliser ceci, j’ai dû :
-
Exporter puis importer la machine virtuelle sur VirtualBox contenant NAGIOS afin de créer une sorte de snapshot et de retrouver l’ancienne version en cas de problème
-
Éteindre la première machine virtuelle et allumer le «clone»
Ensuite, l’administrateur réseau qui s’occupe de la supervision m’a expliqué le fonctionnement des services de NAGIOS :
-
CENTREON : Configuration des éléments d’interconnexion (nom, adresse IP…)
-
NAGVIS : Création de schéma des infrastructures (liaison avec CENTREON)
La marche à suivre pour ajouter un site est la suivante :
Dans CENTREON :
-
On crée un élément (commutateur) et l’on insère son nom et son adresse IP
-
On exporte le commutateur dans NAGVIS
Dans NAGVIS :
-
Options => Créer une carte (en renseignant le nom de la carte. Par exemple : Sovenzia)
-
On crée une architecture via des schémas (commutateurs, routeur, liaisons)
-
On importe le commutateur (Ajouter une icône -> Host) après l’avoir déclaré sur CENTREON
-
On observe le bon fonctionnement des éléments grâce à des ping automatiquement lancés à intervalle de temps régulier
L’élément à surveiller à l’heure actuelle est la communication des commutateurs et routeurs par des ping. Mais il est possible de configurer dans CENTREON tout un tas de champs comme la gestion des interfaces, les avertissements d’incidents, grâce à un champ OID.
Le service informatique souhaite néanmoins trouver une solution afin de mettre en place une alarme sonore, un envoi de mail ou de SMS lors d’un problème rencontré sur l’un des sites pour réagir rapidement.
Après des recherches, j’ai trouvé un plugin permettant d’envoyer des avertissements sonores en cas d’anomalies. Celui-ci est disponible sur les navigateurs Google Chrome et Mozilla Firefox, « Nagios Checker » où l’on renseigne :
-
L’adresse de l’interface NAGIOS
-
Les identifiants de connexion
-
L’URL d’un script (status.cgi)
Cette mission m’a permis de réaliser qu’il était possible de superviser l’ensemble des sites et surtout de prendre les éléments à distance en cas de panne, facilement sans avoir à se déplacer. L’interface de NAGIOS ressemble à Shinken vu au lycée.
Erreurs rencontrées
Pas de problèmes rencontrés, les sites communiquent bien entre eux après les avoir configuré. J'ai aussi réalisé une erreur afin de voir si le problème remontait bien, et ce fut le cas.
Activités/Compétences
Activités
A1.3.3 Accompagnement de la mise en place d'un nouveau service
A2.1.2 Évaluation et maintien de la qualité d'un service
A2.2.1 Suivi et résolution d’incidents
A2.3.2 Proposition d'amélioration d'un service
A3.1.1 Proposition d'une solution d'infrastructure
A3.2.1 Installation et configuration d'éléments d'infrastructure
A5.1.3 Suivi d'une configuration et de ses éléments
Compétences
C1.3.3.1 Mettre en place l'environnement de formation au nouveau service
C2.1.2.4 Superviser les services et leur utilisation
C2.2.1.1 Résoudre l'incident en s'appuyant sur une base de connaissances et la documentation associée ou solliciter l'entité compétente
C2.3.2.1 Décrire les incidences d'un changement proposé sur le service
C3.1.1.3 Caractériser les éléments permettant d'assurer la qualité et la sécurité des services
C3.2.1.1 Installer et configurer un élément d'interconnexion, un service, un serveur, un équipement terminal utilisateur
C3.2.2.2 Mettre en œuvre une procédure de remplacement ou de migration
C5.1.3.1 Contrôler et auditer les éléments de la configuration
Productions associées



Veille technologique sur l'outil de supervision NAGIOS
Au cours de mon stage de deuxième année au sein de l’entreprise EDF, j’ai eu la mission de continuer la configuration des sites de Corse avec l’outil de supervision NAGIOS. Tout en réalisant la tâche qui m’était confié, je me suis renseigné sur cet outil afin d’en savoir un peu plus. Au lycée, nous avons utilisé Shinken, qui n’est pas très différent de NAGIOS.
J’ai effectué une veille technologique sur NAGIOS lors de mon stage. J’ai développé une stratégie basée sur la recherche d’information tous les deux jours durant 15 à 20 minutes, avant de travailler sur la supervision. J’ai trouvé une solution efficace et pratique pour un administrateur réseau, une application pour smartphone : TouchMon for Nagios Lite (Version Gratuite) et TouchMon for Nagios (Version Payante).
J’en ai donc fait part à l’administrateur réseau, qui m’a indiqué vouloir l’essayer mais avec la version gratuite toutefois.
La version gratuite permet de voir l’état de son réseau via NAGIOS alors que la version complète permet, en plus, de voir l’ensemble des hôtes et les problèmes, de reprogrammer les vérifications NAGIOS entre autre.
Lorsque l’on lance TouchMon Lite, il faut se rendre dans : Settings –> Cliquez sur le bouton « + » en haut à droite pour ajouter une nouvelle instance Nagios où l’on renseigne les champs :
-
Instance name : nom de l’instance Nagios
-
URL : Adresse web du dossier cgi-bin de NAGIOS
-
Username/Password : Le nom d’utilisateur et le mot de passe pour vous connecter à l’interface web
-
Version : La version de Nagios
-
Date format : le format de date à utiliser
Une fois cette configuration effectuée, on se rend dans « Problems », et on choisit un host rencontrant un problème :
TouchMon for Nagios permet de configurer son iPhone pour récupérer des informations depuis un serveur NAGIOS, cela peut être pratique dans la mesure où un administrateur réseau n’a pas toujours accès à un ordinateur portable pour vérifier l’état de son système d’informations.
Puis, l’administrateur m’a indiqué vouloir être prévenu en cas de problème d’un host. J’ai lu qu’il était possible d’être prévenu par SMS, mais pour plusieurs raisons, ce n’est pas la meilleure solution dans ce contexte. Alors, j’ai trouvé un plugin permettant d’émettre un son lors d’une remontée d’erreur. Le plugin est disponible sur Mozilla Firefox et sur Google Chrome : Nagios Checker.
Sur Nagios Checker, il faut renseigner :
-
L’adresse de l’interface NAGIOS
-
Les identifiants de connexion
-
L’URL d’un script (status.cgi)
Le plugin est efficace dans le sens où, l’on entend un son dans l’étage du service informatique lors d’une anomalie, ce qui permet aux techniciens ou à l’administrateur réseau de remédier au problème rapidement

