03/07/2017

LinkedIn libère deux outils de notification

Le réseau social pour les professionnels a annoncé qu’il publiera quelques outils clés de son développement sous licence open source. Les outils que compte libérer Linkedin ont pour objectif principal la résolution des problèmes concernant les pannes des sites Web. Ces outils permettront aussi aux entreprises de se connecter automatiquement avec les ingénieurs chaque fois qu’une application échoue.

La problématique exposée par Linkedin lors de son annonce est commune à de nombreuses entreprises dont les services reposent sur la disponibilité d’un serveur. Que faire en cas de panne ? On appelle un ingénieur de l’équipe, que faire s’il ne répond pas ? Traité manuellement ce cas pratique amène souvent à une foison d’appels, de création d’incidents secondaires et le plus souvent une confusion dans les rôles attribués à la résolution du problème. Pour cela, LinkedIn a créé deux outils que la société a présentés dans un récent article de blog : Iris et Oncall.

Iris le messager

Le premier outil libéré s’appelle Iris. Il représente la première partie de l’automatisation pour gérer l’escalade des incidents et fiabiliser la messagerie. Cet outil notifie les utilisateurs lorsqu’un système de l’entreprise génère une alerte depuis près de deux ans au sein de LinkedIn. Il permet de gérer spécifiquement un plan d’escalade par incident. Les plans sont définis avec plusieurs étapes. Si Iris n’a aucune nouvelle de l'utilisateur après avoir exécuté une étape, il passera à l'étape suivante du plan, en continuant à le faire jusqu'à ce que quelqu'un réponde ou que le plan ne comporte aucune autre étape.

Dans l’exemple ci-dessus, la première étape définit un message de priorité moyenne à l'ensemble de l'équipe de surveillance de l'infrastructure, ainsi qu'un message prioritaire au premier appel. Ceux-ci seront envoyés en parallèle et l'équipe ou l'ingénieur ont la capacité d’acquitter le message. Les notifications du plan peuvent être configurées pour se répéter, avec une période d'attente entre les répétitions. Dans cet exemple, le message à priorité haute à droite est répété deux fois, avec cinq minutes entre les messages.

L'une des caractéristiques les plus surprenantes d'un plan Iris est qu'aucun mode de contact spécifique n'est spécifié n'importe où. Ce choix est laissé à l’utilisateur, conférant à l’outil une grande flexibilité. Par exemple, une personne peut préférer recevoir des messages Slack plutôt que des courriels, tandis qu'une autre peut opter pour des SMS.

Oncall pour définir les astreintes

Le second outil est dénommé Oncall. Il aide à déterminer qui le système devra contacter par iris. Cet outil permet aux organisations de déterminer une liste pour chaque problème qui se pose. La liste peut être établie sous la forme d'un calendrier, d'où Iris utilisera les informations pour générer des notifications pertinentes aux bonnes personnes.

La mise en oeuvre

Les outils ont été rendus aussi simples d’utilisation que possible. Lors de la mise en place des outils, l’entreprise a vu croître fortement son nombre d’incidents. L’automatisation permettait alors de lancer toutes les alertes que les méthodes manuelles laissaient de côté. La société a donc rationalisé ces méthodes et ajouté des fonctionnalités comme le traitement par lot ou la réduction automatique de la priorité des messages entrants si un trop grand nombre a été envoyé à un utilisateur particulier dans une fenêtre de temps donnée.

Les développements à venir

En offrant  Iris et  Oncall à la communautéopen sourceun système d'escalade prêt à l'emploi, libre, ouvert et en pleine croissancela société compte sur les contributionsexternespour améliorer les produits.Pour les futurs développements, l’équipe en charge des projets souhaite rendrel'émetteur d'Iris plus fiable pour améliorerl’expérience utilisateurdans le traitement de l'ordonnanceur automatique d'Oncall. Le code et la documentation de ces produits se trouvent

aux adresses  https://iris.claims et https://oncall.tools

Actualités