16/11/2015

Microsoft publie le code de son outil d’IA (aussi)

La firme de Redmond, via sa branche Microsoft Asia, publie sur GitHub les codes sources de DTMK, une suite d’outils dédiée à l’apprentissage des machines.

Si vous êtes un bon geek, il y a de grandes chances que vous ayez passé pas mal de temps à réfléchir à l’intelligence artificielle, au moins, à la façon dont les machines apprennent de nouvelles choses et les appliquent aux tâches courantes. Ce concept d’intelligence artificielle a le vent en poupe et nourrit autant d’espoir que d’interrogations éthiques, déclenchant parfois les peurs des scientifiques les plus renommés de la planète.

Quelques jours après Google

Il y a quelques jours nous vous annoncions la publication de TensorFlow en open source par Google. La firme de Mountain View a tiré la première pour bénéficier des contributions de la communauté et notamment des laboratoires de recherche. La réponse de Microsoft ne s’est pas fait attendre. On est comme ça à Redmond, suiveur, mais réactif !

Microsoft publie donc à destination de la communauté les codes de Machine Learning pour Azure, un nom certainement pratique à retenir, mais manquant singulièrement d’originalité, vous en en conviendrez.

Les outils utilisés pour développer l’apprentissage des machines, Distributed Machine Learning Toolkit (DMTK), ont donc été publiés sur la plateforme GitHub et rendus entièrement open source. Microsoft annonce que d’autres outils seront ajoutés dans les semaines à venir, mais pour l’instant, la suite d’outils contient :

  • DMTK framework : un serveur de paramètre, qui supporte le stocke de modèles de structures de données hybrides et un kit de développement client, qui supporte l’ordonnancement côté client, l’entrainement sur des modèles à large échelle et le maintient d’un cache de modèle local, synchronisé avec les paramètres du modèle côté serveur.
  • LightLDA : un nouvel algorithme annoncé comme particulièrement efficace pour les modèles d’apprentissage qui peut s’exécuter sur des données et modèles de grande taille, y compris sur des clusters de calcul de taille modeste.
  • Distributed Word Embedding : un outil populaire pour le traitement du langage naturel. La suite d’outil offre une implémentation distribuée de deux algorithmes pour la modélisation du langage. L’algorithme standard Word2vec et un algorithme multi sémantique qui supporte donc l’analyse polysémique.

À l’instar de Google, l’équipe Microsoft Asia qui publie la suite d’outil espère que cette ouverture attirera plus de chercheurs et de praticiens afin d’améliorer les ensembles de données et de rendre la suite DMTK plus applicable.

 

Source : winbeta.org

Actualités