26/01/2016

Un peu plus d'intelligence artificielle ouverte avec Microsoft

Les outils de « deep learning » de Microsoft s'ouvrent un peu plus. Auparavant réservés aux chercheurs, ces outils permettent maintenant à chaque développeur d'intégrer des fonctionnalités avancées au sein d'une application.

La firme de Redmond a ouvert son framework d'intelligence artificielle à tous les développeurs. Il est utilisé notamment pour la reconnaissance vocale dans son assistant numérique Cortana et les applications de traduction de Skype. Passé sous licence MIT, n'importe quel développeur peut maintenant accéder, modifier et utiliser le code de Microsoft pour ses propres besoins logiciels.

Sortir de la recherche pour aller vers des applications commerciales

Le kit appelé CNTK est fondé sur une branche de l'intelligence artificielle dénommé « apprentissage profond », qui vise à aider les machines à effectuer des tâches comme la reconnaissance de photos, de videos, la compréhension du langage humain par mimétisme avec les structures et fonctions du cerveau humain. Les géants des nouvelles technologies comme Microsoft, Google et Facebook ont investi des sommes colossales dans ces domaines de recherche depuis des années grâce à des collaborations avec des pionniers de ce champ de recherche. Toutes ces sociétés ont aujourd'hui publié les codes sources de leurs outils pour qu’ils soient critiqués et développés, à l'instar de la publication des articles de recherche académique.

« Nous voulons [que notre outil] ne soit pas utile seulement pour la recherche, mais aussi pour les applications commerciales de l'intelligence artificielle » a déclaré Xuedong Huang, porte-parole scientifique de Microsoft.

Une concurrence qui fait rage sur le front de l'intelligence artificielle

L'année dernière, Google avait livré le code source de son propre moteur d'intelligence artificielle TensorFlow, que la société utilise pour de nombreuses applications comme la reconnaissance vocale dans Android ou le moteur de recherche de la société. Peu après, Facebook avait livré son propre outil . Enfin, il y a quelques semaines c'est le géant chinois Baidu qui prenait le pas de l'ouverture des codes de ses propres outils.

L'avantage de la solution Microsoft

Le framework CNTK de Microsoft possède néanmoins un avantage certain sur l'outil TensorFlow de Google en dehors du champ académique : il permet de s'appuyer sur la puissance cumulée de plusieurs serveurs au même moment. En effet, les applications d'intelligence artificielle dans le monde réel sont particulièrement gourmandes en ressource et rares sont celles qui peuvent donner un résultat satisfaisant avec une seule source de calcul. Bien que Google utilise TensorFlow sur des milliers de serveurs pour ses applications de reconnaissance vocale, la version livrée en open source ne le permet pas. C'est donc un avantage clair en faveur de Microsoft qui permet, comme la solution Torch de mutualiser les tâches de calcul sans développement supplémentaire. Un autre atout qu'il faudra vérifier est la performance de la solution. Microsoft annonce que CNTK est plus performant que les autres solutions open source d'apprentissage profond. Il est aussi un des rares frameworks Microsoft Windows.

La solution n'a pas que des avantages, elle ne supporte par exemple que le langage C++ et son propre langage personnalisé. Bien que Microsoft planifie de support d'autres langages comme Python (très populaire dans le secteur de l'intelligence artificielle), cela reste un frein à l'adoption de la solution qui nécessite un laborieux travail de réécriture.

Actualités