Des médias américains font appels à des robots pour écrire des articles
Cette startup américaine révolutionne le data journalisme avec un logiciel d'intelligence artificielle capable de rédiger une brève en analysant des résultats sportifs ou financiers, des données statistiques et depuis peu des flux Twitter.
Après une décennie de recherche dans le domaine de génération automatique de texte (GAT) en laboratoire, l'équipe de Narrative Science pousse toujours plus loin les limites de la technologie numérique et offre la preuve qu'un programme informatique peut imiter le raisonnement humain, pour peu qu'on lui apprenne quelque routines de notre langage.
La société basée à Chicago, est dirigée par Stuart Frankel, un ancien CEO de DoubleClick et deux universitaires experts en intelligence artificielle et journalisme. Les deux professeurs et co-fondateurs, Kris Hammond et Larry Birnhaum sont également co-directeurs de recherche du Laboratoire d'Information Intelligente (Infolab), sur le campus de l'université du Northwestern.
Aujourd'hui l'entreprise compte une trentaine de clients dont une chaine de télévision sportive américaine, des journaux de la presse quotidienne, et surtout depuis quelques semaines le célèbre magazine économique Forbes. Lu et approuvé par un lectorat fidèle non surpris de lire un flot journalier de brèves financières publiées et passées préalablement par la moulinette d'un algorithme d'une efficacité redoutable et sans contraintes horaires.

Image voir Notes de fin - Article: Des médias américains font appels à des robots pour écrire des articles , by Patrick Dudouit
Alors soyons précis, on ne parle pas ici de reportages, d'enquêtes ou d'articles avec un art maîtrisé de la formule, de la subtilité ou de l'analyse qui caractérise l'exercice journalistique, mais bien de la génération de texte assistée par ordinateur, conçue pour fournir correctement une brève à partir de l'analyse de données et tableaux chiffrées recueillies sur le web.
(Forbes propose sur son site des articles boursiers signés Narrative Science.)Narrative Science a expérimenté sa technologie pendant plusieurs années, avec au début des articles stéréotypés concernant surtout les matchs de base-ball de ligues mineures. L'objectif à l'époque était surtout de rédiger des manchettes à partir des résultats sportifs de compétitions locales et peu importe si les brèves avaient des caractéristiques semblables.
Mais avec l'avènement des progrès de l'intelligence artificielle et les recherches menées par cette équipe de doctorants, les news de Narrative Science sont désormais proches de la perfection. Chaque article est générée en moins de 2 minutes avec une bonne qualité de la narration et de la syntaxe avec des expressions et des tournures de phrases journalistiques courantes. Le logiciel totalement innovant produit du contenu à la demande du client et permet de personnaliser le ton et l'angle des articles à rédiger.
(Artificial Intelligence and Big Data analytics - Narrative Science.)Concrètement, pour les matchs de base-ball, le programme commence par rassembler les données disponibles sur la Toile, récupère les scores sur les sites web des ligues, importe des photos pour illustrer les dépêches, puis d'autres infos ciblées comme des actions ou des incidents de match. Ensuite, il analyse l'ensemble et rédige des conclusions fondées sur les résultats des matchs précédents grâce aux données historiques qu'il recueille et garde en mémoire. Enfin, il rédige le billet à partir de modèles de langage avec les phrases clées et les expressions journalistiques disponibles dans sa base de données.
Bien loin, de vouloir mettre les journalistes au chômage mais plutôt de les dispenser de certaines tâches répétitives, Narrative Science reste sur son savoir-faire, l'article court et sommaire rédigé à partir de données chiffrées. Toutefois le concept ne s'arrête pas là et le marché est vaste, plusieurs sociétés utilisent déjà leurs services pour publier entre autres des comptes rendus d’assemblées générales et des rapports financiers mensuels ou trimestiels.
Lancée en 2010, la jeune pousse a d'ailleurs su séduire et rassurer les investisseurs américains sur ses activités et son marché potentiel. La startup a réussie en 2011 une levée de fonds de 6 millions de dollars auprès de Battery Ventures, un budget destiné à la recherche mais aussi pour se lancer dans plusieurs secteurs éditoriaux comme la politique, l'immobilier, la bourse et la finance.
Notes
[1] Crédits photo : Narrative Science (Capture d'écran)
[2] via Forbes Forbs Narrative Science (Capture d'écran)
[3] via Narrative Science Technology (Capture d'écran)
A lire aussi
- Energies renouvelables : Le plus grand parc solaire de France
Mais pourquoi ce retard à produire en France, de l'énergie avec des moyens dignes de notre siècle. On peut tout d'abord se demander si le contexte politique, énergétique et environnemental... - Logiciel de dessin gratuit, le puissant Sumo
Bien sûr, tout le monde ne peut pas investir dans un logiciel haut de gamme, tel que Photoshop, dont on a pas forcément besoin pour des retouches simples, mais qui reste un outil incontournable... - Koskas Technologies
- Feedly prend le relais de Google Reader
L'annonce par Google de la fermeture de Google Reader au 1er juillet prochain a ouvert la voie à une véritable guerre de succession entre les services concurrents. Parmi ceux-ci, Feedly... - Objet Mag
Ajouter un commentaire
Evidemment derrière cette innovation, la grande question est de savoir si ce genre d'outil est conçu pour remplacer l'homme ou l'aider dans son métier. Car à n'en pas douter ce programme va progresser à pas de géant, à priori il est utiliser pour écrire des manchettes c'est à dire des billets très courts, son raisonnement numérique semble encore limité à l'analyse de quelques informations. Mais bien entendu un jour ou l'autre on va dépasser ce stade d'analyse basique, et ce n'est plus de la science fiction. Dès lors on disposera d'un outil capable de raisonner et traiter des milliers d'informations pour rédiger un article complet.Certes c'est fascinant, mais après le siècle de la désindustrialisation de nos pays, va t'on connaître l'ère de la désindustrialisation de notre planète numérique ?
Alors là, je crois qu'il y a quelques experts en intelligence artificielle et dans l'étude des TALN (traitements automatiques du langage naturel) qui vont côgiter longuement sur ce programme exoplanétaire !
Bonjour, Très intéressant !!! Tout comme Thibault, je me demande à quel point cette innovation va t-elle se rapprocher de la technique humaine. Affaire à suivre !
Impressionnant. Jusqu'où pousseront-ils le concept ? Parviendront,t-ils à générer des articles plus complexes ?
Ce qui est intéressant dans cette histoire, c'est que vu qu'il s'agit chez Forbes des prévisions de résultats de plusieurs sociétés, il vaut mieux que la moulinette soit au point. Kris Hammond est un geek optimiste pour sa société. Il estime que dans quinze ans 90% des news seront générés par un programme informatique. Personnellement, je n'y crois pas, un algoritme peut-il faire une saillie drolatique ou avoir un bel esprit. C'est une qualité qui à mon avis est encore réservée pour quelques décennies à l'esprit humain.
Là je reconnais que je suis surprise par le résultat, l'automatisation m'a toujours semblé un moyen inachevé qui ne permet pas la perfection, là par contre, je suis émue qu'ils ont trouvé la solution pour garder à la fois la syntaxe et la sémantique correctes !
Je trouve cela à la fois impressionnant et un peu surréaliste. Générer du texte c'est bien, encore faut-il qu'il soit agréable à lire, et pour certains textes, il faut même avoir un certain ton, chose que les machines ne peuvent pas imiter ni reproduire. Je pense que l'usage restera malgré tout assez limité.
Je suis d'accord avec Alexandre, le texte doit rester de qualité. On trouve beaucoup de textes traduits ou de textes générés par des robots. Leur lecture est souvent pénible.
Personnellement, même avec cette rédaction des articles par des Bots le texte ne saurait être attirant. Je pense que ce qui fait le charme d'un texte la plupart du temps c'est l'aspect personnel que son auteur lui donne et ceci avec les erreurs qui y vont avec afin au moins d'ouvrir la voie à la polémique.
ce qui est sûre c'est que le texte généré par le robot sera unique, cependant, rien de remplacera le ton d'un texte et la chaleur qui s'en dégage.


Blogueur, codeur, consultant dans le domaine du marketing digital et fondateur du portail Surfandbiz et de sites e-commerce. Le blogue bilingue traite de l'actualité high-tech, de l'Internet Mobile, du e-marketing, du social media et des dernières tendances du Web.