06.01.73.88.13 contact@oliviadupuy.com
Des chercheurs effrayés par la qualité des textes de leur robot auteur

Des chercheurs effrayés par la qualité des textes de leur robot auteur

Antoine Oury – 19.02.2019

« Si elles paraissent encore maladroites et risibles, les intelligences artificielles apprennent vite. Trop vite, même, au point d’effrayer leurs créateurs. L’association à but non lucratif OpenAI a développé une intelligence artificielle capable de générer des textes à partir d’une phrase rédigée par un humain. Generative Pre-trained Transformer-2, ou GPT-2 de son petit nom, s’est révélée tellement douée que ses créateurs ont préféré conserver une partie de son mécanisme secret, afin d’éviter les dérives.

Silly Robot
(Javier Arce, CC BY-NC-ND 2.0)

On connait l’appétit des chercheurs spécialisés dans le développement des intelligences artificielles pour les exercices littéraires. Le texte, en tant que donnée, est particulièrement simple à traiter pour ces « robots qui apprennent » : en utilisant des techniques de fouilles de textes, les chercheurs sont capables de donner une grande quantité d’informations à « apprendre » aux machines.

Autrement dit, ces dernières vont effectuer quantité de recoupements, d’hypothèses et de constructions pour analyser et restituer des déductions tirées de ces données. Par exemple, comment rédiger une phrase qui fait sens. Ou, mieux encore, écrire un texte de fiction à partir d’une phrase imposée.

C’est au point où en sont les chercheurs de l’association OpenAI, avec GPT-2, leur intelligence artificielle capable de générer des textes. « Nous sommes à l’origine d’un modèle de langage à grande échelle, non supervisé, qui génère des paragraphes de texte cohérents, réalise des performances de pointe sur de nombreux tests de modélisation de langage et peut comprendre de manière rudimentaire un texte lu, réaliser une traduction automatique, apporter des réponses à des questions ainsi qu’une synthèse, le tout sans formation spécifique à l’une de ses tâches », annonce ainsi l’équipe.

Le Seigneur des Boulons

Entraîné à l’aide de 8 millions de pages web, GPT-2 est un auteur particulièrement doué, annonce OpenAI : il est ainsi capable d’adapter son style au contexte et à la finalité du texte. Il peut par exemple signer un texte journalistique à propos du vol d’un conteneur rempli de matériel radioactif. Une fiction, bien entendu, mais le résultat est cohérent, cite les paroles de représentants officiels et donne quelques détails sur l’événement, proposant un article comme un journal pourrait en publier.

L’équipe souligne toutefois que quelques erreurs apparaissent, notamment des répétitions et des problèmes de cohérence — le robot aurait ainsi écrit « le feu s’est déclaré sous l’eau ».

Mais l’expérience s’est révélée très enthousiasmante sur un exercice des plus ardus : écrire un texte basé sur les personnages et l’univers du Seigneur des Anneaux, de J.R.R. Tolkien. Là encore, le résultat est surprenant : le robot, qui devait poursuivre un récit commençant par « Legolas et Gimli se jetèrent sur les orcs, brandissant leurs armes, en poussant un puissant cri de guerre », s’en est très bien sorti.

Elrond, Aragorn et Gandalf sont évoqués dans le texte, ainsi que Frodon, Sam et deux anneaux… Si le texte contient là aussi quelques incohérences, on est loin des incompréhensibles passages de Harry Potter qu’un robot avait commis il y a quelques années… Bien entendu, précise l’équipe, plus le robot « connait » son sujet, plus le résultat est convaincant.

Lire la suite de l’article ici :
https://www.actualitte.com/article/lecture-numerique/des-chercheurs-effrayes-par-la-qualite-des-textes-de-leur-robot-auteur/93407

Introduction à la linguistique de corpus

Introduction à la linguistique de corpus

Ce cours s’adresse aux étudiants, doctorants et enseignants, en linguistique, en langues ou en traduction. Il permet de découvrir ce qu’est la linguistique de corpus et ses différentes utilisations dans l’enseignement, la lexicologie, l’analyse de discours ou le traitement automatique des langues. Vous aurez l’occasion de manipuler différents outils de constitution et d’exploration de corpus et de voir quelles précautions s’imposent lorsqu’on entreprend ce travail.
Format

Le cours se déroulera durant 6 semaines.
Prérequis

IMPORTANT : Certaines activités proposées dans ce Mooc utilisent des logiciels en ligne qui nécessitent une connexion internet continue pour fonctionner

Maitrise suffisante de la langue française (B2)

Notions de base dans les fondamentaux de la linguistique (syntaxe, sémantique, lexicologie, analyse du discours)

Début des cours le 13 mai.

Plis d’infos ici : https://www.fun-mooc.fr/courses/course-v1:grenoblealpes+92014+session01/about

Adaptation de Cent ans de solitude de Gabriel García Márquez

Adaptation de Cent ans de solitude de Gabriel García Márquez

Netflix adaptera Cent ans de solitude de Gabriel García Márquez

Camille Cado – 07.03.2019

Mercredi 6 mars, Netflix a annoncé l’adaptation en série de Cien años de soledad (Cent ans de solitude en français traduit par Claude et Carmen Durand chez Seuil) de Gabriel García Márquez. Le projet marque la toute première adaptation à l’écran du chef-d’œuvre de l’auteur colombien. Publié pour la première fois en 1967, le roman est l’une des œuvres hispanophones les plus lues et traduites actuellement.

Le géant du streaming a récemment acquis les droits du chef-d’œuvre de Gabriel García Márquez pour l’adapter en série en langue espagnole. Considéré comme une pièce maîtresse de la littérature, Cent ans de solitude a été vendu à 50 millions d’exemplaires dans le monde entier et traduit en 46 langues.

L’auteur, lauréat du prix Nobel, est décédé en 2014, à l’âge de 87 ans. Ses deux fils, Rodrigo García et Gonzalo García Barcha, seront les producteurs exécutifs de la série, qui sera tournée principalement en Colombie. Netflix n’a pour l’instant pas annoncé d’autres détails pour le projet.
La suite ici :
https://www.actualitte.com/article/culture-arts-lettres/netflix-adaptera-cent-ans-de-solitude-de-gabriel-garcia-marquez/93688