EREL : Education, Rééducation, Evaluation du Langage

Un système multimédia pour des activités éducatives privilégiant le langage naturel écrit




Responsable du projet
:

 Elisabeth Godbert
LIM, Université de la Méditerranée et CNRS, Marseille

Durée du projet : 1995-1998


Participants et partenaires


Ont participé à la conception et/ou au développement du projet :

Ont cofinancé le projet :

 1. Origine du projet EREL

Le projet EREL, élaboré durant l’année 1995, avait pour objectifs la conception et la réalisation, sur une durée de deux ans, d’un système d’aide à la communication destiné à des enfants et des adolescents présentant des troubles du développement, notamment ceux qui sont atteints d’autisme avec ou sans retard mental, ou qui sont poly-handicapés.
Ces enfants présentent en général à la fois des troubles du langage et de la cognition, et des troubles moteurs qui rendent difficile l’expression orale, écrite ou graphique de leurs pensées et de leurs sentiments. Cette difficulté d’extériorisation de leurs pensées ou désirs constitue un handicap majeur pour ces personnes, quels que soient leur stade de développement cognitif et émotionnel et leur degré d’autonomie.
Notre objectif était de développer un système à vocation thérapeutique qui puisse aider à l’éducation ou la rééducation du langage et de la communication, chez ces enfants.

A l'issue d'études préliminaires, le projet initial a évolué et nous nous sommes plus précisément fixé l’objectif suivant :


Concevoir et développer un système destiné à des enfants ayant des difficultés pour l'apprentissage du langage,
qui mette en oeuvre des techniques d’intelligence artificielle et de linguistique informatique dans un environnement multimedia, ludique, interactif et modulaire, et qui :

• propose un ensemble de jeux conçus pour aider l’utilisateur à employer le langage naturel écrit pour s’exprimer sur différents thèmes ;
• utilise conjointement plusieurs supports pour assister l’utilisateur dans son expression ;
• ne demande à l’utilisateur que des manipulations simples (sélections graphiques à l’écran) ;
• soit conçu comme un système multi-utilisateur, qui permet de choisir le niveau de difficulté du travail demandé.


2. Le système ILLICO pour le traitement du langage écrit

Dans le système EREL, l'ingénierie linguistique est assurée par le système générique ILLICO (Pasero & Sabatier, 1994 et 1995). Ce système est constitué d'un ensemble d'outils pour le traitement du langage naturel écrit, qui permettent le développement d'applications du TALN, comme des interfaces intelligentes pour bases de données, des systèmes d'aide à la communication, etc.

ILLICO fournit en premier lieu des formalismes simples pour définir le sous-langage approprié à chaque application, par l'écriture de règles lexicales, syntaxiques, sémantiques, conceptuelles et contextuelles. Ensuite, les algorithmes du coeur d'ILLICO permettent d'effectuer un traitement complet des phrases appartenant à ce sous-langage : analyse ou synthèse d'énoncés dont on produit une représentation sémantique de type logique, dans laquelle les expressions référentielles sont résolues. C'est dire que le système "comprend exactement" les textes analysés et est donc à même de faire ensuite des inférences utilisant leur contenu.

Les algorithmes d’ILLICO mettent en oeuvre un traitement interactif du langage en effectuant l'analyse/synthèse partielle des phrases en cours de construction et en en contrôlant à chaque instant la correction. L'analyse/synthèse partielle de phrases permet en particulier de proposer à l'utilisateur le mode de "composition assistée" dans lequel le système aide l'utilisateur à formuler son texte, en synthétisant et en affichant à chaque instant les mots ou expressions qu'il est possible d'utiliser pour continuer la phrase en cours de construction (Pasero & Sabatier, 1994 ; Milhaud 1994). Cette assistance peut être graduée : assistance au niveau lexical seul, ou lexical+syntaxique, etc., selon que l’on connecte ou non les contrôles linguistiques aux différents niveaux.

Pour le développement d’un logiciel d'éducation ou rééducation du langage, la composition en mode assisté est un trait particulièrement intéressant, car elle permet de guider l'utilisateur pas à pas lors de la formulation de ses phrases. Elle permet donc de définir des exercices pour des enfants très jeunes, en tout début de phase d'apprentissage du langage écrit.

3. Objectifs pédagogiques d'EREL

Nous avons défini  dans EREL des activités de type piagétien qui demandent à l’enfant de raisonner, agir et s’exprimer sur des objets dont les propriétés évoluent dynamiquement.

Les différents stades de développement définis par Piaget comprennent en particulier : la classification d'objets, la sériation, les nombres entiers (exercices de logique quantitative), les déplacements dans l'espace avec la mesure, les structures géométriques, les étapes de la géométrie passant par les relations intrafigurales puis interfigurales (utilisant les coordonnées cartésiennes) et l’algébrisation de la géométrie (groupe des déplacements par exemple).

Sur ces bases, nous avons conçu une suite d’exercices portant sur la désignation et le positionnement les uns par rapport aux autres d'objets de forme, couleur et taille variables :

Pour chacun des jeux proposés par EREL, l’enfant doit utiliser et apprendre à maîtriser le langage associé, qui lui permet d’exprimer ses requêtes. C'est un sous-langage simple du langage naturel, qui contient les expressions linguistiques intuitives nécessaires à la description des propriétés des éléments du contexte, des situations logico-mathématiques et des relations spatiales qui ont une occurrence dans le jeu considéré.

Par ailleurs, EREL a été conçu comme un système multi-utilisateurs et propose donc des exercices de différents niveaux de difficulté, tant pour ce qui concerne l’expression en langage naturel que pour la complexité cognitive des activités.

Ces jeux ont été définis, plus particulièrement, pour aider l'utilisateur à comprendre, appréhender et exprimer en langage naturel différents concepts concernant :


4. Description fonctionnelle du système EREL

4.1. Description générale

Chaque activité d'EREL est organisée pour que l'utilisateur s'exprime par des phrases simples, appelées requêtes, que le système l'aide à composer autour d'une scène. Un langage approprié est associé à chaque activité pour la composition de ces phrases. La scène évolue au fur et à mesure que l’activité se déroule, en fonction des requêtes que formule l’utilisateur et auxquelles le système réagit. Une session d’EREL, schématiquement, est donc une suite de requêtes de l’utilisateur auxquelles le système obéit si elles sont correctes. Si une requête n’est pas correcte, la communication passe par un sous-dialogue pour assister l’utilisateur dans la formulation de son texte.

La correction globale d’une requête requiert sa correction lexicale, syntaxique et conceptuelle, sa correction contextuelle au niveau linguistique (les expressions référentielles peuvent être résolues), sa correction contextuelle au niveau situationnel (l'action est possible ou non) et sa correction par rapport aux règles du jeu (l'action est permise ou non).

Si une requête de l’utilisateur est correcte et complète, le système y réagit, selon le type de la requête :

Dans tous les cas, le système produit la synthèse vocale du texte composant la requête.

Les niveaux de difficulté des activités proposées par EREL sont définis à partir des éléments suivants, dont on laisse le choix à l’utilisateur (l'éducateur ou l'enfant).

4.2. Les activités proposées

Nous décrivons ici les activités qui ont été développées et qui constituent la version actuelle du système. Pour chacune d’elles, les différents modes opératoires définis précédemment sont disponibles.

Un jeu en deux dimensions : le jeu du damier

Le jeu du damier est un jeu de positionnement de pions de diverses formes et couleurs sur un damier. L'utilisateur peut composer des phrases de type impératif, interrogatif ou déclaratif sur les pions illustrés à l'écran : il écrit des commandes pour agir sur les pions (par exemple les effacer, les déplacer, les permuter ou en créer de nouveaux), ou formule des questions sur la situation des divers éléments du jeu, et le système réagit à chaque phrase composée par l'utilisateur. Les Figures 1 et 2 donnent un exemple de l'une des versions de ce jeu en mode assisté (aide à la composition de phrases au niveau lexical+syntaxique+conceptuel).

Dans la Figure 1, l’utilisateur ayant commencé sa requête par Ajoute un carré rouge, le système indique que les seuls mots pertinents pour continuer la phrase sont les locutions locatives à droite, à gauche, etc. Dans la Figure 2, l'utilisateur ayant composé la phrase complète Ajoute un carré rouge à droite de l'étoile., le système exécute l'action demandée.

 
figure 1

Figure 1 : un jeu en deux dimensions (1).

 

Voici quelques exemples de phrases (correctes à tous les niveaux) de différents types que peut composer l'utilisateur :

 
figure 2

Figure 2 : un jeu en deux dimensions (2).

La résolution des expressions référentielles est effectuée pendant le traitement linguistique des phrases au niveau contextuel. Par exemple, si l’on s’en réfère à la situation illustrée par la Figure 2, les expressions définies le rond rouge, l’étoile, le triangle qui est en D2 sont des expressions jugées contextuellement correctes, alors que le pion bleu, le rond ou le triangle gris ne le sont pas, les deux premières ayant plusieurs référents possibles, et la troisième aucun.

Le problème de la désignation d’un objet trouve ici une illustration abondante, il s’agit pour l’enfant de trouver une expression correcte et non-ambiguë pour désigner chaque objet sur lequel il veut agir. Il peut parler du rond rouge, du rond qui se trouve en B1, du rond qui se trouve au dessous de la case A1, du pion qui est dans la colonne 1, etc. (le mot pion étant dans ce jeu un mot générique) : ces expressions sont toutes correctes et désignent le même objet, que le système sait trouver. Les positions des objets sont exprimées soit de façon absolue (en B1), soit relative (à droite de l’étoile).

Plusieurs versions de ce jeu ont été développées, dont une version élémentaire destinée à un tout premier apprentissage de la lecture, dans laquelle on ne travaille que sur un ensemble prédéfini d’objets et dans laquelle le mode de composition assistée propose des groupes nominaux non décomposés. La Figure 3 donne un exemple de la façon dont se présente une session de cette version.

 
figure 3

Figure 3 : la version élémentaire du jeu du damier.
 

Un jeu en trois dimensions : description d'une image

La deuxième activité proposée par EREL est un exercice autour d’un scénario illustré par une image : "A la pêche". L’objectif de ce jeu est d’inciter l’enfant à construire des phrases simples autour de cette scène ; ici les objets dont on parle sont figés.

<>L’interface se présente telle que dans la Figure 4. L’utilisateur dispose de deux modes opératoires :

Pour chaque question, le système calcule et affiche l’ensemble des réponses possibles. Par exemple, à la question où se trouve le panier ? correspondent plusieurs réponses dont : à côté du balluchon, à droite du pêcheur, au bord de la rivière, dans le pré, etc.

 
figure 4

Figure 4 : description d’une image en trois dimensions.

Un jeu en une dimension : un petit train

Il s'agit ici de faire travailler l'enfant sur la composition linéaire d'un ensemble d'éléments, en l'occurrence des wagons et des locomotives (ayant toutes la même orientation).

L’interface se présente comme le montre la Figure 5.

Comme dans le jeu du damier, l'utilisateur compose des requêtes qui lui permettent de supprimer, insérer, permuter, etc. des objets. Il peut également faire reculer ou avancer le train, ou changer la couleur d'un élément. Par exemple il pourra composer la suite de requêtes :

Ici encore, le problème de la désignation d’un objet est un point essentiel. Comme, dans cette activité, il n'existe pas de repère spatial absolu, les objets ne peuvent être localisés que par leurs positions relatives (devant le wagon jaune, entre le... et la..., à gauche de..., etc.). Les repères utilisés sont i) celui qui est donné par l'orientation des locomotives pour les expressions comme devant ou derrière, et ii) celui qui est lié à l'utilisateur pour les expressions comme à droite, à gauche

 
figure 5

Figure 5 : un jeu en une dimension.
 

5. Les composants du système EREL

Pour la réalisation logicielle de chaque exercice d’EREL, et, plus généralement, pour la réalisation de systèmes éducatifs multimédias réactifs privilégiant l'expression en langage naturel, on doit définir et représenter de façon interne :

Nous décrivons ci-dessous comment dans EREL nous avons classé l’ensemble de ces connaissances à l’intérieur de différents composants, dont chacun apporte à l'ensemble du système des données d’un certain domaine (données statiques, algorithmes, outils, etc.), et nous étudions certains aspects de l'ingénierie des connaissances qu'il est nécessaire d'y mettre en oeuvre.

- Le composant Définition des exercices

Il contient les spécifications relatives à chaque exercice : l'ensemble des objets du micro-monde considéré et leurs propriétés, les règles du jeu (règles légales), le langage de requêtes associé, les paramètres qui indiquent le niveau de difficulté de l'exercice, etc.

- Le composant Base de données contient :

Il a donc été nécessaire de définir une représentation interne des objets composant chaque scénario. Dans cette petite base de données, chaque objet est décrit par sa nature conceptuelle, sa couleur et sa place.

La modélisation de la sémantique de l'espace a été faite différemment suivant les jeux. Pour le damier, la localisation d'un objet se fait par ses coordonnées, et les positions relatives des objets sont exprimées à partir des relations cardinales : à droite, à gauche, au-dessus, au-dessous. Dans la description de l'image "A la pêche", on a défini un ensemble de “zones” en trois dimensions qui structure et recouvre l’espace décrit par l’image, suivant une approche qui s’inspire des travaux sur la sémantique de l’espace décrits par (Vieu, 1991). Les relations spatiales entre les objets en découlent, et, pour répondre à une question sur la localisation d'un objet, le système est capable de donner dynamiquement toutes les relations possibles entre la zone concernée et les autres zones. Pour le jeu du petit train, on a modélisé la suite des éléments (wagons ou locomotives) qui composent le train, ainsi que la position de l'élément de tête par rapport au cadre, qui est la seule position modélisée de façon absolue. Les positions des autres éléments en découlent, et les actions sur ces éléments s'effectuent par ajout, insertion, ou suppression d'élément, ou par déplacement de l’ensemble dans un sens ou dans l’autre.

- Le composant TALN

Pour le traitement des phrases écrites, on utilise le système ILLICO présenté ci-dessus. Il contient i) les formalismes pour la définition des sous-langages du langage naturel associés aux diverses activités, ii) les algorithmes pour la compréhension et la génération de textes en langage naturel.

Par ailleurs, le composant TALN contient également un module simple de synthèse de la parole développé pour EREL, qui prend en entrée les phrases complètes et correctes composées par l'utilisateur (Guizol & Godbert, 1999). Ce module utilise le système MBROLA (Dutoit et al. 1996).

- Le composant Graphique

Il contient :
i) les outils classiques et méthodes utilisés dans une IHM graphique, pour les entrées-sorties : listes et menus déroulants, boutons, rectangles d'édition, etc.
ii) une bibliothèque de fonctions graphiques pour l’illustration du micro-monde à l’écran : dessins divers, représentation des déplacements d’objets, modification de leur couleur, etc.
iii) les fonctions nécessaires à la définition et la gestion d'une interaction multimédia et multimodale entre l'utilisateur et la machine (par exemple, dans le jeu du damier, l’utilisateur peut utiliser les modalités <clavier, langage naturel> et <souris, éléments graphiques>, ou mixer les deux, pour formuler ses phrases ; pour désigner une case, il pourra par exemple écrire la case C3 ou bien la sélectionner par un clic, le système se chargeant à partir du clic de générer l’expression la case C3).

- Le composant Dialogue

Il contient les règles cognitives et pragmatiques et les techniques qui permettent de gérer l'enchaînement des actes de communication. Ce composant est en particulier chargé de la production des réponses aux requêtes et de l’aide à l’utilisateur. 

EREL est un système centré-utilisateur : il a été conçu et se présente comme un système ludique "au service de l’enfant utilisateur" dans lequel le système obéit aux requêtes que l'utilisateur formule, et lui apporte s'il le désire une assistance pour formuler ses requêtes.

En ce qui concerne la formulation des requêtes en langage naturel, le système aide l’utilisateur, s'il le désire, à produire des phrases correctes à tous points de vue (bien formées aux niveaux lexical, syntaxique, sémantique, contextuel, pragmatique). Cela correspond à la composition en mode assisté, mise en oeuvre grâce aux outils d'ILLICO décrits ci-dessus. Si par contre l’utilisateur compose son texte en mode libre, le système n’analyse la phrase que lorsqu’elle est terminée et que l’utilisateur en demande une réponse. Le système détecte alors les éventuelles erreurs que contient le texte, les signale à l’utilisateur et propose son aide (le mode assisté).

Lorsqu’une requête est correcte aux niveaux lexical, syntaxique et sémantique, le système en vérifie la correction contextuelle et, dans le cas favorable, donne sa réponse. Dans l’autre cas, il donne un message d’explication sur l’erreur que contient la phrase de l’utilisateur : au niveau contextuel, une requête peut être incorrecte soit parce qu’elle contient une expression référentielle qui ne peut pas être résolue (elle n’admet pas un référent unique), soit parce qu’elle demande l’exécution d’une action qu’il n’est pas possible de réaliser car elle viole les règles du jeu (par exemple tout simplement le débordement des limites du cadre dans le jeu du train ou du damier, comme Pose le triangle au-dessus du rond bleu dans la situation de la Figure 1).

- Le composant Superviseur

Il assure le contrôle et l'orchestration de l'ensemble des composants précédents et de leurs interactions : l’organisation générale du système est telle que les interactions et les processus de coopération entre les composants transitent par le superviseur, qui envoie des données ou des tâches aux différents composants, recueille leurs réponses, et prend des décisions pour la suite du déroulement du jeu.


6. Validation du système

Depuis 1997, EREL est utilisé sur trois sites de la région de Marseille : un cabinet médical, un hôpital de jour et un centre de psychothérapie infantile. Quelques médecins ou éducateurs spécialisés utilisent EREL avec des enfants psychotiques ou autistes, ou avec des enfants en situation d’échec scolaire. Ils pensent que ce logiciel est un bon outil pédagogique, mais d’une part il est difficile d’évaluer les éventuels progrès des enfants qu'ils font travailler avec EREL, et d’autre part nous n’avons défini aucune méthode précise pour l’évaluation et la validation du système. En fait EREL est utilisé comme un outil, parmi d'autres, que les éducateurs ont à leur disposition pour faire travailler des enfants en âge d’apprentissage du langage. Leur retour nous est précieux, en particulier pour tout ce qui concerne l'amélioration de l'interaction, ils nous ont en particulier suggéré d'ajouter quelques fonctionnalités à la première version du logiciel que nous leur avions donnée.


Bibliographie

Bruner, J. (1983). Le développement de l'enfant, Savoir faire savoir dire. Paris : PUF.

Cawsey, A. (1998). "Planning interactive explanations". In Intelligent User Interfaces, Maybury, M.T. & Wahlster, W. (dirs). San Francisco : Morgan Kaufmann Publishers. pp 404-419.

Cohen P.R., Johnson, M., McGee, D., Oviatt, S., Pittman, J., Smith, I., Chen, L., & Clow, J. (1998). "Multimodal Interaction for Distributed Interactive Simulation". In Intelligent User Interfaces, Maybury, M.T. & Wahlster, W. (dirs). San Francisco : Morgan Kaufmann Publishers. pp 562-569.

Donellan, K. (1966). "Reference and definite description". Philosophical Review, 75. pp 281-304.

Douglas Sarah, A. (1995). "LingWorlds: An Intelligent Object-Oriented Environment for Second-Language Tutoring". In Intelligent Language Tutors, Holland, V.M., Kaplan, J.D. & Sams, M.R. (dirs). Mahwah : LEA Publishers. pp 201-220.

Dutoit, T., Pagel, V., Pierret, N., Bataille, F. & Van Der Vrecken, O., (1996). "The MBROLA Project: Towards a Set of High-Quality Speech Synthesizers Free of Use for Non-Commercial Purposes ". Proc. of International Conference of Spoken Language Processing (ICSLP'96), Philadelphie, vol. 3. pp 1393-1396.

Godbert, E.  (2000) Un environnement multimédia privilégiant  l'expression en langage naturel, pour des activités éducatives de type piagétien. Apprentissage des Langues et Systèmes d'Information et de Communication (ALSIC), vol.3, 2, décembre 2000, pp. 167-186. Revue Internet : http://alsic.org ou alsic.univ-fcomte.fr

Guizol, J. & Godbert, E. (1999). "Intégration de la synthèse vocale dans un logiciel éducatif multimédia". Journées Internationales de Linguistique Appliquée, JILA’99, Nice. pp 121-125.

Humblot, L. (1998). “Acquisition des marqueurs des systèmes de référence spatiale”. Actes de la Conférence de l’Association pour la Recherche Cognitive (ARC 98), Paris. pp 28-35.

Joab, M. (1990). Modélisation d’un dialogue pédagogique en langage naturel. Thèse de doctorat en informatique. Paris : Université Paris 6.

Maybury, M.T. (1998). "Planning Multimedia Explanations Using Communicative Acts". In Intelligent User Interfaces, Maybury, M.T. & Wahlster, W. (dirs). San Francisco : Morgan Kaufmann Publishers. pp 99-106.

Milhaud, G. (1994). Un environnement pour la composition de phrases assistée. Thèse de doctorat en informatique. Marseille : Université Aix-Marseille II.

Murray, J.H. (1995). "Lessons Learned from the Athena Learning Project". In Intelligent Language Tutors, Holland, V.M., Kaplan, J.D. & Sams M.R. (dirs). Mahwah : LEA Publishers. pp 243-256.

Nigay, L. & Coutaz, J. (1996). "Espaces conceptuels pour l’interaction multimédia et multimodale". Technique et science informatiques (TSI), vol. 15, 9. pp 1195-1225.

Pasero, R.& Sabatier, P. (1994). "ILLICO for Natural Language Interface". Language Engineering Convention (LEC).

Pasero, R. & Sabatier, P. (1995). "Guided Sentences Composition : Some problems, solutions, and applications". 5th International Conference on Natural Language Understanding and Logic Programming (NLULP), Lisbonne. pp 33-44.

Piaget, J. & Inhelder, B. (1966). La psychologie de l’enfant. Paris : PUF.

Vieu, L. (1991). Sémantique des relations spatiales et inférences spatio-temporelles : Une contribution à l'étude des structures formelles de l'espace en Langage Naturel. Thèse de doctorat en informatique. Toulouse : Université Paul Sabatier.

Wahlster, W., André, E., Finkler, W., Profitlich, H.J. & Rist, T. (1993). "Plan-based integration of Natural Language and Graphics Generation". Artificial Intelligence, 63. pp 387-427.

EREL
Lisez-moi