La notion de corpus dapprentissage dans le projet Mulce change de corpus multimodaux d'apprentissage - PowerPoint PPT Presentation

Loading...

PPT – La notion de corpus dapprentissage dans le projet Mulce change de corpus multimodaux d'apprentissage PowerPoint presentation | free to view - id: 2a86cd-MGJmN



Loading


The Adobe Flash plugin is needed to view this content

Get the plugin now

View by Category
About This Presentation
Title:

La notion de corpus dapprentissage dans le projet Mulce change de corpus multimodaux d'apprentissage

Description:

Acte de forum avec Simuligne. Gallia : Messages du forum E0A3_RDV_bavardage. Message ... Acte de forum avec Simuligne workspaces workspace name E0A3 ... – PowerPoint PPT presentation

Number of Views:140
Avg rating:3.0/5.0
Slides: 31
Provided by: Nor109
Category:

less

Write a Comment
User Comments (0)
Transcript and Presenter's Notes

Title: La notion de corpus dapprentissage dans le projet Mulce change de corpus multimodaux d'apprentissage


1
La notion de corpus dapprentissage dans le
projet Mulce (Échange de corpus multimodaux
d'apprentissage )
  • Thierry CHANIER, Christophe REFFAY,
  • Université de Franche-Comté
  • (avec le concours de Marie-Laure Betbeder, Muriel
    Noras)
  • http//mulce.univ-fcomte.fr

Symposium "Designing, Re-Using And Exchanging
Online Learner Corpora" Epal Conference "Learning
Through Online Exchanges", Grenoble , France , 7
- 9 June 2007
Projet Mulce soutenu par
2
Notions de corpus dans différents projets en
linguistique et en interactions
3
Une variété d'acceptions (non retenues)
  • (ling.) ensemble limité des éléments (énoncés)
    sur lesquels se base létude dun phénomène
    linguistique
  • (lexicométrie) ensemble de textes réunis à des
    fins de comparaison, servant de base à une étude
    quantitative
  • On utilise le mot "corpus" dans
  • Corpus existant ou latent
  • Corpus de référence
  • Corpus d'étude
  • Corpus distingué

Bommier-Pincemin (1999)
4
Au delà d'un rassemblement d'objets
  • "Le corpus se définit de fait comme lobjet
    concret auquel sapplique le traitement, quil
    sagisse dune étude qualitative ou
    quantitative".
  • "réserver le terme corpus pour les ensembles de
    textes rassemblés pour lanalyse et qui en
    fournissent le contexte (cf. corpus de référence,
    corpus détude)".
  • "Le fonds documentaire désignerait alors
    lensemble des textes à disposition (de
    préférence à corpus existant)"
  • "quant au corpus distingué, il correspond
    habituellement à ce que lon appelle
    sous-corpus".
  • Donc pour l'auteur

Corpus fonds documentaire cadre / contexte
Bommier-Pincemin (1999)
5
Projet Freebank
  • Base de corpus du français annotés à plusieurs
    niveaux, libre d'accès, codée selon schémas
    normalisés, intégrant ressources existantes et
    ouverte à l'enrichissement progressif.
  • Corpus collection de données relative à une
    certaine couverture linguistique, vue en tant
    qu'objet d'études linguistiques ou littéraires.
  • Pour les auteurs

Corpus ressources niveaux de description
(avec dépendances)
(http//www.loria.fr/projets/freebank)
Salmon-Alt, Romary, J.-M. Pierrel (2004)
6
Projet Freebank un exemple
Texte brut (Père Goriot)
7
Projet Clapi et interactions orales
  • Le projet corpus de langue parlée en
    interaction enregistrée en situation réelle,
    dans des contextes variés
  • Les corpus sont constitués dobjets multimédias
    documentant une ou plusieurs interactions. Ces
    interactions constituent un corpus dans la mesure
    où elles présentent une certaine homogénéité qui
    peut provenir d'une unité de site, d'une unité
    d'activité ou de genre interactionnel , etc.
  • Corpus
  • données primaires ( enregistrements audio ou
    vidéo, etc., anonymisation)
  • données secondaires les représentations des
    données primaires, notamment les différentes
    formes de transcription, accompagnées de leurs
    conventions de transcription, etc..
  • Métadonnées
  • Plate-forme Clapi Accès (restreint) corpus
    outils recherche (libre sur tous les corpus)

http//clapi.univ-lyon2.fr
Plantin, Mondada et al. (2005)
8
Projet Clapi exemple
Recherche sur unité lexicale accord
Infos sur corpus (métadonnées)
Infos sur participants dans extrait accessible
9
Quelques caractéristiques
  • Visées scientifiques (approfondissement
    recherche dans partage / confrontations entre
    équipes dispersées), appliquées (éducatives),
    patrimoniales
  • Vues et rôles dans base de corpus
  • 1) Déposer responsables et contributeurs corpus
    (transcripteurs, collecteurs, etc.)
  • 2) Organiser, diffuser éditeurs base
  • 3) Utiliser chercheurs, formateurs, anonyme
  • Les éditeurs créent / organisent structures,
    modèles pour représenter et documenter les
    données en vue de l'étude (renseigner la
    démarche)
  • Critères de qualité comme signifiance ,
    acceptabilité, exploitabilité
  • Pour échanger (avec ceux qui déposent ou
    utilisent), importance
  • Interopérabilité, formats d'échange, standards
    (pour les métadonnées, comme pour les données)

10
Corpus d'apprentissage vue par Mulce
  • Objet d'études
  • Interactions, production des participants engagés
    dans une situation de formation / apprentissage
    en ligne

11
Enjeux pour la recherche sur les Tice
  • Quelle validité accordée à une expérimentation
    rapportée dans un article (cf. Henri, 2005 sur
    situations collaboratives en FAD) ?
    S'applique-t-elle
  • A un contexte donné ? Avec un dispositif fixé ?
    Pour une population donnée ? Pour une culture ?
    Pour un type dapprentissage spécifique ?
  • Données et contexte manquent
  • Il faudrait pouvoir
  • reproduire une expérimentation à partir d'un
    scénario explicité
  • Sur des données sources identiques refaire des
    analyses suivant même étude des variables,
    suivant autres variables (invalider, confirmer,
    compléter) cas rares, cf. Kern
  • Construire de nouvelles analyses sur d'autres
    faites précédemment cf. Projet Lund, Girardot

12
Enjeux pour la recherche sur les Tice
  • Disposer d'environnement d'utilisation ayant des
    capacités de fouilles inter-corpus (pas seulement
    intra) sur des critères caractérisant l'objet
    d'études pour
  • élargir le champ de ces études,
  • inviter à de nouveaux questionnements
  • Motivations principales des utilisateurs dans
    Clapi
  • Les standards de la e-formation sont pensés pour
    la réutilisabilité de ressources et de scénarios
    pédagogiques sans considération d'impact sur les
    apprentissages
  • Associer ces scénarios et les données recueillies
  • Élargir les enjeux de la standardisation

13
Notion de corpus d'apprentissage
  • Objet d'études interactions, production des
    participants engagés dans une situation de
    formation / apprentissage en ligne (complétés par
    les traces des actions laissés par ces acteurs
    dans le système)
  • courriel, forums, clavardage, collecticiels,
    vidéo d'écran, audio.
  • Participants  apprenants et formateurs
    (tuteurs).
  • Le cadre (ou contexte) qui permet au chercheur à
    la fois de donner du sens à ces données (offrir
    un cadre interprétatif) et d'ouvrir la porte aux
    analyses est constitué principalement par
  • Le cadre pédagogique scénario pédagogique
    (environnement technologique compris) ,
    participants
  • Le cadre de recherche (s'il existe), qui peut lui
    aussi apporter son lot de données primaires sur
    les acteurs (questionnaires, entretiens,  etc.).
  • Le tout (données et contexte) organisé en vue de
    l'analyse de ses situations d'apprentissage en
    ligne.

14
Interactions situées
  • Les différentes dimensions de ces interactions
    situées (linguistiques, situationnelles et liées
    aux contraintes imposées par le medium de
    communication) nécessitent que les données
    recueillies le soient selon un protocole assurant
    une large couverture, et quelles soient
    organisées de façon à permettre 
  • de situer la lecture des traces dans le contexte
    de la situation dapprentissage
  • de saisir les contraintes de lenvironnement les
    ayant générées
  • dappliquer des analyses automatisables sur des
    données numériques standardisées. Ces conditions
    permettent denvisager le développement doutils
    de suivi de la formation par les acteurs tels que
    des tableaux de bord.

15
Deux granularités principales dans le corpus de
base
  • Corpus global de base
  • Données contexte liées à une formation
    considérée dans son ensemble
  • 3 corpus de base issus de recherche antérieures
    Simuligne (avec Interculture), Copéas, Tridem
  • Corpus distinguable
  • Sous-corpus rassemblant un ensemble de données
    d'une taille suffisante pour être l'objet d'une
    recherche spécifique, données dont on veut
    caractériser la cohésion d'ensemble par rapport
    au corpus de références (global de base)
    contexte
  • Exemple
  • ensemble des forums d'un groupe Simuligne
  • une session d'un groupe d'apprenant Copéas dans
    environnement audio-graphique synchrone
  • Corpus étendu
  • 1 ou plusieurs niveaux de description / analyse
    corpus de base
  • Transcriptions font partie du corpus de base et
    corpus distinguables

16
(No Transcript)
17
Schéma simplifié des parties d'un corpus global
de base
Environnement d'utilisation
Scénario pédagogique
Contexte
licence
Instanciation
Analyses
privée
Protocole de recherche
18
Après
Avant
Pendant
Manifeste Mulce_struct
Scénario Pédago
Analyses
Protocole Recherche
Instanciation
Licence
Approche Péda _______ Activités Rôles Environ.
Questions Méthodo État art _______ Protocole Acti
vités Rôles Environ.
  • Licences
  • Utilisation
  • dépôt
  • _______
  • éditeurs
  • Droits accès
  • (anonyme/AO)
  • Contrat
  • cession acteurs
  • Anonymisation

Observations Agenda _______ Acteurs / groupes
(codes acteurs) Outils Interactions
structurées
Méta
Descrip
Index ressources
SP Consignes Aides Ressour AP Articles
INST Rec question., réflex. Peda Produits,
traces Fichier suivi
LIC Proc Anony. Contrat cession
Données primaires
PR Question Grilles entretien Article
19
Scénario pédagogique exemple Simuligne
Niveau étape structures d'activités
Niveau activité activités apprentissage /
support, environnements, rôles
Logiciel Motplus (Licef, 2007)
20
Instanciation des acteurs et des environnements
  • Description des acteurs qui sont les acteurs de
    la situation (tuteurs, apprenants), quels sont
    les groupes.
  • Description des environnements technologiques
    déterminer quels sont les outils utilisés et
    déterminer comment (selon quelles
    caractéristiques) les traces / transcriptions
    seront organisées.
  • Incorporation des traces / transcriptions dans
    ces environnements

21
Environnements
Plate-forme, espaces de travail, type d'acte
22
Acte de forum avec Simuligne
Gallia Messages du forum E0A3_RDV_bavardage Mess
age numéro 18Sujet Rencdez-vous pour
EOA3Posté par GalliaLe 30/4/2001A
19h54Premier message Chers tous, Comme vous le
savez, nous devons trouver des dates pur nous
rencontrer virtuellement dans le bavardoir (avec
une tasse de thé virtuelle ? Vosu prenez du sucre
?) Je vous propose donc les dates suivantes
-mardi 8 19h - mercredi 9 19h ou 20h - jeudi 19
19h ou 20h - vendredi 19h ou 20h - samedi 19h A
vosu de me dire ce que vous préférez. On essaiera
d'organiser 2 ou 3 groupes. A bientôt de vous
"rencontrer" Amitiés Annie Message numéro
19Sujet Rencdez-vous pour EOA3Posté par
vickersLe 30/4/2001A 22h45Réponse au
message 18 Bonsoir, Comment allez-vous? Je viens
de lire vos propositions de dates pour notre
premier rendez-vous. Je préférai mercredi 9 mai à
20h. Mais je préfére prendre du café au lait sans
sucre avec un bon petit pain au chocolat à la
française. Yum,Yum. à bientôt, Jennie
23
Acte de forum avec Simuligne
ltworkspacesgt ltworkspacegt ltnamegtE0A3lt/namegt lttool
sgt lttool tool_type"forum" id"idForum0"gt ltnamegt
E0A3_RDV_bavardagelt/namegtlt/toolgt lt/toolsgt ltactsgt lt
act id"idAct5"gt ltauthor id_member"idMember6"
/gt ltact_typegt ltforum_act gt ltfathergtidAct4lt/fath
ergt lt! lacte 4 correspond au message
18--gt ltsubjectgtRencdez-vous pour
EOA3lt/subjectgt ltf_contentgt ltcontentgtBonsoir,
Comment allez-vous? Je viens de lire vos
propositions de dates pour notre premier
rendez-vous. Je préférai mercredi 9 mai à
20h. Mais je préfére prendre du café au lait
sans sucre avec un bon petit pain au chocolat à
la française. Yum,Yum. à bientôt,
Jennielt/contentgt lt/f_contentgt lt/forum_actgt
lt/act_typegt ltbeginning_dategt2001-04-30lt/beginnin
g_dategt lt/actgt lt/actsgt ltbeginning_dategt2001-04-30lt
/beginning_dategt ltending_dategt2001-04-30lt/ending_d
ategt lt/workspacegt lt/workspacesgt
24
Plate-forme Mulce et corpus distinguable
sélection recherche concordances,
visualisation.
Environnement utilisateur
Scénarios péda et recherche du corpus global
Hiérarchie des sous-corpus du corpus global
Métadonnées Sous_parties de Contexte
Acteurs Date etc.
Corpus distinguable
Autres doc, articles
Session Lyceum 1 Transcription 1
vidéo
alignement
licence
Schéma forum
Schéma global Mulce_struct
Schéma session Lyceum
Schémas
25
Exemple de visualisation
Session Synchrone Lyceum, Formation
Copéas, Visualisation des interactions
multimodales (clavardage, audio, icônes,
collecticiel)
26
Interopérabilité et standards
  • Scénario pédagogique IMS-Learning Design
  • Métadonnées Dublin Core
  • Instanciation acteurs IMS-Enterprise
  • Empaquetage général pour échange IMS-CP
  • Exportation données interactions XML, format
    propre (TEI ?)

27
(No Transcript)
28
Rappel partager production scientifique et
démarche scientifique
  • Facilitate the advancement of knowledge in the
    social sciences and humanities by encouraging
    researchers to share research data. Sharing data
    strengthens our collective capacity to meet
    academic standards of openness by providing
    opportunities to further analyze, replicate,
    verify and refine research findings.
  • Such opportunities enhance progress within fields
    of research as well as support the expansion of
    inter-disciplinary research. In addition, greater
    availability of research data will contribute to
    improved training for graduate and undergraduate
    students, and, through the secondary analysis of
    existing data, make possible significant
    economies of scale. Finally, researchers whose
    work is publicly funded have a special obligation
    to openness and accountability
  • Research data includes quantitative social,
    political and economic data sets qualitative
    information in digital format experimental
    research data still and moving image and sound
    data bases and other digital objects used for
    analytical purposes.

SSHRC (conseil recherche sciences humaines Canada
) Research Data Archiving Policy
2005 http//www.sshrc.ca/web/about/policies/edata_
e.asp
29
Enjeux Comparaison et capitalisation
C3
Niveau 3
A2
C2
Niveau 2
D2
Analyses
?
A1
A1
C1
Niveau 1

Fichiers
Index - - - -
Corpus d'apprentissage
Niveau 0
BD
30
(No Transcript)
About PowerShow.com