Intelligence Artificielle I'A' - PowerPoint PPT Presentation

1 / 60
About This Presentation
Title:

Intelligence Artificielle I'A'

Description:

L'activit scientifique passe par onze tapes classiques: 1. Observation l mentaire: ... jour pour pouvoir s'appliquer des situations d'int r t actuel. ... – PowerPoint PPT presentation

Number of Views:772
Avg rating:3.0/5.0
Slides: 61
Provided by: CNRS
Category:

less

Transcript and Presenter's Notes

Title: Intelligence Artificielle I'A'


1
Intelligence ArtificielleI.A.
  • Basile Charasse
  • Laboratoire Neurosciencessystèmes sensoriels
  • bcharass_at_olfac.univ-lyon1.fr

2
Plan du cours
  • Introduction démarche scientifique
  • Les systèmes experts
  • Réseaux de Neurones
  • Applications

3
Introduction
  • Démarche scientifique modèle prédictif

Sciences physiques gt étude de la nature
Qu est ce que la démarche scientifique ?
4
Les 11 étapes de la science
  • L'activité scientifique passe par onze étapes
    classiques
  • 1. Observation élémentaire identifier et
    observer des phénomènes de manière fiable et
    répétitive, les mesurer
  • 2. Identification des éléments élémentaires
    distinguer, classifier, identifier, et nommer les
    observations

5
  • Découverte des éléments sous-jacents et de la
    dynamique sous-jacente identifier les influences
    évidentes et cachées, les liens directionnels et
    bidirectionnels entre phénomènes
  • Découverte de la structure identifier des
    structures ordonnées, structures hiéarchiques,
    structures hybrides
  • 5. Développement d'hypothèses explicatives
    entamer un processus d'abstraction, proposer une
    structure intégrée potentielle

6
  • Vérification d'hypothèses appliquer les
    principes de la plus grande simplicité (du
    "principe d'Occam", Occam's razor), et de la
    vérification indépendante
  • Proposition de théories proposer de grandes
    théories intégrantes
  • 8. Vérification de théories appliquer le
    principe de l'argumentation congruente,
    acceptation et rejet.

7
  • Développement de modèles prédictifs développer
    des modèles statiques et dynamiques, des modèles
    mathématiques et computationnels
  • 10. Vérification d'un modèle prédictif
    confronter systématiquement la prédiction et les
    informations de base en utilisant des
    informations connues et nouvelles

8
11. L'exploitation d'un modèle prédictif
promouvoir la compréhension d'un ensemble de
phénomènes, prédire la récurrence d'un phénomène
ou d'un comportement donné, exercer de
l'influence sur un phénomène ou un
comportement
9
Exemple dans lhistoire des sciences
La relativité générale d Einstein
Lune
étoile
Soleil
La théorie prévoit, le système est prédictif
Terre
10
Les systèmes experts
D'un système de prédiction par règles à un
système expert Origine des systèmes de prédiction
à règles          Les systèmes de prédiction par
règles sont anciens et fort répandus. On pense
notamment aux almanachs des agriculteurs
(calendriers de prévisions météorologiques
associées à des conseils de travaux à effectuer à
chaque saison). Au cours des siècles, les bases
astronomiques pour ces règles sont devenues assez
complexes. Ces règles prennent la forme de le
jour x, il est propice de faire y ce qui
correspond logiquement à la règle si...alors de
si le jour x, alors fais y  
11
  • Règles simples, règles complexes, systèmes
    experts
  • Les règles sont partout. La société humaine est
    gouvernée par des règles explicites ("garder la
    droite", "virage permis après stop", "il faut
    être ponctuel", etc.)
  • Un système de règles informatique peut capter
    presque n'importe quel jeu de règles. Un système
    expert formalise un ensemble complexe de telles
    règles (les lois d'un pays, un système de lois en
    chimie, un système de règles d'interconnexion
    électrique, etc.).
  • Systèmes experts. Comme le nom le suggère, un
    système expert diffère d'un système de règles par
    sa complexité. Dans le cas d'un système expert,
    l'assistance d'un expert dans un domaine donné
    est requise pour créer le système.

12
  • Un système expert codifie un fonctionnement.
    Cependant, l'intérêt central d'un système expert
    est la promesse de la prédiction automatique. En
    théorie, si les connaissances d'un domaine donné
    sont bien codifiées, n'importe quelle
    connaissance humaine peut être convertie en
    système de connaissances informatiques.
  • Importance des systèmes de règles/experts. En
    dépit des difficultés de création de systèmes
    experts, les systèmes à règles et les systèmes
    experts représentent les seuls moyens réalistes
    de formalisation d'un ensemble de connaissances.

13
  • La connaissance à codifier dans un système expert
  • Créer un système de raisonnement automatique
    n'est pas facile.
  • Chaque domaine du savoir humain est caractérisé
    par un ensemble de connaissances amples et
    détaillées.
  • Ces connaissances évoluent dans le temps
    Régulièrement, il y a ajout et remplacement de
    connaissances.
  • Ces connaissances sont structurées. Il existe
    une série de relations loisibles entre les
    différents segments dun domaine de
    connaissances, résumées par des hypothèses et
    théories. Régulièrement, ces hypothèses et
    théories subissent des modifications, ajouts ou
    un remplacements.

14
  • Pour qu'un système de règles soit profitable (du
    moins autant ou même plus qu'un expert humain),
    il doit être suffisamment complexe pour avoir une
    puissance de prédiction intéressante (dépassant
    typiquement les pouvoirs d'inférence de "M
    Tout-le-monde") et suffisamment à jour pour
    pouvoir s'appliquer à des situations d'intérêt
    actuel.

15
Composants d'un système expert
Formellement, un système expert consiste dans les
modules suivants          Les bases de
connaissances l'information à long terme, les
"faits reconnus" ou "faits permanents" d'un
domaine.          Un ensemble (ou "une base") de
faits à considérer l'information à court terme,
les faits sous considération immédiate, les
"faits à examiner".          Un "moteur
d'inférences" ou un interpréteur un ensemble de
règles "si - alors" permettant des inférences sur
les faits stockés dans les bases de connaissance
et de faits à examiner.
16
Développement d'un système expert
      Raisons favorisant le développement d'un
système expert          Existence d'un grand
nombre d'observations systématiques        
Existence d'une procédure d'analyse et de prise
de décisions acceptée         Importance des
paramètres qualitatifs, non seulement
quantitatifs solution algorithmique
impossible         Solutions souhaitées non
évidentes du premier coup, ou difficiles à
obtenir autrement         Intérêt économique du
projet (disponibilité d'une information
intelligente 24/24h, complexité excessive, etc.)

17
         Participants au développement
         Un ou plusieurs experts du domaine,
capable et intéressé à formaliser les procédures
d'analyse et de prise de décisions.         Un
ou plusieurs "ingénieurs de la connaissance",
capable(s) et intéressé(s) à formaliser les
connaissances sous forme d'un système expert.
18
     Phases de développement 1.      
Spécification du cahier des charges2.      
Choix d'une architecture du système, de son
interface utilisateur, et d'un langage de
traitement. Prévision des mécanismes de
modification ultérieure du système3.      
Sélection d'un sous-ensemble représentatif du
problème pour l'élaboration d'un
démonstrateur4.       Acquisition des
informations et élaboration du mécanisme
d'ajout et de modification de
la base de connaissances5.       Implantation du
"moteur d'inférences" (règles d'inférence)6.
Test, ajustement et documentation du système
19
L'utilisation d'un système expert
           Coût Des milliers de systèmes
experts sont actuellement en utilisation. La
constitution d'un système expert représente un
investissement important. Il est donc
important de souligner les atouts tout comme
les limites de tels systèmes.         
Atouts L'expérience montre que ce type de
système est utile dans un contexte
d'informations stables et bien définies,
p.ex.          Vérification de lois et de
règlements          Vérification de la
compatibilité entre différents équipements, Dia
gnostic  etc.
20
             Limites Par contre, ce type de
système est mal adapté à l'évaluation de
conditions mal circonscrites, comme l'entrée
sonore de la parole humaine, la surveillance
d'une chaîne de production, l'interprétation de
n'importe quel "pattern" ou schéma visuel,
acoustique, etc., comme les sondages
météorologiques, une séquence vidéo, etc. Pour
ces dernières applications, on applique de
préférence les "réseaux neuronaux" et les
"algorithmes génétiques" avec beaucoup plus de
succès que les systèmes experts         
Systèmes hybrides Un grand nombre d'applications
courantes invitent l'utilisation de concepts de
type 'système expert' pour les aspects stables et
de concepts de type "réseaux neuronaux" ou
"algorithmes génétiques" pour l'acquisition et
l'interprétation initiale des informations.
21
Exemple
22
 1.       Base de connaissances. Supposons une
base de connaissances contenant les faits
schématisés dans le tableau ci-dessous ("garçon",
"Daniel", "singe"). 2.       Faits à examiner
Est-ce que la proposition "Daniel ressemble à un
singe" est vraie ou fausse? 3.       Moteur
dinférences La partie "moteur d'inférences" du
système expert contient, parmi dautres, deux
règles          RESSEMBLANCE. Si la phrase
contient "ressembler à", alors appliquer la règle
ANALOGIE.          ANALOGIE. S'il existe au
moins deux relations de partage, dégalité ou de
descendance entre au moins un trait examiné et un
trait permanent, la relation danalogie est
VRAIE. Dans le cas contraire, la relation est
FAUSSE.
23
Les règles de partage-égalité-descendance
suivantes s'appliquent          Daniel a 7
ans, un singe a gt 0 ans relation de
descendance, car gt 0 inclut 7.          Daniel
et les singes adorent les bananes relation de
partage          Daniel grimpe souvent sur les
arbres et les singes grimpent habituellement sur
les arbres relation de partage, car
"habituellement" est sémantiquement proche de
"souvent". Il existe au moins trois analogies.
La proposition est donc jugée VRAIE.
24
Résumé
1.       Concepts traités. Les systèmes experts
sont en mesure de traiter rapidement,
systématiquement et de manière intuitivement
plausible des concepts provenant dun très grand
nombre de domaines, y-compris des domaines des
sciences humaines. Un système expert peut
appliquer des règles dans nimporte quel ordre de
saillance souhaité par le programmeur.
25
2.       Prédominance des connaissances.
Lexpérience des 20 dernières années a souligné
limportance cardinale du stockage structuré des
connaissances. Selon deux des premiers inventeurs
des systèmes experts, le stockage et la
manipulation damples connaissances joue un rôle
plus important dans la réussite dun système
expert que la conception des règles de traitement
(Feigenbaum Buchanan, 1993).
26
3. Application. Les systèmes experts peuvent
facilement et rapidement résoudre des problèmes
de type "contraintes stables, multiples et
complexes". Par conséquent, ces systèmes sont
fort utiles pour le traitement dinformations
stables et peu variables, comme lapplication
dun réglement, la planification de travaux
étendus, la réservation de billets, la découverte
de compositions chimiques, la configuration de
systèmes informatiques, etc.
27
Les réseaux de neurones
28
Introduction aux réseaux de neurones
Réseaux de neurones formels Les réseaux de
neurones formels sont à l'origine une tentative
de modélisation mathématique du cerveau humain.
Les premiers travaux datent de 1943 et sont
l'oeuvre de MM. Mac Culloch et Pitts. Ils
présentent un modèle assez simple pour les
neurones et explorent les possibilités de ce
modèle. L'idée principale des réseaux de
neurones "modernes" est la suivante On se
donne une unité simple, un neurone, qui est
capable de réaliser quelques calculs
élémentaires. On relie ensuite entre elles un
nombre important de ces unités et on essaye de
déterminer la puissance de calcul du réseau ainsi
obtenu. Il est important de noter que ces
neurones manipulent des données numériques et non
pas symboliques.
29
Deux visions s'affrontent donc, d'un côté les
tenant de la modélisation biologique qui veulent
respecter un certain nombre de contraintes liées
à la nature du cerveau, de l'autre les tenants de
la puissance de calcul qui s'intéressent au
modèle en lui-même, sans aucun lien avec la
réalité biologique. Dans la suite je présente le
point de vue biologique afin d'aboutir au modèle
des perceptrons multicouches, le type de réseaux
de neurones le plus utilisé actuellement.
30
Un modèle biologique
Cette section décrit un modèle très grossier des
neurones biologiques qui a servi à la mise en
place des premiers neurones formels. Dans le
cerveau, les neurones sont reliés entre eux par
l'intermédiaires d'axones et de dendrites. En
première approche. on peut considérer que ces
sortes de filaments sont conducteurs
d'électricité et peuvent ainsi véhiculer des
messages depuis un neurone vers un autre. Les
dendrites représentent les entrées du neurone et
son axone sa sortie.
31
Un neurone émet un signal en fonction des signaux
qui lui proviennent des autres neurones. On
observe en fait au niveau d'un neurone, une
intégration des signaux reçus au cours du temps,
c'est à dire une sorte de sommations des signaux.
En général, quand la somme dépasse un certain
seuil, le neurone émet à son tour un signal
électrique.
32
Un neurone formel
Le modèle Le modèle de neurone formel présenté
ici, du à Mac Culloch et Pitts, est un modèle
mathématique très simple dérivé d'une analyse de
la réalité biologique. On constate tout d'abord
que le modèle biologique fait intervenir une
notion temporelle qui est difficile à intégrer
dans un modèle simple. On oublie donc cette
notion et de ce fait on remplace l'intégration
temporelle par une simple sommation des signaux
arrivant au neurone (ces signaux sont communément
appelés les entrées du neurones).
33
On compare ensuite la somme obtenue à un seuil et
on déduit de la comparaison la sortie du neurone.
Cette sortie sera par exemple égale à 1 si la
somme est supérieure au seuil et à 0 dans le cas
contraire. Plus formellement encore, il suffit
pour obtenir ce comportement de soustraire le
seuil considéré à la somme des entrées, et de
faire passer le résultat par la fonction de
transfert du neurone qui est ici la fonction de
heaviside. Le résultat après transfert est alors
la sortie du neurone. Cette enchaînement
"sommation" puis "non-linéarité" représente
finalement les propriétés "physiques" du neurone.

34
En résumé, un neurone formel réalise simplement
une somme pondérée de ces entrées, ajoute un
seuil à cette somme et fait passer le résultat
par une fonction de transfert pour obtenir sa
sortie.
35
Réseau de neurones
L'idée principale est de grouper des neurones
dans une couche. On place ensuite bout à bout
plusieurs couches et on connecte complètement les
neurones de deux couches adjacentes. Les entrées
des neurones de la deuxième couche sont donc en
fait les sorties des neurones de la première
couche. Les neurones de la première couche sont
reliés au monde extérieur et reçoivent tous le
même vecteur d'entrée (c'est en fait l'entrée du
réseau). Ils calculent alors leur sorties qui
sont transmises aux neurones de la deuxième
couche, etc. Les sorties des neurones de la
dernière couche forment la sortie du réseau.
36
Neurones en reseau
37
Comment ca marche en pratique
  • Phase dapprentissage
  • Rétropopagation du gradient
  • Validation

38
Phase dapprentissage
  • On donne des exemples au reseau
  • Par un algorithme dapprentissage le réseau
    ajuste ses poids pour minimiser une erreur
  • Quand lerreur cible est atteinte le réseau est
    prêt

39
Rétropopagation du gradient
  • Consiste a regarder la difference entre la valeur
    cible attendue par le réseau et la valeur donnée
    par le réseau lors de la phase dapprentissage
  • Le réseau modifie ses propres poids en fonction
    du gradient de cette différence

40
(No Transcript)
41
Phase de test
Consiste à regarder si le comportement du réseau
est satisfaisant sur un ensemble dexemples !! On
quantifie alors la zone de confiance du réseau de
neurone
42
Avantages des réseaux de neurones
  • Capacité de représenter n'importe quelle
    dépendance fonctionnelle. Le réseau découvre
    (apprend, modélise) la dépendance lui-même sans
    avoir besoin qu'on lui "souffle" quoi que ce
    soit. Pas besoin de postuler un modèle, de
    l'amender, etc.
  • On passe directement des données au prédicteur,
    sans intermédiaire, sans recodage, sans
    discrétisation, sans simplification ou
    interprétation sujette à caution.
  • Résistance au bruit ou au manque de fiabilité des
    données.

43
  • Grande variété possible dans la variable
    prédite  oui/non, valeur continue, une ou
    plusieurs classes parmi n, etc.
  • Simple à manier, beaucoup moins de travail
    personnel à fournir que dans l'analyse
    statistique classique. Aucune compétence en
    maths, informatique ou statistiques requise. Pas
    besoin de détecter les colinéarités, non plus.
  • En segmentation, le réseau de neurones détermine
    de lui-même combien de clusters distincts
    renferme chaque classe.

44
  • Comportement moins mauvais en cas de faible
    quantité de données.
  • Pour l'utilisateur novice, l'idée d'apprentissage
    est plus simple à comprendre que les complexités
    des statistiques multivariables.
  • Consultation rapide (10 microsecondes câblé - 50
    millisecondes sur IBM-PC).

45
Inconvénients des réseaux de neurones
Le problème de la "boîte noire"  la validation
du modèle neuronal La validation se fait par test
sur un certain nombre de dossiers passés, dont on
connaît l'issue, que l'on a écartés de
l'échantillon d'apprentissage et réservés à cet
effet. On compare la prédiction de risque faite
par le réseau de neurones sur ces dossiers dits
"de test" avec la réalité survenue. La
performance se mesure en pourcentage de
reclassements exacts, ou bien en pourcentage de
déviation des valeurs attendues.Cette méthode de
validation est parfaitement objective, courante
en analyse de données et peut être appliquée à
toute technique ou même pour évaluer une personne
experte.
46
exemple
47
Reconnaissance de visages
A b c d
a) Images originales apprises à gauche. b) Clefs
soumises en entrée au réseau. c) Images
restituées par le réseau lorsque 160 images ont
été stockées. d) Images restituées par le réseau
lorsque 500 images ont été stockées.
48
résumé
49
Exemple
Le système NRT
50
(No Transcript)
51
Limplant cochleaire
52
(No Transcript)
53
(No Transcript)
54
(No Transcript)
55
Le système NRT
Cest un système qui permet denregistrer la
réponse du nerf auditif à la suite dune
stimulation électrique.
56
(No Transcript)
57
(No Transcript)
58
(No Transcript)
59
Quel est linterêt de ce système ?
Potentiels evoqués
60
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com