Les attributs, leurs types, leurs valeurs - PowerPoint PPT Presentation

1 / 15
About This Presentation
Title:

Les attributs, leurs types, leurs valeurs

Description:

Un attribut a un type et des valeurs contraintes par ce type ... On peut additionner 2 distances. La distance entre un objet et lui-m me est z ro. Les types ... – PowerPoint PPT presentation

Number of Views:77
Avg rating:3.0/5.0
Slides: 16
Provided by: Scha89
Learn more at: http://www.csis.pace.edu
Category:

less

Transcript and Presenter's Notes

Title: Les attributs, leurs types, leurs valeurs


1
Les attributs, leurs types, leurs valeurs
  • Christelle Scharff
  • IFI
  • Juin 2004

2
Attributs
  • Un attribut a un type et des valeurs contraintes
    par ce type
  • Le type dun attribut peut être
  • Ordinal
  • Nominal
  • Intervalle
  • Ratio

3
Attributs à valeurs nominales
  • Les valeurs sont des symboles (des noms)
  • Exemple
  • Les valeurs de Temps sont Ensoleillé, Pluvieux,
    Neigeux, Gris
  • Aucune relation (ordre ou distance) entre les
    nominaux nexiste
  • Seuls des tests dégalité peuvent être exécutés
  • Exemple de règle
  • If Temps Pluvieux Then Match No

4
Attributs à valeurs ordinales
  • Une notion dordre simpose sur les ordinaux
  • Mais il nest pas possible de calculer
    directement des distances entre des valeurs
    ordinales
  • Les opérations daddition et de soustraction ne
    sont pas possibles
  • Exemple
  • La température est décrite par les adjectifs
    chaud, froid, moyen, et chaud gt moyen gt froid
  • Exemple de règle
  • If température gt froid Then match Yes

5
Attributs de type intervalle
  • Les intervalles impliquent une notion dordre, et
    les valeurs sont mesurées dans des unités
    spécifiques et fixées
  • La somme, la différence et le produit de 2
    intervalles ne sont pas possibles (car le point
    zéro nexiste pas)
  • Exemples
  • La température exprimée en degrés Celsius ou
    Fahrenheit
  • Lattribut année

6
Attributs de type rapport (ratio)
  • Toutes les opérations mathématiques sont
    autorisées sur les attributs de ce type
  • Exemple Lattribut distance
  • On peut comparer 2 distances
  • On peut additionner 2 distances
  • La distance entre un objet et lui-même est zéro

7
Les types des attributs en pratique
  • En général nominaux et ordinaux
  • Les attributs nominaux sont aussi appelés
    attributs discrets
  • Mais le terme discret implique une notion
    dordre
  • Les attributs ordinaux sont aussi appelés
    attributs numériques
  • Mais le terme numérique implique certaines
    opérations
  • Cas particulier Les attributs de type booléen

8
Transformation dordinaux en booléens
  • Un attribut de type ordinal à n valeurs peut être
    transformé en n-1 attributs de type booléen
  • Cette solution est plus appropriée que dutiliser
    un attribut de type nominal

9
Les attributs numériques
  • Les numériques sont identifiés aux réels
  • Les attributs numériques sont interprétés comme
    des ordinaux si les opérateurs de relation sont
    utilisés
  • Les attributs numériques sont interprétés comme
    des rapports sil est nécessaire de calculer des
    distances

10
Nominal versus Ordinal
  • Lutilisation dun ordinal peut permettre de
    simplifier les règles
  • Exemple
  • Age prend les valeurs Jeune, Adulte, Âgé
  • Si Age est un attribut nominal
  • If Age Jeune Then Loisirs Yes
  • If Age Adulte Then Loisirs Yes
  • If Age Âgé Then Loisirs No
  • Si Age est un attribut ordinal
  • If Age lt Adulte Then Loisirs Yes
  • If Age Âgé Then Loisirs No

11
Valeurs manquantes
  • Les données ne sont pas toujours collectées pour
    être fouillées
  • Les valeurs sont manquantes parce que inconnues,
    non nécessaires, non enregistrées
  • Exemples Non-fonctionnement du matériel, mesure
    non possible, temps
  • Parfois, une valeur manquante doit être détectée
    et ajoutée, car elle signifie quil y a un
    problème dans les données
  • Exemple Examen médical

12
Valeurs incohérentes
  • Les données ne sont pas toujours collectées pour
    être fouillées
  • Les valeurs sont incohérentes parce que des
    erreurs (délibérées ou non), des omissions, des
    duplications ont été introduites
  • Exemples
  • Erreurs typographiques dans les nominaux
  • Erreurs de mesure

13
WEKA Le format ARFF
Attributs numériques et nominaux
14
FDD et attributs
  • Les algorithmes de FDD dépendent beaucoup des
    types des attributs
  • Les valeurs manquantes et incohérentes doivent
    être détectées et traitées spécialement par les
    algorithmes

15
Réferences
  • I. H. Witten, and E. Frank. Data Mining 
    Practical Machine Learning Tools and Techniques
    with Java Implementations. Morgan Kaufmann.
Write a Comment
User Comments (0)
About PowerShow.com