Recherche Information Web - PowerPoint PPT Presentation

1 / 40
About This Presentation
Title:

Recherche Information Web

Description:

Altavista, Webcrawler, Infoseek, Lycos, Ecila, Lokace, yahoo,voila... Interrogation par ... par discipline. Recherche ECN. Compl tion. automatique. Affichage mots clefs. Section ENC ... – PowerPoint PPT presentation

Number of Views:52
Avg rating:3.0/5.0
Slides: 41
Provided by: hplb
Category:

less

Transcript and Presenter's Notes

Title: Recherche Information Web


1
Recherche Information Web
2
Recherche sur Internet
  • Plusieurs centaines doutils de recherche sur des
    informations ciblées à partir de questions
  • Recherche par Sujet (annuaire)
  • Hiérarchies (Yahoo)
  • WAIS, Sélection de sources
  • Indexation plein texte
  • Altavista, WebCrawler, Virtual Library,
    Excite,Voilà
  • Google

3
Recherche sur Internet
  • Recherche par mots clés ou thésaurus
  • Recherche sur tous les mots gt 2 caractères
  • Serveurs indexeurs
  • Indexation automatique du document
  • Soit sur demande
  • Altavista, Webcrawler, Infoseek, Lycos, Ecila,
    Lokace, yahoo,voila...
  • Interrogation par Opérateurs logique (et, ou,
    sauf)
  • Problèmes
  • du bruit/silence
  • les mêmes serveurs apparaissent plusieurs fois

4
Interrogation Base Documentaire
Documents pertinents
Documents extraits
requêtes
Base Documents
Systèmes Information Documentaire
5
Recherche dInformation
  • Précision
  • P Nombre de documents pertinents extraits
  • Nombre de documents extraits
  • Bruit
  • B Nombre de documents non pertinents extraits
  • Nombre de documents extraits

B 1 - P
6
Recherche dInformation
  • Rappel
  • R Nombre de documents pertinents extraits
  • Nombre de documents pertinents
  • Silence
  • S Nombre de documents pertinents non extraits
  • Nombre de documents pertinents

S 1 - R
7
Recherche dInformation
  • Annuaire
  • Construit manuellement
  • Listes de sites sous ensemble correspondant a des
    rubriques
  • Rubriques
  • Actualités
  • Enseignement ..
  • Informatique et internet
  • Science et technologie
  • Sciences humaines
  • Santé
  • Sport

8
Recherche dInformation
  • Annuaire
  • Yahoo.com ou fr
  • Deux modes d utilisation
  • Hiérarchique Rubrique , sous rubrique
  • Listes de sites centrés sur thème recherché
  • Recherche arborescente puis séquentielle
  • Recherche par mot clé
  • On obtient Rubriques
  • Sites avec bref descriptif

9
Recherche dInformation
  • Avantages
  • Navigation guidée efficace
  • Sites sélectionnés centrés sur thème recherché
  • Recherche arborescente puis séquentielle
  • Inconvénients
  • Taille annuaire réduite (fonction du temps
    humain)
  • On ne trouve que ce qui a été classé par
    gestionnaire annuaire
  • Mise a jour limitée

10
Les Moteurs de Recherche
  • Développés pour rechercher dans les serveurs Web
  • Principe similaire à ceux de Wais
  • - Recherche des documents sur tous les mots (gt2
    caractères)
  • - Indexation des documents contenant des mots
    (anglais le plus souvent)
  • - Listes des documents avec URL
  • - Requêtes plus sophistiquées (et, ou,non)
  • - Rapatriement des documents eux-mêmes

11
Moteur Recherche dInformation
  • Méthodes
  • Indexation par moteur qui passe sur toutes les
    pages web des sites
  • Indexe sur tous les mots gt 2 caractères
  • Indexe nouvelles pages et contenus de maniere
    continue
  • Pondère les documents recherchés
  • Recherche
  • Mot ou groupe de mots
  • Opérations Logiques (ET OU SAUF)
  • Classement des résultats par fréquence
    (apparition des mots , visites du site )

12
Opérateurs Logiques
  • Opérateurs Logiques (Booléens)
  • a ET b a b a ET b
  • V V V
  • V F F
  • F V F
  • F F F
  • a OU b a b a OU b
  • V V V
  • V F V
  • F V V
  • F F F
  • NON a a NON a
  • V F
  • F V

13
Moteur Recherche dInformation
  • Google
  • Indexation par moteur qui passe sur toutes les
    pages web des sites
  • Ignore les articles, adverbes .
  • Ignore Majuscules Minuscules
  • Par defaut ignore les accents
  • Recherche
  • ET logique si plusieurs mots
  • Exclusion de mots SAUF (-)
  • Ou (OR)
  • Expression entre   
  • Forcer à chercher un mot

14
Moteur Recherche dInformation
  • Google
  • Plus de 10 milliards de page en toutes les
    langues
  • Temps de réponse tres rapide (lt0.5S)
  • Sélection des pages en fonction d une requete
  • Classement avec algoritme declassement en
    fonction fréquence et de la popularité d une page
  • Ignore Majuscules Minuscules
  • Par defaut ignore les accents
  • Recherche
  • ET logique si plusieurs mots
  • Exclusion de mots SAUF (-)
  • Ou (OR)
  • Expression entre   
  • Forcer à chercher un mot

15
Moteur Recherche dInformation
  • Choix mot clés
  • Choisir des noms
  • Mots les plus probables dans pages recherchées
  • Précis et bref
  • Mots concrets
  • Mots importants en Tête
  • Rechercher Phrases si possible
  • Ex (sanglots longs des violons )
  • Limites
  • Pas de mots dérivés (canal mais pas canaux)
  • Limite a 32 mots
  • Ignore la ponctuation et signes spéciaux
  • Favorise pâges avec mots dans le même ordre
  • Etendre recherche fichier texte (.doc .pdf ..)

16
Moteur Recherche dInformation
  • Google
  • Moteur le plus utilisé
  • Variante géographique (google earth)
  • Variante Scientifique (scholar)
  • On y trouve toujours quelquechose
  • Recherche Simple
  • Pas de prise en compte des Majuscules
  • Pas de motsde 2 carateres sauf si précéde de
  • Pas daccent , ni suigne diacritiques(Cédille,
    trema,tilde )
  • Dans toute la page, le titre ,adresses
  • Expression exacte entre   
  • Selon le type de format de fichier
  • Etendre recherche fichier texte (.doc .pdf ..)

17
Moteur Recherche dInformation
  • Google
  • Moteur le plus dynamique
  • Variante géographique (google earth)
  • On y trouve toujours quelquechose
  • Variante Scientifique (scholar)
  • Cartes et lieu donné (Google Map)
  • Recherche Avancée
  • Limiter recherche a un site donné
  • Langue donnée
  • Base ou ensemble fichiers restreint
  • Dans toute la page, le titre ,adresses
  • Période donnée
  • Selon le type de format de fichier
  • Etendre recherche fichier texte (.doc .pdf ..)

18
Moteur Recherche dInformation
  • Google
  • Dabord recherche de pages cointenant tous les
    mots (ET)
  • Puis un mot en moins
  • Classement des Pages
  • Pésentation résultats
  • Classement selon algoirthme (pageRanking )
  • Pésentation résultats
  • Dabord les pages les plus consultées
  • Nombre de liens pointant sur page
  • Pages les plus  populaires dabord

19
Moteur Recherche dInformation
  • Avantages
  • Requetes simples ou complexes
  • Index augmentent avec web
  • Mise a jour continue et rapide
  • Peu de silence
  • Inconvénients
  • Difficulté Choix des mots pour interrogation
  • Difficulté pour nouveaux sites demerger
  • On ne trouve que ce qui a été classé par les
    robots qui indexent sites
  • Bruit important

20
Recherche dInformation documentaire
  • Bases de données Documentaire
  • NLM (MEDLINE)
  • Pubmed liens avec Plein texte
  • Editeurs
  • Elsvcier, Springer , Lipincott, Blackwell
  • Voir ENT
  • Bases Bibliographiques En France
  • Pascal (CNRS)Thèses Articles
  • BDSP (ENSP) Santé Publique

21
Recherche dInformation documentaire
  • Catalogue Bibliothèque
  • Listes de documents organisés
  • Thématique
  • Auteurs
  • Titre
  • Par numéro unique international
  • ISBN (International standard Book Number) Livre
  • ISSN (International standard Serial Number) pour
    revue

22
Recherche dInformation documentaire
  • Sudoc (Systeme Universitaire de documentation)
  • 5 millions de références des universités
    française Mise a jour limitée
  • Thèses de Sciences Médecine Pharmacie Dentaire
  • Décrit par des notices auteur ,titre ,éditeur,
    année
  • On peut savoir ou trouver le document dans BU
    Francaises
  • www.sudoc.abes.fr

23
Recherche dInformation documentaire
  • INIST CNRS (Pascal)
  • Tous les domaines des sciences
  • http//articlesciences.inist.fr/
  • Moteur recherche et commandes
  • Par nom auteur , années
  • Par mot clés

24
Recherche dInformation documentaire
  • BDSP
  • Tous les domaines de Santé Publique
  • http//www.bdsp.tm.fr/Base/QbeA.asp
  • Moteur recherche
  • Par mots titre , mot clés
  • nom auteur , années
  • Par type de document

25
Recherche dInformation documentaire
  • BNF
  • Catalogue Collectif de France
  • Tous les domaines
  • Textes, audio, video, multimedia
  • 20 millions documents
  • http//www.ccfr.bnf.fr
  • Moteur recherche
  • Par mots titre , mot clés
  • nom auteur , années
  • Par type de document

26
Recherche dInformation documentaire
  • Epidémiologie Statistiques Santé
  • Base de données
  • Cause médicales décès
  • INSERM Vesinet
  • http//www.cepidc.vesinet.inserm.fr
  • Recherche Base de données
  • Par zone géographique (région, dept..)
  • Années
  • Par cause de décès (CIM ..)

27
Recherche dInformation documentaire
  • Consortium revues en ligne
  • La plupart des revues scientifiques
  • Consortia Payants
  • Partagé entre universités (Couperin)
  • ENT /documentation /doc electronique
  • ScienceDirect (elsevier)
  • Springer
  • Blackwell
  • New England

28
Recherche dInformation documentaire
  • UMVF
  • http//www.umvf.org
  • Ressources pédagogiques
  • GIP UMVF
  • Partage et mutualisation entre universités
  • Indexation par DocUMVF
  • Cours (support et campus numériques)
  • Cas cliniques
  • Vidéos
  • Vidéo enrichie
  • Podcast

29
Recherche simple
30
(No Transcript)
31
Recherche avancée
32
Recherche avancée par discipline
33
(No Transcript)
34
Recherche ECN
Complétionautomatique
35
(No Transcript)
36
Affichage mots clefs
37
Section ENC
38
(No Transcript)
39
(No Transcript)
40
Write a Comment
User Comments (0)
About PowerShow.com