Formation Recherche sur le Web - PowerPoint PPT Presentation

1 / 50
About This Presentation
Title:

Formation Recherche sur le Web

Description:

A set of ordered steps for solving a problem, such as a mathematical formula or ... De gauche droite. Tous les AND en premier, ou tous les OR, ou les NOT ... – PowerPoint PPT presentation

Number of Views:34
Avg rating:3.0/5.0
Slides: 51
Provided by: Comp841
Category:
Tags: formation | recherche | sur | web

less

Transcript and Presenter's Notes

Title: Formation Recherche sur le Web


1
Formation  Recherche sur le Web 
  • présentation pour
  • Amnistie Internationale

2
Déroulement de la présentation
  • Définitions générales
  • Historique
  • À savoir
  • Les types de moteurs
  • Outils de recherche
  • Techniques de recherche
  • Sources utiles

3
Définitions de base
  • Algorithme
  • Adjacence
  • E-mail
  • Formation
  • Fureteur
  • Index (For / Fai)
  • Internet
  • Logique booléenne
  • Méta-outils de recherche
  • Moteurs de recherche
  • Newsgroups
  • Répertoires (For / Fai)
  • Troncature
  • Web invisible
  • WWW

4
Algorithme
  •  A set of ordered steps for solving a problem,
    such as a mathematical formula or the
    instructions in a program. The terms algorithm
    and logic are synonymous. Both refer to a
    sequence of steps to solve a problem. However, an
    algorithm implies an expression that solves a
    complex problem rather than the overall
    input-process-output logic of typical business
    programs. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

5
Adjacence
  • Indique la proximité (adjacence) entre deux
    mots-clés, cest-à-dire la distance maximale
    quil peut y avoir entre eux. Cette distance se
    compte en nombre de mots.

6
E-mail
  •  (Electronic-MAIL) The transmission of memos and
    messages over a network. Within an enterprise,
    users can send mail to a single recipient or
    broadcast it to multiple users. Mail is sent to a
    simulated mailbox in the network mail server or
    host computer until it is interrogated and
    deleted. You can set up your mail program to
    query the mail server every so many minutes and
    alert you if new mail has arrived. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

7
Fureteur
  •  The program that serves as your front end to
    the World Wide Web on the Internet. 
  •  Although Mosaic was the browser that put the
    Web on the map, the two major browsers today are
    Netscape Navigator and Microsoft Internet
    Explorer. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

8
Index
  •  (1) In data management, the most common method
    for keeping track of data on a disk. Indexes are
    directory listings maintained by the OS, DBMS or
    the application.An index of files contains an
    entry for each file name and the location of the
    file. An index of records has an entry for each
    key field (account no., name, etc.) and the
    location of the record.(2) In programming, a
    method for keeping track of data in a table. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

9
Points forts et faibles dun index
  • FORCES
  • Grande flexibilité
  • Permet une recherche très spécifique
  • Approprié pour recherche complexe
  • Sujet à plusieurs facettes et pluridisciplinaire
  • FAIBLESSES
  • Trop de résultats
  • Surtout dans les recherches générales
  • Faible taux de précision
  • Beaucoup de bruit
  • Langage dindexation à maîtriser.
  • Différence entre les moteurs.

10
Internet
  •  A large network made up of a number of smaller
    networks. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

11
Logique booléenne
  •  The "mathematics of logic," developed by
    English mathematician George Boole in the
    mid-19th century. Its rules govern logical
    functions (true/false). As add, subtract,
    multiply and divide are the primary operations of
    arithmetic, AND, OR and NOT are the primary
    operations of Boolean logic. Boolean logic is
    turned into logic gates on circuit boards, and
    various permutations are used, including NAND,
    NOR, XOR and XNOR. The rules, or truth tables,
    for Boolean AND, OR and NOT follow. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

12
Méta-outils de recherche
  • Moteurs de recherche qui exécute une requête à
    travers plusieurs autres moteurs de recherche.
  • Exemples Copernic, Dogpile, Qsearch,
    Metacrawler, Invisible Web.

13
Moteurs de recherche
  •  Software that searches for data based on some
    criteria. Although search engines have been
    around for decades, they have been brought to the
    forefront since the World Wide Web exploded onto
    the scene. Every Web search site uses a search
    engine that it has either developed itself or has
    purchased from a third party. Search engines can
    differ dramatically in the way they find and
    index the material on the Web, and the way they
    search the indexes from the user's query. 
  • Exemples de moteurs de recherche Google,
    AltaVista, AlltheWeb, Gigablast.
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

14
Newsgroup
  • A message board on the Internet. Also known as
    Internet discussion groups, they are like
    player-piano rolls of messages devoted to a
    particular topic. It all starts by someone
    posting an initial query or comment, and other
    members reply. Still others reply to the replies,
    and so the "discussion" forms a chain of related
    postings called a "message thread. "
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

15
Répertoire
  •  A search site on the Web that catalogs Web
    sites by subject and also manually indexes the
    site, providing a brief description of its
    content. Yahoo! is the most well-known directory
    site. 
  • Exemples de repertoires Yahoo !, ODP.
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

16
Points forts et faibles dun répertoire
  • FORCES
  • Approprié pour des recherches simples
  • Bon point de départ pour exploration
  • Information souvent de bonne qualité
  • Facile à utiliser
  • Simple furetage par clics
  • FAIBLESSES
  • Catégories souvent arbitraires
  • Les  nouveaux  sujets nont pas toujours de
    catégories
  • Taxonomie en retard
  • Information souvent périmée
  • Couvrent une petite partie du Web

17
Troncature
  •  To cut off leading or trailing digits or
    characters from an item of data without regard to
    the accuracy of the remaining characters.
    Truncation occurs when data are converted into a
    new record with smaller field lengths than the
    original. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

18
Web invisible
  • Ce sont des zones accessibles via le Web mais qui
    ne sont pas couvertes par les moteurs de
    recherche à cause dun accès par mot de passe par
    exemple.
  •  The "visible web" is what you see in the
    results pages from general web search engines.
    It's also what you see in almost all subject
    directories. The "invisible web" is what you
    cannot retrieve ("see") in the search results and
    other links contained in these types of tools. 
  • UC Berkeley Library.
  • http//www.lib.berkeley.edu/TeachingLib/Guides/Int
    ernet/InvisibleWeb.html (page consulté le 15
    décembre)

19
www
  •  (World Wide Web) The "www-dot" prefix on Web
    addresses is placed in front of the domain name
    in order to provide a recognizable address for
    the world at large. Web addresses (URLs) are read
    from right to left, so that the WWW is the last
    component of the address. However, the WWW is
    quite often optional. Try typing in the name of
    your favorite Web site without the "www-dot"
    prefix and you might find it works just as
    well. 
  •  An Internet service that links documents
    locally and remotely. Documents are stored on the
    Internet in "Web servers" that store and
    disseminate "Web pages." The Web pages are
    accessed by the user with software called a "Web
    browser," the two most popular being Internet
    Explorer and Netscape Navigator. 
  • Tech encyclopedia. URLhttp//www.globetechnology.
    com/site/tech_encyclopedia.html (page consultée
    le 14 décembre 2002)

20
Historique
  • Internet
  • Vaste espace reliant des millions dordinateurs.
  • Developpé au début des années 70
  • Issu dARPAnet qui est à lorigine un réseau de
    recherche militaire.
  • Évoluation rapide pendant les années 80 et 90
    avec lajout du milieu académique et commercial

21
Historique
  • Croissance exponentielle grâce au fureteur
    graphique Mosaic en 1993
  • Composantes dInternet
  • newsgroups,
  • E-mail,
  • www (croit le plus rapidement).

22
Historique
  • Taille dinternet
  • En 2002 dans le monde
  • 445.9 million (eMarketer)
  • 533 million (Computer Industry Almanac)
  • Estimation pour 2004
  • 709.1 million (eMarketer)
  • 945 million (Computer Industry Almanac)
  • Cyber Atlas.
  • www.cyberatlas.internet.com (page consultée le 14
    décembre 2002).

23
Historique
  • Au Canada
  • En 2002
  • 14,2 millions dutilisateurs (Media Metrix
    Canada) sur une population de 31,6 millions (21
    mars 2002).
  • Cyber Atlas
  • http//cyberatlas.internet.com/big_picture/geograp
    hics/article/0,,5911_737081,00.html (page
    consulté le 14 décembre 2002).

24
À savoir
  • Tous les documents ne sont pas indexés et aucun
    index ne contient la totalité des documents
    indexés.
  • Peu de recoupage.
  • Problème lors de lidentification
  • Liens morts
  • Ne pas trouver linformation que lon sait
    existante
  • Inhabileté à organiser linformation repêchée
  • Incapacité à retrouver des pages déjà visitées

25
À savoir
  • Deux types doutils adaptés à la recherche
  • Répertoires
  • Structure hiérarchique structurée
  • Yahoo !, ODP,
  • Index (aucun index ne couvre la totalité du Web)
  • Moteur de recherche
  • Google, AltaVista
  • Outils hybrides
  • Galaxy, Tradeworlds, Clearinghouse

26
Types de moteurs de recherche
  • AltaVista
  • Couverture
  • Environ 5 millions de pages (en perte de vitesse)
  • Ressources recensées
  • Web
  • Images
  • Newsgroups
  • Flexibilité du langage dinterrogation
  • Recherche en mode simple ou en mode expert

27
Types de moteurs de recherche
  • AltaVista
  • Paramètres daffichage (tri) des résultats
  • Qualité de lalgorithme de pertinence
  • Paramètres de personnalisation et régionalisation
  • Qualité des fichiers daide
  • Fonctionnement logique

28
Types de moteurs de recherche
  • Google
  • Couverture
  • Environ 2,5 milliards de pages (la plus grande)
  • Ressources recensées
  • Web
  • Images
  • Newsgroups
  • Flexibilité du langage dinterrogation
  • Recherche en mode simple ou en mode expert

29
Types de moteurs de recherche
  • Google
  • Paramètres daffichage (tri) des résultats
  • Qualité de lalgorithme de pertinence
  • Paramètres de personnalisation et
    régionnalisation
  • Qualité des fichiers daide
  • Fonctionnement logique

30
Opérateurs de recherche
  • Troncature
  • En général à droite avec
  • Spécifié à laide dun masque (en général )
  • Par exemple politique (pour retracer le
    singulier et le pluriel)
  • Attention
  • Hum repérera  humain  et  humains  mais
    aussi  humanitaire .
  • Sur certains moteurs de recherche la troncature
    ne fonctionne pas ou est quelquefois implicite

31
Opérateurs de recherche
  • Proximité
  • Recherche dexpressions à plusieurs mots
  • Mettre lexpression entre guillemets
  •  droits humains 
  • Plus précis car il faut absolument que les deux
    mots se retrouvent lun à coté de lautre
  • La troncature ne fonctionne pas nécessairement à
    lintérieur de lexpression

32
Opérateurs de recherche
  • Proximité
  • Certaines interfaces contiennent une case à
    option pour la recherche dexpressions (phrases)
  • Search as exact phrase
  • Certains moteurs acceptent des opérateurs plus
    précis
  • NEAR
  • BEFORE
  • AFTER

33
Opérateurs de recherche
  • Logique booléenne
  • AND réduit le nombre de documents trouvés
  • Politique AND Droit
  • OR augmente le nombre de documents trouvés
  • Politique OR Droit
  • NOT exclu un terme
  • Politique NOT Droit

34
Opérateurs de recherche
  • Logique booléenne
  • En général on peut remplace AND et NOT par des
    signes
  • AND
  • NOT -
  • Si on ne met pas dopérateurs, le moteur
    interprète les relations à sa manière
  • Comportements par défaut
  • En général AND mais certains moteurs font un OR

35
Opérateurs de recherche
  • Logique booléenne
  • Ordre dexécution
  • Lorsquon utilise plusieurs termes, reliés avec
    des opérateurs booléens, lordre dexécution peut
    varier selon le comportement du moteur.
  • De gauche à droite
  • Tous les AND en premier, ou tous les OR, ou les
    NOT

36
Opérateurs de recherche
  • Logique booléenne
  • Il est recommandé dutiliser le parenthésage ( )
    ce qui permet de rendre lordre dexécution de
    lintérieur vers lextérieur
  • Politique OR Droit AND Humain (équation ambiguë)
  • (politique OR droit) AND humain (équation claire)
  • On peut aussi simplifier les choses avec loption
     search within results 
  • Politique OR Droit
  • Humain search within results

37
Opérateurs de recherche
  • Filtres
  • Certains moteurs offrent la possibilité de
    limiter nos recherches par
  • Domaines (.edu .org .fr .ca)
  • Taille de documents (plus que,..moins que,..)
  • Type de fichier (.pdf .ppt)
  • Type de document (image, news, vidéo, son)
  • Date (de création, de révision)
  • Langue et système dencodage des documents

38
Opérateurs de recherche
  • Options avancées
  • Tri par
  • Date, site, pertinence,
  • Élimination des sites pornographiques
  • Recherche des champs spécifiques
  • ltTITLEgt, ltURLgt
  • Langage dinterface

39
Opérateurs de recherche
  • Attention
  • Certains moteurs requièrent que les opérateurs
    booléens soient en majuscule
  • Quelques rares moteurs ne peuvent interpréter les
    opérateurs booléens
  • En général les moteurs de recherche ne sont pas
    sensibles à la casse (consulter les fichiers
    daide pour plus de sécurité)

40
Opérateurs de recherche
  • Attention
  • Aux fautes dorthographe et aux variantes
  • À la logique des équations de recherche
  • À lambiguité de certains termes (viol)
  • Aux caractères accentués

41
Techniques de recherche
  • Quatres étapes
  • Identifier ce quon cherche
  • Bien formuler sa requête
  • Choisir loutil approprié
  • Adapter la requête à loutil de recherche choisi

42
Techniques de recherche
  • Identifier de ce quon cherche
  • Identification des concepts
  • Qui, que, quoi, où, quand, comment, pourquoi

43
Techniques de recherche
  • Bien formuler sa requête
  • Identification des termes
  • Au départ, utiliser le plus possibles des noms
  • Utiliser les termes les plus précis possibles
    pour obtenir le plus de précision
  • Penser aux synonymes et quasi-synonymes
  • Au maximum de 6 à 8
  • Modifier avec des adjectifs ou des adverbes

44
Techniques de recherche
  • Sélection dun moteur de recherche
  • Se renseigner sur
  • les capacités de recherche
  • troncature possible ?
  • Logique booléenne et de proximité possible ?
  • Les comportements implicites
  • Options de recherche par défaut
  • Consulter les fichiers daide et les études
    dévaluations
  • Rubrique de Gregg Notes
  • Le faire régulièrement

45
Sources utiles pour la recherche sur le Web
  • Search Engine Showdown
  • http//www.searchengineshowdown.com/
  • Abondance
  • http//www.abondance.com/

46
Sources utiles
  • Pages de liens avec des sites WEB liés aux Droits
    de la personne
  • http//www.amnesty.org/aisect/links.htm
  • http//www.hrw.org/links.html
  • Centre de recherche et denseignement des droits
    de la personne
  • http//www.uottawa.ca/hrrec/
  •  
  • Centre international pour les Droits de la
    personne et le développement démocratique (Fra,
    Ang, Esp)
  • http//www.ichrdd.ca/
  • Droits de lhomme
  • http//www.fidh.org/

47
Sources utiles
  • Human rights internet
  • http//www.hri.ca/
  • Human rights watch
  • http//www.hrw.org/
  •  
  • Human rights WEB
  • http//www.hrweb.org/
  • Université du Minesota  Bibliothèque Droits de
    la personne (Fra, Ang, Esp)
  • http//www.umn.edu/humanrts 

48
Sources utiles
  • Index de tous les sites liés aux Nations Unies
    (Fra, Ang)
  • http//www.unsystem.org/
  • Déclaration universelle des droits de lhomme
  • http//www.unhchr.ch/french/html/menu6/1/univdec1_
    fr.htm
  • Le Monde Diplomatique
  • http//www.monde-diplomatique.fr/md/index.html
  • Nations Unies
  • http//www.un.org/
  • Ressources du monde politique sur le WEB
  • http//www.politicalresources.net/ 

49
Sources utiles
  • Reporters sans frontières
  • http//www.rsf.fr/
  • Centre canadien pour les victimes de torture
  • http//www.icomm.ca/ccvt
  • Centre international des femmes
  • http//www.wic.org/
  • Jeune Afrique
  • http//www.jeuneafrique.com/
  • The World Factbook 2002
  • http//www.cia.gov/cia/publications/factbook/

50
Pour me rejoindre
  • Courriel
  • lionel.villalonga_at_laposte.net
Write a Comment
User Comments (0)
About PowerShow.com