Vyhled - PowerPoint PPT Presentation

About This Presentation
Title:

Vyhled

Description:

Barbora Pol kov ; Martin Kozel – PowerPoint PPT presentation

Number of Views:96
Avg rating:3.0/5.0
Slides: 54
Provided by: Scan90
Category:

less

Transcript and Presenter's Notes

Title: Vyhled


1
Vyhledávání v prostredí internetu
  • Barbora Poláková Martin Kozel

2
(No Transcript)
3
Osnova prednášky
  • Co se deje?
  • zmeny v prístupu a práci s informacemi
  • Co s tím ?
  • Struktura informací na webu teorie a praxe
  • Jak na to ?
  • Strategie vyhledávání a postupy

4
Informace
  • Komunikovatelný popis jevu, jehož prijetím
    dochází ke zmenám v informacním systému.
  • Odstranená ENTROPIE
  • ?Vyšší míra usporádanosti
  • Cím více neurcitosti odstraní tím vetší má
    informace hodnotu. (Shannon,1948)
  • popsatelná
  • kontextove nezávislá
  • organizovatelná
  • informacní zdroj/pramen

5
Informacní spolecnost
  • je taková spolecnost, ve které je venována
    pozornost informacní cinnosti natolik, že dojde
    ke snížení zájmu o zemedelskou a prumyslovou
    výrobu (Vlasák, 2000)
  • Marc Uri Porat (1976). Information economy
    definition and measurement
  • 70.léta postindustriální spolecnost
  • prumysl ----- gt služby

6
  • 80.léta informacní spolecnost
  • propojení pocítacového prumyslu s ostatními
    prumyslovými odvetvími
  • rozvoj informacní a pocítacové GRAMOTNOSTI
  • INFORMACNÍ SEKTOR profese tvorby, sberu,
    zpracovávání, uchovávání, zpetného vyhledávání a
    dalšího šírení informací (Vlasák, 2000)

7
Informacní exploze
  • Informace Moc Peníze !!!
  • Prudký rozvoj informacních technologií a jejich
    dostupnost
  • KVANTITATIVNÍ nárust informací a informacních
    zdroju
  • Redundance relevance pertinence
  • Mrtvá data long tail effect

8
Informacní smog (Shenk 1997)
  • lidstvo se nevyvíjí dost rychle aby zvládalo
    množství informací
  • Exformace - informace existující za hranicemi
    našeho vedomí (Gore, 1994)
  • Zahlcení
  • snížení citlivosti k obsahu  - mozková kapacita
    je stále stejná (Cernohlávková, 2006)

9
Znalostní spolecnost
  • nadstavba informacní spolecnosti založená na
    kolaboraci a interakci mezi uživateli
  • Web 2.0 - Tim Bernards-Lee (2000)
  • Znalost
  • kontextove závislá pragmatický obraz informace
    reprezentovaný intelektuálním kapitálem
    jednotlivce (Bukh, 2001)

10
Terminologické vyjasnení
  • Základní abstraktní pojmy
  • INFORMACE
  • ZNALOSTI
  • Základní konkrétní pojmy
  • Informacní / elektronický zdroj
  • digitální / informacní objekt / entita

11
Publikacní procesy
12
Publikacní proces informacního zdroje - puvodní
Nakladatelství, casopisy, databáze, databázová
centra
13
Publikacní proces informacního zdroje nyní
Web 2.0 sociální síte, wiki, blog
14
Hodnocení
  • Aktuálnost
  • Rychlost
  • Kooperace
  • -
  • Kontrola kvality, relevance
  • Korektura
  • Odborný dohled
  • Distribuce a popis jsou na autorovi
    NEDOHLEDATELNOST

15
KDE TO VŠECHNO MUŽEME NAJÍT ?
16
World Wide Web
  • Viditelný / povrchový web
  • informacní entity volne prístupné a snadno
    dostupné pomocí vyhledávacích stroju
  • Neviditelný / hluboký web
  • neviditelný pro bežné vyhledavace
  • databáze, adresáre, rejstríky, dokumenty v
    nepodporovaných formátech, licencované stránky
  • 500x vetší než povrchový web

17
Web povrchový a hluboký (Bergman,2001)
18
Obsahové rozvrstvení hlubokého webu (Bergman,
2001)
19
CO TAM MUŽEME NAJÍT ?
20
Digitální objekt (DO)
  • základní entita
  • Hledisko puvodu
  • digitalizované informacní zdroje
  • E-book postprinty
  • born digital
  • Webové stránky, fóra, komunity, blogy, wiki

21
Hledisko typu DO
  • MIME - Multipurpose Internet Mail Extension
  • Specifikuje charakter obsahu oficiálne
    komunikovaných DO na internetu
  • Typy
  • Text
  • Obraz
  • Video
  • Zvuk
  • Software
  • Trojrozmerné digitální objekty

22
Digitální objekt
Hlavicka / Metadata
Obsah
Podpis
23
Metadata Velká a mocná
  • Data o datech
  • Strukturované informace, které popisují,
    osvetlují, lokalizují a usnadnují vyhledávání a
    využívání informacního zdroje. (Guidlines for
    Digitalization, 2007)

24
Popis DO
  • Predobraz metadatového popisu je v popisu
    tradicních zdroju.
  • strojem citelný X stroji srozumitelný
  • Dve úrovne popisu
  • vecná obsah, anotace, abstrakt, klícová slova,
    kódy systematického trídení
  • popisná popis dokumentu podle formálních znaku
    autor, název, vydavatel, rok vyd.

25
Tradicní bbg. Záznam - MARC 21
26
Dublin Core Metadata Initiative -DCMI
  • Dublin Core
  • Soubor 15 metadatových kvalifikovatelných prvku
  • Puvodne popis zdroju na WWW soucasne popis
    jakéhokoli objektu
  • Garant popisu - autor ? user-friendly
  • Dublin Core Czech
  • DCMI homepage

27
Prvky DC
  • Název
  • Tvurce
  • Predmet
  • Popis
  • Vydavatel
  • Prispevatel
  • Datum
  • Typ zdroje
  • Formát
  • Identifikátor
  • Zdroj
  • Jazyk
  • Vztah
  • Pokrytí
  • Práva

28
Identifikátory
  • URL
  • Adresa DO urcuje pozici DO v prostredí webu
  • URN
  • Znakový retezec nebo císlo, které jednoznacne
    identifikuje dokument
  • Trvalé, neprenosné
  • Generátory metadat
  • XML soubory

29
Metadata - DC
30
TAK JSME TO HEZKY POPSALI A JAK TO NAJDEM?
31
Vyhledávací nástroje HLAVORUCNÍ
  • Predmetové katalogy - directories-
  • Seznam katalog, Yahoo katalog
  • trídení a organizace DO podle predem dané
    taxonomie nebo predmetové klasifikace
  • Nejpodobnejší tradicním knihovnám
  • Lidský faktor
  • Malé pokrytí, úplnost taxonomie

32
Vyhledávací nástroje AUTOMATICKÉ
  • Vyhledavace - search engine
  • Altavista
  • Metavyhledavace
  • víc indexu najednou
  • Open Text
  • Sekvencní analýza
  • Automatická INDEXACE digitálních objektu za
    pomoci speciálního softwaru
  • Robot crawler spiders bot
  • Index reprezentace fondu úplných textu -
    metadata

33
Vyhledavac obecné schéma
Vyhledavac
Prostredí webu
(Poláková, 2009)
34
Google Schéma (Brin Page, 2000)
35
Uživatelské rozhraní 1/2 Textové
  • Textový vyhledávací dotaz
  • Textová reprezentace výsledku
  • Index zkrácená informace o príslušném zdroji
  • odkaz na fulltext
  • Google

36
Question answering 2/2
37
Uživatelské rozhraní 1/3 Clustry
  • Vektorová logika
  • Vážení podobnosti dokumentu s dotazy relevance
  • Informacní prostor soubor prvku a vztahu mezi
    nimi udržovaných informacním systémem (Ingwersen
    1996)

38
Clustry 2/3v informacním prostoru
(Traykovski Sosisk, 2007)
39
Clusty.com 3/3
40
Uživatelské rozhraní 1/3 Vizuální
41
Carrot2 2/3
42
Searchme 3/3
43
Strategie vyhledávání
  • CO, KDE, a JAK

44
Základní princip
CO?
KDE?
JAK?
45
Co chci najít?
  • Informacní potreba
  • to co vím mi nestací
  • Požadavek
  • konkretizovaná predstava o informacní potrebe
  • Dotaz
  • Kladu prímo zdroji, ve kterém hledám
  • Ve vyhledávacích obecne
  • navigacní, informacní, transakcní (napr. co,
    kdy, kde atd.)

46
Informacní potreba
  • V 80-90 letech se rozvíjí veda nazvaná
    informacní chování uživatele
  • Posun v prístupu
  • computer-centred gt user-centred
  • Tri základní prístupy
  • Kognitivní
  • Sociální
  • Sociokognitivní (nejvíc in, kombinace
    individualismu s kontextualitou prostredí)

47
KDE
  • Typ zdroje
  • Primární zdroje
  • Sekundární zdroje
  • Terciální zdroje
  • Vyhledavace, katalogy, databáze, encyklopedie
  • Globální / lokální charakter, Gatekeeping

48
JAK
  • Vychytávky
  • Boolean logika (AND, OR, NOT )
  • Proximitní operátory (NEAR, WITHIN, SAME, )
  • Lematizace (sklonování, ?, atd.)
  • Typy vyhledávání
  • Fulltextové
  • Faktografické
  • Atd.
  • Rešeršní strategie

49
JAK
  • ANALYTICKÉ VYHLEDÁVÁNÍ
  • Systematická strategie
  • Príprava, promýšlení problému, preddotazy
  • PROHLÍŽENÍ (browsing)
  • Intuitivní vyhledávání

50
ZPETNÁ VAZBA
51
REŠERŠNÍ STRATEGIE
  • Základní kameny
  • Rostoucí perla
  • Osekávání

52
Literatura
  • GORE, Albert. Zeme na misce vah. 1.vyd. Praha
    Argo, 1994, ISBN 80-85794-21-7. str.186.
  • CERNOHLÁVKOVÁ, Katerina. Informacní hygiena. Brno
    Masarykova Univerzita, 2006.
  • SHENK, David. Data Smog Surviving the
    Information Glut. 1 st ed. San Francisco Harper
    Edge,1997. 250 s. ISBN 0060187018.
  • ARMS, W. Key Concepts in the Architecture of the
    Digital Library. D-Lib Magazine online. July
    1995 cit. 2007-10-22. Dostupný z WWW lt
    http//www.dlib.org/dlib/July95/07arms.htmlgt.
    ISSN 1082-9873.
  • Brin S., Page, L. The Anatomy of a Large-Scale
    Hypertextual Web Search Engine. Stanford
    University online 2000 cit. 2010-03-22.
    Dostupný z WWW http//infolab.stanford.edu/backr
    ub/google.html
  • SKLENÁK (2000). Data informace znalosti
  • BUKH, P.N. Larsen H.T., Mouritsen J. (2001)
    Constructing intellectual capital statements.
    Scandinavian Journal of managemennt roc. 17, s.
    87-108

53
Literatura
  • VLASÁK, R. (2000). Informacní povolání a
    informacní spolecnost
  • PILECKÁ, Vera Kognitivní aspekty vyhledávání.
    Dostupný z WWW lthttp//www.ikaros.cz/node/3592gt.
  • Pilecká, Vera (2010) Kognitivní prístupy k
    vyhledávání informací. Praha Univerzita
    Karlova.
  • Mírková, Miluše (2009) Bibliografická a rešeršní
    cinnost. Dostupný z WWW http//home.czu.cz/mirko
    va/
  • Portál pro podporu informacní gramotnosti
    www.inforgram.cz
Write a Comment
User Comments (0)
About PowerShow.com