zpět na hlavní stránku

K vyhledávání na internetu (poznámka k článku v prosincovém čísle Kunstchronik)

 

Uživatelé internetu jsou zpravidla nadšeni senzačním množstvím informací, ke kterým se mohou dostat. Skutečně mají k dispozici informace z několika miliard adres. Prakticky pro každou specializaci tak lze nalézt alespoň několik desítek, ale i třeba tisícovek adres. Využívání vhodných adres je však do značné míry závislé na náhodě, chcete-li – štěstí –, při hledání informačních zdrojů. Úměrně své systematičnosti, vynalézavosti a případně podnětům od "spřízněných duší" se každý může dopracovat k velmi cenným materiálům. Velice přínosnou pomůckou jsou seznamy dalších odkazů na většině vhodně zaměřených stránek (v každém oboru se jich většina kryje, ale při přecházení takto získanými adresami křížem krážem se lze dopracovat k řadě zajímavých "nálezů"). Paralelně je třeba položit vhodné otázky vyhledávačům (postupně v několika verzích odlišných koncovkami slov atd. – to jistě každý ví). Takto by vše fungovalo docela jednoduše. Jenže je tu několik nepřehlédnutelných překážek – zčásti historických, zčásti bohužel stále aktuálně vytvářených. Základní historickou překážkou je různost jazyků a pro vědy o historii ve značné míře také proměnlivost užívaných slov, jmen atd. Svými technickými komplikacemi přispívají také "přísní" programátoři a tvůrci databází, kteří jsou např. přesvědčeni, že uživatel má při dotazu užít "jediný správný" tvar určitého výrazu, jinak nechť má smůlu. K odsouvání reálného problému přispívají také "hraví" uživatelé, kteří si nestěžují na problematickou funkci vyhledávacích "nástrojů", ale těší se ze své obratnosti, která jim umožnila najít nějaké údaje, aniž by ovšem věděli, o jak velké procento existujících údajů se jedná (potěšení je ještě větší, když se ukáže, že kolega při "hře" neměl podobné "štěstí"). Ke "komplikátorům" je třeba započítati "hravé" webmastery, kteří se baví vymýšlením stránek, plných skrývaček: "link" na další údaje se Vám ukáže až při víceméně náhodném "najetí" kurzorem do nějakého nepředpokládatelného místa obrázku.

O tom, že tyto v praxi přehlížené, ale ve skutečnosti dosti nápadné situace konečně začínají znepokojovat větší počet uživatelů, vypovídá aktuální článek Gottfried KERSCHER: Thesaurus-Verwendung und Internationalisierung Bilddatenbanken, in: Kunstchronik, roč. 57, 2004, č. 12, s. 605-606. Autor se zaměřil především na vyhledávací zařízení obrazových databází typu www.bildindex.de, www.prometheus-bildarchiv.de (nutné přihlášení a registrace). Poukazuje na to, že využití obrazových informací sice není omezeno jazykovými bariérami, avšak slovníky příslušných vyhledávacích nástrojů ano. U souborů historických dokumentů kromě jazykových omezení přistupují problémy s tvorbou slovníků – tezaurů. Na některých příkladech (Raphael, Raphaello, Raphaeel Santi, Santo,...; Dosso Dossi, Dosso Doxi, Dossio Dossi, Dosi da Ferrara, Dossio Ferrarese,... - je totiž třeba hledat i zdroje psané v jiných jazycích - to jsou "dublety" tepu Paris, Paříž, Paryža,... London, Londres, Londýn,...) ukazuje, že vytvoření příslušných vyhledávacích zařízení je velice složité. Šance na úspěch při vyhledávání je tím značně snižována (a to nemluvíme o článcích o italské renesanci psaných v japonštině nebo v čínštině). (V malém to lze ilustrovat např. na aktuálním vývojovém stadiu nejmenovaného vyhledávače zpřístupněných památek. Při zadání dotazu "Hradec" se po "fulltextovém" prohledání objeví všechny lokality, u nichž se v textu vyskytne slovo "Hradec" – tedy i všechny lokality, jež leží v okresu Hradec Králové nebo v Královéhradeckém kraji. Při volbě "Hradec nad Moravicí" však nástroj nezareaguje, což se projeví tím, že souhrnně zobrazí všechny objekty z databáze.) Běžné vyhledávací nástroje nereagují ani tím, že by ukázaly třeba 5 nebo 10 nejblíže podobných výrazů. Prostě Vám znovu ukáží prázdné vstupní okénko, u něhož u "výkonnějšího" a "promyšlenějšího"zařízení může být poznámka o tom, že je třeba zadat správný výraz (samozřejmě většinou napsaný jen v jazyce, v němž komunikuje tvůrce nástroje).

 

Jsem přesvědčen, že cesta k řešení hlavních problémů vede jedině přes mezinárodní spolupráci, která však samozřejmě nemůže být rozvíjena jen v rámci specializovaných oborů (např. historici umění, archeologové,...). Bylo by vhodné navázat na některé již nastartované cesty k mezinárodním standardům a slovníkům (převodní tezaury mezi hlavními jazyky tvoří např. archiváři). Domnívám se však, že těmito dohodami a pracnými kroky mohou být odstraněny jen hlavní problémy. Další přijdou na řadu na každém stupni takového vývoje.

 

Jsem toho názoru, že v přítomném stadiu vývoje existují dvě základní řešení.

Jedno mají po ruce tvůrci stránek, kteří mohou různými způsoby zdokonalovat vyhledávání zejména nabízením variantních výrazů, návrhy oprav dotazu (ne jen sdělením, že se nic nenašlo). Pokud nejsou dat gigantická množství (jak je tomu u databází typu seznamů státem chráněných památek, kde se běžně může jednat o milióny položek), měl by vyhledávací nástroj běžně mít podobu abecedního (nebo jinak tříděného) seznamu, neboť v něm se nejsnáze orientuje i zájemce, který nezná přesně podobu, v níž je nějaký termín na stránce uplatněn, nebo třeba je jen pasivním uživatelem jazyka, v němž je stránka "vedena". Velkou výhodou takových "primitivních" "řešení" je, že údaje jsou dostupné i z obvyklých

K příkladům stránek s jednoduchými abecedně seřazenými seznamy lze počítat některé specializované přehledy památek. (http://hrady.dejiny.cz/) Tuto variantu však jako prioritní používají pro některé typy vyhledávání i "v Marburgu" (http://www.bildindex.de/).

Při vyhledávání je velkým usnadněním, pokud nás nástroj přenese na místo seznamu, v němž je použit zvolený výraz nebo jemu nejblíže podobné slovo. To umožní velmi operativní korekci případně nevhodně zapsaného hledaného slova.

Vysoce efektivním vyhledávacím nástrojem je vyhledávání podle lokalizace, pro uživatele nejsnadnější pomocí interaktivní mapy. Snaha o prosazení prostorové identifikace je asi více než 20 let vlastní části památkářů. Vytvoření dokonale funkční interaktivní mapy je však velice náročné. Spojení mapy s rozsáhlou databází je již náročným úkolem pro zkušený tým programátorů. Přesto by data měla být rutinně již dnes identifikována pomocí globálních souřadnic. Tímto způsobem lze dojít k nejsnadnějšímu spojení dat zpracovaných na různých místech (popisná data spolu s plánovou a fotografickou dokumentací různého stáří, uloženou na různých místech, atd.). Soudím, že jde o základní perspektivní systém, některými odborníky již aplikovaný (tradici má především v archeologii, i když u nás zatím dominuje metoda odměřování v mapách 1:10000). Jediným problémem totiž je volba vhodného formátu pro zápis souřadnic a volba způsobů vyhledávání např. v situacích, kdy jsou souřadnice stanoveny jen hrubě. Přesnost alespoň ve vteřinách by měla být závazná. (Bylo by vhodné jednotně stanovit zápis neúplné souřadnice, aby se mohly spojovat přesná data (zlomky vteřin) s orientačními (vteřiny)).

Prostorová identifikace s pomocí globálních souřadnic je možná v terénu (GPS, Galileo), z tištěné mapy (odměřením, případně s využitím SW, dodávaných s některými mapami) nebo ze základních map dostupných na webu.

Příklad vůdčího tuzemského systému, využívajícího identifikaci souřadnicemi: http://www.mapy.cz/ (další např. www.atlas.cz).

 

Na toto téma se hovořilo na nedávné konferenci Muzea... v počítači (viz komentář k příspěvku Petra Žabičky) a na semináři MONUDAT.

 

Podobně jako vyobrazení – jak se o tom píše v Kunstchronik – nejsou jazykovými bariérami omezeny ani globální souřadnice. Měly by tedy být užívány všude, kde je to možné (v případě umělců mají být souřadnicemi označena jejich díla, takže v zásadě při pohledu na nějakou věc lze o ní najít informace jen ze znalosti souřadnic... tedy v ideální situaci; např. u obrazů by bylo možné jejich "zachycení" na různých místech, na něž je osud zavál...). Pokud by byl stanoven jednotný systém zápisu souřadnic – tedy podle jednotného geodetického standardu – nastala by dokonce možnost využívat souřadnice i při práci s vyhledávači typu Google! Při dotazu na určitou souřadnici by se (úměrně "podrobnosti" souřadnic) objevily položky, lokalizované do daného bodu či "čtverce".

 

Související adresy:

http://ecai.org/

http://www.timemap.net/

http://ausstage.edu.au/

http://www.nla.gov.au/digicoll/#maps

http://www.davidrumsey.com/

 

 © Jan SOMMER, Praha 22.12.2004

 

zpět na hlavní stránku