Vyhledat   Tisk    Daidalos 1/2, leden 2001: sekce příspěvků    @ vuppraha@mbox.vol.cz

Zdeněk Jonák

Systémy zajišťující kvalitnější vyhledávání na Internetu


Internetové vyhledávání nevytěžuje kapacitu počítače natolik, aby nebylo možno jeho inteligenci zvýšit podpůrnými programy. K tomuto účelu jsou vyvíjeny systémy, které souběžně s vyhledáváním užívají podporu důmyslných algoritmů z oblasti umělé inteligence. Paralelnost vyhledávací činnosti člověka s inteligentní podporou může být realizována jako pomocná vyhledávací strategie nebo se může opírat o schopnost počítače utřídit vyhledané dokumenty podle impaktního faktoru, tedy váhy, která udává jaký význam přisuzují vyhledaným článkům ostatní autoři.

Reprezentantem prvního přístupu je např. systém LETIZIA, který paralelně s činností uživatele vyhledávajícího informace sleduje jeho vyhledávací strategii a v době, kterou uživatel tráví prohlížením vyhledaných dokumentů, na základě pochopení jeho strategie, nabídne postup dalšího vyhledávání, který uživatel může, ale nemusí přijmout.

Zatímco uživatel vyhledává pod tlakem okolností, je limitován časem, podléhá únavě, předností úspěchu systému je jeho nezměrná trpělivost. Jestliže ideálním cílem každé vědecké činnosti je najít ten pravý dokument, který poznání badatele posune dále, aniž se přitom musí brodit množstvím nerelevantních dokumentů, potom musí důvěřovat inteligenci systému a vsadit na současně velmi zkoumaný fenomén SERENDIPITY, tj. řečeno metaforicky, schopnost učinit šťastný objev náhodou. A na této strategii, opírající se o mohutnost současných ICT, je založen i systém Letizia.

Druhý systém se nazývá ResearchIndex, využívá k docílení efektivního vyhledávání impaktního faktoru, tj. ukazatele vzniklého vyhodnocením počtu článků, které vyhledaný článek citují. Popisovaný systém má funkce i strukturu odlišné od Citačního indexu, který je dostupný v rámci konsorcia WOS.

Nebudu zatěžovat čtenáře popisem toho, jak systém k výsledkům dospívá, popíši spíše to, co systém umí a na výstupu poskytuje. Autoři nazývají tento systém Digitální knihovna s autonomním citačním indexováním. Na vstupní obrazovce se dozvíte, že systém pracuje s 5 mil. www stránkami a obsahuje 4 mil. citací. Systém nabízí možnost dvojího přístupu:
- vyhledávání citací,
- vyhledávání dokumentů.

Oba subsystémy mají velmi podobnou strukturu. Dotaz může obsahovat jméno autora či téma formulované pomocí booleovské logiky. Vyhledává bibliografické údaje článků obsahující jméno či téma uspořádané podle impaktního faktoru (s vyloučením autocitací).

Výstup doplní grafem, v němž je vyznačen vývoj výskytu citací v časových řadách. Uživatel zjistí, v kterých letech kulminoval zájem o zadaného autora či tématiku. Kliknutím na levou stranu seznamu článků na slovo Context získáme seznam bibliografických údajů článků, které uvedený článek citují. Citace článku je doplněna odstavci, které obsahují jméno autora nebo které se problematiku uvedenou v dotaze zabývají. Věty, kde jsou údaje formulované v dotazu přímo citovány, jsou zdůrazněny tučně. Kliknutím na bibliografický údaj článku získáme abstrakt článku spolu s charakteristikami dalších obsahově podobných článků a jejich impaktními faktory. Tímto mnohočetným vnořením lze získat vyčerpávající přehled o analyzovaném autoru či problematice.

Uvedené systémy jsou jen ukázkami, jakým způsobem se dá zvýšit efektivita vyhledávání s využitím systémů umělé inteligence. Nejsou zatím kompatibilní se všemi typy počítačů (PC, Apple) ani browserů (Explorer, Netscape) ani nejsou všechny dostupné free, ale v této fázi jde spíše o to vědět, že tato možnost se nabízí a ve vhodnou dobu ji umět využít.


Daidalos - hlavní stránka | daidalos@ff.cuni.cz