Vyhledat   Tisk    Daidalos 2/1, říjen 2000: sekce příspěvků    @ vuppraha@mbox.vol.cz

Zdeněk Jonák

START - faktografický informační systém na zodpovídání dotazů v přirozeném jazyku


Řada stávajících vyhledávacích systémů již dosahuje poměrně dobré úrovně lingvistického zpracování dotazu (např. technologie firmy VERITY apod.). Výsledkem jejich zpracování dotazu je však odkaz na větší či menší počet dokumentů, které musí uživatel sám přečíst a zpracovat.

Na některé "triviální", neproblematické dotazy (typu učebnicových, encyklopedických hesel) by si však uživatel, vzhledem k dnešním technologickým možnostem, již mohl nárokovat elegantnější výstup, tzn. stručnou a obsažnou odpověď v přirozeném jazyku.

V následujícím textu chci představit systém, který tato kritéria do značné míry splňuje.

Systém START (SynTactic Analysis using Reversible Transformations) je faktografický dotazovací informační systém na bázi syntaktické analýzy, který na dotaz formulovaný v přirozeném jazyku (angličtině), formuluje smysluplnou odpověď rovněž v přirozeném jazyku.

Systém START vyvinul B. Katz z MIT´ Artificial Intelligence Laboratory. START odpovídá na otázky typu:

What is …
Where is ….
How far is X from Y …
Who is …
apod.

Poskytuje odpovědi z oblasti geografie, klimatu země, poskytuje mapy a informace o vzdálenostech mezi lokalitami. Najdeme zde informace o představitelích vědy, umění, politiky. Systém průběžně přebírá zajímavé informace z webovských stránek.

START sestává ze dvou subsystémů: Modulu pro porozumění anglickému textu, který do databáze ukládá informace z analyzovaných textů a modulu pro generování anglických vět jako odpovědí na dotaz.

Každou analyzovanou větu dotazu či textu rozloží systém na jakési holé věty (tzv. T-expressions), ve struktuře:

PODMĚT - RELACE - PŘEDMĚT.
(Ostatní větné členy jsou ukládány jako doplněk T-expressions).

K porozumění anglické větě musí systém obsahovat morfologické, syntaktické a sémantické informace o každém slově uloženém v databázi. Tyto informace jsou uloženy v Lexikonu ve formě S-pravidel a jsou určeny pro definování relace v T-expressions.

Ukázka transformace věty (dotazu, textu) do formy T-expressions:

Z věty:
Bill surprised Hillary with his answer.

se vytvoří T-expressions:
<Bill surprised Hillary> with answer/
<answer related - to Bill>

Takto uložená struktura umožňuje formulovat otázky typu: KDO, CO, JAKÝ apod.

např.: Whom did Bill surprise with this answer?

nebo otázky typu ANO/NE:

např.:
Did Bill surprise Hillary with his answer?
Yes, Bill surprised Hillary with his answer.

Systém START poskytuje zatím informace omezeného záběru. Knihovny užívající dosud převážnou měrou příručky v tištěné podobě mohou nabídnout nesrovnatelně bohatší rejstřík informací. Časem by však mohl jejich funkci podpořit inteligentmí faktografický systém a usnadnit tak nedoceňovanou poradenskou funkci knihoven Vyzkoušejte si systém START. Z. Jonák


Daidalos - hlavní stránka | daidalos@ff.cuni.cz