Inteligentné vyhľadávanie

Večne niečo hľadáme. Zápis z predchádzajúcej porady, starší e-mail od kolegu, informácie o konkurencii, aktuality z odvetvia, judikatúru podobného prípadu, kontraindikácie liekov alebo zaujímavú časť v hodinovom videu alebo podcaste. O koľko viac vecí by sme stihli, keby sme stále niečo nehľadali? A mnoho aplikácií nám v tom pomáha.

Či už ste tvorcovia všeobecných aplikácií alebo komplexných riešení na vnútropodnikové účely, venujte pozornosť nasledujúcim jazykovým modulom.

Lemmatizátor (stemmer)

Toto je základný jazykový komponent väčšiny vyhľadávačov. Dokáže totiž k ľubovoľnému tvaru slova daného jazyka nájsť jeho základný tvar (tzv. lemma), prípadne k základnému tvaru vygenerovať všetky možné správne tvary daného slova. Vďaka tomu stačí v zadávacom poli zadať napr. slovo človek a vyhľadávač nájde aj všetky texty so slovami človeku, človekom či ľudia. Že to nie je vždy jednoduché, si môžete prečítať v článku Formálna morfológia.

Lemmatizátor sa zvyčajne integruje do všeobecných fulltextových alebo databázových systémov, ktoré efektívne riešia indexáciu a rýchle vyhľadávanie, zatiaľ čo lemmatizátor sa postará o záludnosti jazyka. Viac tu: Integrácia.

Tezaurus (synonymá)

Akékoľvek vyhľadávanie môže nepriaznivo ovplyvniť skutočnosť, že určité pojmy sa dajú vyjadriť viacerými rôznymi termínmi. Takže napríklad premiér je to isté ako predseda vlády alebo ministerský predseda, namiesto slova podnikateľ možno použiť biznismen, a ak je nejaký príbeh pútavý, môže byť tiež napínavý, zaujímavý, príťažlivý alebo atraktívny. Tieto a podobné rozdiely dokáže zahladiť práve tezaurus, ktorý býva častým doplnkom lemmatizátora, pretože dokáže rozšíriť otázku alebo žiadosť a nájsť ďalšie relevantné dokumenty.

Rozpoznanie jazyka

Pri spracovaní viacjazyčných textov alebo dokumentov, v ktorých sú niektoré pasáže (napr. odkazy alebo citácie) napísané v inom jazyku, je dôležité rozpoznať, o aký jazyk ide a podľa toho vybrať vhodný lemmatizátor alebo tezaurus. Tento problém rieši modul, ktorý využíva dostupné lemmatizátory a na presné určenie jazyka mu stačí niekoľko málo slov.

Prekladač (translator)

V dnešnom globalizovanom svete málokedy stačí vyhľadávať a analyzovať dokumenty a spracovávať informácie len v jednom jazyku. Jazykovú bariéru dnes elegantne prekonávajú nástroje strojového prekladu, ktoré dokážu zdrojový text preložiť v takej kvalite, ktorá nebráni pochopeniu textu a umožní v ňom vyhľadať a spracovať relevantné informácie.