Korektor preklepov

Korektor preklepov asi každý pozná a aj bežne používa. A keďže v textovom editore MS Word, tabuľkovom procesore Excel, prezentačnom programe PowerPoint, v programe Adobe InDesign či programe Photoshop je integrované riešenie práve od spoločnosti Lingea, možno ste aj vy už dlhú dobu spokojní používatelia našich produktov.

Jazyková časť

Štruktúra slovníka je založená na rozsiahlom formálnom popise morfológie a na detailnom systéme vzorov. Tento popis umožňuje z jedného slovného základu (kmeňa) generovať až niekoľko desiatok odvodených tvarov, napr. v slovenských slovách:
milovať: milovať, milujem, miluješ, milujeme, miloval, milovala, milovali, milovaný, milovaná, milovaného, milovaní...
brat: brat, brata, bratovi, bratom, bratia, bratoch, bratov, bratova, bratovo, bratove...

Bohatú slovotvorbu majú predovšetkým slovanské jazyky, avšak aj v románskych jazykoch majú slovesá množstvo rôznych tvarov, napr. vo
francúzštine:

parler: parle, parles, parlons, parlez, parlent, parlais, parlait, parlions, parliez, parlaient, parlerai, parlé, parlant...

V ruštine je zase potrebné brať do úvahy zvratné zámená, ktoré sa s niektorými slovesnými tvarmi píšu spolu: 

женится: женюсь, женишься, женится, женись, женилась, женились...
Podobné je to aj v španielčine, kde sa navyše môžu spolu so slovesom písať aj osobné záujmy (poner->ponlodecir->dimeescuchar->escúchala).

Extrémne rozmery nadobúdajú tvary v maďarčine, fínčine a turečtine, kde sa slová tvoria pomocou sufixov. Maďarčina rozoznáva okrem dvoch čísel až 25 pádov a dva druhy privlastňovania (patriace danému objektu a patriace osobe):

ház: házak, házat, háznak, házzal, házig, házé, házéi, házaké, házakéi, házamé, házadé, házáé...

Všetky slová, ktoré vytvárajú odvodené tvary rovnakým spôsobom, sa priraďujú k jednému vzoru. Každý slovník sa teda skladá z dvoch hlavných častí:
slovník vzorov: obsahuje jazykovú informáciu o tvorení tvarov, o alternáciách koreňa a popis gramatických kategórií
slovník kmeňov: obsahuje základnú slovnú zásobu kmeňov väčšiny slov daného jazyka.

Popis slov vyššie uvedeným spôsobom je úplný v tom zmysle, že okrem slov s pravidelným odvodzovaním zahŕňa aj slová:
s alternáciami koreňa (napr. slovenské pes->psa, nemecké Bruder->Brüder)
s úplnou zmenou kmeňa (napr. anglické go->went, nemecké essen->isst, slovenské hnať->ženie)
nepravidelné slovesá (byť, jesť, chcieť),

Popis je všeobecný do takej miery, že umožňuje vytvoriť slovník nielen pre češtinu a slovenčinu, ale aj pre ďalšie európske jazyky. Vysporiada sa napr. so zvratnými slovesami v ruštine, opisným stupňovaním v angličtine či poľštine, stiahnutými formami vo francúzštine, oddeliteľnými predponami v nemčine, zlučovaním slovesných tvarov so zámenami v španielčine alebo bohatým vytváraním tvarov pomocou sufixov v ugrofínskych jazykoch.

Programové riešenie

Vďaka efektívnemu algoritmu komprimovania a celkovému generovaniu slovníka je programové rozhranie jednoduché a ľahko použiteľné v ľubovoľnom softvérovom produkte.

Dostupné funkcie

  • Overenie, či je slovo v slovníku. Táto funkcia tiež kontroluje správnosť používania veľkého písmena na začiatku vlastných mien (Bratislava, Mária, Eisenhower), písanie veľkých písmen v skratkách (USA, IBM) alebo ukončenie skratiek bodkou (atď., ap.).
  • Ponuka opráv: vygeneruje všetky slová, z ktorých mohlo slovo vzniknúť preklepom.
  • Obsluha používateľských slovníkov alebo špeciálnych slovníkov na automatickú zámenu chybných slov.
  • Nastavenie parametrov, napr. ignorovanie akronymov, jednopísmenových slov, slov s číslicami atď.

V súčasnosti ponúkame kontrolu preklepov pre širokú škálu jazykov (pozri tabuľku). Je implementovaná aj na väčšine platforiem (pozri prehľad).

Referencie

Funkčnosť a rýchlosť nášho riešenia si môžete overiť napr. v Microsoft Office od verzie Office 95 vyššie, v textových editoroch (Corel WordPerfect), sádzacích systémoch (Adobe InDesign), OCR Programoch, redakčných systémoch (MF DNES) aj napr. v programoch firiem Autodesk A Siemens.