Základní operátory
Systém podporuje základní logické operátory AND, OR, NOT (alternativní zápis operátorů: &&,|| a !). Defaultním operátorem je AND. Hledání živnostenský zákon je tedy ekvivalentem živnostenský AND zákon. Slovní spojení můžete vyhledat s pomocí uvozovek. Pokud tedy zadáte „Zákoník práce“, dostanete jen ty dokumenty, kde se tato slova vyskytují těsně za sebou. Výrazy můžete seskupovat i pomocí závorek pro určení priority operátorů – (OSVČ OR firma) AND rejstřík. Pozor, logické operátory musí být zapisovány velkými písmeny, jinak je systém bude považovat za hledaná slova.
Systém nehledí na velikost písmen – zadání Česká národní banka je to samé jako česká národní banka. Rovněž je možné rozlišit, zda chcete hledat s diakritikou či bez ní pomocí přepínače na stránce pokročilého hledání.
Pokročilé operátory
+slovo
Znamená, že slovo musí být ve výsledku obsaženo. Použitím rejstřík +zákon tedy říkáte: vrať mi články, kde bude rejstřík, ale musí tam být zároveň zmíněn zákon.
-slovo
Znamená, že slovo nesmí být ve výsledku obsaženo. Dotaz pojištění -daně značí, že hledáte informace o pojištění, ale zároveň nechcete texty, kde se zmiňuje daně.
Žolíci
Znaky * a ? fungují jako zástupní žolíci. Hvězdička zastupuje libovolný počet znaků – inspekc* najde texty se slovy inspekce, inspektoráti inspekční, P*SZ najde PSSZ i překlepové PSZ. Otazník zastupuje právě jeden znak – disku?e najde texty se slovem diskuze i diskuse.
Vyhledávání v nadpisech a perexu
Pomocí konstrukce title:"" můžete hledat pouze v nadpisech článků, např. title:„fondy EU“ vrátí pouze texty, kde je spojení fondy EU v nadpisu. Hledání perex:„zákon“ pak vrátí jen texty, kde se v perexu píše o nějakém zákonu. Můžete hledat i pouze v těle článku – text:„daně“.
Zvýšený důraz na slovo
Pomocí modifikátoru ^ můžete zvýšit váhu hledaného slova, např. dotazem komentář^zákoník práce říkáte, že vás zajímají dokumety s komentáři k zákoníku práce a důraz kladete na slovo komentář. Výpis výsledku pak bude seřazen jinak než při použití dotazu komentář k zákoníku práce. Defaultní hodnota důrazu na slovo je 1, jakékoliv číslo větší než 1 říká, že na slovo kladete větší důraz než na ostatní slova (čím je číslo vyšší, tím vyšší důraz na slovo kladete).
Fuzzy vyledávání
Pomocí modifikátoru ~ můžete aktivovat fuzzy vyhledávání, tj. hledání podobných slov – padák~ najde i panák či padáky. Stupeň podobnosti můžete určit na stupnici 0 až 1 (default je 0.5) – padák~0.3 znamená, že chcete i vzdáleně podobná slova, naopak padák~0.9 znamená, že chcete pouze velmi podobná slova.
Proximity vyhledávání
Položením dotazu „zákon“~4 vyhledáte dokumenty, kde jsou mezi slovy „licence“ a „program“ maximálně čtyři další slova.
Specifické znaky
Pro hledání znaků + – & | ! ( ) { } [ ] ^ " ~ * ? : \ před ně musíte přidat obrácené lomítko.
Stop-words
Některá slova systém neindexuje, protože se vyskytují v (téměř) každém článku a jejich vyhledání nemá na výsledek prakticky žádný vliv. Tato slova se označují jako stop-words a jsou to zejména spojky, předložky apod.
Nyní se již můžete vrátit na stránku vyhledávání a nabyté informace vyzkoušet v praxi.
Vyhledávání je realizováno za pomoci knihovny Lucene.