Provided by:
hunspell_1.2.6-1ubuntu2_i386 
NĂV
hunspell - a Hunspell ĂĄllomĂĄnyainak formĂĄtuma
LEĂRĂS
A Hunspell(1) kĂŠt ĂĄllomĂĄnyt igĂŠnyel egy adott nyelven tĂśrtĂŠnĹ
helyesĂrĂĄs-ellenĹrzĂŠshez. Az elsĹ ĂĄllomĂĄny egy szĂłtĂĄrĂĄllomĂĄny,
ami az adott nyelv szavait, ĂŠs ezek kapcsolĂłit (attribĂştumait)
tartalmazza. A mĂĄsodik ĂĄllomĂĄny egy ragozĂĄsi (affixum) ĂĄllomĂĄny,
ami meghatĂĄrozza az emlĂtett kapcsolĂłk jelentĂŠsĂŠt.
SZĂTĂRĂLLOMĂNY
Egy hunspell szĂłtĂĄrĂĄllomĂĄny (*.dic) elsĹ sora a
szĂłtĂĄrĂĄllomĂĄnyban lĂŠvĹ szavak kĂśzelĂtĹ szĂĄmĂĄt tartalmazza (az
optimĂĄlis mĂŠretĹą memĂłriaterĂźlet lefoglalĂĄsĂĄhoz). A tĂśbbi sor
soronkĂŠnt egy szĂłt tartalmaz. Minden szĂł utĂĄn nem kĂśtelezĹen egy
perjel, ĂŠs egy, vagy tĂśbb kapcsolĂł kĂśvetkezhet. A kapcsolĂłk
egybetĹąsek, ĂŠs meghatĂĄrozzĂĄk, hogy milyen toldalĂŠkokat kaphat a
tĹszĂł, illetve milyen egyĂŠb speciĂĄlis tulajdonsĂĄgokkal rendelkezik.
PĂŠldĂĄul a
1
hunspellezik/EeX
szĂłtĂĄr egy szĂłt tartalmaz (hunspell), ami a magyar ragozĂĄsi
ĂĄllomĂĄny alapjĂĄn alanyi ĂŠs tĂĄrgyas igeragozĂĄst is vonz (E ĂŠs e
kapcsolĂłk), valamint igekĂśtĹ prefixumokat is kaphat. A pĂŠlda
szĂłtĂĄrĂĄllomĂĄny ĂŠs a magyar ragozĂĄsi ĂĄllomĂĄny alapjĂĄn a
meghunspelleztĂŠtek helyes szĂłkĂŠnt kerĂźlne felismerĂŠsre.
A szĂłtĂĄri szavak perjelet is tartalmazhatnak, ha az fordĂtott
perjellel van bevezetve: "". A kapcsolĂłk alapĂŠrtelmezĂŠskĂŠnt egy
karakteresek, de ha tĂśbb ragozĂĄsi osztĂĄlyt szeretnĂŠnk hasznĂĄlni,
ez tĂśbb karakteresre vagy szĂĄmra is mĂłdosĂthatĂł.
A Hunspell szĂłtĂĄrĂĄllomĂĄnyok sorai kiegĂŠszĂtĹ adatmezĹket is
tartalmazhatnak, amelyek szĂłkĂśzĂśkkel vagy tabulĂĄtorokkal vannak
elvĂĄlasztva (l. kiegĂŠszĂtĹ adatmezĹk).
A szemĂŠlyes szĂłtĂĄrak egyszerĹą szĂłlistĂĄk. Megadhatunk perjellel
elvĂĄlasztott pĂŠldaszavakat is a toldalĂŠkolĂĄs engedĂŠlyezĂŠsĂŠre:
Obama/Tamara
A pĂŠldĂĄban a Tamara szĂł toldalĂŠkolĂĄsĂĄt a szemĂŠlyes szĂłtĂĄr
Obama szavĂĄra is alkalmazza az ellenĹrzĹ, elfogadva az ObamĂĄrĂłl,
ObamĂĄĂŠkat stb. alakokat is.
RAGOZĂSI ĂLLOMĂNY
A ragozĂĄsi ĂĄllomĂĄny rendszerint kisebb mĂŠretĹą. KĂźlĂśnfĂŠle
definĂciĂłkat ĂŠs ragozĂĄsi szabĂĄlyokat ad meg meghatĂĄrozott
kulcsszĂłival. PĂŠldĂĄul a SET a karakterkĂłdolĂĄs, a TRY
javaslattevĂŠsnĂŠl mĂłdosĂtot betĹąk, a REP a javaslattevĂŠsnĂŠl
mĂłdosĂtott szĂłrĂŠszletek, a PFX ĂŠs az SFX pedig a szĂł elejĂŠre ĂŠs
vĂŠgĂŠre illesztendĹ toldalĂŠkok megadĂĄsĂĄra szolgĂĄl.
A kĂśvetkezĹ pĂŠlda egy UTF-8-as kĂłdolĂĄsĂş szĂłtĂĄr
affixumĂĄllomĂĄnyĂĄnak definĂciĂłja. A TRY felsorolja a magyar betĹąket
gyakorisĂĄgi sorrendjĂźkben, a LANG beĂĄllĂtja a magyar nyelvet, a
WORDCHARS megadja azokat a karaktereket, amelyeket a parancssori
Hunspell a szavak rĂŠszekĂŠnt fog kezelni.
SET UTF-8
TRY ĂóúĂĂĂtaeslzĂĄnorhgkiĂŠdmyĹpvĂśbucfjߏxwqTAESLZĂNORHGKIĂDMYĹPVĂBUCFJĂŰXWQ-.
LANG hu_HU
WORDCHARS -.§%â°Â°0123456789
REP 2
REP j ly
REP ly j
PFX X Y 3
PFX X 0 meg .
PFX X 0 rĂĄ .
PFX X 0 Ăśssze .
SFX e Y 6
SFX e ik tĂźk e[dz]ik
SFX e ik tĂŠtek e[dz]ik
SFX e ik tĂŠk e[dz]ik
SFX e 0 tĂźk e[dzt]
SFX e 0 tĂŠtek e[dzt]
SFX e 0 tĂŠk e[dzt]
SFX f Y 2
SFX f ik het/e e[dz]ik
SFX f ik tet/e e[dz]ik
A REP a j ĂŠs ly felcserĂŠlĂŠse esetĂŠn ad jĂł ĂŠs elĂśl rangsorolt
javaslatokat. A PFX-ek pĂĄr igekĂśtĹt definiĂĄlnak, az SFX-ek pedig
pĂĄr igeragot. Ezek nagyobb rĂŠszĂŠnĂŠl a szĂł vĂŠgi ik is levĂĄgĂĄsra
kerĂźl a toldalĂŠk illesztĂŠse elĹtt. Itt az illesztĂŠs feltĂŠtele,
hogy az igĂŠk -edik vagy -ezik karaktersorozatra vĂŠgzĹdjenek,
kĂźlĂśnben pedig az -ed, -ez vagy -et betĹąkre. Az f jelĹą
toldalĂŠkolĂĄsi osztĂĄly ĂŠrdekessĂŠge, hogy a -het ĂŠs -tet
illesztĂŠse utĂĄn mĂŠg folytatĂłdhat a toldalĂŠkolĂĄs az e jelĹą
toldalĂŠkolĂĄsi osztĂĄllyal (ezt a het/e ls tet/e hatĂĄrozza meg), Ăgy
kaphat -hettĂźk, -hettĂŠtek, -hettĂŠk, -tettĂźk, -tettĂŠtek, -tettĂŠk
toldalĂŠkokat a szĂłtĂĄrban szereplĹ levelezik szĂł:
1
levelezik/e
ĂLTALĂNOS PARAMĂTEREK
A Hunspell forrĂĄs tĂśbb mint 80 pĂŠldĂĄt tartalmaz a paramĂŠterek
hasznĂĄlatĂĄra vonatkozĂłan. A kĂśvetkezĹ leĂrĂĄs nem teljes, l. mĂŠg
az angol kĂŠzikĂśnyvoldalt is.
SET karakterkĂłd
A szĂłtĂĄr ĂŠs affixumĂĄllomĂĄny karakterkĂłdolĂĄsĂĄnak beĂĄllĂ-
tĂĄsa. A lehetsĂŠges ĂŠrtĂŠkek: UTF-8, ISO8859-1-tĹl
ISO8859-10-ig, ISO8859-13-ISO8859-15, KOI8-R, KOI8-U, microsoft-
cp1251, ISCII-DEVANAGARI.
FLAG ĂŠrtĂŠk
A kapcsolĂłk 1 karakteres alapbeĂĄllĂtĂĄsĂĄnak mĂłdosĂtĂĄsa. (A
ragozĂĄsi osztĂĄlyokat ĂŠs egyĂŠb tulajdonsĂĄgokat jelĂślik a
kapcsolĂłk, amelyek alapĂŠrtelmezĂŠs szerint 1 karakteresek, a
pĂŠkdĂĄkban legtĂśbbszĂśr nagybetĹąvel szerepelnek). Az `UTF-8'
ĂŠrtĂŠkkel Unicode karaktereket hasznĂĄlhatunk kapcsolĂłkĂŠnt
(UTF-8 kĂłdolĂĄssal ĂŠs maximum 65 ezres karakterkĂłdig), a
`long' ĂŠrtĂŠkkel kĂŠt karakteres kapcsolĂłkat (tĂśbb kapcsolĂł
esetĂŠn sincs elvĂĄlasztĂłjel, a `num' ĂŠrtĂŠkkel vesszĹvel
elvĂĄlasztott decimĂĄlis szĂĄmokat 1-tĹl 65 ezerig.
COMPLEXPREFIXES
KĂŠtszeres prefixumillesztĂŠst ĂĄllĂt be (de csak egyszeres
szuffixumokat az alapĂŠrtelmezett kettĹ helyett.) JobbrĂłl balra
ĂrĂł ragasztĂł nyelveknĂŠl hasznos.
LANG nyelvkĂłd
Nyelv megadĂĄsa (nyelvfĂźggĹ programrĂŠszek bekapcsolĂĄsĂĄhoz)
az ISO nyelv- ĂŠs rĂŠgiĂłkĂłddal (pl. hu_HU).
IGNORE karakterek
A felsorolt karaktereket tĂśrli a szĂłtĂĄri szavakbĂłl ĂŠs
toldalĂŠkokbĂłl, valamint a bemeneti szavakbĂłl. Hasznos az
opcionĂĄlis ĂrĂĄsjelek, mint az arab vagy a hĂŠber mellĂŠkjelek
kezelĂŠsĂŠre.
AF a_kĂśvetkezĹ_AF_sorok_szĂĄma
AF kapcsolĂłk
A Hunspell program kĂŠpes a kapcsolĂłhalmazokat egy termĂŠszetes
szĂĄmmal helyettesĂteni a szĂłtĂĄrĂĄllomĂĄnyban ĂŠs a
tĂśbbszĂśrĂśs toldalĂŠkĂĄsnĂĄl az affixumĂĄllomĂĄnyban (alias
tĂśmĂśrĂtĂŠs), felgyorsĂtva ezzel a szĂłtĂĄr betĂśltĹdĂŠsĂŠt ĂŠs
csĂśkkentve a program memĂłriaigĂŠnyĂŠt. Egy rĂśvid pĂŠlda:
3
hello
try/1
work/2
Ăs a kapcsolĂłdĂł AF definĂciĂłk az affixumĂĄllomĂĄnyban:
SET UTF-8
TRY esianrtolcdugmphbyfvkwzESIANRTOLCDUGMPHBYFVKWZ'
AF 2
AF A
AF AB
Ami megfelel a kĂśvetkezĹ szĂłtĂĄrĂĄllomĂĄnynak:
3
hello
try/A
work/AB
LĂĄsd mĂŠg a tests/alias* pĂŠldĂĄt a forrĂĄsban.
MegjegyzĂŠs: az AF sorok nem elĹzhetik meg a FLAG paramĂŠtert. Alias
tĂśmĂśrĂtĂŠsre szolgĂĄl a Hunspell makealias segĂŠdprogramja.
AM a_kĂśvetkezĹ_AM_sorok_szĂĄma
AM morfolĂłgiai_ĂŠs_egyĂŠb_adatmezĹk
A Hunspell program kĂŠpes a kiegĂŠszĂtĹ adatmezĹket egy
termĂŠszetes szĂĄmmal helyettesĂteni, az AF paramĂŠterhez
hasonlĂłan. LĂĄsd mĂŠg a tests/alias* pĂŠldĂĄt a forrĂĄsban.
JAVĂTĂSI PARAMĂTEREK
Az alapĂŠrtelmezett n-gram, illetve betĹącserĂŠn ĂŠs -tĂśrlĂŠsen
alapulĂł javaslatokat kiegĂŠszĂthetjĂźk a javĂtĂĄsi paramĂŠterekkel. A
REP segĂt a tipikus hibĂĄk ĂŠs javĂtĂĄsuk megadĂĄsĂĄban. A PHONE a
kiejtĂŠst kevĂŠsbĂŠkĂśvetĹ ĂrĂĄsrendszereknĂŠl nyĂşjt segĂtsĂŠget.
KEY
szomszĂŠdos_karakterek_opcionĂĄlisan_fĂźggĹleges_vonallal_elvĂĄlasztva
A nyelv alapĂŠrtelmezett billentyĹązetkiosztĂĄsĂĄt adhatjuk meg
a KEY paramĂŠterrel, hogy a javaslatoknĂĄl a szomszĂŠdos betĹąk
elĂźtĂŠsĂŠt felismerje a program. A nem szomszĂŠdos betĹąket
fĂźggĹleges vonallal vĂĄlaszthatjuk el:
KEY Üßó|qwertzuiopĹĂş|asdfghjklĂŠĂĄĹą|Ăyxcvbnm
TRY karakterek
A javaslattevĂŠsnĂŠl az 1 karakteres prĂłbĂĄlkozĂĄsoknĂĄl az itt
felsorolt karakterekre cserĂŠl, illetve bĹvĂt. A paramĂŠternĂŠl
a kis- ĂŠs nagybetĹąket kĂźlĂśn kell megadni.
NOSUGGEST kapcsolĂł
Az itt definiĂĄlt kapcsolĂłval jelĂślt szavakat a program nem
javasolja a hibajavĂtĂĄsnĂĄl. VulgĂĄris ĂŠs obszcĂŠn szavak
esetĂŠben hasznos.
MAXNGRAMSUGS
Az n-gram (n hosszĂş szĂłrĂŠszletek megegyezĹsĂŠge alapjĂĄn
sĂşlyozott) javaslatok maximĂĄlis szĂĄmĂĄnak beĂĄllĂtĂĄsa.
AlapĂŠrtelmezetten 5. A 0 ĂŠrtĂŠk kikapcsolja az n-gram
javaslatokat.
NOSPLITSUGS
Nem javasol szĂłfelbontĂĄst a Hunspell ezzel a beĂĄllĂtĂĄssal.
HiĂĄnyzĂł ĂśsszetettszĂł-kezelĂŠs esetĂŠn hasznos a hibĂĄs
kĂźlĂśnĂrĂĄsi javaslatok tiltĂĄsĂĄra.
SUGSWITHDOTS
Ha a hibĂĄs szĂł pont(ok)ra vĂŠgzĹdik, ezeket a javaslatok
esetĂŠben is feltĂźnteti. Az OpenOffice.org szĂłtĂĄrak szĂĄmĂĄra
nem szĂźksĂŠges ez a beĂĄllĂtĂĄs.
REP szĂĄm
REP mit mire
A javĂtĂĄsi cseretĂĄblĂĄzat megadĂĄsĂĄra szolgĂĄlĂł definĂciĂłk.
Az elsĹ REP utĂĄn adjuk meg a tĂśbbi REP sor szĂĄmĂĄt. Ezek a
sorok mĂĄr kĂŠt paramĂŠtert vĂĄrnak: elĹszĂśr megadjuk a
felismerendĹ mintĂĄt (hibĂĄs szĂłrĂŠszletet), utĂĄna pedig azt a
karaktersorozatot, amire a felismert mintĂĄt javĂtani
szeretnĂŠnk. A helyesĂrĂĄs-ellenĹrzĹ a cseretĂĄblĂĄzat rĂŠvĂŠn
tud helyes javaslatot tenni tĂśbbkarakteres eltĂŠrĂŠs (pl. j-ly)
esetĂŠn.
A szĂłkĂśz alĂĄhĂşzĂĄsjellel helyettesĂtendĹ a javaslatokban:
REP 1
REP vĂŠgĂźlis vĂŠgĂźl_is
A szervĂz, szintĹą ĂŠs a hasonlĂł hibĂĄs Ăśsszetett szavak
letiltĂĄsĂĄban szintĂŠn a REP tĂĄblĂĄzat segĂt a CHECKCOMPOUNDREP
megadĂĄsĂĄval (l. ott).
MAP a_MAP_definĂciĂłk_szĂĄma
MAP karakterek
Rokon karaktereket adhatunk meg tĂśbb sorban. A
javaslattevĂŠsnĂŠl tĂśbb rokon karakter cserĂŠje is lehetsĂŠges,
Ăgy pĂŠldĂĄul ĂŠkezet nĂŠlkĂźli szavakat is kĂŠpes ĂŠkezetesĂ-
teni a Hunspell a kĂśvetkezĹ definĂciĂł mellett:
MAP 5
MAP aĂĄ
MAP eÄ‚Å
MAP iĂ
MAP oóÜĹ
MAP uúߏ
PHONE a_PHONE_definĂciĂłk_szĂĄma
PHONE karakterek
A PHONE egy tĂĄblĂĄzattal megadhatĂł fonetikus ĂĄtĂrĂĄsi
algoritmust hasznĂĄl a kiejtĂŠsi hasonlĂłsĂĄg kiszĂĄmĂtĂĄsĂĄra.
KĂźlĂśnĂśsen hasznos azoknĂĄl a nyelveknĂŠl, ahol az ĂrĂĄs nem
tĂźkrĂśzi a kiejtĂŠst. A rĂŠszletes dokumentĂĄciĂł az Aspell
helyesĂrĂĄs-ellenĹrzĹ oldalĂĄn ĂŠrhetĹ el angol nyelven:
http://aspell.net/man-html/Phonetic-Code.html.
MegjegyzĂŠs: a szabĂĄlyokban szereplĹ kapcsos zĂĄrĂłjelek nem
tartalmazhatnak mĂŠg tĂśbb byte-os UTF-8 karaktereket, ahogy a
kĂśtĹjeles kifejezĂŠsek is byte-ot jelĂślnek, nem karaktert
Unicode szĂłtĂĄr esetĂŠn is.
SZĂ-ĂSSZETĂTELEZĂSI PARAMĂTEREK
BREAK a_BREAK_definĂciĂłk_szĂĄma
BREAK karakter_vagy_karaktersorozat
Ha a keresett szĂł nincs a szĂłtĂĄrban, a felsorolt
karaktereknĂŠl vagy karaktersorozatoknĂĄl felbontja ĂŠs
rĂŠszenkĂŠnt ellenĹrzi. Hasznos pĂŠldĂĄul a kis- ĂŠs
nagykĂśtĹjeles szavaknĂĄl a magyarban.
COMPOUNDRULE
RegulĂĄris kifejezĂŠsekhez hasonlĂł ĂśsszetĂŠteli szabĂĄlyok
megadĂĄsa.
COMPOUNDMIN szĂĄm
A legkisebb szĂłhossz, ami mĂŠg Ăśsszetett szĂłban szerepelhet.
AlapĂŠrtelmezĂŠs szerint 3 karakter.
COMPOUNDFLAG kapcsolĂł
Itt adható meg a szóÜsszetÊtelben való szereplÊst
engedĂŠlyezĹ kapcsolĂł.
COMPOUNDBEGIN kapcsolĂł
A kapcsolĂł az Ăśsszetett szavak elsĹ tagjakĂŠnt engedĂŠlyezi a
megjelĂślt szavakat.
COMPOUNDLAST kapcsolĂł
A kapcsolĂł az Ăśsszetett szavak utolsĂł tagjakĂŠnt engedĂŠlyezi
a megjelĂślt szavakat. KombinĂĄlhatĂł az elĹzĹ kapcsolĂłval.
COMPOUNDMIDDLE kapcsolĂł
A kapcsolĂł az Ăśsszetett szavak kĂśzbensĹ tagjakĂŠnt
engedĂŠlyezi a megjelĂślt szavakat. KombinĂĄlhatĂł a kĂŠt elĹzĹ
kapcsolĂłval.
ONLYINCOMPOUND kapcsolĂł
Csak az Ăśsszetett szavakban megjelenĹ ragozĂĄs jelĂślĂŠsĂŠre
szolgĂĄlĂł kapcsolĂł (germĂĄn nyelvek esetĂŠben tipikus).
CIRCUMFIX kapcsolĂł
Ezzel a kapcsolĂłval jelĂślt szuffixum csak ugyanilyen
kapcsolĂłval jelĂślt prefixummal jelenhet meg egy tĂśvĂśn. (Pl.
leg-ĂŠdes-ebb).
COMPOUNDPERMITFLAG kapcsolĂł
AlapĂŠrtelmezĂŠs szerint a prefixumok ĂŠs szuffixumok nem
fordulhatnak elĹ az Ăśsszetett szavak belsejĂŠben. A
COMPOUNDPERMITFLAG kapcsolĂłval rendelkezĹ affixumok viszont itt
is megjelenhetnek.
COMPOUNDFORBIDFLAG kapcsolĂł
ToldalÊkolt szavak szóÜsszetÊtelben való szereplÊsÊt
tiltĂł kapcsolĂł. A tiltĂĄshoz az adott SFX szabĂĄly folytatĂĄsi
osztĂĄlyakĂŠnt (l. kĂŠsĹbb) adjuk meg ezt a kapcsolĂłt.
COMPOUNDROOT kapcsolĂł
A szĂłtĂĄrba kĂśzvetlenĂźl felvett Ăśsszetett szavakat jelĂślĹ
kapcsolĂł. A COMPOUNDWORDMAX, ĂŠs Ăgy a magyar esetĂŠben a
6â3-as szabĂĄly mĹąkĂśdĂŠsĂŠt befolyĂĄsolja azzal, hogy a
COMPOUNDROOT kapcsolĂłval Ăśsszetettnek jelĂślt szavak kĂŠt
szĂłnak szĂĄmĂtanak.
COMPOUNDWORDMAX szĂĄm
A szóÜsszetÊtelekben szereplŠegyszerŹ tÜvek maximålis
szĂĄma. A magyar esetĂŠben 2 az ĂŠrtĂŠk, e fĂślĂśtti
szĂłszĂĄmnĂĄl mĂĄr ĂŠletbe lĂŠp a 6â3-as szabĂĄly.
COMPOUNDSYLLABLE szĂĄm karakterek
KĂŠt paramĂŠtert vĂĄr. Az elsĹ megadja az Ăśsszetett szavak
tĂśvĂŠnek maximĂĄlis szĂłtagszĂĄmĂĄt, ami a magyar helyesĂrĂĄs
6â3-as szabĂĄlya szerint 6. A mĂĄsodik mezĹ felsorolja a
magĂĄnhangzĂłkat, ami a szĂłtagszĂĄm megĂĄllapĂtĂĄsĂĄhoz
szĂźksĂŠges. Ha hiĂĄnyzik ez a definĂciĂł, akkor nincsen
korlĂĄtozĂĄs az Ăśsszetett szavak tĂśvĂŠnek szĂłtagszĂĄmĂĄra
vonatkozĂłan.
SYLLABLENUM kapcsolĂłk
Egy paramĂŠtert vĂĄr. A paramĂŠterben megadhatĂłak azok a
ragozĂĄsi osztĂĄlyok, amelyek ragozĂĄs esetĂŠn eggyel nĂśvelik
az Ăśsszetett szavak tĂśvĂŠnĂŠl kiszĂĄmĂtott szĂłtagszĂĄmot. A
magyarban ezek a mellĂŠknĂŠvkĂŠpzĹk: kerĂŠkpĂĄrjavĂtĂĄsainkrĂłl,
de kerĂŠkpĂĄr-javĂtĂĄsi. A
FORBIDDENWORD kapcsolĂł
A tiltott szavakat jelĂślĹ kapcsolĂł. A tiltott szĂłtĂśvek
toldalĂŠkolt alakjai is letiltĂĄsra kerĂźlnek. A tiltott szavak
akår toldalÊkolåsi, vagy szóÜsszetÊteli szinonimakÊnt sem
kerĂźlnek elfogadĂĄsra.
PSEUDOROOT kapcsolĂł
A kapcsolĂłval jelĂślt szavak toldalĂŠkolt alakjai kerĂźlnek
csak elfogadĂĄsra. FiktĂv tĂśvek megadĂĄsĂĄra szolgĂĄlĂł
kapcsolĂł. A tĹ lehet mĂŠg helyes szĂł, ha ĂŠrvĂŠnyes
szinonimakĂŠnt elĹĂĄll vagy szerepel a szĂłtĂĄrban.
WORDCHARS karakterek
ParamĂŠtere azok a karakterek, amelyek a beĂĄllĂtott kĂłdolĂĄs
(pl. a magyar esetĂŠben az ISO-8859-2) betĹąi mellett mĂŠg az
adott nyelv szavaiban elĹfordulhatnak. Ilyen pĂŠldĂĄul a
magyarban a kĂśtĹjel, pont, szĂĄzalĂŠkjel, fokjel, paragrafusjel
ĂŠs a nagykĂśtĹjel. Az utĂłbbi csak UTF-8, vagy microsoft-cp1250
karakterkĂŠszlet mellett lesz hasznĂĄlhatĂł a magyar
szĂłtĂĄrban.
PFX kapcsolĂł keresztkombinĂĄlĂłdĂĄs szĂĄm
PFX kapcsolĂł levĂĄgĂĄs prefixum feltĂŠtel morfolĂłgia
Prefixum megadĂĄsĂĄra szolgĂĄlĂł definĂciĂłk. A prefixumok
egykarakteres nĂŠvvel jelĂślt osztĂĄlyokba vannak sorolva. A
pĂŠldĂĄban az X osztĂĄly definĂciĂłja lĂĄthatĂł. Az egyes
osztĂĄlyokra vonatkozĂł PFX fejlĂŠc tartalmazza a kĂśvetkezĹket:
(1) az osztĂĄly betĹąjelĂŠt (a pĂŠldĂĄban X)
(2) a keresztbe valĂł kombinĂĄlĂĄs engedĂŠlyezĂŠse, illetve
tiltĂĄsa (Y/N). EngedĂŠlyezĂŠs esetĂŠn az adott prefixum akkor
is alkalmazhatĂł, ha a tĹszĂł toldalĂŠkolt alakban fordul elĹ.
Ehhez az is szĂźksĂŠges, hogy a toldalĂŠk (affixum) ragozĂĄsi
osztĂĄlyĂĄban is legyen engedĂŠlyezve a kombinĂĄlĂĄs.
(3) az osztĂĄlyba tartozĂł bejegyzĂŠsek szĂĄmĂĄt
A PFX fejlĂŠcet kĂśvetĹ sorokban a PFX paramĂŠterek jelentĂŠse a
kĂśvetkezĹ:
(1) az osztĂĄly betĹąjele
(2) a ragozĂĄsnĂĄl a szĂł elejĂŠrĹl levĂĄlasztandĂł
karaktersorozat. Ha nem kell levĂĄlasztani, akkor 0.
(3) a prefixum (pĂŠldĂĄul igekĂśtĹ, vagy a leg-, legesleg- a
mellĂŠkneveknĂŠl). Perjellel elvĂĄlasztva kapcsolĂłkat is
megadhatunk (l. tĂśbbszĂśrĂśs toldalĂŠkolĂĄs).
(4) a minta, ami ha illeszkedik, alkalmazhatĂł a szabĂĄly.
PĂŠldĂĄul ha itt kutya szerepelne, akkor csak a kutya kezdetĹą
szavak elĂŠlehetne tenni az ebben a sorban megadott prefixumot.
A minta megadĂĄsĂĄnĂĄl a pont (.) speciĂĄlis jelentĂŠssel bĂr:
minden karakterre illeszkedik. Megadhatunk csak bizonyos
karakterekre illeszkedĹ mintĂĄt is szĂśgletes zĂĄrĂłjelek segĂ-
tsĂŠgĂŠvel. PĂŠldĂĄul az [abcd] illeszkedik az a, b, c, illetve
d karakterekre is. EllentĂŠtben az Ispell-lel, a kĂśtĹjel
szerepe a szĂśgletes zĂĄrĂłjelek kĂśzĂśtt nem speciĂĄlis, vagyis
kĂśtĹjelet jelent, ĂŠs nem karaktertartomĂĄnyt. Ha a nyitĂł
szĂśgletes zĂĄrĂłjel utĂĄn kalap (^) karakter talĂĄlhatĂł, a
karaktertartomĂĄny komplementerĂŠre illeszkedik a minta,
hasonlĂłan a regulĂĄris kifejezĂŠsekhez (l. regex(7)).
(5) MorfolĂłgiai leĂrĂĄs. SzĂłkĂśzzel vagy tabulĂĄtorral
elvĂĄlasztott mezĹk. A mezĹnevek ĂŠs hasznĂĄlatuk az angol
kĂŠzikĂśnyvoldalon talĂĄlhatĂł.
SFX kapcsolĂł keresztkombinĂĄlĂłdĂĄs szĂĄm
SFX kapcsolĂł szuffixum feltĂŠtel mofolĂłgiai_leĂrĂĄs
A PFX-szel megegyezĹ paramĂŠtereket kap, csak nem a szĂł eleji,
hanem a szĂł vĂŠgi toldalĂŠkok leĂrĂĄsĂĄra szolgĂĄl. A
pĂŠldĂĄban szereplĹ definĂciĂłk jelentĂŠse: az -edik, vagy -ezik
vĂŠgĹą szavakra alkalmazhatĂł a hĂĄrom szabĂĄly. A rag
illesztĂŠsĂŠnĂŠl levesszĂźk a szĂł vĂŠgi -ik karaktersorozatot,
ĂŠs szabĂĄlytĂłl fĂźggĹen illesztjĂźk a -tĂźk, -tĂŠtek, -tĂŠk
toldalĂŠkokat, vĂŠgeredmĂŠnyben -edtĂźk, -edtĂŠtek, -edtĂŠk,
illetve -eztĂźk, -eztĂŠtek, -eztĂŠk vĂŠgĹą szavakat kapva.
TĂśbbszĂśrĂśs toldalĂŠkolĂĄs
A PFX ĂŠs az SFX szabĂĄlyokban a toldalĂŠk perjellel
elvĂĄlasztva kapcsolĂłkat is kaphat, hasonlĂłan a
szĂłtĂĄrĂĄllomĂĄny tĂśveihez. A kapcsolĂłk a kĂśvetkezĹek
lehetnek:
(1) SFX szabĂĄlyban az SFX folytatĂĄs jelentĂŠse, hogy a
toldalĂŠk mĂŠg tovĂĄbb ragozĂłdhat a megadott kapcsolĂłkkal
(tĂśbbszĂśrĂśs affixumlevĂĄlasztĂĄs). A Hunspell esetĂŠben csak
a kĂŠtszeres affixumlevĂĄlasztĂĄs lett megvalĂłsĂtva, tehĂĄt a
folytatĂĄsi osztĂĄly folytatĂĄsĂĄt mĂĄr nem veszi figyelembe a
program.
(2) SFX szabĂĄlyban a PFX folytatĂĄs jelentĂŠse, hogy az adott
prefixum is hozzĂĄjĂĄrulhat a tĹhĂśz, feltĂŠve, ha az SFX
szabĂĄly is ĂŠl.
(3) PFX szabĂĄlyban az SFX szabĂĄly jelentĂŠse, hogy a
megjelĂślt SFX szabĂĄly a tĹhĂśz jĂĄrulhat, ha a PFX szabĂĄly is
ĂŠl.
(4) ONLYINCOMPOUND kapcsolĂł megadĂĄsĂĄval az adott PFX vagy SFX
toldalÊk csak szóÜsszetÊtelben jelentkezhet.
(5) CIRCUMFIX kapcsolĂł megadĂĄsĂĄval az adott SFX csak az
ugyanilyen toldalĂŠkot kapĂł PFX-szel egyĂźtt fordulhat csak
elĹ.
(6) Az ĂśsszetĂŠteli kapcsolĂłk megadĂĄsĂĄval engedĂŠlyezhetjĂźk
vagy letilthatjuk (COMPOUNDFORBIDFLAG) az ĂśsszetĂŠtelben valĂł
szereplĂŠst. A Ăśsszetett szavak utolsĂł tagja alapĂŠrtelmezĂŠs
szerint minden affixumot felvehet. A kĂśzbensĹ szavaknĂĄl
viszont explixit mĂłdon engedĂŠlyezni kell ezt.
A ragozĂĄsi ĂĄllomĂĄny ezeken kĂvĂźl mĂŠg megjegyzĂŠseket is
tartalmazhat, ezĂŠrt az adott szĂłtĂĄr vĂĄltozatĂĄt, szerzĹjĂŠt,
felhasznĂĄlĂĄsi engedĂŠlyeit itt keressĂźk.
SAJĂT SZĂTĂR
A sajĂĄt szĂłtĂĄr formĂĄtuma kĂśzel megegyezik a szĂłtĂĄrĂĄllomĂĄny
formĂĄtumĂĄval. A kĂźlĂśnbsĂŠgek a kĂśvetkezĹek:
(1) Nem kell megadni az elsĹ sorban az ĂĄllomĂĄnyban lĂŠvĹ szavak
mĂŠretĂŠt.
(2) A szĂłhoz nem kapcsolĂłkat, hanem egy mintaszĂłt adhatunk meg, ami
alapjĂĄn az ellenĹrzĹ a szĂł toldalĂŠkolt alakjait is felismeri.
PĂŠldĂĄul a Patyomkin/ĂdĂĄm azt jelenti, hogy a Patyomkin szĂłt az
ĂdĂĄmĂŠval megegyezĹ ragozĂĄssal is el kell fogadni.
(3) A csillag tiltĂĄst jelent: a csillaggal jelĂślt szavakat az
ellenĹrzĹ akkor sem ismeri fel, ha az alapszĂłtĂĄrban szerepelnek, pl.
*kĂłricĂĄl.
(4) Az ĂĄllomĂĄny kĂŠzzel mĂłdosĂthatĂł, ĂŠs ezt idĹnkĂŠnt javasolt is
megtenni, ha esetleg hibĂĄsan vettĂźnk fel szavakat.
LĂSD MĂG
angol nyelvĹą hunspell (4), hunspell (1), ispell (1), ispell (4),
Magyar Ispell dokumentĂĄciĂł.
TĂRTĂNET
A MySpell szĂłtĂĄr-, illetve ragozĂĄsi ĂĄllomĂĄnyĂĄnak formĂĄtumĂĄt
Kevin Hendricks kĂŠszĂtette olyan cĂŠllal, hogy lehetĹvĂŠtegye ezen
ĂĄllomĂĄnyok gyors, futĂĄs idejĹą feldolgozĂĄsĂĄt.
A COMPOUNDFLAG ĂŠs a Hunspell formĂĄtumbĹvĂtĂŠst, valamint a REP
tĂśbbkarakteres cseretĂĄblĂĄzatot NĂŠmeth LĂĄszlĂł kĂŠszĂtette
elsĹsorban a jobb magyar nyelvĹą helyesĂrĂĄs-ellenĹrzĂŠs cĂŠljĂĄbĂłl. A
minimĂĄlis ĂśsszetettszĂł-kezelĂŠst lehetĹvĂŠtevĹ COMPOUNDMIN,
COMPOUNDFLAG, ĂŠs a REP tĂśbbkarakteres cseretĂĄblĂĄzat rĂŠsze a
hivatalos MySpell fĂźggvĂŠnykĂśnyvtĂĄrnak is.
A Hunspell szĂłtĂĄrĂĄllomĂĄnyĂĄnak formĂĄtuma megegyezik a MySpell
fĂźggvĂŠnykĂśnyvtĂĄrĂŠval, a ragozĂĄsi tĂĄblĂĄzat pedig a fentiekben
felsorolt bĹvĂtĂŠseket tartalmazza. A bĹvĂtett formĂĄtumĂş affixum
ĂĄllomĂĄny gond nĂŠlkĂźl egyĂźttmĹąkĂśdik az eredeti MySpell
fĂźggvĂŠnykĂśnyvtĂĄrral is, de a bĹvĂtĂŠsek nem fognak mĹąkĂśdni. SĹt,
mivel a hivatalos MySpell egy megengedĹbb ĂśsszetettszĂł-kezelĂŠst
valĂłsĂt meg, mint a magyar vĂĄltozat, az Ăśsszetett szavakon belĂźli
toldalĂŠkolt alakok is elfogadĂĄsra kerĂźlnek (ez kĂźlĂśnĂśsen sok
hibĂĄs ĂśsszetĂŠtel elfogadĂĄsĂĄt eredmĂŠnyezi a magyar nyelv
esetĂŠben).
EbbĹl fakad, hogy a hivatalos Magyar OpenOffice.org
(http://office.fsf.hu) - mivel a Magyar MySpell fĂźggvĂŠnykĂśnyvtĂĄrat
tartalmazza - jobban tĂĄmogatja a magyar nyelvet, mint mĂĄs
vĂĄltozatok. EgyszerĹąen meggyĹzĹdhetĂźnk arrĂłl, hogy melyik
vĂĄltozattal van dolgunk: Ărjuk be, hogy helyesĂrĂĄsellenĹrzĹ az OOo
szĂśvegszerkesztĹjĂŠbe. Ha hibĂĄsnak jelzi, ĂŠs helyesĂrĂĄs-ellenĹrzĹt
javasol helyette, a Hunspell-lel van dolgunk. Ha helyesnek fogadja el,
akkor pedig az eredeti MySpell-lel.
2008. ĂĄprilis 11. hunspell(4)