Kiel krei vortfaradilon — dua parto

5 dec

Se oni uzas La Simplan Vortaron hodiaŭ, oni noticias ke la vortfarada serĉo funkcias bone*. Tamen en mia lasta afiŝo pri la vortfaradilo, mi diris ke mi havis problemojn kun multaj eblecoj. Do, kiel mi solvis ĉi tion?

La Defio

Plejofte (pli ol 75% da vortfaradaĵoj) nur estas unu ebleco. ‘Malsanulejo’ ne povas esti io ajn krom ‘mal-san-ul-ej-o’. Tamen ekzistas vortoj kun multaj eblecoj laŭ mia listo de radikoj:

Persone: ‘person-e’, ‘per-son-e’, ‘pers-on-e’

Unue, mi esperis ke mi povus simple ĉiam elekti la ebelecon kun la malplej radikoj. Ĉi tio ofte helpas, sed ne ĉiam:

Homarano: ‘hom-ar-an-o’, ‘homa-ran-o’, ‘ho-mar-an-o’

Oni povus argumenti ke ‘ho’ devus ne esti en la listo de radikoj por vortfarado, sed pli bonas havi ĝeneralan solvon.

La Solvo

Anstataŭ simple ordigi la eblecojn laŭ la kvanto de radikoj, mi bezonis pli inteligenta ordiga metodo. Unue, mi kolektis liston de vortfaradaĵoj kiu havas pli ol unu ebleco en mia vortfaradilo.

Jen la listo:

homarano, hundomalfermilo, persone, altabligi, manĝilaro, renovigi, ripozejo, neniigi, pintigi, senlaborulo, ĉirkaŭrigardi, eksilentigi, intermiksiĝi, memkompreneble, gastigema, malrapidigi, koketulino, bovinejeto, kielvifartulo

Due, mi skribis malgrandan programon, kiu testas ĉiun vortfaradaĵon en ĉiu tiu listo. Ĝi ankaŭ enhavas komarliston de la ĝustaj rezultoj, kiun mi faris sen ilo.

Trie, mi eksperimentis ĝis mi havas bonan metodon por poentigi ĉiun rezulton de la vortfaradilo. Mi kalkulas ‘malbonecon’ por ĉiu ebleco. La formulo estas:

malboneco = (kvanto de radikoj) – 0.5 * (kvanto de afiksoj)

La radikoj kiujn mi konsideras kiel afiksoj estas: –ig-, -il-, -ul-, -ej-, -in-, -an-, -ar-, -ant-, -int-, -ont-

Kompreneble, estas aliaj afiksoj, sed ili ne kaŭzas problemojn. Ekzemple, sen la poentiga metodo, la vortfaradilo preferus -tig- ol -ig- sed bo- ne havas alian radikon kun simila literumado.

Do, la vorto ‘homarano’ povus esti ‘hom-ar-an-o’ (malboneco de 3), ‘homa-ran-o’ (malboneco de 3) aŭ ‘ho-mar-an-o’ (malboneco de 3.5).

La Simpla Vortaro simple montras la du eblecoj kun la malplej malboneco. Ofte la dua estas sensenca (‘inteligent-a’, ‘in-tel-ig-ent-a’) sed iufoje ĝi havas sencon (‘koleg-o’, ‘kol-eg-o’). Mi ne havas metodon por distingi la du tipojn.

Kio ankoraŭ ne funkcias

Mia listo de eblaj vortfaradaĵeroj enhavas -o kaj -a vortoj. Tiel la vortfarada serĉo povas kompreni vortojn kiel ‘dormosako’ kaj ‘ĝustatempe’.

La vorto ‘posteulo’ enhavas -e vorton kiel radiko, sed mi ne aldonis -e vortojn al listo ĉar mi ne kredas ke aliajn tiajn vortojn ekzistas. Do oni ne povas serĉi ‘posteulo’ hodiaŭ per la vortfarada serĉo.

Simile, ‘kielvifartasulo’ kaj ‘vivui’ enhavas plenajn verbojn kiel radikoj. Mi ne havas verbojn kun finaĵojn en mia listo ĉar ĉi tiaj vortoj estas tre malkomunaj.

* Laŭ mia scio. Se vi trovis ekzemplon, kun kiu ĝi ne kalkulas la ĝustan rezulton, bonvolu informi min.

Advertisements

Respondi

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Ŝanĝi )

Twitter picture

You are commenting using your Twitter account. Log Out / Ŝanĝi )

Facebook photo

You are commenting using your Facebook account. Log Out / Ŝanĝi )

Google+ photo

You are commenting using your Google+ account. Log Out / Ŝanĝi )

Connecting to %s

%d bloggers like this: