Mi diris tion sed celis tion ĉi

28 sep

Imagu ke vi estas komencanto kaj ĵus legis la vorton ‘bedauru’. Ĉi tiu vorto validas, tamen oni nur povas trovi ‘bedaŭri’ en vortaro.

Iu ajn skribsistemo

Do, unue, mi volis ke oni povus uzi ajnan skribsistemon. Bedaŭrinde oni nur povas facile ŝanĝi x-sistemajn vortojn al vortoj kun supersignoj. Estas malpli facila ŝanĝi h-sistemajn vortojn. Mia solvo simplas. El la vortaro  (kiu uzas supersignojn) mi kreas liston de ĉiuj vortoj kun aŭ supersignoj aŭ x-sistemo aŭ h-sistemo (se ili malsamas):

aĉeti ->

aĉeti, acxheti, acheti

bedaŭri ->

bedaŭri, bedauxri, bedauri

ĉirkaŭ ->

ĉirkaŭ, cxirkaux, chirkau

domo ->

domo

Nun kiam uzanto serĉas per ajn sistemo mi povas trovi la deziratan vorton.

Iu ajn tenso

Tamen mi ne povas garantii ke uzanto tajpos verbojn kun i-finaĵoj. Do mi ankaŭ bezonis permesi as-finaĵojn, is-finaĵojn k.t.p. Denove mi kreas liston de ĉiu ebleco (kaj poste aldoni ilin en ĉiu skribsistemo):

aĉeti ->

aĉeti, aĉetis, aĉetas, aĉetos, aĉetus, aĉetu ->

aĉeti, aĉetis, aĉetas, aĉetos, aĉetus, aĉetu, acxeti, acxetis, acxetas, acxetos, acxetus, acxetu, acheti, achetis, achetas, achetos, achetus, achetu

bedaŭri ->

bedaŭri, bedaŭris, bedaŭras, bedaŭros, bedaŭrus, bedaŭru ->

bedaŭri, bedaŭris, bedaŭras, bedaŭros, bedaŭrus, bedaŭru, bedauxri, bedauxris, bedauxras, bedauxros, bedauxrus, bedauxru, bedauri, bedauris, bedauras, bedauros, bedaurus, bedauru

celi ->

celi, celis, celas, celos, celus, celu ->

celi, celis, celas, celos, celus, celu

Iu ajn finaĵo

Ĉi tio estas pli bona, sed oni povas fari plu. Verboj povas fini kun -i, -is, -as, -os, -us aŭ -u, sed indas ankaŭ pensi pri substantivoj, adjektivoj kaj adverboj (mi ne volas uzi la vortojn ‘o-vorto’ k.t.p. kiel PMEG ĉar mi ankaŭ parolas pri oj-vortoj k.c.). Do mi ankaŭ kreas similajn listojn por ili:

fromaĝo ->

fromaĝo, fromaĝon, fromaĝoj, fromaĝojn ->

fromaĝo, fromaĝon, fromaĝoj, fromaĝojn, fromagxo, fromagxon, fromagxoj, fromagxojn, fromagho, fromaghon, fromaghoj, fromaghojn

blua ->

blua, bluaj, bluan, bluajn ->

blua, bluaj, bluan, bluajn

antaŭe ->

antaŭe, antaŭen ->

antaŭe, antaŭen, antauxe, antauxen, antaue, antauen

Limoj

Kompreneble, ekzistas vortoj kiuj havas finaĵojn kie la finaĵo ne signifas la vortotklason. La vorto ‘la’ havas -a finaĵon, sed mi tute ne volas aldoni al mia listo la vortojn ‘laj’, ‘lan’ ‘lajn’. Do mi zorgeme legis ReVo, kaj provis trovi ĉiu de ĉi tiaj vortoj en ĝi:

Neverbaj i-vortoj:  mi, vi, li, ŝi, ĝi, oni, ili, si, ci, ĉi, ahi, fi, ĥi, -ologi, pli

Nesubstantivaj o-vortoj: ho, do, po

Neadjektivaj a-vortoj: ta ta ta, hura, pa, aha, ba, ha, tra, la, ja

Neadverbaj e-vortoj: de, je, ĉe, he, ve, ehe, ke, ne, tre, Kabe

Verŝajne mankis iom da ili en ĉi tiu. Ĝi ne gravas (kvankam plaĉus se mi havus plenan liston) ĉar kiam mi malĝuste aldonas finaĵojn al vortoj, mi simple pligrandigi la verŝajnecon de ili aperos en la vortara serĉo.

Nenombraj vortoj ankaŭ estas problemo tie ĉi. Oni ne povas diri ‘laktoj’, sed ĝi aperas en mia listo. Denove ĉi tiu ne gravas ĉar ĉi tiuj listoj nur helpas serĉadon, ne ŝanĝas difinojn.

Mi ankaŭ eksciis ke korelativoj malsamas (ekz. ‘kiu’ agas kiel adjektivo) do mia softvaro traktas ilin aparte.

Eĉ pli bona

Do, mi nun havas solvon por trovi la vorton ‘bedauru’. Sed kion oni faras kiam la literumado estas malĝusta (ekz. ‘beduaru’)? Ĝi ankoraŭ estas trovebla, ĉar mi povas uzi mian literumadan korektilon kun la listo! Hura!

Poemo: Lazaro Ludoviko

19 sep

Mi ĵus trovis ĉi tion en mia domo:


Vidu, Lazaro Ludoviko,
Jen konflikto en Bjalistoka plac’.
Kial najbar’ devas esti malamiko?
Kion fari, ke regu pac’?
      Vi pensas…

“Malamikete de la nacjes.
Kadó, kadó, jam temp’ está!
La tot’ homoze en familje
Konunigare so debá.

Skribu, Lazaro Ludoviko,
en kajeron, vortojn de vigla kant’!
Novlingva via poemo kun muziko
varbos nin al pra-Esperant’.
      Ni kantos:

“Malamikete…” ktp

Aŭdu, Lazaro Ludoviko,
aplaŭdadon de la aŭskultintar’!
Pro via ĵusa inspira retoriko
eĥas ĝi tra Bulonj’-ĉe-Mar’
      Aŭskultu!:

“Malamikete…” ktp

Tenu, Lazaro Ludoviko,
ĉiam firman kredon en via kor’
ke, spit’ al ĉia malica polemiko,
venkos vi en decida hor’.
      Memoru:

“Malamikete…” ktp

Kredu, Lazaro Ludoviko,
al luktado baldaŭ jam venos fin’,
kaj paca mond’ konvinkiĝos pri l’ logiko
de l’ mondlingvo, kaj benos vin, –
      – kiu diris:

“Malamikete…” ktp

Ho nacioj, ĉesu malamiki,
falu, falu baroj inter vi!
Jam paciĝu la Homaro, kaj fariĝu
unu granda famili’!


Fakte, ĉi tiu ne estas poemo sed kantotekso verkita de Terry Page. Tamen mi aŭdis ĝin kiel poemo, kaj ĝi estas la unua fojo ke mi aŭdis esperantan poemon. Mi ne komprenis ĉion tiam, kaj la uzado de pra-Esperanto ne helpis. La refreno en hodiaŭa Esperanto:

Malamikeco de la nacioj.
Falu, falu, jam temp’ estas!
La tuta homaro en familion
Kununuigi sin devas.

Kiam mi iris al SES-2010, mi trovis malmutekostan antaŭposedatan ekzempleron de ‘Esperantan Antologion’. Mi ĝuas ĝin, kaj ĝi estas bonega fonto de novaj vortoj. En ĝi, la poemoj estas ordigitaj laŭ la tempo kiam ili estis verkitaj. Oni povas vidi ŝanĝojn inter la plej fruaj poemoj (ĉiuj estas finvenkistaj) kaj la malpli malnovaj poemoj (kiuj temas pri io ajn). Do kompreneble la refreno, kiu estas la plej malnova teksto en Esperanto, estas finvenkista. Mi ne ĉiam scias, kiel oni devus reagi al ĉi tiaj poemoj. Iam mi ĝuas la ritmon, la rimojn aŭ la enkapbildojn, sed iam ili nur aspektas kiel optimismego.

Literuma Korektilo

15 sep

Ofte kiam mi uzas retajn vortarojn, mi serĉas vortojn kiujn mi ne bone konas. Eble mi iomete misaŭdis la vorton aŭ simple ne tute konas la ĝustan literumadon.

Malfeliĉe, aliaj retaj vortaroj ne havas korektilon. Ĝi ne estas tre malfacile se oni komprenas dinamikajn retejojn. Do, mi kreis esperantan literuman korektilon pli malpli laŭ la informo ĉi tie (en la angla).

La ideo estas simpla. Se oni havas la (malĝustan) vorton episodo,

  1. Listigi ĉiun variaĵon kie apudaj literoj anstaŭas unu la alian: peisodo, eipsodo, epsiodo, epiosdo, episdoo, episood
  2. Listigi ĉiun variaĵon kie unu literon estas foriganta: pisodo, eisodo, epsodo, epiodo, episdo, episoo, episod
  3. Listigi ĉiun variaĵon kiu havas plian literon: aepisodo, bepisodo, […] eapisodo, ebpisodo, [..] episodov, episodoz
  4. Listigi ĉiun variaĵon kiu havas unu ŝanĝitan literon: apisodo, bpisodo, cpisodo, ĉpisodo, dpisodo, fpisodo, […] episodv, episodz

Poste, oni serĉas ciun variaĵon en la vortaro, kaj se la vortaro enhavas ilin, ili restas. Do la fina rezulto estas epizodo (fakte ĉi tiu vorto estis eraro en Podkastaro).

Kompreneble, povas esti pli ol unu ebleco. Ekzemple, la malĝusta vorto epizodz povus esti (laŭ ReVo) epizodoepizoda. Tamen ĉi tiu ne estas problemo, la vortaro simple bezonas montri ĉiun eblecon.

Kiel normale, la kodo estas havebla. Mi nun verkas la videblan parton de la vortaro, kaj ankaŭ esploras “kion fari kiam la vorto estas vortfarita?”, sed tio devas atendi alian blogafiŝon.

xkcd 695: Spirit

28 aŭg

Malgaja, sed iel dolĉa. Mi ankoraŭ ne estas tute kontenta pri ‘Mars-aŭto’, sed Vikipedio nur uzas la tre longa “aŭtonoma esplorada vaganta veturilo”.

Duplikataj Vortoj En Vortaro

15 aŭg

Hodiaŭ mi daŭrigas miajn esplorojn por mia vortaro. Mi esploris ĉu du vortoj povas esti skribita same en ajn sistemo.

Unue, mi serĉis vortojn kiu havas pli ol unu difino en REVO. Mi trovis 110 vortojn, kiu estas skribita same sed havas malsamajn difinojn.

alburno
aro
asekura agento
[…]
vato
ventkapa
vojreto

Mi trovis 96 vortojn pliajn, kiu estas skribita same krom majuskleco.

Abelo
Aerpumpilo
Afganio
[…]
Virgulino
Volto
Vorto

La plena listo estas elŝutebla.

Mi ofte scivolis ĉu la h-sistemo enkondukas aliajn dusencaĵojn. Ekzemple, se “fluĝaveno” estus vorto, oni ne povus distingi inter “fluĝaveno” kaj “flughaveno” en la h-sistemo. Feliĉe, mi malkovris ke ne ekzistas tiaj vortoj en REVO. Verŝajne ne ekzistas tiaj vortoj eĉ kun kunmetitaj aŭ vortfaritaj vortoj.

Serĉado de vortaro

Kiel ĉi tiu rilatas al mia vortaro? Nu, mi volas ke ĝi estos uzebla en aŭ unikodo aŭ la h-sistemo aŭ la x-sistemo. Oni vidas ciun sistemon sur la reto, kaj oni ne ĉiam povas diveni kiu sistemo estis uzita. La solvo estas simpla: oni kreas tri listojn de vortoj en la vortaro, kaj la vortaro serĉas ciujn.

17 septembron 2010: forigis eraron dank’ al Ĵeromo, la listo espereble estas ĝusta nun.

Vortoj En La Reta Vortaro

10 aŭg

Ĉi tiam estas ekscitanta tempo por retaj esperantistoj. Estas du retaj Eo-Eo vortaroj nuntempe: Lernu kaj ReVo (almenaŭ kiun mi konas). Ankaŭ, PIV planas eldoni retan version.

Dum la pasintaj malmultaj monatoj, mi ankaŭ planis krei retan vortaron! Jen stranga mondo. Mi ne volas (kaj ne povas) anstataŭigi la aliajn, sed mi volas eksperimenti kun la interfaco por helpi uzantojn. Mia kodo estos libera, do mi esperas ke miaj ideoj helpos aliajn komputikajn esperantistojn ankaŭ.

ReVo kiel fonto da vortoj kaj difinoj

ReVo enhavas multegajn vortojn, kaj ĉiuj estas elŝuteblaj. La difinoj ankaŭ estas tre bonaj. Bedaŭrinde, la XML-aj dosieroj havas tro komplikan struktoron. Jen ekzemplo:

<br>
&lt;kap&gt;brazil&lt;tld/&gt;arbo, &lt;var&gt;&lt;kap&gt;brazila &lt;tld/&gt;arbo&lt;/kap&gt;&lt;/var&gt;&lt;/kap&gt;<br>

Do mi ne povis kolekti la vortojn facile. Tamen, mi sukcesis (mi nur havas la vortojn sole nuntempe) kaj mi skribis programeton por fari ĉi tion.

Post mi havis liston de la vortoj, mi bezonis ordigi ilin. Por tio, denove mi skribis kodon.

Finfine, la listo da vortoj ankaŭ estas elŝutebla se oni ne volas uzi la kodon.

Mi ankoraŭ havas multon kiun mi devas fari por krei mian vortaro. Tamen, se vi volas uzi ReVon aŭ simple bezonas liston da vortoj, mi esperas ke ĉi tio estas utila por vi.

Ĝisdatigo: Mi ĵus malkovris ke ankoraŭ ekzistas tri problemoj kun ĉi tiu listo. (1) ekzistas vortoj kun krampoj, (2) estas malmultaj nevolataj komoj kaj (3) problemoj restas kun \n. Mi ĝisdatigos ĝin baldaŭ.

xkcd 776: Ankoraŭ Sen Dormo

9 aŭg