RELADIC – RELACIJSKI RJEČNIK

(nacrt relacijskog rječnika, objavljen 13.5.2006., autor: Goran Igaly)

Četiri godine nakon pokretanja projekta EH rječnika objavljujem novi korak u izgradnji cjelovitog rječničkog sustava – RELACIJSKI RJEČNIK (eng. RELATIONAL DICTIONARY, skraćeno RELADIC). Reladic predstavlja velik korak u sistematizaciji cjelokupnog ljudskog znanja i temelji se na dvije glavne postavke – jedinstvenom skupu značenja kao univerzalnom identifikatoru svih postojećih pojmova te definiranjem višestrukih relacija (veza) među njegovim elementima. Na ovaj način bitno se poopćava pojam hiperveze i na jednostavan i konzistentan način omogućuje uspostava složene strukture na skupu svih pojmova. Slično kao i kod world wide weba, relacijski rječnik čini skup međusobno povezanih objekata. Pri tome za svaki objekt postoji niz metapodataka, a svaka veza sadrži važne dodatne informacije.

EH.Txt

1. Objekti i relacije

Najkraće govoreći, RELACIJSKI RJEČNIK je relacijska struktura koja omogućuje unificiranu pohranu i prezentaciju svih jednojezičnih i dvojezičnih rječnika.

Formalno govoreći, osnovni objekti relacijskog rječnika su:

-          jedinstveni skup značenja Z, neovisan o jeziku

-          skupovi pojmova pojedinih jezika W_i

-          dvojezični zapisi prijevoda pojmova P_ij za parove jezika

 U relacijskom rječniku svaka dva objekta (pojmovi, značenja, prijevodi) mogu biti u nekoj od relacija r_i iz skupa relacija R={r_1,...,r_n}

2. Jedinstveni identifikator značenja

Relacijski rječnik temeljen je na jedinstvenom identifikatoru značenja svakog uključenog pojma, bez obzira na jezik kojemu pripada taj pojam. Ovaj identifikator obuhvaća jezik, vrstu riječi i jedinstvenu oznaku. Na ovaj način se u relacijskom rječniku točno definira mjesto za svaki pojam koji postoji u barem jednom od obuhvaćenih jezika.

Identifikatori pojmova usklađeni su s oznakama iz WordNeta 2.1. Odnosno, za sve pojmove čija oznaka postoji u Wordnetu 2.1 koriste se u svim jezicima identične oznake. Time se nasljeđuju i relacije uspostavljene u sustavu WordNet 2.1. Ostalim pojmovima pridružuju se nove jedinstvene oznake.

3. Ravnopravnost jezika

Korištenjem relacijskog koncepta stvara se okvir za objedinjavanje svih postojećih svjetskih rječnika u jedan. Ovakvih pokušaja bilo je i ranije, ali relacijskim rječnikom se objedinjavanju pristupa na bitno novi način. U relacijskom rječniku uspostavlja se potpuna ravnopravnost jezika odnosno svi jezici služe istovremeno i kao glavni i kao metajezici.

Na primjer, ako je neki jezik A bogatiji pojmovima u određenom segmentu od jezika B, u relacijskom rječniku koriste se veze koje nepoznati pojam iz jezika A povezuju s pojmovima za koje postoje ekvivalenti u jeziku B. Konkretno, u mnogim jezicima ne postoje standardni naziv za neke biljke odnosno životinje koje ne obitavaju na područjima obuhvaćenim tim jezicima. U takvom slučaju, korisnik rječnika dobit će informaciju o svim pojmovima povezanim s tim pojmom i prijevod takvih pojmova. Time se korisniku na pregledan način izlažu postojeće informacije i otvara put ka konzistentnom proširenju rječnika. Pri tom se nove relacije ne generiraju automatski (česta pogreška u dosadašnjim pristupima), već se samo predlažu, a daljnjom leksikografskom obradom svaki će se pojam nastojati što preciznije smjestiti u jedinstvenu strukturu značenja.

4. Uključivanje rječnika i pojmovnika

Apstraktna struktura relacijskog rječnika implementirana je s ugrađenom redundancijom koja omogućuje trenutno uključivanje djelomično obrađenih rječnika, kao i višestruko povećanje brzine unosa (nekoliko desetaka puta brži unos u odnosu na klasičan način).

Relacijski rječnik omogućuje praktički trenutačno uklapanje sadržaja bilo kojeg jednojezičnog, dvojezičnog rječnika ili stručnog pojmovnika bez gubitka informacija. Pri integriranju novog sadržaja provjerava se konzistencija novog sadržaja s postojećim sadržajem relacijskog rječnika. Broj zapisa i trenutna nekonzistencija sadržaja nije prepreka prezentaciji novog rječničkog sadržaja.

Upotpunjavanjem skupa podataka (novih zapisa i atributa postojećih zapisa) tijekom vremena poboljšava se funkcionalnost i konzistentnost, kako novouklopljenog rječnika/pojmovnika, tako i cjelokupnog relacijskog rječnika.

5. Koristi za krajnje korisnike

S obzirom da je izgradnja rječnika trajan proces koji niti počinje, niti završava, relacijski rječnik je koncipiran tako da u svakom trenutku maksimalno koristi informacije sadržane u postojećim parcijalnim podacima. To znači da relacijski rječnik nema pilot ili testnu fazu, već nastaje postupnim proširenjima postojeće komercijalne verzije EH rječnika (EH.Pro) koju svakodnevno koristi sve veći broj korisnika.

Funkcionalnost pretraživanja i prikaza sadržaja svakog rječnika uklopljenog u relacijski rječnik je veća ili jednaka od izvorne funkcionalnosti uključenog rječnika.

Relacijski rječnik posebno je pogodan za ugradnju multimedijskih sadržaja neovisnih o jeziku, standardnog latinskog nazivlja koje se koristi kao referentno nazivlje u mnogim strukama, pohranjivanje preciznih definicija, ugradnju korisničkih, strukovnih i projektnih pojmovnika, te kao platforma za zajedničku, ali ne i stihijsku, izgradnju univerzalnog rječnika kao polazišne točke pribavljanja informacija, te u kasnijoj fazi - zbog semantičkih veza i pozicioniranja pojmova - kao temeljnog resursa potrebnog za automatsko prevođenje.

6. Poziv na suradnju i potporu projektu

Pri implementaciji relacijskog rječnika vodeću ulogu ima tvrtka Taktika Nova, koja je omogućila pristup rječnicima EH.Web (besplatni englesko-hrvatski rječnik), DH,Web (besplatni njemačko hrvatski rječnik), razvila aplikaciju EH.Pro (englesko-hrvatski rječnik za napredne korisnike), rr.HE (hrvatsko-engleski rečenični rječnik), sudjelovala u realizaciji EH rječnika za dlanovnike i mobilne telefone.

Ukoliko ste u izgradnji relacijskog rječnika prepoznali projekt od trajne vrijednosti, ali i projekt čiji su rezultati, za razliku od projekata s velikim obećanjima, ali bez rezultata, svima dostupni i primjenjivi, pozivam vas da se priključite u jednom od najizazovnijih svjetskih pothvata danas – izgradnji sustava sistematizacije cjelokupnog ljudskog znanja. Pomoći možete na mnoge načine – vlastitim radom, osiguravanjem rječnika za uklapanje u relacijski rječnik, znanstvenom i tehnologijskom suradnjom, promotivnim aktivnostima, sponzorstvom stranica besplatnih web rječnika ili kupnjom nekog od proizvoda čijom prodajom se financira razvoj relacijskog rječnika.

Prepoznajte pravu vrijednost i pomozite oživotvorenju ideje s nesagledivim dugoročnim pozitivnim utjecajem u uspostavi bolje komunikacije među svim ljudima.

Voditelj projekta izrade relacijskog rječnika,

Dr.sc. Goran Igaly

Molim vas da za kontakt ne koristite moju osobnu adresu e-pošte, već adresu posebno namijenjenu komunikaciji vezanoj za relacijski rječnik: reladic@taktikanova.hr . Poštu pristiglu na ovu adresu redovito čita netko iz projektnog tima i ako se radi o pitanju na koje trebam ja osobno odgovoriti, odgovorit ću vam. Samo, molim vas za malo strpljenja, jer rad na relacijskom rječniku zahtijeva neprekinut i koncentriran rad, tako da na pisma odgovaram u serijama.

 

 

O autoru teksta i voditelju projekta

Noviji projekti

Autor tekstualne baze EH.Txt, slobodno dostupne za preuzimanje, na temelju koje je napravljeno preko 40 implementacija englesko-hrvatskog rječnika (2002-)

Voditelj projekata EH.Web (2003-) i DH.Web (2004-), besplatnog englesko-hrvatskog i njemačko-hrvatskog rječnika na Internetu. Na temelju upita postavljenih putem ovih sučelja EH i DH rječnik se proširuju najtraženijim pojmovima.

Voditelj projekta EH.Pro (2005-) – najpotpunijeg internetskog englesko-hrvatskog rječnika namijenjenog zahtjevnim korisnicima i profesionalcima.

Voditelj projekta primjene informacijske tehnologije: Englesko-hrvatski rječnik za prevoditelje (2003-2004, projekt sufinanciran sredstvima Ministarstva znanosti i tehnologije RH)

Voditelj projekta primjene informacijske tehnologije: Hrvatsko-engleski rečenični rječnik (2004-2005, projekt sufinanciran od strane Ministarstva znanosti, obrazovanja i športa RH)

Zaposlenja

1987-1988 Softverski centar R.O. Nikola Tesla

1988- Prirodoslovno-matematički fakultet, Matematički odjel Sveučilišta u Zagrebu, mlađi asistent, asistent, viši asistent, viši predavač

Ostali poslovi

Savjetnik za IT, British Council. Zagreb, 1995-

Savjetnik za baze podataka u Upravi za Informacijsko društvo, Ministarstvo znanosti, obrazovanja i športa RH (ranije Ministarstvo znanosti i tehnologije RH), 2001-

Konzultant za organizaciju procesa prevođenja, Ministarstvo vanjskih poslova i europskih integracija (ranije Ministarstvo europskih integracija) 2002-

Tajnik Seminara za kombinatornu i diskretnu matematiku (1990-), PMF, Matematički odjel, Zagreb

Školovanje

1987. diplomirani inženjer matematičke informatike i statistike (diplomski rad: Potpuna parcijalna uređenja i nesintaktički lambda modeli)

1992. magistar znanosti, matematika (magistarski rad: Teorija hrpa i prebrajanje konveksnih poliomina)

1997. doktor znanosti, matematika (disertacija: Prilozi rješavanju problema automatskog prevođenja korištenjem teorije formalnih jezika)

Znanja i vještine korištene u izgradnji relacijskog rječnika

Priprema podataka

Napredno korištenje Office aplikacija (MS Word, Excel, Access)

Napredno korištenje sustava za upravljanje bazama podataka Paradox for Windows

Napredno korištenje programskih editora korištenjem regularnih izraza

Programiranje u programskom jeziku C

Priprema organizacijske strukture

Relacijske baze podataka

Teorija formalnih jezika, teorija automata

Kombinatorna matematika i teorija grafova

Razvoj koncepta pristupu podacima i sučelja

20 godišnje iskustvo rada s korisničkim programima kroz držanje seminara i računarskih kolegija za potrebe studija matematike

Poznavanje problema prijevoda i terminologije

Suradnja na više projekata lokalizacije poznatih programskih produkata i dokumentacije

Iskustvo s prevoditeljskim alatima tvrtke TRADOS (1994-), SDLX (2005-)

Iskustvo sa specijaliziranim lokalizacijskim programskim alatima pojedinih tvrtki

Aktivnosti vezane uz Internet

1998. pokrenuo akciju širih razmjera putem Interneta (stranica trajno dostupna od tada)

Osmišljavanje Web aplikacija od 2001.

Trenutno  – AJAX, XML, Web servisi

 

Kraj stranice :o)