O projektu

Ivana

Suvremena se leksikografija sve više kreće u smjeru izrade rječnika u digitalnom obliku, izvorno izrađenih za internet. Hrvatska leksikografija trenutačno ima dva mrežna rječnika: Hrvatski jezični portal (koji uključuje opći rječnik hrvatskoga jezika, pravopis i rječnik stranih riječi) i Hrvatski pravopis, dok su frazeološki rječnici dostupni samo u tiskanom obliku. Osim elektroničke leksikografije, nezaobilazan alat u izradi rječnika postali su i računalni korpusi koji omogućavaju ispitivanje stvarne jezične uporabe na temelju velikog broja potvrđenih primjera. Premda postoje tri računalna korpusa hrvatskoga jezika (Hrvatska jezična riznica, Hrvatski nacionalni korpus i mrežni korpus hrWaC), hrvatska leksikografija još uvijek nema rječnik utemeljen na podacima iz korpusa.

Cilj je ovoga projekta izraditi frazeološki rječnik hrvatskoga jezika koji se temelji na računalnome korpusu. Prikupljanje rječničke građe odvija se pretragom računalnog korpusa hrWaC pomoću softverskog alata Sketch Engine koji je od 1. travnja 2018. akademskim institucijama slobodno dostupan tijekom četiri godine, što se financira putem EU-HORIZON2020 infrastrukturnog projekta ELEXIS. Sketch Engine daje uvid u tipično kolokacijsko okruženje leksičkih jedinica (Word sketch) i u razlike između riječi s obzirom na kolokacije u kojima se javljaju (Sketch diff). Budući da su kriterij za uključivanje u rječnik karakterističnost sveza riječi i frekvencija pojavljivanja u korpusu, podaci koje omogućava Sketch Engine osobito su važni, posebno kod vrlo promjenjivih frazema kako bismo mogli sa sigurnošću utvrditi koji su oblici ustaljeni, a u kojim se slučajevima radi o nekonvencionalnoj uporabi. Također, važna je novost u izradi ovoga rječnika konceptualna organizacija frazema. Krajnji rezultat projekta bit će objavljeni mrežni rječnik u otvorenom pristupu.

Ova web-stranica koristi kolačiće za poboljšanje vašeg iskustva. Pretpostavit ćemo da se s time možete slagati, ali možete odbiti ako želite. Prihvati Čitaj više