Od n-grama do višerječnih izraza

O odnosu korpusne lingvistike i leksikogramatike

Autor(i)

  • Mirjana Borucinsky Sveučilište u Rijeci, Pomorski fakultet

Ključne riječi:

korpusna lingvistika; leksikogramatika; n-gram; učestali leksički spoj (ULS)

Sažetak

U ovom radu istražuje se odnos leksika i gramatike kroz n-grame ili učestale leksičke spojeve (ULS) u engleskom i hrvatskom jeziku. Kriteriji utvrđivanja ULS-ova iz n-grama uključuju frekvenciju, rekurentnost, semantičku neovisnost te gramatičku strukturu. ULS-ovi su vrsta višerječnih izraza koji predstavljaju nepotpune strukturne jedinice koje nadilaze gramatičke strukture (npr. at the same time, on the basis of, s obzirom na to, u skladu s člankom itd). Analizom podataka iz korpusa engleskog i hrvatskog jezika pomoću računalnojezikoslovnog alata Sketch Engine (Kilgarriff i dr. 2004) promatra se kako su navedene gramatičke strukture instancirane u tekstu. Za teorijsku osnovu odabran je okvir sistemske funkcionalne gramatike (engl. Systemic Functional Grammar, SFG, Halliday 1994; Halliday i Matthiessen 2004) zbog primjenjivosti i usredotočenosti na jezik u uporabi. U radu se istražuje i sintaktička sinonimija u vidu dvojnih gramatičkih struktura poput in case of + IMENSKA SKUPINA, in case + SUREČENICA; in the event of + IMENSKA SKUPINA, in the event + SUREČENICA i njihovih hrvatskih istovrijednica: u slučaju + IMENSKA SKUPINA i u slučaju + SUREČENICA. Kontrastivnom analizom pokazuje se odnos između gramatičkih i leksičkih struktura te kako je njihova funkcionalnost u tekstu motivirana značenjem. Naglašava se važnost kvantitativne analize podataka dobivenih iz korpusa stavljajući u suodnos korpusnu lingvistiku i leksikogramatiku. Dok postoje brojna istraživanja o ULS-ovima u engleskom jeziku, oni gotovo da i nisu istraživani u hrvatskome. Rad donosi nove podatke o uporabi leksičko-gramatičkih sveza u hrvatskome jeziku. Rezultati istraživanja mogu se primijeniti u poučavanju jezika, kontrastivnim istraživanjima koja povezuju leksikogramatičke obrasce različitih jezika te u unapređenju korpusne metodologije, osobito u pogledu preciznijeg označavanja imenskih skupina i njihovih postmodifikatora.

Preuzimanja

Objavljeno

2025-12-31

Broj časopisa

Rubrika

Izvorni znanstveni članak

Kategorije