Piše: Rada Stijović
Procenjuje se da će najsveobuhvatniji Rečnik SANU imati oko 500.000 reči zabeleženih u poslednja dva veka.
Internetom kruži video-snimak u kome se navodi da srpski jezik ima 11 miliona reči i da su one sabrane u Frekvencijskom rečniku srpskog jezika. Pozivanje na ovaj podatak je relativno često, kao i pitanje šta se dogodilo sa tolikim brojem reči i zašto one nisu u upotrebi. Odgovor zahteva osvrt na nastanak pomenutog rečnika.
U periodu od 1955. do 1961. u Institutu za eksperimentalnu fonetiku i patologiju govora pod rukovodstvom Đorđa Kostića sačinjen je korpus reči srpskog jezika iz perioda od 12. do 20. veka. Taj korpus zaista sadrži 11 miliona reči, ali je neophodno definisati šta taj broj predstavlja.
U lingvistici podatak da korpus ima 11 miliona reči znači da u njemu postoji toliko potvrda za postojeće reči, odnosno primera njihove upotrebe. Jedna ista reč je često potvrđena i u više stotina primera – u različitim kontekstima i iz različitih izvora. Na primer u građi za izradu Rečnika SANU postoji preko 1000 potvrda za predlog po. To podrazumeva preko 1000 rečenica, kao što su: „Po ceo dan ide po kući“, „Spava po danu“, „Mota mi se po glavi“, „Poznajem ga po ocu“, „Oni su rod po majci“, „Idi po Boru“, „Ne vozi po magli“, „Ide po kafanama“. U svim ovim slučajevima reč je o istom predlogu, o istoj reči, koja se pojavljuje u različitim kontekstima i različitim značenjima.
Devedesetih godina prošlog veka započeta je digitalizacija korpusa Đorđa Kostića, kojom rukovodi akademik Aleksandar Kostić. Na osnovu pripremljene baze podataka izdat je Frekvencijski rečnik savremenog srpskog jezika u sedam tomova, zasnovan na primerima iz dnevne štampe i poezije. Ovaj rečnik sadrži 1.985.575 reči i 64.100 odrednica. Rečnička odrednica je zapravo nova, zasebna reč.
Ako u ovom rečniku ima oko dva miliona reči i 64.100 odrednica, lako se može zaključiti da bi u pet i po puta većem korpusu (11 miliona) bilo oko 352.000 odrednica, odnosno, toliko zasebnih reči. Poređenja radi, savremeni korpus Društva za jezičke resurse i tehnologije (JerTeh) sadrži preko milijardu reči, što ne znači da jezik ima toliko leksičkih jedinica.
Rada Stijović: Šta su Njegoševe „stalne grudi” koje je Karađorđe dao Srbima?
Procenjuje se da će najsveobuhvatniji Rečnik SANU imati oko 500.000 reči zabeleženih u poslednja dva veka. Tu su ubrojane i dijalekatske obličke varijante, ali nema svih stručnih termina, tako da je broj okviran. Kada bismo ovoj cifri dodali reči iz starijeg perioda, među kojima ima dosta zaboravljenih ili napuštenih zbog nestanka pojmova koje označavaju, broj bi se svakako uvećao, ali nikako ne bi dostigao 11 miliona. To mogu da potvrde postojeći istorijski rečnici, kao što su Rječnik iz književnih starina srpskih Đure Daničića, Frekvencijski rečnik Domentijanovog jezika, dva crkvenoslovenska rečnika, Rečnik naših starih mera, ogledna sveska Srpskoslovenskog rečnika jevanđelja, registri uz izdanja Zakonika cara Stefana Dušana i drugi.
Iako se ne bi došlo ni blizu broja koji se pominje u navedenom video-snimku, iščitavanje ovih rečnika bilo bi korisno za svakoga ko želi da bolje upozna, a možda nekom rečju i obogati sopstveni jezik.
Izvor: Politika Onlajn
