Пише: Рада Стијовић
Процењује се да ће најсвеобухватнији Речник САНУ имати око 500.000 речи забележених у последња два века.
Интернетом кружи видео-снимак у коме се наводи да српски језик има 11 милиона речи и да су оне сабране у Фреквенцијском речнику српског језика. Позивање на овај податак је релативно често, као и питање шта се догодило са толиким бројем речи и зашто оне нису у употреби. Одговор захтева осврт на настанак поменутог речника.
У периоду од 1955. до 1961. у Институту за експерименталну фонетику и патологију говора под руководством Ђорђа Костића сачињен је корпус речи српског језика из периода од 12. до 20. века. Тај корпус заиста садржи 11 милиона речи, али је неопходно дефинисати шта тај број представља.
У лингвистици податак да корпус има 11 милиона речи значи да у њему постоји толико потврда за постојеће речи, односно примера њихове употребе. Једна иста реч је често потврђена и у више стотина примера – у различитим контекстима и из различитих извора. На пример у грађи за израду Речника САНУ постоји преко 1000 потврда за предлог по. То подразумева преко 1000 реченица, као што су: „По цео дан иде по кући“, „Спава по дану“, „Мота ми се по глави“, „Познајем га по оцу“, „Они су род по мајци“, „Иди по Бору“, „Не вози по магли“, „Иде по кафанама“. У свим овим случајевима реч је о истом предлогу, о истој речи, која се појављује у различитим контекстима и различитим значењима.
Деведесетих година прошлог века започета је дигитализација корпуса Ђорђа Костића, којом руководи академик Александар Костић. На основу припремљене базе података издат је Фреквенцијски речник савременог српског језика у седам томова, заснован на примерима из дневне штампе и поезије. Овај речник садржи 1.985.575 речи и 64.100 одредница. Речничка одредница је заправо нова, засебна реч.
Ако у овом речнику има око два милиона речи и 64.100 одредница, лако се може закључити да би у пет и по пута већем корпусу (11 милиона) било око 352.000 одредница, односно, толико засебних речи. Поређења ради, савремени корпус Друштва за језичке ресурсе и технологије (ЈерТех) садржи преко милијарду речи, што не значи да језик има толико лексичких јединица.
Рада Стијовић: Шта су Његошеве „сталне груди” које је Карађорђе дао Србима?
Процењује се да ће најсвеобухватнији Речник САНУ имати око 500.000 речи забележених у последња два века. Ту су убројане и дијалекатске обличке варијанте, али нема свих стручних термина, тако да је број оквиран. Када бисмо овој цифри додали речи из старијег периода, међу којима има доста заборављених или напуштених због нестанка појмова које означавају, број би се свакако увећао, али никако не би достигао 11 милиона. То могу да потврде постојећи историјски речници, као што су Рјечник из књижевних старина српских Ђуре Даничића, Фреквенцијски речник Доментијановог језика, два црквенословенска речника, Речник наших старих мера, огледна свеска Српскословенског речника јеванђеља, регистри уз издања Законика цара Стефана Душана и други.
Иако се не би дошло ни близу броја који се помиње у наведеном видео-снимку, ишчитавање ових речника било би корисно за свакога ко жели да боље упозна, а можда неком речју и обогати сопствени језик.
Извор: Политика Онлајн
