Коллокация (лингвистика)
Коллокация — словосочетание, имеющее признаки синтаксически и семантически целостной единицы, в котором выбор одного из компонентов осуществляется по смыслу, а выбор второго зависит от выбора первого (например, ставить условия — выбор глагола ставить определяется традицией и зависит от существительного условия, при слове предложение будет другой глагол — вносить).
К коллокациям также обычно причисляют составные топонимы, антропонимы и другие часто совместно употребляемые именования (например, крейсер «Аврора», завод имени Кирова).
Другое наименование того же явления — устойчивые, или фразеологические словосочетания, N-граммы.
СвойстваПравить
В отличие от идиом (подложить свинью, темна вода в облацех и т. п.) коллокации широко распространены, без них невозможно говорить по-русски.
Слово, которое сохраняет своё значение, называется ключевым, или свободным компонентом: слово влияние в оказывать влияние, слово смысл в сочетании глубокий смысл. Свободный компонент порождается по обычным правилам порождения речи: подбирается по значению в зависимости от выражаемого смысла. Слово, выбор которого определяется традицией, зависит от ключевого компонента и должен храниться в памяти (в словаре), называется несвободным компонентом. Для того, чтобы выбрать правильный глагол при слове влияние, необходимо не только представлять, какой смысл нужно выразить (смысл «делать»), но и помнить (или узнать из словаря), что это глагол оказывать, а не делать, не производить, не создавать.
Большая часть коллокаций выражает ограниченное количество стандартных смыслов, названных в модели «Смысл — Текст» лексическими функциями: оказывать влияние — это функция Oper, глубокое потрясение — Magn и т. п.
Классификация коллокацийПравить
Коллокации по синтаксически главному слову делятся на:
- глагольные (оказать влияние, внести изменения, идет дождь);
- именные (высокая температура, рост влияния).
Коллокации также могут классифицироваться в зависимости от функционального стиля, в котором они употребляются. Большинство коллокаций — книжные: научные (вести исследования), официально-деловые (выносить приговор), газетно-публицистические (энтузиазм охватил). Но есть и разговорные (нести ерунду, молоть чушь).
По лексическому составу коллокации делятся на :
- Несоставные
- Незаменяемые
- Неизменяемые
У несоставных коллокаций смысл полностью отличается от её составных частей. Это, как правило, идиомы и идиоматические выражения. Например, дать дуба, наставить рога и пр.
Незаменяемые коллокации не допускают синонимическую замену одного слова другим. В этот класс входят устойчивые обороты и метафоры. Например, белое вино нельзя заменить на прозрачное вино или жёлтое вино и пр.
Неизменяемые коллокации содержат жёсткие связи между словами, не разрешающие их изменять с помощью дополнительной лексики или замены грамматической функции. Например, сердце в пятки не заменить на сердце в пятку, а (ходить) вокруг да около — на (ходить) вокруг дома да около.
Ещё одна классификация коллокаций — на разрывные и неразрывные. В разрывные коллокации могут попадать второстепенные слова (жизнь кипит и жизнь его кипит, жизнь его постоянно кипит и пр.).
МетодыПравить
Коллокации выявляются при лексическом анализе текста. Статистические методы, отмечающие частоту совместного употребления, могут помочь их обнаружить в весьма малой степени. Некоторые статистические методы получения коллокаций:
- Частотные методы (обычно используются с частеречным фильтром англ. POS-filter)[1].
- Подсчёт среднего значения и дисперсии (для поиска разрывных коллокаций)[2].
- C-value — показывает устойчивость коллокаций[3].
- Методы, основанные на теореме Байеса.
- Т-критерий (или критерий Стьюдента)[4].
- Критерий Хи-квадрат[5].
- Метод отношения правдоподобия[6].
- Взаимная информация (MI & PMI)[7][8].
См. такжеПравить
ПримечанияПравить
- ↑ John S. Justeson, Slava M. Katz. Technical terminology: some linguistic properties and an algorithm for identification in text. (англ.) // Natural Language Engineering (англ.) (рус. : journal. — 1995. — Vol. 1. — P. 9—27.
- ↑ Frank Smadja. Retrieving collocations from text: Xtract. (неопр.) // Computational Linguistics. — 1993. — Т. 19. — С. 143—177.
- ↑ Hirosi Nakagawa. Corpus-based extension of a terminological semantic lexicon. (англ.) // In Recent Advances in Computational Terminology. John Benjamins, : journal. — 2001. — P. 327—351.
- ↑ Kenneth Ward Church and Patrick Hanks. Word association norms, mutual information and lexicography. (неопр.) (PDF) 76—83 (1989). Архивировано 22 июля 2012 года.
- ↑ Kenneth W. Church and A. Gale. William. Concordances for parallel text. (неопр.) // In Proceedings of the Seventh Annual Conference of the UW Centre for the New OED and Text Research, Oxford. — 1991. — С. 40—62.
- ↑ Fred J.Damerau. Generating and evaluating domain-oriented multi-word terms from texts. (англ.) // Information Processing & Management (англ.) (рус. : journal. — 1993. — Vol. 29. — P. 433—447.
- ↑ Kenneth Church, Gale William , Patrick Hanks, and Donald Hindle. Using statistics in lexical analysis. (неопр.) // In Uri Zernik (ed.), Lexical Acquisition: Exploiting On-Line Resources to Build a Lexicon, Hillsdale, NJ: Lawrence Erlbaum.. — 1991. — С. 115—164.
- ↑ Robert M. Fano. Transmission of information; a statistical theory of communications. (англ.) // New York: MIT Press. : journal. — 1961.
ЛитератураПравить
- Виноградов В. В. Русский язык. — М.: 1947.
- Регинина К. В., Тюрина Г. П., Широкова Л. И. Устойчивые сочетания русского языка. — М.: 1978
- Мельчук И. А. Опыт теории лингвистических моделей «Смысл — Текст». — М: 1976.
- Фразеологический подфонд машинного фонда русского языка. — М.: 1990.
- Борисова Е. Г. Коллокации. Что это такое и как их изучать? — М.: 1996.
- Борисова Е. Г. Слово в тексте. Словарь коллокаций (устойчивых сочетаний) русского языка. — М.: 1996
СсылкиПравить
- Перевод на русский язык 5-й части книги К. Меннинга и Г. Шютце «Основы статистической обработки естественного языка», где рассказывается о различных видах коллокаций и методах их получения и оценки.
- Пример коллокаций (ассоциаций) к слову «Влияние»
Для улучшения этой статьи желательно:
|