лингвистическая статистика - применение статистических методов к исследованию произведений речи и системы языка.
См. статистическая лингвистика.
лингвистическая статистика - применение статистических методов к исследованию произведений речи и системы языка.
См. статистическая лингвистика.
Лингвисти́ческая стати́стика
(лингвостатистика) - 1) в широком смысле: область применения
статистических методов в языкознании (см. Количественные методы в языкознании);
2) в узком смысле: изучение некоторых математических проблем,
связанных с лингвистическим материалом, главным образом с типами
статистических распределений языковых единиц в тексте. Наиболее
распространён метод анализа, основанный на так называемом законе Ципфа,
сводящемся к уравнению вида: F × i = const, где F - частота слова в
частотном словаре, а i - ранг этого слова, т. е. номер в списке слов,
упорядоченном по уменьшающейся частоте. С поправочными коэффициентами
Б. Мандельброта закон подтверждается на многих и разнообразных
текстах. Таким образом, закон Ципфа выступает как модель описания распределения слов по частоте,
однако вводимые на каждый случай поправочные коэффициенты в значительной
мере лишают его предсказательной силы. Существуют и другие подобные
модели (работы Г. Хердана, Дж. Б. Кэрролла). Проблема связи частоты
слова и его ранга смыкается с проблемой оценки лексического богатства
текста или совокупности текстов. Обычно Л. с.
рассматривается как лингвистическая дисциплина, однако, будучи связанной
с языкознанием по материалу, она ещё не наполнилась собственно
лингвистическим содержанием. В частности, лингвистическая интерпретация
закона Ципфа остаётся предметом дискуссий.
Фрумкина Р. М., Роль статистических методов в современных
лингвистических исследованиях, в кн.: Математическая лингвистика, М.,
1973;
Орлов Ю. К., Модель частотной структуры лексики, в кн.:
Исследования в области вычислительной лингвистики и лингвостатистики,
[М.], 1976;
Тулдава Ю., К вопросу об аналитическом выражении связи
между объёмом словаря и объёмом текста, «Учёные записки Тартуского
государственного университета», 1980, в. 549, Лингвостатистика и
квантитативные закономерности текста;
Zipf G. K., The psycho-biology of language,
Boston, 1935;
Herdan G., The advanced theory of language as
choice and chance, B. - [a. o.], 1966.
А. Я. Шайкевич.
Применение статистических методов к исследованию системы языка и произведений речи (высказываний, текстов и т. д.).