Квантитативная лингвистика

Поделись знанием:
Перейти к: навигация, поиск

Квантитати́вная лингви́стика (англ. quantitative linguistics) — это раздел общей лингвистики и, в частности, математической лингвистики. Квантитативная лингвистика (КЛ) исследует язык при помощи статистических методов; её конечная цель — сформулировать законы, по которым функционирует язык и, в конечном счете, построить общую теорию языка в виде совокупности взаимосвязанных законов функционирования языков[1] Специально для этой цели была создана синергетическая лингвистика (Synergetic linguistics).[2] КЛ эмпирически основывается на результатах языковой статистики, которая, в свою очередь, может интерпретироваться как статистика языков или статистика лингвистического объекта. Эта область знаний не обязательно связана с фундаментальными научными целями. Корпусная лингвистика и компьютерная лингвистика также вносят свой вклад в КЛ, поставляя важные эмпирические данные.





История

Самые ранние концепции КЛ относятся к древнегреческой и древнеиндийской культурам. Один из исторических источников включает приложения комбинаторики к лингвистическим реалиям[3], другой основывается на элементарных статистических исследованиях, которые можно найти под заголовками колометрия и стихометрия.[4]

Языковые законы в квантитативной лингвистике

В КЛ под законом понимается класс гипотез, выведенных из теоретических допущений, математически сформулированных, взаимосвязанных с другими законами в этой области и в достаточном объёме и успешно проверенных на эмпирических данных, то есть таких, которые нельзя было опровергнуть несмотря на многочисленные попытки. Köhler пишет о законах КЛ: «Более того, можно показать, что эти свойства лингвистических элементов и отношений между ними подчиняются универсальным законам, которые могут быть сформулированы строго математически также как и законы естественных наук. Нужно иметь в виду в данном контексте, что эти законы стохастической природы; они не соблюдаются в каждом отдельном случае (в этом не было бы необходиомсти и возможности); они скорее определяют вероятности событий или количественные отношения изучаемых явлений. Легко найти противоположные примеры каждому из упомянутых выше примеров; тем не менее, эти случаи не нарушают соответствующих законов, поскольку вариации вокруг статистического среднего не только допустимы, но и даже необходимы; сами они квантитативно точно определяются соответствующими законами. Ситуация такая же, как и в естественных науках, которые уже давно отказались от старых детерминистских и каузальных (причинно-следственных) взглядов на мир и заменили их на статистические/вероятностные модели.»[5]

Некоторые языковые (лингвистические) законы

Существует целый ряд языковых законов, среди которых[6]:

  • Закон диверсификации: Если лингвистические категории (такие, например, как части речи или грамматические окончания) появляются в различных формах, то можно сказать, что частоты их появления в текстах контролируются определенными законами.
  • Распределение длин (или, в более общем виде, многокомпонентности). Исследование частот различных языковых единиц с точки зрения их длин в текстах и словарях регулярно приводит к выявлению целого ряда распределений, в зависимости от изучаемой единицы. На данный момент были изучены следующие единицы:
    • Закон распределения длин морфов;
    • Закон распределения длин ритмических единиц;
    • Закон распределения длин предложений;
    • Закон распределения длин слогов;
    • Закон распределения длин слов;

Другие языковые единицы, которые также подчиняются этому закону, — это, например, буквы (символы) различной сложности, длины так называемых hrebs и речевых актов. Это же справедливо и для распределений звуков (фонов) различной длительности (долготы).

  • Закон Мартина: Этот закон касается лексических цепочек, которые образуются при поиске дефиниций (определений) слов в словаре, затем дефиниций только что найденных дефиниций и т. д. В конце концов все эти дефиниции образуют иерархию всё более и более общих значений, при этом дефиниций становится тем меньше, чем более общее значение получается. Среди уровней данной иерархии существует целый ряд подчиняющихся закону отношений.
  • Закон Менцерата (также, в особенности в лингвистике, известный как закон Менцерата-Альтмана): Данный закон гласит, что размеры составляющих конструкции уменьшаются с увеличением самой изучаемой конструкции. Чем длиннее, например, предложение (измеренное количеством входящих в его состав придаточных предложений), тем короче входящие в его состав придаточные предложения (измеренные количеством слов), или: чем длиннее слово (в слогах или морфах), тем короче слоги или слова в звуках.
  • Законы частотно-рангового распределения: Практически любая языковая единица подчиняется этим закономерностям. Приведем лишь несколько примеров:
    • Слова в тексте организованы в соответствии с частотой их появления в тексте, и каждому из них присвоен номер ранга и соответствующая частота. Со времен Джорджа Кингсли Ципфа (широкоизвестный закон Ципфа), предлагалось большое количество математических моделей, описывающих отношения между рангом и частотой.
    • Можно наблюдать похожее распределение между рангом и частотой звуков, фонем и букв.
    • Словесные ассоциации: Ранг и частота ассоциаций реагируют на (словесный) стимул.
  • Закон изменения языка: Процессы роста в языке (как, например, рост словаря), распространение иностранных и заимствованных слов, изменения во флективной системе и т. д. подчиняются закону, известному в КЛ как закон Пиотровского, и соответствуют моделям роста в других научных дисциплинах. Закон Пиотровского — это частный случай так называемой логистической модели (ср. с логистическим уравнением). Было показано, что он затрагивает и процессы усвоение языка (ср. закон усвоения языка).
  • Закон текстового блока: Лингвистические единицы (напр., слова, буквы, синтаксические функции и конструкции) демонстрируют определенное распределение частоты в одинаково больших блоках текстов.
  • Закон Ципфа: Частота слова обратно пропорциональна его порядковому номеру в списках частотности.[7]

Стилистика

Изучение поэтического и непоэтического стилей может основываться на статистических методах; более того, возможно проводить соответствующие исследования на основе особых форм (параметров), которые языковые законы принимают в текстах различных стилей. В таких случаях КЛ проводит исследование в стилистике: одна из итоговых целей — доказать настолько объективно, насколько это возможно, по крайней мере в одной области действий существование стилистического феномена, ссылаясь на действие языкового закона. Одно из главных предположений КЛ состоит в том, что некоторые законы (например, закон распределения длин слов) требуют различных моделей, по крайне мере различных значений параметров закона (распределений или функций), в зависимости от типа текста, к которому принадлежит этот текст. Если изучаются поэтические тексты, то методы КЛ образуют поддисциплину, которая называется «Квантитативное изучение литературы» (Стилометрия).[8]

Напишите отзыв о статье "Квантитативная лингвистика"

Литература

  • Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4.
  • Emmerich Kelih: Geschichte der Anwendung quantitativer Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6.
  • В. В. Левицкий: Квантитативные методы в лингвистике. Нова книга, Винница 2007. ISBN 978-966-382-046-0.

Примечания

  1. Reinhard Köhler: Gegenstand und Arbeitsweise der Quantitativen Linguistik. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik — Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, S. 1-16. ISBN 3-11-015578-8.
  2. Reinhard Köhler: Synergetic linguistics. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik — Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, S. 760—774. ISBN 3-11-015578-8.
  3. N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, S. 109—136.
  4. Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, S. 48-54.
  5. cf. note 1, p. 1-2.
  6. cf. references: Köhler, Altmann, Piotrowski (eds.) (2005)
  7. H. Guiter, M. V. Arapov (eds.): Studies on Zipf’s Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8.
  8. Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik — Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, p. 325—348, esp. Quantitative Stilistik, p. 339—340. ISBN 3-11-015578-8; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9.

Отрывок, характеризующий Квантитативная лингвистика

Потому что это так случилось. «Случай сделал положение; гений воспользовался им», – говорит история.
Но что такое случай? Что такое гений?
Слова случай и гений не обозначают ничего действительно существующего и потому не могут быть определены. Слова эти только обозначают известную степень понимания явлений. Я не знаю, почему происходит такое то явление; думаю, что не могу знать; потому не хочу знать и говорю: случай. Я вижу силу, производящую несоразмерное с общечеловеческими свойствами действие; не понимаю, почему это происходит, и говорю: гений.
Для стада баранов тот баран, который каждый вечер отгоняется овчаром в особый денник к корму и становится вдвое толще других, должен казаться гением. И то обстоятельство, что каждый вечер именно этот самый баран попадает не в общую овчарню, а в особый денник к овсу, и что этот, именно этот самый баран, облитый жиром, убивается на мясо, должно представляться поразительным соединением гениальности с целым рядом необычайных случайностей.
Но баранам стоит только перестать думать, что все, что делается с ними, происходит только для достижения их бараньих целей; стоит допустить, что происходящие с ними события могут иметь и непонятные для них цели, – и они тотчас же увидят единство, последовательность в том, что происходит с откармливаемым бараном. Ежели они и не будут знать, для какой цели он откармливался, то, по крайней мере, они будут знать, что все случившееся с бараном случилось не нечаянно, и им уже не будет нужды в понятии ни о случае, ни о гении.
Только отрешившись от знаний близкой, понятной цели и признав, что конечная цель нам недоступна, мы увидим последовательность и целесообразность в жизни исторических лиц; нам откроется причина того несоразмерного с общечеловеческими свойствами действия, которое они производят, и не нужны будут нам слова случай и гений.
Стоит только признать, что цель волнений европейских народов нам неизвестна, а известны только факты, состоящие в убийствах, сначала во Франции, потом в Италии, в Африке, в Пруссии, в Австрии, в Испании, в России, и что движения с запада на восток и с востока на запад составляют сущность и цель этих событий, и нам не только не нужно будет видеть исключительность и гениальность в характерах Наполеона и Александра, но нельзя будет представить себе эти лица иначе, как такими же людьми, как и все остальные; и не только не нужно будет объяснять случайностию тех мелких событий, которые сделали этих людей тем, чем они были, но будет ясно, что все эти мелкие события были необходимы.
Отрешившись от знания конечной цели, мы ясно поймем, что точно так же, как ни к одному растению нельзя придумать других, более соответственных ему, цвета и семени, чем те, которые оно производит, точно так же невозможно придумать других двух людей, со всем их прошедшим, которое соответствовало бы до такой степени, до таких мельчайших подробностей тому назначению, которое им предлежало исполнить.


Основной, существенный смысл европейских событий начала нынешнего столетия есть воинственное движение масс европейских народов с запада на восток и потом с востока на запад. Первым зачинщиком этого движения было движение с запада на восток. Для того чтобы народы запада могли совершить то воинственное движение до Москвы, которое они совершили, необходимо было: 1) чтобы они сложились в воинственную группу такой величины, которая была бы в состоянии вынести столкновение с воинственной группой востока; 2) чтобы они отрешились от всех установившихся преданий и привычек и 3) чтобы, совершая свое воинственное движение, они имели во главе своей человека, который, и для себя и для них, мог бы оправдывать имеющие совершиться обманы, грабежи и убийства, которые сопутствовали этому движению.
И начиная с французской революции разрушается старая, недостаточно великая группа; уничтожаются старые привычки и предания; вырабатываются, шаг за шагом, группа новых размеров, новые привычки и предания, и приготовляется тот человек, который должен стоять во главе будущего движения и нести на себе всю ответственность имеющего совершиться.
Человек без убеждений, без привычек, без преданий, без имени, даже не француз, самыми, кажется, странными случайностями продвигается между всеми волнующими Францию партиями и, не приставая ни к одной из них, выносится на заметное место.
Невежество сотоварищей, слабость и ничтожество противников, искренность лжи и блестящая и самоуверенная ограниченность этого человека выдвигают его во главу армии. Блестящий состав солдат итальянской армии, нежелание драться противников, ребяческая дерзость и самоуверенность приобретают ему военную славу. Бесчисленное количество так называемых случайностей сопутствует ему везде. Немилость, в которую он впадает у правителей Франции, служит ему в пользу. Попытки его изменить предназначенный ему путь не удаются: его не принимают на службу в Россию, и не удается ему определение в Турцию. Во время войн в Италии он несколько раз находится на краю гибели и всякий раз спасается неожиданным образом. Русские войска, те самые, которые могут разрушить его славу, по разным дипломатическим соображениям, не вступают в Европу до тех пор, пока он там.
По возвращении из Италии он находит правительство в Париже в том процессе разложения, в котором люди, попадающие в это правительство, неизбежно стираются и уничтожаются. И сам собой для него является выход из этого опасного положения, состоящий в бессмысленной, беспричинной экспедиции в Африку. Опять те же так называемые случайности сопутствуют ему. Неприступная Мальта сдается без выстрела; самые неосторожные распоряжения увенчиваются успехом. Неприятельский флот, который не пропустит после ни одной лодки, пропускает целую армию. В Африке над безоружными почти жителями совершается целый ряд злодеяний. И люди, совершающие злодеяния эти, и в особенности их руководитель, уверяют себя, что это прекрасно, что это слава, что это похоже на Кесаря и Александра Македонского и что это хорошо.
Тот идеал славы и величия, состоящий в том, чтобы не только ничего не считать для себя дурным, но гордиться всяким своим преступлением, приписывая ему непонятное сверхъестественное значение, – этот идеал, долженствующий руководить этим человеком и связанными с ним людьми, на просторе вырабатывается в Африке. Все, что он ни делает, удается ему. Чума не пристает к нему. Жестокость убийства пленных не ставится ему в вину. Ребячески неосторожный, беспричинный и неблагородный отъезд его из Африки, от товарищей в беде, ставится ему в заслугу, и опять неприятельский флот два раза упускает его. В то время как он, уже совершенно одурманенный совершенными им счастливыми преступлениями, готовый для своей роли, без всякой цели приезжает в Париж, то разложение республиканского правительства, которое могло погубить его год тому назад, теперь дошло до крайней степени, и присутствие его, свежего от партий человека, теперь только может возвысить его.
Он не имеет никакого плана; он всего боится; но партии ухватываются за него и требуют его участия.
Он один, с своим выработанным в Италии и Египте идеалом славы и величия, с своим безумием самообожания, с своею дерзостью преступлений, с своею искренностью лжи, – он один может оправдать то, что имеет совершиться.
Он нужен для того места, которое ожидает его, и потому, почти независимо от его воли и несмотря на его нерешительность, на отсутствие плана, на все ошибки, которые он делает, он втягивается в заговор, имеющий целью овладение властью, и заговор увенчивается успехом.
Его вталкивают в заседание правителей. Испуганный, он хочет бежать, считая себя погибшим; притворяется, что падает в обморок; говорит бессмысленные вещи, которые должны бы погубить его. Но правители Франции, прежде сметливые и гордые, теперь, чувствуя, что роль их сыграна, смущены еще более, чем он, говорят не те слова, которые им нужно бы было говорить, для того чтоб удержать власть и погубить его.