Машинный фонд русского языка

Поделись знанием:
Перейти к: навигация, поиск

Машинный фонд русского языка — проект создания большого представительного корпуса русского языка. Опыт МФРЯ используется при разработке, начиная с 2004 года, Национального корпуса русского языка.





Программа по созданию МФРЯ

Отдел Машинного фонда русского языка был создан в 1985 году по инициативе академика А. П. Ершова, после состоявшейся в 1983 году специальной всесоюзной конференции[1] Под руководством члена-корреспондента АН СССР Ю. Н. Караулова в Институте русского языка была разработана «Комплексная программа научных исследований и прикладных разработок по созданию Машинного фонда русского языка на 1996—2000 годы и информатизации исследований».

В создании Машинного фонда русского языка (1986—1990 гг.) принимали участие более 40 организаций-соисполнителей, среди них Московский, Ленинградский, Харьковский, Гродненский, Сыктывкарский и Саратовский университеты.

Под комплексной информатизацией научных исследований и прикладных разработок в русистике понималось:

  • Последовательное оснащение отделов Института русского языка и организаций-соисполнителей современными вычислительными машинами с перспективой объединения их в локальную сеть (не выполнено)
  • Последовательное накопление на машинных носителях и в базах данных главнейших источников, необходимых как для научного изучения русского языка, так и для осуществления прикладных разработок (выполнено частично)
  • Создание программных средств, необходимых как для подготовки научных трудов по филологии, так и для проведения прикладных разработок (разработаны 2 программы под MS DOS и переведены в электронный вид несколько словарей);
  • Развитие прикладных направлений (лексикография, терминоведение, автоматическая обработка данных на естественном языке) как составной части академической русистики, являющихся, с одной стороны, проводником результатов фундаментальных исследований в практику, а с другой — источником новых идей и данных для фундаментальной науки (программа не реализована).

Реализация программы (1985—1992)

За 8 лет работы отделом Машинного фонда русского языка (частично с участием соисполнителей) были осуществлены:

  • Разработка концепции и архитектуры Машинного фонда русского языка [2].
  • Разработка концепции терминологического банка данных [3]
  • Накопление значительного количества источников — накоплены на машинных носителях и частично в базах данных текстовые источники русской литературы XIX—XX вв., главнейшие словари русского языка, Краткая академическая грамматика, некоторые другие материалы справочного характера, созданы текстовые корпусы поэзии, художественной прозы, общественно-политических и технических текстов [4]
  • Разработка двух программ под управлением MS DOS:
 — UNILEX-T для изготовления частотных словарей, словоуказателей (индексов слов к текстам) и конкордансов и работы с последними [5]
 — UNILEX-D для создания словарных баз данных и работы с последними.[6]
  • Разработка программно-источниковых пакетов (их разработка была остановлена), например:
Автоматический Синтаксический словарь русского языка
Автоматический словарь синонимов русского языка
Автоматический вариант Словаря русского языка С. И. Ожегова
Автоматический словарь глагольного управления в русском языке.[7]

Деятельность отдела МФ русского языка (1992—1998)

Полномасштабные испытания систем обработки лингвистических данных UNILEX путём участия в подготовке Орфографического словаря и Словаря поэзии XX в.

Ускоренное накопление новых источников на основе электронных изданий газет и сканирования произведений русского классической литературы. Полный архив источников Машинного фонда русского языка сейчас составляет более 100 млн словоупотреблений;

Работа над словарем языка Ф. М. Достоевского[8].

Накопление источников в целях широкого дистрибутивно-статистического исследования русской прозы последней трети XIX в. и газет конца XX в.

Накопление и анализ дистрибутивно-статистических данных, подготовка публикаций сводных данных[9].

Анализ деятельности по развитию МФ русского языка

Концепция развития МФ русского языка (1983 год)

  • создание компонентов лингвистического обеспечения задач информатики и
  • информатизация научных исследований в русистике.

Современные задачи создания МФРЯ

К:Википедия:Статьи без источников (тип: не указан)
  • дистрибутивно-статистический анализ и накопления лингвистических ресурсов в интернете
  • накопление источников на сайтах Фонда
  • дальнейшее развитие функций Автоматической словарной картотеки Фонда
  • конструирование глобальной лингвостатистической обработки всех текстовых источников Фонда в интерактивном режиме[10].

См. также

Напишите отзыв о статье "Машинный фонд русского языка"

Примечания

  1. Материалы опубликованы в книге: Машинный фонд русского языка: идеи и суждения, М.: Наука, 1989
  2. Опубликована в книге В. М. Андрющенко Концепция и архитектура Машинного фонда русского языка, М.: 1989
  3. Опубликована в книге Лингвистическая концепция терминологического банка данных Машинного фонда русского языка (проект), под ред. А. С. Герда, М.: 1989
  4. содержание Архива источников было опубликовано в Бюллетене Машинного фонда русского языка, вып. 1; сейчас оно сильно устарело и нынешнее состояние архива лучше всего отражено здесь:[www.artint.ru/cfrl/ ] (недоступная ссылка с 13-05-2013 (3998 дней) — история) [cfrl.ru/]
  5. Разработчик Ж. Г. Аношкина
  6. Разработчик Л. И. Колодяжная
  7. Описания в Бюллетене Машинного фонда русского языка, вып. 1-3).
  8. под руководством Ю. Н. Караулова
  9. первый результат такой публикации — книга А. Я. Шайкевича, В. М. Андрющенко и Н. А. Ребецкой «Статистический словарь языка Ф. М. Достоевского»
  10. образец такой обработки представлен в Статистическом словаре языка Достоевского). В. М. Андрющенко

Литература

  • Ершов А. П. Машинный фонд русского языка: внешняя постановка, в кн. «Машинный фонд русского языка: идеи и суждения», Наука, Москва: 1986.
  • Сборник «Машинный фонд русского языка: идеи и суждения», Наука, Москва: 1986.
  • Андрющенко В. М. Концепция и архитектура Машинного фонда русского языка, Наука, Москва: 1989.
  • Андрющенко В. М. Разработка комбинированных изданий (книга+CD+Internet), в: Московский лингвистический журнал, т.7 № 1, 2003.
  • Лесников [nature.syktsu.ru/cfrl/cfrl-biblio1985-1998.htm С. В. Машинный фонд русского языка в публикациях (1985—1998)]
  • Шайкевич А. Я. Дистрибутивно-статистический анализ в семантике, в: Принципы и методы семантических исследований, Наука, Москва: 1976.
  • Шайкевич А. Я. Гипотезы о естественных классах и возможность количественной таксономии в лингвистике, в: Гипотеза в современной лингвистике, Наука, Москва: 1979.
  • Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Статистический словарь языка Достоевского, Изд-во «Языки славянской культуры», Москва: 2003.

Ссылки

  • [cfrl.ru/ Сайт Машинного фонда] — автор — гл.конструктор МФРЯ В. М. Андрющенко.

Отрывок, характеризующий Машинный фонд русского языка

– Это еще что? Что вы наделали, я вас спрашиваю, – сказала она строго.
– Я? что я? – сказал Пьер.
– Вот храбрец отыскался! Ну, отвечайте, что это за дуэль? Что вы хотели этим доказать! Что? Я вас спрашиваю. – Пьер тяжело повернулся на диване, открыл рот, но не мог ответить.
– Коли вы не отвечаете, то я вам скажу… – продолжала Элен. – Вы верите всему, что вам скажут, вам сказали… – Элен засмеялась, – что Долохов мой любовник, – сказала она по французски, с своей грубой точностью речи, выговаривая слово «любовник», как и всякое другое слово, – и вы поверили! Но что же вы этим доказали? Что вы доказали этой дуэлью! То, что вы дурак, que vous etes un sot, [что вы дурак,] так это все знали! К чему это поведет? К тому, чтобы я сделалась посмешищем всей Москвы; к тому, чтобы всякий сказал, что вы в пьяном виде, не помня себя, вызвали на дуэль человека, которого вы без основания ревнуете, – Элен всё более и более возвышала голос и одушевлялась, – который лучше вас во всех отношениях…
– Гм… гм… – мычал Пьер, морщась, не глядя на нее и не шевелясь ни одним членом.
– И почему вы могли поверить, что он мой любовник?… Почему? Потому что я люблю его общество? Ежели бы вы были умнее и приятнее, то я бы предпочитала ваше.
– Не говорите со мной… умоляю, – хрипло прошептал Пьер.
– Отчего мне не говорить! Я могу говорить и смело скажу, что редкая та жена, которая с таким мужем, как вы, не взяла бы себе любовников (des аmants), а я этого не сделала, – сказала она. Пьер хотел что то сказать, взглянул на нее странными глазами, которых выражения она не поняла, и опять лег. Он физически страдал в эту минуту: грудь его стесняло, и он не мог дышать. Он знал, что ему надо что то сделать, чтобы прекратить это страдание, но то, что он хотел сделать, было слишком страшно.
– Нам лучше расстаться, – проговорил он прерывисто.
– Расстаться, извольте, только ежели вы дадите мне состояние, – сказала Элен… Расстаться, вот чем испугали!
Пьер вскочил с дивана и шатаясь бросился к ней.
– Я тебя убью! – закричал он, и схватив со стола мраморную доску, с неизвестной еще ему силой, сделал шаг к ней и замахнулся на нее.
Лицо Элен сделалось страшно: она взвизгнула и отскочила от него. Порода отца сказалась в нем. Пьер почувствовал увлечение и прелесть бешенства. Он бросил доску, разбил ее и, с раскрытыми руками подступая к Элен, закричал: «Вон!!» таким страшным голосом, что во всем доме с ужасом услыхали этот крик. Бог знает, что бы сделал Пьер в эту минуту, ежели бы
Элен не выбежала из комнаты.

Через неделю Пьер выдал жене доверенность на управление всеми великорусскими имениями, что составляло большую половину его состояния, и один уехал в Петербург.


Прошло два месяца после получения известий в Лысых Горах об Аустерлицком сражении и о погибели князя Андрея, и несмотря на все письма через посольство и на все розыски, тело его не было найдено, и его не было в числе пленных. Хуже всего для его родных было то, что оставалась всё таки надежда на то, что он был поднят жителями на поле сражения, и может быть лежал выздоравливающий или умирающий где нибудь один, среди чужих, и не в силах дать о себе вести. В газетах, из которых впервые узнал старый князь об Аустерлицком поражении, было написано, как и всегда, весьма кратко и неопределенно, о том, что русские после блестящих баталий должны были отретироваться и ретираду произвели в совершенном порядке. Старый князь понял из этого официального известия, что наши были разбиты. Через неделю после газеты, принесшей известие об Аустерлицкой битве, пришло письмо Кутузова, который извещал князя об участи, постигшей его сына.
«Ваш сын, в моих глазах, писал Кутузов, с знаменем в руках, впереди полка, пал героем, достойным своего отца и своего отечества. К общему сожалению моему и всей армии, до сих пор неизвестно – жив ли он, или нет. Себя и вас надеждой льщу, что сын ваш жив, ибо в противном случае в числе найденных на поле сражения офицеров, о коих список мне подан через парламентеров, и он бы поименован был».
Получив это известие поздно вечером, когда он был один в. своем кабинете, старый князь, как и обыкновенно, на другой день пошел на свою утреннюю прогулку; но был молчалив с приказчиком, садовником и архитектором и, хотя и был гневен на вид, ничего никому не сказал.
Когда, в обычное время, княжна Марья вошла к нему, он стоял за станком и точил, но, как обыкновенно, не оглянулся на нее.
– А! Княжна Марья! – вдруг сказал он неестественно и бросил стамеску. (Колесо еще вертелось от размаха. Княжна Марья долго помнила этот замирающий скрип колеса, который слился для нее с тем,что последовало.)
Княжна Марья подвинулась к нему, увидала его лицо, и что то вдруг опустилось в ней. Глаза ее перестали видеть ясно. Она по лицу отца, не грустному, не убитому, но злому и неестественно над собой работающему лицу, увидала, что вот, вот над ней повисло и задавит ее страшное несчастие, худшее в жизни, несчастие, еще не испытанное ею, несчастие непоправимое, непостижимое, смерть того, кого любишь.
– Mon pere! Andre? [Отец! Андрей?] – Сказала неграциозная, неловкая княжна с такой невыразимой прелестью печали и самозабвения, что отец не выдержал ее взгляда, и всхлипнув отвернулся.
– Получил известие. В числе пленных нет, в числе убитых нет. Кутузов пишет, – крикнул он пронзительно, как будто желая прогнать княжну этим криком, – убит!
Княжна не упала, с ней не сделалось дурноты. Она была уже бледна, но когда она услыхала эти слова, лицо ее изменилось, и что то просияло в ее лучистых, прекрасных глазах. Как будто радость, высшая радость, независимая от печалей и радостей этого мира, разлилась сверх той сильной печали, которая была в ней. Она забыла весь страх к отцу, подошла к нему, взяла его за руку, потянула к себе и обняла за сухую, жилистую шею.
– Mon pere, – сказала она. – Не отвертывайтесь от меня, будемте плакать вместе.
– Мерзавцы, подлецы! – закричал старик, отстраняя от нее лицо. – Губить армию, губить людей! За что? Поди, поди, скажи Лизе. – Княжна бессильно опустилась в кресло подле отца и заплакала. Она видела теперь брата в ту минуту, как он прощался с ней и с Лизой, с своим нежным и вместе высокомерным видом. Она видела его в ту минуту, как он нежно и насмешливо надевал образок на себя. «Верил ли он? Раскаялся ли он в своем неверии? Там ли он теперь? Там ли, в обители вечного спокойствия и блаженства?» думала она.
– Mon pere, [Отец,] скажите мне, как это было? – спросила она сквозь слезы.
– Иди, иди, убит в сражении, в котором повели убивать русских лучших людей и русскую славу. Идите, княжна Марья. Иди и скажи Лизе. Я приду.
Когда княжна Марья вернулась от отца, маленькая княгиня сидела за работой, и с тем особенным выражением внутреннего и счастливо спокойного взгляда, свойственного только беременным женщинам, посмотрела на княжну Марью. Видно было, что глаза ее не видали княжну Марью, а смотрели вглубь – в себя – во что то счастливое и таинственное, совершающееся в ней.