Компьютерная лингвистика
Компью́терная лингви́стика (также: математи́ческая или вычисли́тельная лингви́стика, англ. computational linguistics) — научное направление в области математического и компьютерного моделирования интеллектуальных процессов у человека и животных при создании систем искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Компьютерная лингвистика частично пересекается с обработкой естественных языков. Однако в последней акцент делается не на абстрактные модели, а на прикладные методы описания и обработки языка для компьютерных систем.
Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации.
Содержание
Истоки
Математическая лингвистика является ветвью науки искусственного интеллекта. Её история началась в Соединённых Штатах Америки в 1950-х годах. С изобретением транзистора и появлением нового поколения компьютеров, а также первых языков программирования, начались эксперименты с машинным переводом, особенно русских научных журналов. В 1960-х годах подобные исследования проводились и в СССР (например, статья о переводе с русского на армянский в сб. «Проблемы кибернетики» за 1964 год). Однако качество машинного перевода до сих пор сильно уступает качеству перевода, произведённого человеком.
С 15 по 21 мая 1958 года в I МГПИИЯ состоялась первая Всесоюзная конференция по машинному переводу. Оргкомитет возглавляли В. Ю. Розенцвейг и ответственный секретарь Оргкомитета Г. В. Чернов. Полностью программа конференции опубликована в сборнике «Машинный перевод и прикладная лингвистика», вып. 1, 1959 г. (он же «Бюллетень Объединения по машинному переводу № 8»). Как вспоминает В. Ю. Розенцвейг, опубликованный сборник тезисов конференции попал в США и произвел там большое впечатление.
В апреле 1959 года в Ленинграде состоялось I Всесоюзное совещание по математической лингвистике, созванное Ленинградским университетом и комитетом прикладной лингвистики. Главным организатором Совещания был Н. Д. Андреев. В Совещании приняли участие ряд видных математиков, в частности, С. Л. Соболев, Л. В. Канторович (впоследствии — Нобелевский лауреат) и А. А. Марков (последние двое выступали в прениях). В. Ю. Розенцвейг выступил в день открытия Совещания с программным докладом «Общая лингвистическая теория перевода и математическая лингвистика».
Направления компьютерной лингвистики
- Обработка естественного языка (англ. natural language processing; синтаксический, морфологический, семантический анализы текста). Сюда включают также:
- Корпусная лингвистика, создание и использование электронных корпусов текстов
- Создание электронных словарей, тезаурусов, онтологий. Например, Lingvo. Словари используют, например, для автоматического перевода, проверки орфографии.
- Автоматический перевод текстов. Среди русских переводчиков популярным является Промт. Среди бесплатных известен переводчик Google Translate
- Автоматическое извлечение фактов из текста (извлечение информации) (англ. fact extraction, text mining)
- Автореферирование (англ. automatic text summarization). Эта функция включена, например, в Microsoft Word.
- Построение систем управления знаниями. См. Экспертные системы
- Создание вопросно-ответных систем (англ. question answering systems).
- Оптическое распознавание символов (англ. OCR). Например, программа FineReader
- Автоматическое распознавание речи (англ. ASR). Есть платное и бесплатное ПО
- Автоматический синтез речи
Крупные ассоциации и конференции
- Ассоциация по компьютерной лингвистике (ACL): подразделяется на две ветви: Европейскую и Североамериканскую[1].
- Международная конференция по компьютерной лингвистике «Диалог»[2].
- Международная конференция по компьютерной лингвистике и интеллектуальной обработке текста (CICLing).
Учебные программы в России
- Магистерская программа «Компьютерная лингвистика» в Национальном исследовательском университете «Высшая школа экономики»[3]
- Магистерская программа «Компьютерная лингвистика» в Национальном исследовательском университете «Высшая школа экономики» в Нижнем Новгороде[4]
- Магистерская программа «Компьютерная лингвистика» в Российском государственном гуманитарном университете[5]
- Магистерские программы «Компьютерная лингвистика и интеллектуальные технологии» и «Прикладная, экспериментальная и математическая лингвистика» в Санкт-Петербургском государственном университете[6]
- Бакалавриат по направлению «Фундаментальная и прикладная лингвистика» в Новосибирском государственном университете[7]
- Магистерская программа «Фундаментальная лингвистика и её приложения в естествознании» в Новосибирском государственном университете[8]
См. также
Примечания
- ↑ [www.aclweb.org/index.php ACL]
- ↑ [www.dialog-21.ru/ Диалог]
- ↑ [philology.hse.ru/compling/ Магистратура в НИУ ВШЭ]
- ↑ [nnov.hse.ru/bipm/magcl/ Магистратура в НИУ ВШЭ — Нижний Новгород]
- ↑ [il.rsuh.ru/section.html?id=9637 Магистратура в РГГУ]
- ↑ [mathling.phil.spbu.ru/node/89 Магистратура в СПбГУ]
- ↑ [www.nsu.ru/7f269ae667b8261348ef314cef729d97/ Направление подготовки «Фундаментальная и прикладная лингвистика» в НГУ]
- ↑ [gf.nsu.ru/www/?page_id=157/ Правила приёма и список магистерских программ Гуманитарного факультета НГУ]
Ссылки
- [www.krugosvet.ru/enc/gumanitarnye_nauki/lingvistika/KOMPYUTERNAYA_LINGVISTIKA.html «Компьютерная лингвистика»]
- [compuling.narod.ru/referat.htm История развития методов компьютерной лингвистики с точки зрения задач машинного перевода и автоматизированного понимания текстов] (реферат)
- [nlpub.ru/ NLPub] — база знаний по лингвистическим ресурсам для русского языка
- [aot.ru/ АОТ] — открытые исходники некоторых утилит компьютерной лингвистики
- [itfru.ru/ ITFRU] — онлайн доступ к программам компьютерной лингвистики
<imagemap>: неверное или отсутствующее изображение |
Для улучшения этой статьи желательно?:
|