Татоэба

Поделись знанием:
Перейти к: навигация, поиск
Tatoeba Project
URL

[tatoeba.org .org]

Коммерческий

Нет

Тип сайта

Открытый мультиязычный онлайн-словарь фраз

Регистрация

Требуется только для редактирования

Язык(-и)

19 языков интерфейса, включая русский; контент на 130 языках (Май 2013)

Владелец

Trang Ho

Автор

Trang Ho

Начало работы

2006

Текущий статус

Актуальный[1]

К:Сайты, появившиеся в 2006 году

Проект Татоэба (Tatoeba project, от японского слова татоэба (яп. 例えば, «например») — сайт для обмена примерами фраз на всех доступных языках мира. В отличие от онлайн-словарей, в которых хранятся переводы слов, проект ориентирован на цельные семантические конструкции — фразы, предложения, пословицы и т. д.; их накапливаемые аналоги на различных языках сопоставляются друг с другом вручную или автоматически. Особенностью проекта является его открытость и общедоступность: Татоэба заявлена как некоммерческий проект[2], а любой желающий вне зависимости от специализации и языковой принадлежности может вносить изменения в базы данных проекта (добавлять и, в отдельных случаях, редактировать существующие фразы, исправлять ошибки).

Благодаря этим особенностям проект Татоэба постепенно получает признание как уникальное средство для самостоятельного обучения[3]. На декабрь 2010 года проект поддерживал 81 язык и предоставлял 11 вариантов языкового интерфейса; в ноябре 2011 эти показатели составили 94 и 17 соответственно; в январе 2014 — 132 и 19.

Создателем и лидером проекта является Чанг Хо (Trang Ho), француженка вьетнамского происхождения[4]. Первые примеры сайта датированы 30 сентября 2007 [tatoeba.org/eng/contributions/activity_timeline/2007/09]. Предложение № 1 принадлежит пользователю sysko: это китайская фраза «Посмотрим-ка!» [tatoeba.org/eng/sentences/show/1].





Принцип работы

Принцип работы проекта заключается в сборе и увязывании переводов той или иной фразы данного языка. Система анализирует все поступившие данные. Если конструкция А переводится на другой язык как конструкция В, а та, в свою очередь — как конструкция С, то все три будут отображены как цепочка прямых или косвенных переводов, которая по умолчанию будет отображена при поиске любого из фрагментов соответствующих фраз А, В и С (количество отображаемых языков может быть ограничено индивидуальными пользователями).

Просматривать накопленный материал могут все желающие, добавлять и редактировать — только зарегистрированные участники. Участники со стажем могут получить статус «доверенного» («trusted user»). Он дает доступ к тегам, а также позволяет связывать адекватные переводы между собой или «отрезать» неадекватные. Ограниченный круг участников проекта имеет статус «блюстителей» (corpus maintainers), которые имеют администраторские полномочия.

В отличие от учебников, интернет-словарей и форумов, проект Татоэба не ориентирован на конкретную языковую аудиторию или профессиональный круг пользователей. Зарегистрироваться и дополнять примеры фраз на родном или изучаемом языке может любой желающий с базовыми навыками грамотности[5]. Для работы пользователям предлагается весь спектр имеющихся языков или возможность выборочного чтения с указанием языка оригинала и/или перевода. При этом для собственных переводов на Татоэба рекомендуется ориентироваться только на оригинал, так как сопутствующие переводы могут быть неточными[6]. Обсуждение нюансов перевода возможно тут же в комментариях к каждому из предложений.

Накапливаемый таким образом материал может бесплатно распространяться для всех видов использования, включая коммерческое, при отсылке на источник по лицензии CC-BY[7]. На сайте имеются ссылки для скачивания всего корпуса материалов[8] или его частей[9]. Единственным ограничением контента является запрет на фразы, защищенные авторским правом согласно французскому законодательству.

Каждой фразе при внесении на платформу присваивается порядковый номер, однако некоторые вклады (машинный перевод, дубликаты, неоконченные фразы и проч.) впоследствии удаляются. Процент удаления может быть вычислен при сравнении последнего порядкового номера (открыть верхнюю фразу в списке последних вкладов на лицевой) со счётчиком фраз на лицевой странице. Например, 12 дек. 2011 они составили, соответственно, 1295340 и 1241274.

Грамматически верные фразы, недостаточно соответствующие друг другу в качестве переводов, могут быть разъединены (перестают отображаться как цепочка), но не удаляются. Они сохраняются в базе проекта как отправные точки для новых переводов. История модификаций каждой из фраз, а также соединений/разъединений между ними прилагается при каждой фразе и видна всем пользователям.

Поддерживаемые языки

Начальным ресурсом для сайта стал англо-японский корпус языковых примеров проф. Ясухиро Танаки. В декабре 2010 года Татоэба содержала более 648 000 предложений; в апреле 2012 эта цифра почти достигла 1.5 млн, 12 января составила 2 037 379. Наибольшее количество фраз (по убывающей, февраль 2013):

Кроме того, есть более тысячи предложений на следующих языках: арабский, исландский, хинди, уйгурский, вьетнамский, норвежский (букмол), белорусский, шанхайский и кантонский диалекты китайского языка.

Наряду с естественными языками в проекте фигурируют искусственные: эсперанто, клингон, интерлингва, CycL, токипона.

Первоначально для введения нового языка было достаточно лишь обратиться к администраторам и внести на нём пять примеров. Впоследствии необходимым требованием стало наличие сертификации вносимого языка согласно стандарту ISO 639-3. При заявке на добавление нового языкового раздела можно предложить флаг-символ, который его обозначит на сайте; этот графический знак не обязан представлять конкретное государство из современных либо существовавших ранее[10].

Аудио

Помимо письменной передачи предложений, платформа Татоэба коллекционирует их произношение. (Поэтому участникам запрещается вводить предложения с вариантами грамматических и лексических форм в скобках, которые потребовали бы более чем один вариант прочтения). Для участия в пополнении аудиораздела необходимо пройти аккредитацию, доказывающую качество записываемых примеров.[tatoeba.org/eng/faq#submit-audio] По этой причине аудиоразделы Татоэба пополняются сравнительно медленно.

Активность и формы сотрудничества

Открытость и доступность, в сочетании с удобством сайта, привела к устойчивому росту его популярности. (График активности сайта[11] фиксирует количество новых языковых примеров начиная с 30 сентября 2007). В декабре 2010 года количество ежедневных посетителей составляло ок. 1 800[12], которые добавляли до полутора-двух тысяч примеров в день. К 2013 году вторая цифра возросла до 2,5-3 тысяч.

Татоэба выступает за открытость и свободу Интернета в проекте [www.drumbeat.org/project/tatoeba-project/about Mozilla Drumbeat] в числе нескольких сотен других проектов-участников.

Татоэба содействует многим электронным словарям и переводчикам — например, электронному словарю японского языка WWWJDIC[13]. Татоэба сотрудничает с проектом Shtooka  (нем.) — бесплатной коллекцией аудиозаписей слов, фраз, пословиц и т. п. на различных языках[14]. Материал платформы используется в электронных словарях Glosbe [ru.glosbe.com/].

На базе Татоэба разработано приложение для самостоятельного изучения языков при помощи компьютерных флэш-карточек ТаТоТэн [www.tatoten.com/].

Напишите отзыв о статье "Татоэба"

Примечания

  1. [www.alexa.com/siteinfo/tatoeba.org tatoeba.org — Traffic Details from Alexa]. Alexa Internet, Inc  (англ.). [www.webcitation.org/68wcaycpB Архивировано из первоисточника 6 июля 2012].
  2. [blog.tatoeba.org/2010/02/how-to-be-good-contributor-in-tatoeba.html#rule1 Rule 1. Understand the context of the project]  (англ.)
  3. [archive.is/20120714085202/teacherless.wordpress.com/2010/11/01/tatoeba-where-to-learn/ Tatoeba (Where to Learn)]  (англ.)
  4. [tatoeba.org/eng/user/profile/TRANG Профиль Trang Ho]  (англ.)
  5. [blog.tatoeba.org/2010/02/how-to-be-good-contributor-in-tatoeba.html#rule14 Rule 14. Spread the love] (англ.)
  6. [blog.tatoeba.org/2010/02/how-to-be-good-contributor-in-tatoeba.html#rule3 Rule 3. Do not pay attention to the other translations]  (англ.)
  7. [bloахоg.tatoeba.org/2010/02/how-to-be-good-contributor-in-tatoeba.html#rule8 Rule 8. Do not add sentences from copyrighted content]  (англ.)
  8. [tatoeba.org/eng/download_tatoeba_example_sentences Downloads]  (англ.)
  9. [tatoeba.org/eng/sentences_lists/index Public lists]  (англ.)
  10. [tatoeba.org/eng/faq#new-language FAQ]  (англ.)
  11. [tatoeba.org/rus/contributions/activity_timeline График активности]  (англ.)
  12. [www.visualizetraffic.com/show/tatoeba.org If Tatoeba.org was a country, it would be larger than Niue with its 1,809 daily visitors!] (недоступная ссылка с 13-05-2013 (3994 дня))  (англ.)
  13. [www.csse.monash.edu.au/~jwb/cgi-bin/wwwjdic.cgi?14 Example Sentence Management System  (англ.)]
  14. [swac-collections.org/download.php Shtooka Project Download]  (англ.)

Ссылки

  • [tatoeba.org/rus/home Татоэба] — главная страница проекта
  • [en.wiki.tatoeba.org/articles/show/main# Вики-Татоэба (англ.)] - сопровождающий сайт (принципы работы, история проекта, технические подробности)
  • [lingvowiki.info/w/Tatoeba Статья] про Татоэба на [lingvowiki.info/w/ Лингвовики]
  • [www.manythings.org/b/e/4640 Введение в проект Татоэба] — видеоролик, объясняющий суть проекта и его работу  (англ.)
  • [www.drumbeat.org/node/25501/about Татоэба] — участник интернет-проекта [www.drumbeat.org/ Mozilla Drumbeat]  (англ.)
  • [magazeta.com/chinese-internet/2010/08/26/tatoeba/ Обзор] проекта на сайте [magazeta.com/ Магазета]
  • [zhonga.reformal.ru/proj/?ia=72766 Краткий обзор] Татоэба на сайте [zhonga.reformal.ru Джунга] (крупнейший русско-китайский интернет-словарь)
  • [www.sinoglot.com/wu/2010/04/interview/ Интервью Аллана Симона] сайту [sinoglot.com Sinoglot.com], посвященному китайскому языку  (англ.)
  • [babelhut.com/languages/use-tatoeba-org-for-mining-sentences/ Use tatoeba.org for mining sentences]  (англ.)
  • [web.archive.org/web/20100916205942/web.me.com/quitscheentchen/KSTen/Jp_LS_Touch.html Japonais], обучающая программа-переводчик для iPhone/iPod/iPad, использующие базу Татоэбы для немецкого и французского языков  (англ.)
  • [www.edrdg.org/wiki/index.php/Tanaka_Corpus Статья] о корпусе Tanaka Corpus, базе данных фраз, с которой начинал свою работу проект Татоэба, на сайте [www.edrdg.org/ Группы исследования и развития электронных словарей]  (англ.)
  • [www.csse.monash.edu.au/~jwb/wwwjdicinf.html#examp_tag Сайт] японского словаря WWWJDIC  (англ.)
  • [a4esl.com/temporary/tatoeba/] - вспомогательный сайт со статистикой и разъяснениями правил Татоэба.
  • a4esl.com/temporary/tatoeba/links.html - приложения, использующие Татоэба.

См. также

Отрывок, характеризующий Татоэба

– Тут приехал разъезд, и всех тех, которые не грабили, всех мужчин забрали. И меня.
– Вы, верно, не все рассказываете; вы, верно, сделали что нибудь… – сказала Наташа и помолчала, – хорошее.
Пьер продолжал рассказывать дальше. Когда он рассказывал про казнь, он хотел обойти страшные подробности; но Наташа требовала, чтобы он ничего не пропускал.
Пьер начал было рассказывать про Каратаева (он уже встал из за стола и ходил, Наташа следила за ним глазами) и остановился.
– Нет, вы не можете понять, чему я научился у этого безграмотного человека – дурачка.
– Нет, нет, говорите, – сказала Наташа. – Он где же?
– Его убили почти при мне. – И Пьер стал рассказывать последнее время их отступления, болезнь Каратаева (голос его дрожал беспрестанно) и его смерть.
Пьер рассказывал свои похождения так, как он никогда их еще не рассказывал никому, как он сам с собою никогда еще не вспоминал их. Он видел теперь как будто новое значение во всем том, что он пережил. Теперь, когда он рассказывал все это Наташе, он испытывал то редкое наслаждение, которое дают женщины, слушая мужчину, – не умные женщины, которые, слушая, стараются или запомнить, что им говорят, для того чтобы обогатить свой ум и при случае пересказать то же или приладить рассказываемое к своему и сообщить поскорее свои умные речи, выработанные в своем маленьком умственном хозяйстве; а то наслажденье, которое дают настоящие женщины, одаренные способностью выбирания и всасыванья в себя всего лучшего, что только есть в проявлениях мужчины. Наташа, сама не зная этого, была вся внимание: она не упускала ни слова, ни колебания голоса, ни взгляда, ни вздрагиванья мускула лица, ни жеста Пьера. Она на лету ловила еще не высказанное слово и прямо вносила в свое раскрытое сердце, угадывая тайный смысл всей душевной работы Пьера.
Княжна Марья понимала рассказ, сочувствовала ему, но она теперь видела другое, что поглощало все ее внимание; она видела возможность любви и счастия между Наташей и Пьером. И в первый раз пришедшая ей эта мысль наполняла ее душу радостию.
Было три часа ночи. Официанты с грустными и строгими лицами приходили переменять свечи, но никто не замечал их.
Пьер кончил свой рассказ. Наташа блестящими, оживленными глазами продолжала упорно и внимательно глядеть на Пьера, как будто желая понять еще то остальное, что он не высказал, может быть. Пьер в стыдливом и счастливом смущении изредка взглядывал на нее и придумывал, что бы сказать теперь, чтобы перевести разговор на другой предмет. Княжна Марья молчала. Никому в голову не приходило, что три часа ночи и что пора спать.
– Говорят: несчастия, страдания, – сказал Пьер. – Да ежели бы сейчас, сию минуту мне сказали: хочешь оставаться, чем ты был до плена, или сначала пережить все это? Ради бога, еще раз плен и лошадиное мясо. Мы думаем, как нас выкинет из привычной дорожки, что все пропало; а тут только начинается новое, хорошее. Пока есть жизнь, есть и счастье. Впереди много, много. Это я вам говорю, – сказал он, обращаясь к Наташе.
– Да, да, – сказала она, отвечая на совсем другое, – и я ничего бы не желала, как только пережить все сначала.
Пьер внимательно посмотрел на нее.
– Да, и больше ничего, – подтвердила Наташа.
– Неправда, неправда, – закричал Пьер. – Я не виноват, что я жив и хочу жить; и вы тоже.
Вдруг Наташа опустила голову на руки и заплакала.
– Что ты, Наташа? – сказала княжна Марья.
– Ничего, ничего. – Она улыбнулась сквозь слезы Пьеру. – Прощайте, пора спать.
Пьер встал и простился.

Княжна Марья и Наташа, как и всегда, сошлись в спальне. Они поговорили о том, что рассказывал Пьер. Княжна Марья не говорила своего мнения о Пьере. Наташа тоже не говорила о нем.
– Ну, прощай, Мари, – сказала Наташа. – Знаешь, я часто боюсь, что мы не говорим о нем (князе Андрее), как будто мы боимся унизить наше чувство, и забываем.
Княжна Марья тяжело вздохнула и этим вздохом признала справедливость слов Наташи; но словами она не согласилась с ней.
– Разве можно забыть? – сказала она.
– Мне так хорошо было нынче рассказать все; и тяжело, и больно, и хорошо. Очень хорошо, – сказала Наташа, – я уверена, что он точно любил его. От этого я рассказала ему… ничего, что я рассказала ему? – вдруг покраснев, спросила она.
– Пьеру? О нет! Какой он прекрасный, – сказала княжна Марья.
– Знаешь, Мари, – вдруг сказала Наташа с шаловливой улыбкой, которой давно не видала княжна Марья на ее лице. – Он сделался какой то чистый, гладкий, свежий; точно из бани, ты понимаешь? – морально из бани. Правда?
– Да, – сказала княжна Марья, – он много выиграл.
– И сюртучок коротенький, и стриженые волосы; точно, ну точно из бани… папа, бывало…
– Я понимаю, что он (князь Андрей) никого так не любил, как его, – сказала княжна Марья.
– Да, и он особенный от него. Говорят, что дружны мужчины, когда совсем особенные. Должно быть, это правда. Правда, он совсем на него не похож ничем?
– Да, и чудесный.
– Ну, прощай, – отвечала Наташа. И та же шаловливая улыбка, как бы забывшись, долго оставалась на ее лице.


Пьер долго не мог заснуть в этот день; он взад и вперед ходил по комнате, то нахмурившись, вдумываясь во что то трудное, вдруг пожимая плечами и вздрагивая, то счастливо улыбаясь.
Он думал о князе Андрее, о Наташе, об их любви, и то ревновал ее к прошедшему, то упрекал, то прощал себя за это. Было уже шесть часов утра, а он все ходил по комнате.
«Ну что ж делать. Уж если нельзя без этого! Что ж делать! Значит, так надо», – сказал он себе и, поспешно раздевшись, лег в постель, счастливый и взволнованный, но без сомнений и нерешительностей.
«Надо, как ни странно, как ни невозможно это счастье, – надо сделать все для того, чтобы быть с ней мужем и женой», – сказал он себе.
Пьер еще за несколько дней перед этим назначил в пятницу день своего отъезда в Петербург. Когда он проснулся, в четверг, Савельич пришел к нему за приказаниями об укладке вещей в дорогу.
«Как в Петербург? Что такое Петербург? Кто в Петербурге? – невольно, хотя и про себя, спросил он. – Да, что то такое давно, давно, еще прежде, чем это случилось, я зачем то собирался ехать в Петербург, – вспомнил он. – Отчего же? я и поеду, может быть. Какой он добрый, внимательный, как все помнит! – подумал он, глядя на старое лицо Савельича. – И какая улыбка приятная!» – подумал он.
– Что ж, все не хочешь на волю, Савельич? – спросил Пьер.
– Зачем мне, ваше сиятельство, воля? При покойном графе, царство небесное, жили и при вас обиды не видим.
– Ну, а дети?
– И дети проживут, ваше сиятельство: за такими господами жить можно.
– Ну, а наследники мои? – сказал Пьер. – Вдруг я женюсь… Ведь может случиться, – прибавил он с невольной улыбкой.
– И осмеливаюсь доложить: хорошее дело, ваше сиятельство.
«Как он думает это легко, – подумал Пьер. – Он не знает, как это страшно, как опасно. Слишком рано или слишком поздно… Страшно!»
– Как же изволите приказать? Завтра изволите ехать? – спросил Савельич.
– Нет; я немножко отложу. Я тогда скажу. Ты меня извини за хлопоты, – сказал Пьер и, глядя на улыбку Савельича, подумал: «Как странно, однако, что он не знает, что теперь нет никакого Петербурга и что прежде всего надо, чтоб решилось то. Впрочем, он, верно, знает, но только притворяется. Поговорить с ним? Как он думает? – подумал Пьер. – Нет, после когда нибудь».
За завтраком Пьер сообщил княжне, что он был вчера у княжны Марьи и застал там, – можете себе представить кого? – Натали Ростову.
Княжна сделала вид, что она в этом известии не видит ничего более необыкновенного, как в том, что Пьер видел Анну Семеновну.
– Вы ее знаете? – спросил Пьер.
– Я видела княжну, – отвечала она. – Я слышала, что ее сватали за молодого Ростова. Это было бы очень хорошо для Ростовых; говорят, они совсем разорились.
– Нет, Ростову вы знаете?
– Слышала тогда только про эту историю. Очень жалко.
«Нет, она не понимает или притворяется, – подумал Пьер. – Лучше тоже не говорить ей».
Княжна также приготавливала провизию на дорогу Пьеру.
«Как они добры все, – думал Пьер, – что они теперь, когда уж наверное им это не может быть более интересно, занимаются всем этим. И все для меня; вот что удивительно».
В этот же день к Пьеру приехал полицеймейстер с предложением прислать доверенного в Грановитую палату для приема вещей, раздаваемых нынче владельцам.
«Вот и этот тоже, – думал Пьер, глядя в лицо полицеймейстера, – какой славный, красивый офицер и как добр! Теперь занимается такими пустяками. А еще говорят, что он не честен и пользуется. Какой вздор! А впрочем, отчего же ему и не пользоваться? Он так и воспитан. И все так делают. А такое приятное, доброе лицо, и улыбается, глядя на меня».
Пьер поехал обедать к княжне Марье.
Проезжая по улицам между пожарищами домов, он удивлялся красоте этих развалин. Печные трубы домов, отвалившиеся стены, живописно напоминая Рейн и Колизей, тянулись, скрывая друг друга, по обгорелым кварталам. Встречавшиеся извозчики и ездоки, плотники, рубившие срубы, торговки и лавочники, все с веселыми, сияющими лицами, взглядывали на Пьера и говорили как будто: «А, вот он! Посмотрим, что выйдет из этого».
При входе в дом княжны Марьи на Пьера нашло сомнение в справедливости того, что он был здесь вчера, виделся с Наташей и говорил с ней. «Может быть, это я выдумал. Может быть, я войду и никого не увижу». Но не успел он вступить в комнату, как уже во всем существе своем, по мгновенному лишению своей свободы, он почувствовал ее присутствие. Она была в том же черном платье с мягкими складками и так же причесана, как и вчера, но она была совсем другая. Если б она была такою вчера, когда он вошел в комнату, он бы не мог ни на мгновение не узнать ее.
Она была такою же, какою он знал ее почти ребенком и потом невестой князя Андрея. Веселый вопросительный блеск светился в ее глазах; на лице было ласковое и странно шаловливое выражение.
Пьер обедал и просидел бы весь вечер; но княжна Марья ехала ко всенощной, и Пьер уехал с ними вместе.
На другой день Пьер приехал рано, обедал и просидел весь вечер. Несмотря на то, что княжна Марья и Наташа были очевидно рады гостю; несмотря на то, что весь интерес жизни Пьера сосредоточивался теперь в этом доме, к вечеру они всё переговорили, и разговор переходил беспрестанно с одного ничтожного предмета на другой и часто прерывался. Пьер засиделся в этот вечер так поздно, что княжна Марья и Наташа переглядывались между собою, очевидно ожидая, скоро ли он уйдет. Пьер видел это и не мог уйти. Ему становилось тяжело, неловко, но он все сидел, потому что не мог подняться и уйти.