Тематическое моделирование

Поделись знанием:
Перейти к: навигация, поиск

Тематическое моделирование — способ построения модели коллекции текстовых документов, которая определяет, к каким темам относится каждый из документов[1].

Тематическая модель (англ. topic model) коллекции текстовых документов определяет, к каким темам относится каждый документ и какие слова (термины) образуют каждую тему[2].

Переход из пространства терминов в пространство найденных тематик помогает разрешать синонимию и полисемию терминов, а также эффективнее решать такие задачи, как тематический поиск, классификация, суммаризация и аннотация коллекций документов и новостных потоков.

Тематическое моделирование как вид статистических моделей для нахождения скрытых тем встреченных в коллекции документов, нашло своё применение в таких областях как машинное обучение и обработка естественного языка. Исследователи используют различные тематические модели для анализа текстов, текстовых архивов документов, для анализа изменения тем в наборах документов[⇨]. Интуитивно понимая, что документ относится к определенной теме, в документах посвященных одной теме можно встретить некоторые слова чаще других. Например: «собака» и «кость» встречаются чаще в документах про собак, «кошки» и «молоко» будут встречаться в документах о котятах, предлоги «и» и «в» будут встречаться в обеих тематиках. Обычно документ касается нескольких тем в разных пропорциях, таким образом, документ в котором 10 % темы составляют кошки, а 90 % темы про собак, можно предположить, что слов про собак в 9 раз больше. Тематическое моделирование отражает эту интуицию в математическую структуру, которая позволяет на основании изучения коллекции документов и исследования частотных характеристик слов в каждом документе, сделать вывод, что каждый документ это некоторый баланс тем.

Наибольшее применение в современных приложениях находят подходы, основанные на Байесовских сетях — ориентированных графических вероятностных моделях. Ориентированные вероятностные тематические модели — это относительно молодая область исследований в теории самообучения[⇨]. Одним из первых был предложен вероятностный латентно-семантический анализ[⇨] (PLSA), основанный на принципе максимума правдоподобия, как альтернатива классическим методам кластеризации, основанным на вычислении функций расстояния. Вслед за PLSA был предложен метод латентного размещения Дирихле и его многочисленные обобщения [3][⇨]. Вероятностные тематические модели осуществляют «мягкую» кластеризацию, позволяя документу или термину относиться сразу к нескольким темам с различными вероятностями. Вероятностные тематические модели описывает каждую тему дискретным распределением на множестве терминов, каждый документ — дискретным распределением на множестве тем. Предполагается, что коллекция документов — это последовательность терминов, выбранных случайно и независимо из смеси таких распределений, и ставится задача восстановления компонент смеси по выборке[4][⇨].

Хотя тематическое моделирование описывали и применяли в обработке естественного языка, они нашли своё применение и в других областях таких как биоинформатика.





История

Первое описание тематического моделирования появилось в работе Рагавана, Пападимитриу, Томаки и Вемполы 1998 году[5]. Томас Хофманн в 1999 году[6] предложил вероятностное скрытое семантическое индексирование (PLSI). Одна из самых распространенных тематических моделей — это латентное размещение Дирихле (LDA), эта модель является обобщением вероятностного семантического индексирования и разработана Дэвидом Блейем (англ. David Blei), Эндрю Ыном и Майклом Джорданом (англ. Michael I. Jordan) в 2002 году[7]. Другие тематические модели как правило являются расширением LDA, например, размещение патинко улучшает LDA за счёт введения дополнительных корреляционных коэффициентов для каждого слова, которое составляет тему.

Тематические исследования

Тэмплтон сделал обзор работ по тематическому моделированию в гуманитарных науках, сгруппированных по синхронному и диахроническому подходу[8]. Синхронные подходы выделяют темы в некоторый момент времени, например, Джокерс с помощью тематической модели исследовал, о чём писали блогеры в День Цифровых Гуманитарных наук в 2010 году[9].

Диахронические подходы, включая определение Блока и Ньюмана о временной динамике тем в Пенсильванской газете 1728—1800 года[10]. Грифитс и Стейверс использовали тематическое моделирование для обзоров журнала PNAS, определяли изменения популярности тем с 1991 по 2001 год[11]. Блевин создал тематическую модель дневника Марты Балладс[12]. Мимно использовал тематическое моделирование для анализа 24 журналов по классической филологии и археологии за 150 лет, чтобы определить изменения популярности тем и узнать, насколько сильно изменились журналы за это время[13].

Алгоритмы тематического моделирования

В работе Дэвида Блея «Введение в тематическое моделирование» рассмотрен наиболее популярный алгоритм Латентное размещение Дирихле[⇨][14]. На практике исследователи используют одну из эвристик метода максимального правдоподобия, методы сингулярного разложения (SVD), метод моментов, алгоритм, основанный на неотрицательной матрице факторизации (NMF), вероятностные тематические модели, вероятностный латентно-семантический анализ, латентное размещение Дирихле. В работе Воронцова К. В. рассмотрены вариации основных алгоритмов тематического моделирования: робастная тематическая модель, тематические модели классификации, динамические тематические модели, иерархические тематические модели, многоязычные тематические модели, модели текста как последовательности слов, многомодальные тематические модели [2].

Вероятностные тематические модели основаны на следующих предположениях [15] [16] [17] [18]:

  • Порядок документов в коллекции не имеет значения
  • Порядок слов в документе не имеет значения, документ — мешок слов
  • Слова, встречающиеся часто в большинстве документов, не важны для определения тематики
  • Коллекцию документов можно представить как выборку пар документ-слово <math>(d, w)</math> , <math>d \in D</math>, <math>w \in \mathit{W}_d</math>
  • Каждая тема <math>t \in T</math> описывается неизвестным распределением <math>p(\mathit{W}|t)</math> на множестве слов <math>w \in \mathit{W}</math>
  • Каждый документ <math>d \in D</math> описывается неизвестным распределением <math>p(t|d)</math> на множестве тем <math>t \in T</math>
  • Гипотеза условной независимости <math>p(w|t,d) = p (w|t)</math>

Построить тематическую модель — значит, найти матрицы <math>\Phi = ||p(w|t)||</math> и <math>\Theta = ||p(t|d)||</math> по коллекции <math>\mathit{D}</math> В более сложных вероятностных тематических моделях некоторые из этих предположений заменяются более реалистичными.

Вероятностный латентно-семантический анализ

Вероятностный латентно-семантический анализ (PLSA) предложен Томасом Хофманном в 1999 году. Вероятностная модель появления пары «документ-слово» может быть записана тремя эквивалентными способами:

<math>p(d,w) = \sum_{t\in T} p(t) p(w|t) p(d|t) = \sum_{t\in T} p(d) p(w|t) p(t|d) = \sum_{t\in T} p(w) p(t|w) p(d|t)</math>

где <math>T</math> — множество тем;

<math> p(t)</math> — неизвестное априорное распределение тем во всей коллекции;
<math> p(d)</math> — априорное распределение на множестве документов, эмпирическая оценка <math>p(d) = n_d/n</math> , где <math>n = \sum_d n_d</math> — суммарная длина всех документов;
<math>p(w)</math> — априорное распределение на множестве слов, эмпирическая оценка <math>p(w) = n_w/n</math>, где <math>n_w</math> — число вхождений слова <math>w</math> во все документы;

Искомые условные распределения <math>p(w|t), p(t|d)</math> выражаются через <math>p(t|w), p(d|t)</math> по формуле Байеса:

<math>p(w|t) = \frac{p(t|w)p(w)}{\sum_{w'} p(t|w')p(w')};\qquad p(t|d) = \frac{p(d|t)p(t)}{\sum_{t'} p(d|t')p(t')}.</math>

Для идентификации параметров тематической модели по коллекции документов применяется принцип максимума правдоподобия, который приводит к задаче минимизации функционала

<math>\sum_{d\in D} \sum_{w\in d} n_{dw}\log p(d,w) \to \min_{\Phi,\Theta} ,</math>

при ограничениях нормировки

<math>\sum_w p(w|t) = 1,\; \sum_t p(t|d) = 1,\; \sum_t p(t) = 1,</math>

где <math>n_{dw}</math> — число вхождений слова <math>w</math> в документ <math>d</math>. Для решения данной оптимизационной задачи обычно применяется EM-алгоритм.

Основные недостатки PLSA:

  • Число параметров растёт линейно по числу документов в коллекции, что может приводить к переобучению модели.
  • При добавлении нового документа <math>d</math> в коллекцию распределение <math>p(t|d)</math> невозможно вычислить по тем же формулам, что и для остальных документов, не перестраивая всю модель заново.

Латентное размещение Дирихле

Метод латентного размещения Дирихле (LDA) предложен Дэвидом Блеем в 2003 году.

В этом методе устранены основные недостатки PLSA.

Метод LDA основан на той же вероятностной модели

<math>p(d,w) = \sum_{t\in T} p(d) p(w|t) p(t|d),</math>

при дополнительных предположениях:

  • вектора документов <math>\theta_d = \bigl(p(t|d): t\in T\bigr)</math> порождаются одним и тем же вероятностным распределением на нормированных <math>|T|</math>-мерных векторах; это распределение удобно взять из параметрического семейства распределений Дирихле <math>\mathrm{Dir}(\theta,\alpha),\; \alpha\in\mathbb{R}^{|T|}</math>;
  • вектора тем <math>\phi_t = \bigl(p(w|t): w\in W\bigr)</math> порождаются одним и тем же вероятностным распределением на нормированных векторах размерности <math>|W|</math>; это распределение удобно взять из параметрического семейства распределений Дирихле <math>\mathrm{Dir}(\theta,\beta),\; \beta\in\mathbb{R}^{|W|}</math>.

Для идентификации параметров модели LDA по коллекции документов применяется семплирование Гиббса, вариационный байесовский вывод или метод Expectation-Propagation.

См. также

Напишите отзыв о статье "Тематическое моделирование"

Примечания

Литература

  • Коршунов Антон, Гомзин Андрей [cyberleninka.ru/article/n/tematicheskoe-modelirovanie-tekstov-na-estestvennom-yazyke Тематическое моделирование текстов на естественном языке] // Труды Института системного программирования РАН : журнал. — 2012.
  • Воронцов К.В. [www.machinelearning.ru/wiki/images/2/22/Voron-2013-ptm.pdf Вероятностное тематическое моделирование] // www.machinelearning.ru : web. — 2013.
  • Воронцов К.В., Потапенко А.А. [crm.ics.org.ru/journal/article/1950/ Регуляризация, робастность и разреженность вероятностных тематических моделей] // Компьютерные исследования и моделирование : журнал. — 2012. — С. 693-706.
  • Воронцов К.В. [www.machinelearning.ru/wiki/images/6/63/Voron13mmro-talk.pdf Аддитивная регуляризация вероятностных тематических моделей Презентация] // www.machinelearning.ru : web. — 2013.
  • Воронцов К.В. [www.machinelearning.ru/wiki/images/7/7e/Voron-ML-TopicModels-slides.pdf Вероятностные тематические модели коллекции текстовых документов Презентация] // www.machinelearning.ru : web. — 2013.
  • Марк Стейверс, Tom Griffiths. [psiexp.ss.uci.edu/research/papers/SteyversGriffithsLSABookFormatted.pdf Вероятностная тематическая модель.] // [www.psypress.com/books/details/9780805854183/ Справочник скрытого семантического анализа] / T. Landauer, D. McNamara, S. Dennis, W. Kintsch. — Psychology Press, 2007. — ISBN 978-0-8058-5418-3.
  • Daud Ali, Li Juanzi, Zhou Lizhu, Muhammad Faqir [www.researchgate.net/publication/215904200_Knowledge_Discovery_through_Directed_Probabilistic_Topic_Models._a_Survey Knowledge discovery through directed probabilistic topic models: a survey. In Proceedings of Frontiers of Computer Science in China.] // www.researchgate.net : web. — 2010.
  • Christos Papadimitriou, Prabhakar Raghavan, Hisao Tamaki, Santosh Vempala [www.cs.berkeley.edu/~christos/ir.ps Latent Semantic Indexing: A probabilistic analysis] // Proceedings of ACM PODS. — 1998.
  • Thomas Hoffman [www.cs.brown.edu/~th/papers/Hofmann-SIGIR99.pdf Probabilistic Latent Semantic Indexing] // Proceedings of the Twenty-Second Annual International SIGIR Conference on Research and Development in Information Retrieval. — 1999.
  • David M. Blei, Andrew Y. Ng, Michael I. Jordan [jmlr.csail.mit.edu/papers/v3/blei03a.html Latent Dirichlet Allocation] // Journal of Machine Learning Research. — 2003.
  • David Blei [www.cs.princeton.edu/~blei/papers/Blei2011.pdf Introduction to Probabilistic Topic Models] // Communications of the ACM. — 2012. — С. 77–84.
  • David Blei, J.D. Lafferty [www.cs.princeton.edu/~blei/papers/BleiLafferty2009.pdf Topic models] : web. — 2009.
  • David Blei, J.D. Lafferty [www.cs.princeton.edu/~blei/papers/Blei2011.pdf Introduction to Probabilistic Topic Models] // Annals of Applied Statistics. — 2007. — С. 17–35. — DOI:10.1214/07-AOAS114.
  • David Mimno [www.perseus.tufts.edu/~amahoney/02-jocch-mimno.pdf Computational Historiography: Data Mining in a Century of Classics Journals] // Journal on Computing and Cultural Heritag : журнал. — 2012. — DOI:10.1145/2160165.2160168.
  • Matthew L. Jockers [www.stanford.edu/~mjockers/cgi-bin/drupal/node/39 Who's your DH Blog Mate: Match-Making the Day of DH Bloggers with Topic Modeling] : web. — 2010.
  • E. Микс [dhs.stanford.edu/comprehending-the-digital-humanities/ Понимание цифровых гуманитарных наук] : web. — 2011.
  • C. Тэмплтон [mith.umd.edu/topic-modeling-in-the-humanities-an-overview/ Тематическое моделирование в гуманитарных науках: обзор.] // Maryland Institute for Technology in the Humanities Blog : web. — 2011.
  • T. Гифитс, М. Стейверс Нахождение научных тем // Proceedings of the National Academy of Sciences : журнал. — 2004. — DOI:10.1073/pnas.0307752101. — PMID 14872004.
  • T. Янг, A Торгет и Р. Mihalcea [www.aclweb.org/anthology/W/W11/W11-15.pdf#page=108 Тематическое моделирование в исторических газетах] // Proceedings of the 5th ACL-HLT Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities. The Association for Computational Linguistics, Madison : журнал. — 2011. — С. 96–104.
  • С. Блок [www.common-place.org/vol-06/no-02/tales/ Делаем больше с оцифровкой- введение в тематическое моделирование в ранних американских источниках] // Common-place The Interactive Journal of Early American Life : журнал. — 2006.
  • Д. Ньюман, С. Блок [www.ics.uci.edu/~newman/pubs/JASIST_Newman.pdf Вероятностное тематическое разложение в газетах 18 века] // Journal of the American Society for Information Science and Technology : журнал. — 2006. — DOI:10.1002/asi.20342.
  • C. Блевин [historying.org/2010/04/01/topic-modeling-martha-ballards-diary/ Тематическое моделирование дневника Марты Баллардс] // historying : web. — 2010.

Ссылки

  • [shad.yandex.ru/lectures/machine_learning_23.xml Лекция: Тематическое моделирование — К. В. Воронцов] // Школа анализа данных (видео-лекции).
  • [shad.yandex.ru/lectures/machine_learning_24.xml Лекция 2: Тематическое моделирование — К. В. Воронцов] // Школа анализа данных (видео-лекции).
  • [www.machinelearning.ru/wiki/index.php?title=Тематическое_моделирование Тематическое моделирование].
  • [www.machinelearning.ru/wiki/index.php?title=Коллекции_документов_для_тематического_моделирования Коллекции документов для тематического моделирования].
  • [www.machinelearning.ru/wiki/images/a/ab/FSTM-summary.pdf Полностью разреженные тематические модели (перевод) / Fully Sparse Topic Models].
  • [www.machinelearning.ru/wiki/images/9/90/Daud2009survey-rus.pdf Обзор по вероятностным тематическим моделям].
  • [www.machinelearning.ru/wiki/images/8/82/BMMO11_14.pdf Тематические модели для коллекции текстов].
  • [www.machinelearning.ru/wiki/index.php?title=Bmmo Байесовские методы машинного обучения (курс лекций, Д. П. Ветров, Д. А. Кропотов)].
  • Тепллтон, Клай [mith.umd.edu/topic-modeling-in-the-humanities-an-overview/ Тематическое моделирование в гуманитарных науках. Общий обзор.]. Maryland Institute for Technology in the Humanities.
  • [www.youtube.com/watch?v=1wcX4fEdNUo Применение тематического моделирования для анализа новостей и ревю.] Video of a Google Tech Talk presentation by Alice Oh on topic modeling with Latent Dirichlet allocation
  • [www.youtube.com/watch?v=8nBE5Qm8y6I Моделирование науки: Динамическое тематическое моделирование научных исследований.] Video of a Google Tech Talk presentation by David M. Blei
  • [vimeo.com/13597441 Автоматизированная тематическая модель в политической науке.] Video of a presentation by Brandon Stewart at the [toolsfortext.wordpress.com/ Tools for Text Workshop], 14 June 2010
  • [videolectures.net/mlss09uk_blei_tm/ Лекция: Тематическое моделирование — Дэвид Блей 2009 г.] Видео лекция Принстонский университет
  • [www.dialog-21.ru/digests/dialog2014/materials/pdf/VorontsovKVPotapenkoAA.pdf Регуляризация вероятностных тематических моделей для повышения интерпретируемости и определения числа тем] Диалог 2014
  • [arxiv.org/abs/1401.6169 Parsimonious Topic Models with Salient Word Discovery]

Программное обеспечение и программные библиотеки

  • [mallet.cs.umass.edu/ Малет] (программа)
  • [nlp.stanford.edu/software/tmt/tmt-0.4/ Инструментарий Стэндфордского университета по тематическому моделированию]
  • [radimrehurek.com/gensim/ GenSim] — «тематическое моделирование для людей»
  • [research.microsoft.com/en-us/um/cambridge/projects/infernet/docs/Latent%20Dirichlet%20Allocation.aspx LDA C#] LDA in Infer.NET

Отрывок, характеризующий Тематическое моделирование

– Так… так…
– И ежели вашей светлости понадобится человек, который бы не жалел своей шкуры, то извольте вспомнить обо мне… Может быть, я пригожусь вашей светлости.
– Так… так… – повторил Кутузов, смеющимся, суживающимся глазом глядя на Пьера.
В это время Борис, с своей придворной ловкостью, выдвинулся рядом с Пьером в близость начальства и с самым естественным видом и не громко, как бы продолжая начатый разговор, сказал Пьеру:
– Ополченцы – те прямо надели чистые, белые рубахи, чтобы приготовиться к смерти. Какое геройство, граф!
Борис сказал это Пьеру, очевидно, для того, чтобы быть услышанным светлейшим. Он знал, что Кутузов обратит внимание на эти слова, и действительно светлейший обратился к нему:
– Ты что говоришь про ополченье? – сказал он Борису.
– Они, ваша светлость, готовясь к завтрашнему дню, к смерти, надели белые рубахи.
– А!.. Чудесный, бесподобный народ! – сказал Кутузов и, закрыв глаза, покачал головой. – Бесподобный народ! – повторил он со вздохом.
– Хотите пороху понюхать? – сказал он Пьеру. – Да, приятный запах. Имею честь быть обожателем супруги вашей, здорова она? Мой привал к вашим услугам. – И, как это часто бывает с старыми людьми, Кутузов стал рассеянно оглядываться, как будто забыв все, что ему нужно было сказать или сделать.
Очевидно, вспомнив то, что он искал, он подманил к себе Андрея Сергеича Кайсарова, брата своего адъютанта.
– Как, как, как стихи то Марина, как стихи, как? Что на Геракова написал: «Будешь в корпусе учитель… Скажи, скажи, – заговорил Кутузов, очевидно, собираясь посмеяться. Кайсаров прочел… Кутузов, улыбаясь, кивал головой в такт стихов.
Когда Пьер отошел от Кутузова, Долохов, подвинувшись к нему, взял его за руку.
– Очень рад встретить вас здесь, граф, – сказал он ему громко и не стесняясь присутствием посторонних, с особенной решительностью и торжественностью. – Накануне дня, в который бог знает кому из нас суждено остаться в живых, я рад случаю сказать вам, что я жалею о тех недоразумениях, которые были между нами, и желал бы, чтобы вы не имели против меня ничего. Прошу вас простить меня.
Пьер, улыбаясь, глядел на Долохова, не зная, что сказать ему. Долохов со слезами, выступившими ему на глаза, обнял и поцеловал Пьера.
Борис что то сказал своему генералу, и граф Бенигсен обратился к Пьеру и предложил ехать с собою вместе по линии.
– Вам это будет интересно, – сказал он.
– Да, очень интересно, – сказал Пьер.
Через полчаса Кутузов уехал в Татаринову, и Бенигсен со свитой, в числе которой был и Пьер, поехал по линии.


Бенигсен от Горок спустился по большой дороге к мосту, на который Пьеру указывал офицер с кургана как на центр позиции и у которого на берегу лежали ряды скошенной, пахнувшей сеном травы. Через мост они проехали в село Бородино, оттуда повернули влево и мимо огромного количества войск и пушек выехали к высокому кургану, на котором копали землю ополченцы. Это был редут, еще не имевший названия, потом получивший название редута Раевского, или курганной батареи.
Пьер не обратил особенного внимания на этот редут. Он не знал, что это место будет для него памятнее всех мест Бородинского поля. Потом они поехали через овраг к Семеновскому, в котором солдаты растаскивали последние бревна изб и овинов. Потом под гору и на гору они проехали вперед через поломанную, выбитую, как градом, рожь, по вновь проложенной артиллерией по колчам пашни дороге на флеши [род укрепления. (Примеч. Л.Н. Толстого.) ], тоже тогда еще копаемые.
Бенигсен остановился на флешах и стал смотреть вперед на (бывший еще вчера нашим) Шевардинский редут, на котором виднелось несколько всадников. Офицеры говорили, что там был Наполеон или Мюрат. И все жадно смотрели на эту кучку всадников. Пьер тоже смотрел туда, стараясь угадать, который из этих чуть видневшихся людей был Наполеон. Наконец всадники съехали с кургана и скрылись.
Бенигсен обратился к подошедшему к нему генералу и стал пояснять все положение наших войск. Пьер слушал слова Бенигсена, напрягая все свои умственные силы к тому, чтоб понять сущность предстоящего сражения, но с огорчением чувствовал, что умственные способности его для этого были недостаточны. Он ничего не понимал. Бенигсен перестал говорить, и заметив фигуру прислушивавшегося Пьера, сказал вдруг, обращаясь к нему:
– Вам, я думаю, неинтересно?
– Ах, напротив, очень интересно, – повторил Пьер не совсем правдиво.
С флеш они поехали еще левее дорогою, вьющеюся по частому, невысокому березовому лесу. В середине этого
леса выскочил перед ними на дорогу коричневый с белыми ногами заяц и, испуганный топотом большого количества лошадей, так растерялся, что долго прыгал по дороге впереди их, возбуждая общее внимание и смех, и, только когда в несколько голосов крикнули на него, бросился в сторону и скрылся в чаще. Проехав версты две по лесу, они выехали на поляну, на которой стояли войска корпуса Тучкова, долженствовавшего защищать левый фланг.
Здесь, на крайнем левом фланге, Бенигсен много и горячо говорил и сделал, как казалось Пьеру, важное в военном отношении распоряжение. Впереди расположения войск Тучкова находилось возвышение. Это возвышение не было занято войсками. Бенигсен громко критиковал эту ошибку, говоря, что было безумно оставить незанятою командующую местностью высоту и поставить войска под нею. Некоторые генералы выражали то же мнение. Один в особенности с воинской горячностью говорил о том, что их поставили тут на убой. Бенигсен приказал своим именем передвинуть войска на высоту.
Распоряжение это на левом фланге еще более заставило Пьера усумниться в его способности понять военное дело. Слушая Бенигсена и генералов, осуждавших положение войск под горою, Пьер вполне понимал их и разделял их мнение; но именно вследствие этого он не мог понять, каким образом мог тот, кто поставил их тут под горою, сделать такую очевидную и грубую ошибку.
Пьер не знал того, что войска эти были поставлены не для защиты позиции, как думал Бенигсен, а были поставлены в скрытое место для засады, то есть для того, чтобы быть незамеченными и вдруг ударить на подвигавшегося неприятеля. Бенигсен не знал этого и передвинул войска вперед по особенным соображениям, не сказав об этом главнокомандующему.


Князь Андрей в этот ясный августовский вечер 25 го числа лежал, облокотившись на руку, в разломанном сарае деревни Князькова, на краю расположения своего полка. В отверстие сломанной стены он смотрел на шедшую вдоль по забору полосу тридцатилетних берез с обрубленными нижними сучьями, на пашню с разбитыми на ней копнами овса и на кустарник, по которому виднелись дымы костров – солдатских кухонь.
Как ни тесна и никому не нужна и ни тяжка теперь казалась князю Андрею его жизнь, он так же, как и семь лет тому назад в Аустерлице накануне сражения, чувствовал себя взволнованным и раздраженным.
Приказания на завтрашнее сражение были отданы и получены им. Делать ему было больше нечего. Но мысли самые простые, ясные и потому страшные мысли не оставляли его в покое. Он знал, что завтрашнее сражение должно было быть самое страшное изо всех тех, в которых он участвовал, и возможность смерти в первый раз в его жизни, без всякого отношения к житейскому, без соображений о том, как она подействует на других, а только по отношению к нему самому, к его душе, с живостью, почти с достоверностью, просто и ужасно, представилась ему. И с высоты этого представления все, что прежде мучило и занимало его, вдруг осветилось холодным белым светом, без теней, без перспективы, без различия очертаний. Вся жизнь представилась ему волшебным фонарем, в который он долго смотрел сквозь стекло и при искусственном освещении. Теперь он увидал вдруг, без стекла, при ярком дневном свете, эти дурно намалеванные картины. «Да, да, вот они те волновавшие и восхищавшие и мучившие меня ложные образы, – говорил он себе, перебирая в своем воображении главные картины своего волшебного фонаря жизни, глядя теперь на них при этом холодном белом свете дня – ясной мысли о смерти. – Вот они, эти грубо намалеванные фигуры, которые представлялись чем то прекрасным и таинственным. Слава, общественное благо, любовь к женщине, самое отечество – как велики казались мне эти картины, какого глубокого смысла казались они исполненными! И все это так просто, бледно и грубо при холодном белом свете того утра, которое, я чувствую, поднимается для меня». Три главные горя его жизни в особенности останавливали его внимание. Его любовь к женщине, смерть его отца и французское нашествие, захватившее половину России. «Любовь!.. Эта девочка, мне казавшаяся преисполненною таинственных сил. Как же я любил ее! я делал поэтические планы о любви, о счастии с нею. О милый мальчик! – с злостью вслух проговорил он. – Как же! я верил в какую то идеальную любовь, которая должна была мне сохранить ее верность за целый год моего отсутствия! Как нежный голубок басни, она должна была зачахнуть в разлуке со мной. А все это гораздо проще… Все это ужасно просто, гадко!
Отец тоже строил в Лысых Горах и думал, что это его место, его земля, его воздух, его мужики; а пришел Наполеон и, не зная об его существовании, как щепку с дороги, столкнул его, и развалились его Лысые Горы и вся его жизнь. А княжна Марья говорит, что это испытание, посланное свыше. Для чего же испытание, когда его уже нет и не будет? никогда больше не будет! Его нет! Так кому же это испытание? Отечество, погибель Москвы! А завтра меня убьет – и не француз даже, а свой, как вчера разрядил солдат ружье около моего уха, и придут французы, возьмут меня за ноги и за голову и швырнут в яму, чтоб я не вонял им под носом, и сложатся новые условия жизни, которые будут также привычны для других, и я не буду знать про них, и меня не будет».
Он поглядел на полосу берез с их неподвижной желтизной, зеленью и белой корой, блестящих на солнце. «Умереть, чтобы меня убили завтра, чтобы меня не было… чтобы все это было, а меня бы не было». Он живо представил себе отсутствие себя в этой жизни. И эти березы с их светом и тенью, и эти курчавые облака, и этот дым костров – все вокруг преобразилось для него и показалось чем то страшным и угрожающим. Мороз пробежал по его спине. Быстро встав, он вышел из сарая и стал ходить.
За сараем послышались голоса.
– Кто там? – окликнул князь Андрей.
Красноносый капитан Тимохин, бывший ротный командир Долохова, теперь, за убылью офицеров, батальонный командир, робко вошел в сарай. За ним вошли адъютант и казначей полка.
Князь Андрей поспешно встал, выслушал то, что по службе имели передать ему офицеры, передал им еще некоторые приказания и сбирался отпустить их, когда из за сарая послышался знакомый, пришепетывающий голос.
– Que diable! [Черт возьми!] – сказал голос человека, стукнувшегося обо что то.
Князь Андрей, выглянув из сарая, увидал подходящего к нему Пьера, который споткнулся на лежавшую жердь и чуть не упал. Князю Андрею вообще неприятно было видеть людей из своего мира, в особенности же Пьера, который напоминал ему все те тяжелые минуты, которые он пережил в последний приезд в Москву.
– А, вот как! – сказал он. – Какими судьбами? Вот не ждал.
В то время как он говорил это, в глазах его и выражении всего лица было больше чем сухость – была враждебность, которую тотчас же заметил Пьер. Он подходил к сараю в самом оживленном состоянии духа, но, увидав выражение лица князя Андрея, он почувствовал себя стесненным и неловким.
– Я приехал… так… знаете… приехал… мне интересно, – сказал Пьер, уже столько раз в этот день бессмысленно повторявший это слово «интересно». – Я хотел видеть сражение.
– Да, да, а братья масоны что говорят о войне? Как предотвратить ее? – сказал князь Андрей насмешливо. – Ну что Москва? Что мои? Приехали ли наконец в Москву? – спросил он серьезно.
– Приехали. Жюли Друбецкая говорила мне. Я поехал к ним и не застал. Они уехали в подмосковную.


Офицеры хотели откланяться, но князь Андрей, как будто не желая оставаться с глазу на глаз с своим другом, предложил им посидеть и напиться чаю. Подали скамейки и чай. Офицеры не без удивления смотрели на толстую, громадную фигуру Пьера и слушали его рассказы о Москве и о расположении наших войск, которые ему удалось объездить. Князь Андрей молчал, и лицо его так было неприятно, что Пьер обращался более к добродушному батальонному командиру Тимохину, чем к Болконскому.
– Так ты понял все расположение войск? – перебил его князь Андрей.
– Да, то есть как? – сказал Пьер. – Как невоенный человек, я не могу сказать, чтобы вполне, но все таки понял общее расположение.
– Eh bien, vous etes plus avance que qui cela soit, [Ну, так ты больше знаешь, чем кто бы то ни было.] – сказал князь Андрей.
– A! – сказал Пьер с недоуменьем, через очки глядя на князя Андрея. – Ну, как вы скажете насчет назначения Кутузова? – сказал он.
– Я очень рад был этому назначению, вот все, что я знаю, – сказал князь Андрей.
– Ну, а скажите, какое ваше мнение насчет Барклая де Толли? В Москве бог знает что говорили про него. Как вы судите о нем?
– Спроси вот у них, – сказал князь Андрей, указывая на офицеров.
Пьер с снисходительно вопросительной улыбкой, с которой невольно все обращались к Тимохину, посмотрел на него.
– Свет увидали, ваше сиятельство, как светлейший поступил, – робко и беспрестанно оглядываясь на своего полкового командира, сказал Тимохин.
– Отчего же так? – спросил Пьер.
– Да вот хоть бы насчет дров или кормов, доложу вам. Ведь мы от Свенцян отступали, не смей хворостины тронуть, или сенца там, или что. Ведь мы уходим, ему достается, не так ли, ваше сиятельство? – обратился он к своему князю, – а ты не смей. В нашем полку под суд двух офицеров отдали за этакие дела. Ну, как светлейший поступил, так насчет этого просто стало. Свет увидали…
– Так отчего же он запрещал?
Тимохин сконфуженно оглядывался, не понимая, как и что отвечать на такой вопрос. Пьер с тем же вопросом обратился к князю Андрею.
– А чтобы не разорять край, который мы оставляли неприятелю, – злобно насмешливо сказал князь Андрей. – Это очень основательно; нельзя позволять грабить край и приучаться войскам к мародерству. Ну и в Смоленске он тоже правильно рассудил, что французы могут обойти нас и что у них больше сил. Но он не мог понять того, – вдруг как бы вырвавшимся тонким голосом закричал князь Андрей, – но он не мог понять, что мы в первый раз дрались там за русскую землю, что в войсках был такой дух, какого никогда я не видал, что мы два дня сряду отбивали французов и что этот успех удесятерял наши силы. Он велел отступать, и все усилия и потери пропали даром. Он не думал об измене, он старался все сделать как можно лучше, он все обдумал; но от этого то он и не годится. Он не годится теперь именно потому, что он все обдумывает очень основательно и аккуратно, как и следует всякому немцу. Как бы тебе сказать… Ну, у отца твоего немец лакей, и он прекрасный лакей и удовлетворит всем его нуждам лучше тебя, и пускай он служит; но ежели отец при смерти болен, ты прогонишь лакея и своими непривычными, неловкими руками станешь ходить за отцом и лучше успокоишь его, чем искусный, но чужой человек. Так и сделали с Барклаем. Пока Россия была здорова, ей мог служить чужой, и был прекрасный министр, но как только она в опасности; нужен свой, родной человек. А у вас в клубе выдумали, что он изменник! Тем, что его оклеветали изменником, сделают только то, что потом, устыдившись своего ложного нарекания, из изменников сделают вдруг героем или гением, что еще будет несправедливее. Он честный и очень аккуратный немец…
– Однако, говорят, он искусный полководец, – сказал Пьер.
– Я не понимаю, что такое значит искусный полководец, – с насмешкой сказал князь Андрей.
– Искусный полководец, – сказал Пьер, – ну, тот, который предвидел все случайности… ну, угадал мысли противника.
– Да это невозможно, – сказал князь Андрей, как будто про давно решенное дело.
Пьер с удивлением посмотрел на него.
– Однако, – сказал он, – ведь говорят же, что война подобна шахматной игре.
– Да, – сказал князь Андрей, – только с тою маленькою разницей, что в шахматах над каждым шагом ты можешь думать сколько угодно, что ты там вне условий времени, и еще с той разницей, что конь всегда сильнее пешки и две пешки всегда сильнее одной, a на войне один батальон иногда сильнее дивизии, а иногда слабее роты. Относительная сила войск никому не может быть известна. Поверь мне, – сказал он, – что ежели бы что зависело от распоряжений штабов, то я бы был там и делал бы распоряжения, а вместо того я имею честь служить здесь, в полку вот с этими господами, и считаю, что от нас действительно будет зависеть завтрашний день, а не от них… Успех никогда не зависел и не будет зависеть ни от позиции, ни от вооружения, ни даже от числа; а уж меньше всего от позиции.
– А от чего же?
– От того чувства, которое есть во мне, в нем, – он указал на Тимохина, – в каждом солдате.
Князь Андрей взглянул на Тимохина, который испуганно и недоумевая смотрел на своего командира. В противность своей прежней сдержанной молчаливости князь Андрей казался теперь взволнованным. Он, видимо, не мог удержаться от высказывания тех мыслей, которые неожиданно приходили ему.
– Сражение выиграет тот, кто твердо решил его выиграть. Отчего мы под Аустерлицем проиграли сражение? У нас потеря была почти равная с французами, но мы сказали себе очень рано, что мы проиграли сражение, – и проиграли. А сказали мы это потому, что нам там незачем было драться: поскорее хотелось уйти с поля сражения. «Проиграли – ну так бежать!» – мы и побежали. Ежели бы до вечера мы не говорили этого, бог знает что бы было. А завтра мы этого не скажем. Ты говоришь: наша позиция, левый фланг слаб, правый фланг растянут, – продолжал он, – все это вздор, ничего этого нет. А что нам предстоит завтра? Сто миллионов самых разнообразных случайностей, которые будут решаться мгновенно тем, что побежали или побегут они или наши, что убьют того, убьют другого; а то, что делается теперь, – все это забава. Дело в том, что те, с кем ты ездил по позиции, не только не содействуют общему ходу дел, но мешают ему. Они заняты только своими маленькими интересами.