Задача классификации

Поделись знанием:
Перейти к: навигация, поиск

Задача классифика́ции — формализованная задача, в которой имеется множество объектов (ситуаций), разделённых некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется выборкой. Классовая принадлежность остальных объектов неизвестна. Требуется построить алгоритм, способный классифицировать (см. ниже) произвольный объект из исходного множества.

Классифици́ровать объект — значит, указать номер (или наименование) класса, к которому относится данный объект.

Классифика́ция объекта — номер или наименование класса, выдаваемый алгоритмом классификации в результате его применения к данному конкретному объекту.

В математической статистике задачи классификации называются также задачами дискриминантного анализа. В машинном обучении задача классификации решается, в частности, с помощью методов искусственных нейронных сетей при постановке эксперимента в виде обучения с учителем.

Существуют также другие способы постановки эксперимента — обучение без учителя, но они используются для решения другой задачи — кластеризации или таксономии. В этих задачах разделение объектов обучающей выборки на классы не задаётся, и требуется классифицировать объекты только на основе их сходства друг с другом. В некоторых прикладных областях, и даже в самой математической статистике, из-за близости задач часто не различают задачи кластеризации от задач классификации.

Некоторые алгоритмы для решения задач классификации комбинируют обучение с учителем с обучением без учителя, например, одна из версий нейронных сетей Кохонена — сети векторного квантования, обучаемые с учителем.





Математическая постановка задачи

Пусть <math>X</math> — множество описаний объектов, <math>Y</math> — множество номеров (или наименований) классов. Существует неизвестная целевая зависимость — отображение <math>y^{*}\colon X\to Y</math>, значения которой известны только на объектах конечной обучающей выборки <math>X^m = \{(x_1,y_1),\dots,(x_m,y_m)\}</math>. Требуется построить алгоритм <math>a\colon X\to Y</math>, способный классифицировать произвольный объект <math>x \in X</math>.

Вероятностная постановка задачи

Более общей считается вероятностная постановка задачи. Предполагается, что множество пар «объект, класс» <math>X \times Y</math> является вероятностным пространством с неизвестной вероятностной мерой <math>\mathsf P</math>. Имеется конечная обучающая выборка наблюдений <math>X^m = \{(x_1,y_1),\dots,(x_m,y_m)\}</math>, сгенерированная согласно вероятностной мере <math>\mathsf P</math>. Требуется построить алгоритм <math>a\colon X\to Y</math>, способный классифицировать произвольный объект <math>x \in X</math>.

Признаковое пространство

Признаком называется отображение <math>f\colon X\to D_f</math>, где <math>D_f</math> — множество допустимых значений признака. Если заданы признаки <math>f_1,\dots,f_n</math>, то вектор <math>{\mathbf x} = (f_1(x),\dots,f_n(x))</math> называется признаковым описанием объекта <math>x\in X</math>. Признаковые описания допустимо отождествлять с самими объектами. При этом множество <math>X = D_{f_1}\times\dots\times D_{f_n}</math> называют признаковым пространством.

В зависимости от множества <math>D_f</math> признаки делятся на следующие типы:

  • бинарный признак: <math>D_f=\{0,1\}</math>;
  • номинальный признак: <math>D_f</math> — конечное множество;
  • порядковый признак: <math>D_f</math> — конечное упорядоченное множество;
  • количественный признак: <math>D_f</math> — множество действительных чисел.

Часто встречаются прикладные задачи с разнотипными признаками, для их решения подходят далеко не все методы.

Типология задач классификации

Типы входных данных

Классификацию сигналов и изображений называют также распознаванием образов.

Типы классов

  • Двухклассовая классификация. Наиболее простой в техническом отношении случай, который служит основой для решения более сложных задач.
  • Многоклассовая классификация. Когда число классов достигает многих тысяч (например, при распознавании иероглифов или слитной речи), задача классификации становится существенно более трудной.
  • Непересекающиеся классы.
  • Пересекающиеся классы. Объект может относиться одновременно к нескольким классам.
  • Нечёткие классы. Требуется определять степень принадлежности объекта каждому из классов, обычно это действительное число от 0 до 1.

См. также

Напишите отзыв о статье "Задача классификации"

Ссылки

  • [www.machinelearning.ru www.MachineLearning.ru] — профессиональный вики-ресурс, посвященный машинному обучению и интеллектуальному анализу данных
  • Константин Воронцов. Курс лекций [www.ccas.ru/voron/teaching.html Математические методы обучения по прецедентам], МФТИ, 2004-2008
  • Юрий Лифшиц. [yury.name/internet/06ia.pdf Автоматическая классификация текстов] (Слайды) — лекция №6 из курса [yury.name/internet.html «Алгоритмы для Интернета»]
  • [www.math.le.ac.uk/people/ag153/homepage/KNN/KNN3.html kNN и Потенциальная энергия] (апплет), Е.М. Миркес и университет Лейстера.

Литература

  1. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989.
  2. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979.
  3. Журавлев Ю. И., Рязанов В. В., Сенько О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: Фазис, 2006. ISBN 5-7036-0108-8.
  4. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. ISBN 5-86134-060-9.
  5. Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. — Киев: Наукова думка, 2004. ISBN 966-00-0341-2.
  6. Hastie, T., Tibshirani R., Friedman J. [www-stat.stanford.edu/~tibs/ElemStatLearn/ The Elements of Statistical Learning: Data Mining, Inference, and Prediction]. — 2nd ed. — Springer-Verlag, 2009. — 746 p. — ISBN 978-0-387-84857-0..
  7. Mitchell T. Machine Learning. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7.

Отрывок, характеризующий Задача классификации

Сперанский, всё еще смеясь, подал князю Андрею свою белую, нежную руку.
– Очень рад вас видеть, князь, – сказал он. – Минутку… обратился он к Магницкому, прерывая его рассказ. – У нас нынче уговор: обед удовольствия, и ни слова про дела. – И он опять обратился к рассказчику, и опять засмеялся.
Князь Андрей с удивлением и грустью разочарования слушал его смех и смотрел на смеющегося Сперанского. Это был не Сперанский, а другой человек, казалось князю Андрею. Всё, что прежде таинственно и привлекательно представлялось князю Андрею в Сперанском, вдруг стало ему ясно и непривлекательно.
За столом разговор ни на мгновение не умолкал и состоял как будто бы из собрания смешных анекдотов. Еще Магницкий не успел докончить своего рассказа, как уж кто то другой заявил свою готовность рассказать что то, что было еще смешнее. Анекдоты большею частью касались ежели не самого служебного мира, то лиц служебных. Казалось, что в этом обществе так окончательно было решено ничтожество этих лиц, что единственное отношение к ним могло быть только добродушно комическое. Сперанский рассказал, как на совете сегодняшнего утра на вопрос у глухого сановника о его мнении, сановник этот отвечал, что он того же мнения. Жерве рассказал целое дело о ревизии, замечательное по бессмыслице всех действующих лиц. Столыпин заикаясь вмешался в разговор и с горячностью начал говорить о злоупотреблениях прежнего порядка вещей, угрожая придать разговору серьезный характер. Магницкий стал трунить над горячностью Столыпина, Жерве вставил шутку и разговор принял опять прежнее, веселое направление.
Очевидно, Сперанский после трудов любил отдохнуть и повеселиться в приятельском кружке, и все его гости, понимая его желание, старались веселить его и сами веселиться. Но веселье это казалось князю Андрею тяжелым и невеселым. Тонкий звук голоса Сперанского неприятно поражал его, и неумолкавший смех своей фальшивой нотой почему то оскорблял чувство князя Андрея. Князь Андрей не смеялся и боялся, что он будет тяжел для этого общества. Но никто не замечал его несоответственности общему настроению. Всем было, казалось, очень весело.
Он несколько раз желал вступить в разговор, но всякий раз его слово выбрасывалось вон, как пробка из воды; и он не мог шутить с ними вместе.
Ничего не было дурного или неуместного в том, что они говорили, всё было остроумно и могло бы быть смешно; но чего то, того самого, что составляет соль веселья, не только не было, но они и не знали, что оно бывает.
После обеда дочь Сперанского с своей гувернанткой встали. Сперанский приласкал дочь своей белой рукой, и поцеловал ее. И этот жест показался неестественным князю Андрею.
Мужчины, по английски, остались за столом и за портвейном. В середине начавшегося разговора об испанских делах Наполеона, одобряя которые, все были одного и того же мнения, князь Андрей стал противоречить им. Сперанский улыбнулся и, очевидно желая отклонить разговор от принятого направления, рассказал анекдот, не имеющий отношения к разговору. На несколько мгновений все замолкли.
Посидев за столом, Сперанский закупорил бутылку с вином и сказав: «нынче хорошее винцо в сапожках ходит», отдал слуге и встал. Все встали и также шумно разговаривая пошли в гостиную. Сперанскому подали два конверта, привезенные курьером. Он взял их и прошел в кабинет. Как только он вышел, общее веселье замолкло и гости рассудительно и тихо стали переговариваться друг с другом.
– Ну, теперь декламация! – сказал Сперанский, выходя из кабинета. – Удивительный талант! – обратился он к князю Андрею. Магницкий тотчас же стал в позу и начал говорить французские шутливые стихи, сочиненные им на некоторых известных лиц Петербурга, и несколько раз был прерываем аплодисментами. Князь Андрей, по окончании стихов, подошел к Сперанскому, прощаясь с ним.
– Куда вы так рано? – сказал Сперанский.
– Я обещал на вечер…
Они помолчали. Князь Андрей смотрел близко в эти зеркальные, непропускающие к себе глаза и ему стало смешно, как он мог ждать чего нибудь от Сперанского и от всей своей деятельности, связанной с ним, и как мог он приписывать важность тому, что делал Сперанский. Этот аккуратный, невеселый смех долго не переставал звучать в ушах князя Андрея после того, как он уехал от Сперанского.
Вернувшись домой, князь Андрей стал вспоминать свою петербургскую жизнь за эти четыре месяца, как будто что то новое. Он вспоминал свои хлопоты, искательства, историю своего проекта военного устава, который был принят к сведению и о котором старались умолчать единственно потому, что другая работа, очень дурная, была уже сделана и представлена государю; вспомнил о заседаниях комитета, членом которого был Берг; вспомнил, как в этих заседаниях старательно и продолжительно обсуживалось всё касающееся формы и процесса заседаний комитета, и как старательно и кратко обходилось всё что касалось сущности дела. Он вспомнил о своей законодательной работе, о том, как он озабоченно переводил на русский язык статьи римского и французского свода, и ему стало совестно за себя. Потом он живо представил себе Богучарово, свои занятия в деревне, свою поездку в Рязань, вспомнил мужиков, Дрона старосту, и приложив к ним права лиц, которые он распределял по параграфам, ему стало удивительно, как он мог так долго заниматься такой праздной работой.


На другой день князь Андрей поехал с визитами в некоторые дома, где он еще не был, и в том числе к Ростовым, с которыми он возобновил знакомство на последнем бале. Кроме законов учтивости, по которым ему нужно было быть у Ростовых, князю Андрею хотелось видеть дома эту особенную, оживленную девушку, которая оставила ему приятное воспоминание.
Наташа одна из первых встретила его. Она была в домашнем синем платье, в котором она показалась князю Андрею еще лучше, чем в бальном. Она и всё семейство Ростовых приняли князя Андрея, как старого друга, просто и радушно. Всё семейство, которое строго судил прежде князь Андрей, теперь показалось ему составленным из прекрасных, простых и добрых людей. Гостеприимство и добродушие старого графа, особенно мило поразительное в Петербурге, было таково, что князь Андрей не мог отказаться от обеда. «Да, это добрые, славные люди, думал Болконский, разумеется, не понимающие ни на волос того сокровища, которое они имеют в Наташе; но добрые люди, которые составляют наилучший фон для того, чтобы на нем отделялась эта особенно поэтическая, переполненная жизни, прелестная девушка!»
Князь Андрей чувствовал в Наташе присутствие совершенно чуждого для него, особенного мира, преисполненного каких то неизвестных ему радостей, того чуждого мира, который еще тогда, в отрадненской аллее и на окне, в лунную ночь, так дразнил его. Теперь этот мир уже более не дразнил его, не был чуждый мир; но он сам, вступив в него, находил в нем новое для себя наслаждение.