Критерий Краскела — Уоллиса

Поделись знанием:
Перейти к: навигация, поиск

Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона — Манна — Уитни. Критерий Краскела — Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Известен также под названиями: H-критерий Краскела — Уоллиса, односторонний дисперсионный анализ Краскела — Уоллиса (англ. Kruskal — Wallis one-way analysis of variance), тест Крускала — Уоллиса (англ. Kruskal — Wallis test).





Примеры задач

Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом «Каковы шансы на победу сборной России?» до начала чемпионата. Вторая выборка —- после первой игры, третья — после второго матча и т. д. Значения в выборках — шансы России на победу по десятибалльной шкале (1 —- «никаких перспектив», 10 — «отвезти в Россию кубок —- дело времени»). Требуется проверить, зависят ли результаты опросов от хода чемпионата.

Описание критерия

Заданы <math>k</math> выборок:

<math>x_1^{n_1}=\{x_{11},\;\ldots,\;x_{1n_1}\},\;\ldots,\;x_k^{n_k}=\{x_{k1},\;\ldots,\;x_{kn_k}\}</math>.

Объединённая выборка будет иметь вид:

<math>x=x_1^{n_1}\cup x_2^{n_2}\cup\ldots\cup x_k^{n_k}.</math>

Дополнительные предположения:

  1. обе выборки простые, объединённая выборка независима;
  2. выборки взяты из неизвестных непрерывных распределений <math>F_1(x),\;\ldots,\;F_k(x)</math>.

Проверяется нулевая гипотеза <math>H_0\colon F_1(x)=\ldots=F_k(x)</math> при альтернативе <math>H_1\colon F_1(x)=F_2(x-\Delta_1)=\ldots=F_k(x-\Delta_{k-1})</math>.

Упорядочим все <math>N=\sum_{i=1}^k n_i</math> элементов выборок по возрастанию и обозначим <math>R_{ij}</math> ранг <math>j</math>-го элемента <math>i</math>-й выборки в полученном вариационном ряду.

Статистика критерия Краскела — Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид:

<math>H=\sum_{i=1}^k\left(1-\frac{n_i}{N}\right)\left\{\frac{\bar{R}_i-\dfrac{N+1}{2}}{\sqrt{\dfrac{(N-n_i)(N+1)}{12n_i}}}\right\}^2 = \frac{12}{N(N+1)}\sum_{i=1}^k n_i \left(\bar{R}_i-\frac{N+1}{2}\right)^2 =</math>
<math> =\frac{12}{N(N+1)}\sum_{i=1}^k\frac{R_i^2}{n_i}-3(N+1)</math>,

где

<math>R_i=\sum_{j=1}^k R_{ij}</math>;
<math>\bar{R}_i=\frac{1}{n_i}R_i</math>.

Гипотеза сдвига отклоняется на уровне значимости <math>\alpha</math>, если <math>H\geqslant H_\alpha</math>, где <math>H_\alpha</math> — критическое значение, при <math>k\leqslant 5</math> и <math>n_i\leqslant 8</math> вычисляемое по таблицам. При бо́льших значениях применимы различные аппроксимации.

Аппроксимация Краскела — Уоллиса

Пусть

<math>M=\frac{N^3-\displaystyle{\sum_{i=1}^k n_i^3}}{N(N+1)}</math>;
<math>\nu_1=(k-1)\frac{(k-1)(M-k+1)-V}{\dfrac{1}{2}MV}</math>;
<math>\nu_2=\frac{M-k+1}{k-1}\nu_1</math>;
<math>V=2(k-1)-\frac{2\left\{3k^2-6k+N(2k^2-6k+1)\right\}}{5N(N+1)}-\frac{6}{5}\sum_{i=1}^k\frac{1}{n_i}</math>.

Тогда статистика <math>F=\frac{H(M-k+1)}{(k-1)(M-H)}</math> будет иметь при отсутствии сдвига <math>F</math>-распределение с <math>\nu_1</math> и <math>\nu_2</math> степенями свободы. Таким образом, нулевая гипотеза отклоняется на уровне значимости <math>\alpha</math>, если <math>F>F_{\alpha}(\nu_1,\;\nu_2)</math>.

Аппроксимация Имана — Давенпорта

В соответстви с ней нулевая гипотеза сдвига отклоняется с достоверностью <math>\alpha</math>, если <math>J\geqslant J_\alpha</math>, где <math>J=\frac{H}{2}\left(1+\frac{N-k}{N-1-H}\right)</math>; <math>J_\alpha=\left\{(k-1)F_\alpha(k-1;\;N-l)+\chi_\alpha^2(k-1)\right\}</math>, <math>F_\alpha(f_1;\;f_2)</math> и <math>\chi_\alpha^2(a)</math> — соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.

Это более точная аппроксимация, чем аппроксимация Краскела — Уоллиса. При наличии связанных рангов (то есть когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику <math>H^*=H\left\{1-\left(\sum_{j=1}^q \frac{T_j}{N^3-N} \right) \right\} ^{-1}</math>, где <math>T_j=t_j^3-t_j</math>; <math>t_j</math> — размер <math>j</math>-й группы одинаковых элементов; <math>q</math> — количество групп одинаковых элементов. При <math>n_i\geqslant 20</math> справедлива аппроксимация распределения статистики <math>H</math>; <math>\chi^2</math>-распределением с <math>f=k-1</math> степенями свободы, то есть нулевая гипотеза отклоняется, если <math>H\geqslant\chi_\alpha^2(k-1)</math>.

См. также

Напишите отзыв о статье "Критерий Краскела — Уоллиса"

Литература

  • Kruskal W. H., Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — pp. 583–621.
  • Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
  • Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.

Ссылки

  • [www.recognition.su/wiki/index.php?title=Критерий_Краскела-Уоллиса Критерий Краскела — Уоллиса]


Отрывок, характеризующий Критерий Краскела — Уоллиса

– Кю… – с усилием выговорил Залетаев. – Кью ю ю… – вытянул он, старательно оттопырив губы, – летриптала, де бу де ба и детравагала, – пропел он.
– Ай, важно! Вот так хранцуз! ой… го го го го! – Что ж, еще есть хочешь?
– Дай ему каши то; ведь не скоро наестся с голоду то.
Опять ему дали каши; и Морель, посмеиваясь, принялся за третий котелок. Радостные улыбки стояли на всех лицах молодых солдат, смотревших на Мореля. Старые солдаты, считавшие неприличным заниматься такими пустяками, лежали с другой стороны костра, но изредка, приподнимаясь на локте, с улыбкой взглядывали на Мореля.
– Тоже люди, – сказал один из них, уворачиваясь в шинель. – И полынь на своем кореню растет.
– Оо! Господи, господи! Как звездно, страсть! К морозу… – И все затихло.
Звезды, как будто зная, что теперь никто не увидит их, разыгрались в черном небе. То вспыхивая, то потухая, то вздрагивая, они хлопотливо о чем то радостном, но таинственном перешептывались между собой.

Х
Войска французские равномерно таяли в математически правильной прогрессии. И тот переход через Березину, про который так много было писано, была только одна из промежуточных ступеней уничтожения французской армии, а вовсе не решительный эпизод кампании. Ежели про Березину так много писали и пишут, то со стороны французов это произошло только потому, что на Березинском прорванном мосту бедствия, претерпеваемые французской армией прежде равномерно, здесь вдруг сгруппировались в один момент и в одно трагическое зрелище, которое у всех осталось в памяти. Со стороны же русских так много говорили и писали про Березину только потому, что вдали от театра войны, в Петербурге, был составлен план (Пфулем же) поимки в стратегическую западню Наполеона на реке Березине. Все уверились, что все будет на деле точно так, как в плане, и потому настаивали на том, что именно Березинская переправа погубила французов. В сущности же, результаты Березинской переправы были гораздо менее гибельны для французов потерей орудий и пленных, чем Красное, как то показывают цифры.
Единственное значение Березинской переправы заключается в том, что эта переправа очевидно и несомненно доказала ложность всех планов отрезыванья и справедливость единственно возможного, требуемого и Кутузовым и всеми войсками (массой) образа действий, – только следования за неприятелем. Толпа французов бежала с постоянно усиливающейся силой быстроты, со всею энергией, направленной на достижение цели. Она бежала, как раненый зверь, и нельзя ей было стать на дороге. Это доказало не столько устройство переправы, сколько движение на мостах. Когда мосты были прорваны, безоружные солдаты, московские жители, женщины с детьми, бывшие в обозе французов, – все под влиянием силы инерции не сдавалось, а бежало вперед в лодки, в мерзлую воду.
Стремление это было разумно. Положение и бегущих и преследующих было одинаково дурно. Оставаясь со своими, каждый в бедствии надеялся на помощь товарища, на определенное, занимаемое им место между своими. Отдавшись же русским, он был в том же положении бедствия, но становился на низшую ступень в разделе удовлетворения потребностей жизни. Французам не нужно было иметь верных сведений о том, что половина пленных, с которыми не знали, что делать, несмотря на все желание русских спасти их, – гибли от холода и голода; они чувствовали, что это не могло быть иначе. Самые жалостливые русские начальники и охотники до французов, французы в русской службе не могли ничего сделать для пленных. Французов губило бедствие, в котором находилось русское войско. Нельзя было отнять хлеб и платье у голодных, нужных солдат, чтобы отдать не вредным, не ненавидимым, не виноватым, но просто ненужным французам. Некоторые и делали это; но это было только исключение.
Назади была верная погибель; впереди была надежда. Корабли были сожжены; не было другого спасения, кроме совокупного бегства, и на это совокупное бегство были устремлены все силы французов.
Чем дальше бежали французы, чем жальче были их остатки, в особенности после Березины, на которую, вследствие петербургского плана, возлагались особенные надежды, тем сильнее разгорались страсти русских начальников, обвинявших друг друга и в особенности Кутузова. Полагая, что неудача Березинского петербургского плана будет отнесена к нему, недовольство им, презрение к нему и подтрунивание над ним выражались сильнее и сильнее. Подтрунивание и презрение, само собой разумеется, выражалось в почтительной форме, в той форме, в которой Кутузов не мог и спросить, в чем и за что его обвиняют. С ним не говорили серьезно; докладывая ему и спрашивая его разрешения, делали вид исполнения печального обряда, а за спиной его подмигивали и на каждом шагу старались его обманывать.