Критерий согласия Пирсона

Поделись знанием:
Перейти к: навигация, поиск

Критерий согласия Пирсона, или критерий согласия <math> \chi^2 </math> (Хи-квадрат) — наиболее часто употребляемый критерий для проверки гипотезы о принадлежности наблюдаемой выборки <math> x_1, x_2, ... , x_n </math> объёмом <math> n </math> некоторому теоретическому закону распределения <math> F(x,\theta) </math>. Свойства критерия были впервые исследованы Карлом Пирсоном в 1900 году[1].

Критерий может использоваться при проверке простых гипотез вида

<math> H_0: F_n(x)=F(x,\theta) </math>,

где <math> \theta </math> — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида

<math> H_0 : F_n(x) \in \left\{ F(x,\theta) , \theta \in \Theta \right\} </math> ,

когда оценка <math> \hat \theta </math> скалярного или векторного параметра распределения <math> F(x,\theta) </math> вычисляется по той же самой выборке.





Статистика критерия

Процедура проверки гипотез с использованием критериев типа <math> \chi^2 </math> предусматривает группирование наблюдений. Область определения случайной величины разбивают на <math> k </math> непересекающихся интервалов граничными точками

<math> x_{(0)}, x_{(1)}, ... , x_{(k-1)}, x_{(k)} </math> ,

где <math> x_{(0)} </math> — нижняя грань области определения случайной величины; <math> x_{(k)} </math> — верхняя грань.

В соответствии с заданным разбиением подсчитывают число <math> n_i </math> выборочных значений, попавших в <math> i </math> -й интервал, и вероятности попадания в интервал

<math> P_i (\theta )= F(x_{(i)},\theta)- F(x_{(i-1)},\theta) </math> ,

соответствующие теоретическому закону с функцией распределения <math> F(x,\theta) </math>.

При этом

<math> n=\sum_{i=1} ^k n_i </math> и <math> \sum_{i=1} ^k P_i (\theta )=1 </math> .

При проверке простой гипотезы известны как вид закона <math> F(x,\theta) </math>, так и все его параметры (известен скалярный или векторный параметр <math> \theta </math>).

В основе статистик, используемых в критериях согласия типа <math> \chi^2 </math>, лежит измерение отклонений <math> n_i/n </math> от <math> P_i (\theta ) </math>.

Статистика критерия согласия <math> \chi^2 </math> Пирсона определяется соотношением

<math> X_{n}^{2} = n\sum_{i=1}^{k} \frac {\left( n_i/n - P_i(\theta) \right)^2} {P_i(\theta)} </math>.

В случае проверки простой гипотезы в пределе при <math> n \to \infty </math> эта статистика подчиняется <math> \chi_r^2 </math> -распределению с <math> r=k-1 </math> степенями свободы, если верна проверяемая гипотеза <math> H_0 </math>. Плотность <math> \chi_r^2 </math> -распределения, которое является частным случаем гамма-распределения, описывается формулой

<math> g(s) = \frac {1} {2^{r/2} \Gamma(r/2)} s^{r/2-1} e^{-s/2} </math>.

Проверяемая гипотеза <math> H_0 </math> отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики <math> X_n^{2*} </math> больше критического значения <math> \chi_{r,\alpha}^2 </math> , или достигнутый уровень значимости (p-value)

<math> P \left( X_n^2 > X_n^{2*} \right) = \frac {1} {2^{r/2} \Gamma(r/2)} \int_{X_n^{2*}}^\infty s^{r/2-1} e^{-s/2} ds </math>

меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) <math> \alpha </math>.

Проверка сложных гипотез

При проверке сложных гипотез, если параметры закона <math> F(x,\theta) </math> по этой же выборке оцениваются в результате минимизации статистики <math> X_n^2 </math> или по сгруппированной выборке методом максимального правдоподобия, то статистика <math> X_n^2 </math> при справедливости проверяемой гипотезы подчиняется <math> \chi_r^2 </math>-распределению с <math> r=k-m-1 </math> степенями свободы, где <math> m </math> — количество оцененных по выборке параметров.

Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться <math> \chi_{k-m-1}^{2} </math> -распределением[2]. Более того, распределения статистики при справедливости гипотезы <math> H_0 </math> будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы[3]

При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа <math> \chi^2 </math> [4][5][6][7].

О мощности критерия

При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону. А в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что способность критерия отличать закон, соответствующий <math> H_0 </math>, от других, близких к закону, соответствующему <math> H_0 </math>, и далёких от него, отличаются. Если задать конкурирующую гипотезу <math> H_1 </math> и соответствующий ей некоторый конкурирующий закон <math> F_1(x,\theta) </math>, то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы <math> H_0 </math> при её справедливости) и вероятности этой ошибки <math> \alpha </math>), но и об ошибке 2-го рода (неотклонении <math> H_0 </math> при справедливости <math> H_1 </math>) и вероятности этой ошибки <math> \beta </math>). Мощность критерия по отношению к конкурирующей гипотезе <math> H_1 </math> характеризуется величиной <math> 1-\beta </math>. Критерий тем лучше распознаёт пару конкурирующих гипотез <math> H_0 </math> и <math> H_1 </math>, чем выше его мощность.

Мощность критерия согласия <math> \chi^2 </math> Пирсона существенно зависит от способа группирования [8], [9] и от выбранного числа интервалов[9], [10].

При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием) критерий согласия <math> \chi^2 </math> Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез[11],[9],[10].

При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия <math> \chi^2 </math> Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет[12],[13]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счет выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия[14].

Напишите отзыв о статье "Критерий согласия Пирсона"

Примечания

  1. [www.economics.soton.ac.uk/staff/aldrich/1900.pdf ‘’Pearson, Karl’’ (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine Series 5 50 (302): 157—175.]
  2. Chernoff H., Lehmann E. L. The use of maximum likelihood estimates in χ2 test for goodness of fit. // The Annals of Mathematical Statistics. — 1954. — Vol. 25. — P. 579—586.
  3. [www.ami.nstu.ru/~headrd/seminar/publik_html/Z_lab_4.htm Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик X² Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. Т. 64. — № 5. — С. 56-63.]
  4. Никулин М. С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба // Теория вероятностей и её применение. — 1973. — Т. XVIII, № 3. — С. 583—591.
  5. Никулин М. С. О критерии хи-квадрат для непрерывных распределе¬ний // Теория вероятностей и её применение. — 1973. — Т. XVIII. — № 3. — С. 675—676.
  6. Rao K. C., Robson D. S. A chi-squared statistic for goodness-of-fit tests within the exponential family // Commun. Statist. — 1974. — Vol. 3. — P. 1139—1153.
  7. Greenwood P. E., Nikulin M. S. A guide to chi-squared testing. — New York : John Wiley & Sons, 1996. — 280 p.
  8. [www.ami.nstu.ru/~headrd/seminar/publik_html/Z_lab_2.htm Лемешко Б. Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия // Заводская лаборатория, 1998. Т. 64. № 1. — С.56-64]
  9. 1 2 3 [www.ami.nstu.ru/~headrd/seminar/xi_square/start1.htm Р 50.1.033-2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов. 2002. — 87 с.]
  10. 1 2 [www.ami.nstu.ru/~headrd/seminar/publik_html/Z_lab_8.htm Лемешко Б. Ю., Чимитова Е. В. О выборе числа интервалов в критериях согласия типа X² // Заводская лаборатория. Диагностика материалов. 2003. Т. 69. — № 1. — С. 61-67.]
  11. Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5-14.
  12. [www.ami.nstu.ru/~headrd/seminar/publik_html/Power_Part_1.pdf Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез // Сибирский журнал индустриальной математики. 2008. — Т.11. — № 2(34). — С.96-111.]
  13. [www.ami.nstu.ru/~headrd/seminar/publik_html/Power_Part_2_new.pdf Лемешко Б. Ю., Лемешко С. Б., Постовалов С. Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез // Сибирский журнал индустриальной математики. 2008. — Т.11. — № 4(36). — С.78-93.]
  14. [www.ami.nstu.ru/~headrd/seminar/publik_html/Statistical_Data_Analysis.pdf Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход : монография / Б. Ю. Лемешко, С. Б. Лемешко, С. Н. Постовалов, Е. В. Чимитова. — Новосибирск : Изд-во НГТУ, 2011. — 888 с. (раздел 4.9)]

Литература

  • Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.

См. также

Ссылки

  • [www.nsu.ru/mmf/tvims/chernova/ms/lec/node46.html Критерий Пирсона на сайте Новосибирского государственного университета]
  • [www.ami.nstu.ru/~headrd/seminar/xi_square/start1.htm Критерии типа хи-квадрат на сайте Новосибирского государственного технического университета (Рекомендации по стандартизации Р 50.1.033-2001)]


Отрывок, характеризующий Критерий согласия Пирсона

Ростов с Ильиным поспешили найти уголок, где бы они, не нарушая скромности Марьи Генриховны, могли бы переменить мокрое платье. Они пошли было за перегородку, чтобы переодеться; но в маленьком чуланчике, наполняя его весь, с одной свечкой на пустом ящике, сидели три офицера, играя в карты, и ни за что не хотели уступить свое место. Марья Генриховна уступила на время свою юбку, чтобы употребить ее вместо занавески, и за этой занавеской Ростов и Ильин с помощью Лаврушки, принесшего вьюки, сняли мокрое и надели сухое платье.
В разломанной печке разложили огонь. Достали доску и, утвердив ее на двух седлах, покрыли попоной, достали самоварчик, погребец и полбутылки рому, и, попросив Марью Генриховну быть хозяйкой, все столпились около нее. Кто предлагал ей чистый носовой платок, чтобы обтирать прелестные ручки, кто под ножки подкладывал ей венгерку, чтобы не было сыро, кто плащом занавешивал окно, чтобы не дуло, кто обмахивал мух с лица ее мужа, чтобы он не проснулся.
– Оставьте его, – говорила Марья Генриховна, робко и счастливо улыбаясь, – он и так спит хорошо после бессонной ночи.
– Нельзя, Марья Генриховна, – отвечал офицер, – надо доктору прислужиться. Все, может быть, и он меня пожалеет, когда ногу или руку резать станет.
Стаканов было только три; вода была такая грязная, что нельзя было решить, когда крепок или некрепок чай, и в самоваре воды было только на шесть стаканов, но тем приятнее было по очереди и старшинству получить свой стакан из пухлых с короткими, не совсем чистыми, ногтями ручек Марьи Генриховны. Все офицеры, казалось, действительно были в этот вечер влюблены в Марью Генриховну. Даже те офицеры, которые играли за перегородкой в карты, скоро бросили игру и перешли к самовару, подчиняясь общему настроению ухаживанья за Марьей Генриховной. Марья Генриховна, видя себя окруженной такой блестящей и учтивой молодежью, сияла счастьем, как ни старалась она скрывать этого и как ни очевидно робела при каждом сонном движении спавшего за ней мужа.
Ложка была только одна, сахару было больше всего, но размешивать его не успевали, и потому было решено, что она будет поочередно мешать сахар каждому. Ростов, получив свой стакан и подлив в него рому, попросил Марью Генриховну размешать.
– Да ведь вы без сахара? – сказала она, все улыбаясь, как будто все, что ни говорила она, и все, что ни говорили другие, было очень смешно и имело еще другое значение.
– Да мне не сахар, мне только, чтоб вы помешали своей ручкой.
Марья Генриховна согласилась и стала искать ложку, которую уже захватил кто то.
– Вы пальчиком, Марья Генриховна, – сказал Ростов, – еще приятнее будет.
– Горячо! – сказала Марья Генриховна, краснея от удовольствия.
Ильин взял ведро с водой и, капнув туда рому, пришел к Марье Генриховне, прося помешать пальчиком.
– Это моя чашка, – говорил он. – Только вложите пальчик, все выпью.
Когда самовар весь выпили, Ростов взял карты и предложил играть в короли с Марьей Генриховной. Кинули жребий, кому составлять партию Марьи Генриховны. Правилами игры, по предложению Ростова, было то, чтобы тот, кто будет королем, имел право поцеловать ручку Марьи Генриховны, а чтобы тот, кто останется прохвостом, шел бы ставить новый самовар для доктора, когда он проснется.
– Ну, а ежели Марья Генриховна будет королем? – спросил Ильин.
– Она и так королева! И приказания ее – закон.
Только что началась игра, как из за Марьи Генриховны вдруг поднялась вспутанная голова доктора. Он давно уже не спал и прислушивался к тому, что говорилось, и, видимо, не находил ничего веселого, смешного или забавного во всем, что говорилось и делалось. Лицо его было грустно и уныло. Он не поздоровался с офицерами, почесался и попросил позволения выйти, так как ему загораживали дорогу. Как только он вышел, все офицеры разразились громким хохотом, а Марья Генриховна до слез покраснела и тем сделалась еще привлекательнее на глаза всех офицеров. Вернувшись со двора, доктор сказал жене (которая перестала уже так счастливо улыбаться и, испуганно ожидая приговора, смотрела на него), что дождь прошел и что надо идти ночевать в кибитку, а то все растащат.
– Да я вестового пошлю… двух! – сказал Ростов. – Полноте, доктор.
– Я сам стану на часы! – сказал Ильин.
– Нет, господа, вы выспались, а я две ночи не спал, – сказал доктор и мрачно сел подле жены, ожидая окончания игры.
Глядя на мрачное лицо доктора, косившегося на свою жену, офицерам стало еще веселей, и многие не могла удерживаться от смеха, которому они поспешно старались приискивать благовидные предлоги. Когда доктор ушел, уведя свою жену, и поместился с нею в кибиточку, офицеры улеглись в корчме, укрывшись мокрыми шинелями; но долго не спали, то переговариваясь, вспоминая испуг доктора и веселье докторши, то выбегая на крыльцо и сообщая о том, что делалось в кибиточке. Несколько раз Ростов, завертываясь с головой, хотел заснуть; но опять чье нибудь замечание развлекало его, опять начинался разговор, и опять раздавался беспричинный, веселый, детский хохот.


В третьем часу еще никто не заснул, как явился вахмистр с приказом выступать к местечку Островне.
Все с тем же говором и хохотом офицеры поспешно стали собираться; опять поставили самовар на грязной воде. Но Ростов, не дождавшись чаю, пошел к эскадрону. Уже светало; дождик перестал, тучи расходились. Было сыро и холодно, особенно в непросохшем платье. Выходя из корчмы, Ростов и Ильин оба в сумерках рассвета заглянули в глянцевитую от дождя кожаную докторскую кибиточку, из под фартука которой торчали ноги доктора и в середине которой виднелся на подушке чепчик докторши и слышалось сонное дыхание.
– Право, она очень мила! – сказал Ростов Ильину, выходившему с ним.
– Прелесть какая женщина! – с шестнадцатилетней серьезностью отвечал Ильин.
Через полчаса выстроенный эскадрон стоял на дороге. Послышалась команда: «Садись! – солдаты перекрестились и стали садиться. Ростов, выехав вперед, скомандовал: «Марш! – и, вытянувшись в четыре человека, гусары, звуча шлепаньем копыт по мокрой дороге, бренчаньем сабель и тихим говором, тронулись по большой, обсаженной березами дороге, вслед за шедшей впереди пехотой и батареей.
Разорванные сине лиловые тучи, краснея на восходе, быстро гнались ветром. Становилось все светлее и светлее. Ясно виднелась та курчавая травка, которая заседает всегда по проселочным дорогам, еще мокрая от вчерашнего дождя; висячие ветви берез, тоже мокрые, качались от ветра и роняли вбок от себя светлые капли. Яснее и яснее обозначались лица солдат. Ростов ехал с Ильиным, не отстававшим от него, стороной дороги, между двойным рядом берез.
Ростов в кампании позволял себе вольность ездить не на фронтовой лошади, а на казацкой. И знаток и охотник, он недавно достал себе лихую донскую, крупную и добрую игреневую лошадь, на которой никто не обскакивал его. Ехать на этой лошади было для Ростова наслаждение. Он думал о лошади, об утре, о докторше и ни разу не подумал о предстоящей опасности.
Прежде Ростов, идя в дело, боялся; теперь он не испытывал ни малейшего чувства страха. Не оттого он не боялся, что он привык к огню (к опасности нельзя привыкнуть), но оттого, что он выучился управлять своей душой перед опасностью. Он привык, идя в дело, думать обо всем, исключая того, что, казалось, было бы интереснее всего другого, – о предстоящей опасности. Сколько он ни старался, ни упрекал себя в трусости первое время своей службы, он не мог этого достигнуть; но с годами теперь это сделалось само собою. Он ехал теперь рядом с Ильиным между березами, изредка отрывая листья с веток, которые попадались под руку, иногда дотрогиваясь ногой до паха лошади, иногда отдавая, не поворачиваясь, докуренную трубку ехавшему сзади гусару, с таким спокойным и беззаботным видом, как будто он ехал кататься. Ему жалко было смотреть на взволнованное лицо Ильина, много и беспокойно говорившего; он по опыту знал то мучительное состояние ожидания страха и смерти, в котором находился корнет, и знал, что ничто, кроме времени, не поможет ему.
Только что солнце показалось на чистой полосе из под тучи, как ветер стих, как будто он не смел портить этого прелестного после грозы летнего утра; капли еще падали, но уже отвесно, – и все затихло. Солнце вышло совсем, показалось на горизонте и исчезло в узкой и длинной туче, стоявшей над ним. Через несколько минут солнце еще светлее показалось на верхнем крае тучи, разрывая ее края. Все засветилось и заблестело. И вместе с этим светом, как будто отвечая ему, раздались впереди выстрелы орудий.
Не успел еще Ростов обдумать и определить, как далеки эти выстрелы, как от Витебска прискакал адъютант графа Остермана Толстого с приказанием идти на рысях по дороге.