Základné pojmy používané pri testovaní hypotéz. Testovanie nulových hypotéz

Keďže štatistika ako výskumná metóda sa zaoberá údajmi, v ktorých sú vzorce záujmu výskumníka skreslené rôznymi náhodnými faktormi, väčšinu štatistických výpočtov sprevádza testovanie niektorých predpokladov alebo hypotéz o zdroji týchto údajov.

Pedagogická hypotéza (vedecká hypotéza informácie o výhodnosti tej či onej metódy) sa v procese štatistickej analýzy preložia do jazyka štatistickej vedy a preformulujú aspoň do dvoch štatistických hypotéz.

Existujú dva typy hypotéz: prvý typ - popisný hypotézy, ktoré popisujú príčiny a možné následky. Druhý typ - vysvetľujúce : poskytujú vysvetlenie možných následkov z určitých príčin a tiež charakterizujú podmienky, za ktorých tieto následky nevyhnutne nastanú, t. j. vysvetľujú, v dôsledku akých faktorov a podmienok k tomuto následku dôjde. Deskriptívne hypotézy nemajú predvídavosť, ale vysvetľujúce hypotézy áno. Vysvetľujúce hypotézy vedú výskumníkov k predpokladu existencie určitých pravidelných súvislostí medzi javmi, faktormi a podmienkami.

Hypotézy vo výskume vzdelávania môžu naznačovať, že jeden z prostriedkov (alebo ich skupina) bude efektívnejší ako iné prostriedky. Tu sa vytvára hypotetický predpoklad o porovnateľnej účinnosti prostriedkov, metód, metód a foriem školenia.

Vyššia úroveň hypotetickej predikcie spočíva v tom, že autor štúdie predpokladá, že určitý systém opatrení bude nielen lepší ako iný, ale že spomedzi množstva možných systémov sa z hľadiska určitých kritérií javí ako optimálny. Takáto hypotéza si vyžaduje ešte prísnejší, a teda aj podrobnejší dôkaz.

Kulaichev A.P. Metódy a nástroje pre analýzu dát v prostredí Windows. Ed. 3., revidované a dodatočné - M: InKo, 1999, s. 129-131

Psychologický a pedagogický slovník pre učiteľov a vedúcich vzdelávacích inštitúcií. – Rostov-n/D: Phoenix, 1998, s

ŠTATISTICKÁ KONTROLA ŠTATISTIKY

Pojem štatistická hypotéza.

Typy hypotéz. Chyby prvého a druhého druhu

Hypotéza- toto je predpoklad o niektorých vlastnostiach skúmaných javov. Pod štatistická hypotéza rozumieť akémukoľvek tvrdeniu o všeobecnej populácii, ktoré možno štatisticky overiť, to znamená na základe výsledkov pozorovaní v náhodnej vzorke. Uvažujú sa dva typy štatistických hypotéz: hypotézy o zákonoch distribúcie populácie a hypotézy o parametroch známe distribúcie.

Hypotéza, že čas strávený montážou strojovej jednotky v skupine strojární, ktoré vyrábajú výrobky rovnakého druhu a majú približne rovnaké technicko-ekonomické podmienky výroby, sa rozdeľuje podľa normálneho zákona, je teda hypotézou o distribučnom zákone. . A hypotéza, že produktivita práce pracovníkov v dvoch tímoch vykonávajúcich rovnakú prácu za rovnakých podmienok sa nelíši (pričom produktivita práce pracovníkov v každom tíme má normálny distribučný zákon), je hypotéza o distribučných parametroch.

Hypotéza, ktorá sa má testovať, je tzv nulový, alebo základné, a je určený N 0 Nulová hypotéza je proti súťažiť, alebo alternatíva, hypotéza, ktorá je N 1. Typicky konkurenčná hypotéza N 1 je logickou negáciou hlavnej hypotézy N 0.

Príkladom nulovej hypotézy by bolo, že priemery dvoch normálne rozdelených populácií sú rovnaké, potom môže byť konkurenčnou hypotézou, že priemery nie sú rovnaké. Symbolicky je to napísané takto:

N 0: M(X) = M(Y); N 1: M(X) M(Y) .

Ak je nulová (predložená) hypotéza zamietnutá, potom existuje konkurenčná hypotéza.

Existujú jednoduché a zložité hypotézy. Ak hypotéza obsahuje iba jeden predpoklad, potom je - jednoduché hypotéza. Komplexné hypotéza pozostáva z konečného alebo nekonečného počtu jednoduchých hypotéz.

Napríklad hypotéza N 0: p = p 0 (neznáma pravdepodobnosť p rovná hypotetickej pravdepodobnosti p 0 ) je jednoduchá a hypotéza N 0: p < p 0 - zložitý, skladá sa z nespočetného množstva jednoduchých hypotéz formy N 0: p = p i, Kde p i- ľubovoľné číslo, menej p 0 .

Predložená štatistická hypotéza môže byť správna alebo nesprávna, preto je potrebné skontrolovať na základe výsledkov pozorovaní v náhodnej vzorke; kontrola sa vykonáva štatistické metódy, preto sa to nazýva štatistické.

Pri testovaní štatistickej hypotézy sa používa špeciálne zložená náhodná veličina, tzv štatistické kritérium(alebo štatistiky). Záver o správnosti (alebo nesprávnosti) hypotézy je založený na štúdiu rozdelenia tejto náhodnej premennej podľa vzorových údajov. Štatistické testovanie hypotéz má preto pravdepodobnostný charakter: vždy existuje riziko omylu pri prijatí (odmietnutí) hypotézy. V tomto prípade sú možné chyby dvoch druhov.

Chyba prvého druhu je, že nulová hypotéza bude zamietnutá, aj keď je v skutočnosti pravdivá.

Chyba druhého typu je, že nulová hypotéza bude prijatá, aj keď konkurenčná hypotéza je skutočne pravdivá.

Vo väčšine prípadov sú dôsledky týchto chýb nerovnaké. Čo je lepšie alebo horšie, závisí od konkrétnej formulácie problému a obsahu nulovej hypotézy. Pozrime sa na príklady. Predpokladajme, že v podniku sa kvalita výrobkov posudzuje na základe výsledkov odberu vzoriek. Ak podiel chýb vzorky nepresahuje vopred stanovenú hodnotu p 0 , potom je dávka prijatá. Inými slovami, je predložená nulová hypotéza: N 0: p p 0 . Ak pri testovaní tejto hypotézy dôjde k chybe prvého typu, vhodné produkty odmietneme. Ak dôjde k chybe druhého typu, spotrebiteľovi bude zaslaný chybný výrobok. Je zrejmé, že následky chyby typu II môžu byť oveľa vážnejšie.

Ďalší príklad možno uviesť z oblasti právnej vedy. Prácu sudcov budeme považovať za úkony na overenie prezumpcie neviny obžalovaného. Hlavnou hypotézou, ktorá sa má testovať, by mala byť hypotéza N 0 : Obžalovaný je nevinný. Potom alternatívna hypotéza N 1 je hypotéza: obvinený je vinný zo spáchania trestného činu. Je zrejmé, že súd sa môže pri ukladaní trestu obžalovanému dopustiť chýb prvého alebo druhého typu. Ak dôjde k chybe prvého typu, znamená to, že súd potrestal nevinnú osobu: obžalovaný bol odsúdený, hoci v skutočnosti nespáchal trestný čin. Ak sa sudcovia dopustili chyby druhého typu, znamená to, že súd oslobodil spod obžaloby, pričom obvinený bol v skutočnosti vinný zo spáchania trestného činu. Je zrejmé, že dôsledky chyby prvého typu pre obvineného budú oveľa závažnejšie, zatiaľ čo dôsledky chyby druhého typu sú pre spoločnosť najnebezpečnejšie.

Pravdepodobnosť zaviazať sa chyba prvý druh volal úroveň významnosti kritériá a označujú .

Vo väčšine prípadov sa úroveň významnosti kritéria považuje za 0,01 alebo 0,05. Ak sa napríklad hladina významnosti rovná 0,01, znamená to, že v jednom prípade zo sto existuje riziko chyby I. typu (teda zamietnutia správnej nulovej hypotézy).

Pravdepodobnosť zaviazať sa chyba druhého typu označovať . Pravdepodobnosť
nerobenie chyby typu II, teda odmietnutie nulovej hypotézy, keď je nepravdivá, sa nazýva sila kritéria.

Štatistický test.

Kritické oblasti

Štatistická hypotéza sa testuje pomocou špeciálne vybranej náhodnej veličiny, ktorej presné alebo približné rozdelenie je známe (označujeme ju TO). Táto náhodná premenná sa nazýva štatistické kritérium(alebo jednoducho kritérium).

V praxi sa používajú rôzne štatistické kritériá: U- A Z-kritériá (tieto náhodné premenné majú normálne rozdelenie); F-kritérium (náhodná premenná je rozdelená podľa Fisher-Snedecorovho zákona); t-kritérium (podľa študentského zákona); -kritérium (podľa zákona chí-kvadrát) atď.

Súbor všetkých možných hodnôt kritéria možno rozdeliť do dvoch nesúvislých podmnožín: jedna z nich obsahuje hodnoty kritéria, pri ktorých je akceptovaná nulová hypotéza, a druhá - pri ktorej je zamietnutá.

Volá sa množina hodnôt kritéria, pri ktorých je nulová hypotéza zamietnutá kritická oblasť. Kritický región označíme W.

Volá sa množina hodnôt kritéria, pri ktorých je akceptovaná nulová hypotéza oblasť prijímania hypotéz(alebo oblasti prijateľných hodnôt kritéria). Túto oblasť budeme označovať ako .

Ak chcete otestovať platnosť nulovej hypotézy na základe vzorových údajov, vypočítajte sledovaná hodnota kritéria. Označíme to TO obs.

Základný princíp testovania štatistických hypotéz možno formulovať takto: ak pozorovaná hodnota kritéria spadá do kritickej oblasti (t.j.
), potom sa nulová hypotéza zamietne; ak pozorovaná hodnota kritéria spadá do rozsahu prijatia hypotézy (tj.
), potom nie je dôvod zamietnuť nulovú hypotézu.

Aké zásady by sa mali dodržiavať pri budovaní kritického regiónu? W ?

Predpokladajme, že hypotéza N 0 je vlastne pravda. Potom splnenie kritéria
do kritickej oblasti, vzhľadom na základný princíp testovania štatistických hypotéz, znamená odmietnutie správnej hypotézy N 0 , čo znamená spáchanie chyby I. typu. Preto pravdepodobnosť zasiahnutia
do regiónu W ak je hypotéza pravdivá N 0 sa musí rovnať úrovni významnosti kritéria, tj

.

Všimnite si, že pravdepodobnosť, že urobíte chybu typu I, je zvolená ako pomerne malá (spravidla
). Potom splnenie kritéria
do kritickej oblasti W ak je hypotéza pravdivá N 0 možno považovať za takmer nemožnú udalosť. Ak podľa vzorových pozorovacích údajov dôjde k udalosti
sa vyskytla, potom ju možno považovať za nezlučiteľnú s hypotézou N 0 (čo je nakoniec zamietnuté), ale je kompatibilné s hypotézou N 1 (čo je v konečnom dôsledku akceptované).

Predpokladajme teraz, že hypotéza je pravdivá N 1 . Potom splnenie kritéria
do oblasti prijímania hypotéz znamená prijatie nesprávnej hypotézy N 0 , čo znamená spáchanie chyby typu II. Preto
.

Od udalostí
A
sú navzájom opačné, potom pravdepodobnosť splnenia kritéria
do kritickej oblasti W sa bude rovnať sile kritéria, ak je hypotéza N 1 pravda, to je

.

Je zrejmé, že kritická oblasť by mala byť zvolená tak, aby na danej úrovni významnosti bola sila kritéria
bolo maximum. Maximalizácia sily kritéria zabezpečí minimálnu pravdepodobnosť chyby typu II.

Treba poznamenať, že bez ohľadu na to, aká malá je hladina významnosti, dostať kritérium do kritickej oblasti je len nepravdepodobná, ale nie absolútne nemožná udalosť. Preto je možné, že ak je nulová hypotéza pravdivá, hodnota kritéria vypočítaná z údajov vzorky bude stále v kritickej oblasti. V tomto prípade sa hypotéza zamieta N 0 , urobíme chybu I. typu s pravdepodobnosťou . Čím je menšia, tým je menšia pravdepodobnosť, že urobí chybu I. typu. S poklesom sa však kritická oblasť zmenšuje, čo znamená, že je menej možné, aby do nej spadla pozorovaná hodnota. TO pozorované, aj keď hypotéza N 0 nesprávne. Pri = 0 hypotéza N 0 budú vždy akceptované bez ohľadu na výsledky vzorky. Zníženie teda znamená zvýšenie pravdepodobnosti prijatia nesprávnej nulovej hypotézy, teda vykonania chyby typu II. V tomto zmysle súperia chyby prvého a druhého typu.

Keďže chyby prvého a druhého typu nie je možné odstrániť, je potrebné sa v každom konkrétnom prípade aspoň snažiť minimalizovať straty z týchto chýb. Samozrejme, že je žiaduce znížiť obe chyby súčasne, ale keďže si konkurujú, zníženie pravdepodobnosti, že sa dopustí jednej z nich, znamená zvýšenie pravdepodobnosti, že urobia druhú. Jediná cesta simultánne znížiť riziko chýb spočíva v zvýšenie veľkosti vzorky.

V závislosti od typu konkurenčnej hypotézy N 1 budujú jednostranné (pravostranné a ľavostranné) a obojstranné kritické oblasti. Body oddeľujúce kritickú oblasť
z oblasti prijímania hypotéz , volal kritických bodov a označujú k Kréta. Pre nájsť kritickú oblasť je potrebné poznať kritické body.

Pravák kritickú oblasť možno opísať nerovnosťou
TO>k Kréta. pr, kde sa predpokladá, že správny kritický bod k Kréta. pr >0. Takáto oblasť pozostáva z bodov umiestnených na pravej strane kritického bodu k Kréta. pr, to znamená, že obsahuje veľa kladných a dostatočne veľkých hodnôt kritéria TO. Nájsť k Kréta. Pr nastavte najprv úroveň významnosti kritéria. Ďalej správny kritický bod k Kréta. pr sa zistia zo stavu. Prečo táto požiadavka definuje pravostrannú kritickú oblasť? Keďže pravdepodobnosť udalosti (TO>k Kréta. atď ) je malá, potom z princípu praktickej nemožnosti nepravdepodobných udalostí by táto udalosť nemala nastať, ak je v jedinom teste pravdivá nulová hypotéza. Ak k tomu dôjde, potom existuje pozorovaná hodnota kritéria vypočítaná z údajov vzorky
ukázalo sa, že viac k Kréta. atď., potom to možno vysvetliť skutočnosťou, že nulová hypotéza nie je v súlade s pozorovanými údajmi, a preto by sa mala zamietnuť. Takže požiadavka
určuje hodnoty kritéria, pri ktorom je nulová hypotéza zamietnutá, a tvoria pravostrannú kritickú oblasť.

Ak
spadal do rozsahu prijateľných hodnôt kritéria , teda
< k Kréta. atď., potom sa hlavná hypotéza nezamieta, pretože je kompatibilná s pozorovacími údajmi. Všimnite si, že pravdepodobnosť splnenia kritéria
do rozsahu prijateľných hodnôt ak je nulová hypotéza pravdivá, rovná sa (1-) a blíži sa k 1.

Je potrebné mať na pamäti, že zasiahnutie hodnôt kritéria
do rozsahu prijateľných hodnôt nie je striktným dôkazom platnosti nulovej hypotézy. Znamená to len, že medzi predloženou hypotézou a výsledkami vzorky nie je žiadny významný nesúlad. Preto v takýchto prípadoch hovoria, že pozorovacie údaje sú v súlade s nulovou hypotézou a nie je dôvod ju zamietnuť.

Výstavba ostatných kritických oblastí sa vykonáva podobne.

takže, lobojsmerný kritická oblasť je opísaná nerovnosťou
TO<k Kréta. l, kde k krit.l<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k crit.l, to znamená, že predstavuje množinu negatívnych, ale v absolútnej hodnote dosť veľkých hodnôt kritéria. kritický bod k crit.l je zistený zo stavu
(TO<k Kréta. k)
, teda pravdepodobnosť, že kritérium nadobudne hodnotu menšiu ako k crit.l, rovná sa akceptovanej hladine významnosti, ak je pravdivá nulová hypotéza.

Obojstranný kritickej oblasti
je opísaná nasledujúcimi nerovnosťami: ( TO< k crit.l alebo TO>k Kréta. pr), kde sa predpokladá, že k krit.l<0 и k Kréta. pr >0. Takáto oblasť je súborom hodnôt kritéria, ktoré sú dostatočne veľké v absolútnej hodnote. Kritické body vyplývajú z požiadavky: súčet pravdepodobností, že kritérium bude mať hodnotu menšiu ako k Kréta. l alebo viac k Kréta. pr, by sa malo rovnať akceptovanej hladine významnosti, ak je nulová hypotéza pravdivá, tj

(TO< k Kréta. l )+
(TO>k Kréta. atď )= .

Ak je kritérium rozdelenie TO symetricky okolo počiatku, potom budú kritické body umiestnené symetricky okolo nuly, takže k Kréta. l = - k Kréta. atď. Potom sa obojstranná kritická oblasť stane symetrickou a možno ju opísať nasledujúcou nerovnosťou: > k Kréta. dv, kde k Kréta. dv = k Kréta. blízko kritického bodu k Kréta. dv sa dá zistiť zo stavu

P(K< -k Kréta. dv )=P(K>k Kréta. dv )= .

Poznámka 1. Pre každé kritérium TO kritických bodov na danej úrovni významnosti
možno zistiť zo stavu
len číselne. Výsledky numerických výpočtov k kritiky sú uvedené v príslušných tabuľkách (pozri napr. prílohy 4 – 6 v súbore „Prílohy“).

Poznámka 2. Vyššie opísaný princíp testovania štatistickej hypotézy zatiaľ nedokazuje jej pravdivosť či nepravdivosť. Prijatie hypotézy N 0 porovnávané s alternatívnou hypotézou N 1 neznamená, že sme si istí absolútnou správnosťou hypotézy N 0 - len hypotéza N 0 je v súlade s pozorovacími údajmi, ktoré máme k dispozícii, to znamená, že ide o celkom hodnoverné tvrdenie, ktoré nie je v rozpore so skúsenosťami. Je možné, že s nárastom veľkosti vzorky n hypotéza N 0 bude odmietnutý.

V rôznych štádiách štatistického výskumu a modelovania je potrebné formulovať a experimentálne testovať určité predpoklady (hypotézy) týkajúce sa povahy a veľkosti neznámych parametrov analyzovanej populácie (populácií). Napríklad výskumník vychádza z predpokladu: „vzorka pochádza z normálnej populácie“ alebo „všeobecný priemer analyzovanej populácie je päť“. Takéto predpoklady sú tzv štatistické hypotézy.

Porovnanie vyslovenej hypotézy týkajúcej sa všeobecnej populácie s dostupnými vzorovými údajmi, sprevádzané kvantitatívnym hodnotením miery spoľahlivosti výsledného záveru, sa vykonáva pomocou jedného alebo druhého štatistického kritéria a nazýva sa testovanie štatistických hypotéz .

Predložená hypotéza je tzv nula (primárna) . Je zvykom ho označovať H 0.

Vo vzťahu k uvedenej (hlavnej) hypotéze sa dá vždy formulovať alternatívny (súťažiaci) , v rozpore s tým. Alternatívna (konkurenčná) hypotéza sa zvyčajne označuje ako H 1.

Účel testovania štatistických hypotéz je rozhodnúť o platnosti hlavnej hypotézy na základe vzorových údajov H 0.

Ak sa predložená hypotéza zníži na tvrdenie, že hodnota nejakého neznámeho parametra populácie presne rovnakí danej hodnoty, potom sa táto hypotéza nazýva jednoduché, napríklad: „priemerný celkový príjem obyvateľstva Ruska na obyvateľa je 650 rubľov mesačne“; „Miera nezamestnanosti (podiel nezamestnaných na ekonomicky aktívnom obyvateľstve) v Rusku je 9 %. V ostatných prípadoch je hypotéza tzv komplexné.

Ako nulová hypotéza H 0 Je zvykom predkladať jednoduchú hypotézu, pretože Zvyčajne je pohodlnejšie skontrolovať silnejšie vyhlásenie.

Hypotézy o podobe distribučného zákona skúmanej náhodnej premennej;

Hypotézy o číselných hodnotách parametrov študovanej populácie;

Hypotézy o homogenite dvoch alebo viacerých vzoriek alebo určitých charakteristikách analyzovaných populácií;

Hypotézy o všeobecnej podobe modelu popisujúceho štatistickú závislosť medzi charakteristikami atď.

Keďže testovanie štatistických hypotéz prebieha na základe vzorových údajov, t.j. obmedzená séria pozorovaní, rozhodnutia týkajúce sa nulovej hypotézy H 0 majú pravdepodobnostný charakter. Inými slovami, takéto rozhodnutie je nevyhnutne sprevádzané určitou, hoci možno veľmi malou pravdepodobnosťou chybného záveru v oboch smeroch.



Takže v malej časti prípadov α nulová hypotéza H 0 sa môže ukázať ako odmietnutý, zatiaľ čo v skutočnosti je v bežnej populácii spravodlivý. Táto chyba sa nazýva chyba prvého druhu . A jeho pravdepodobnosť sa zvyčajne nazýva úroveň významnosti a určiť α .

Naopak, v malom množstve prípadov β nulová hypotéza H 0 je akceptovaná, zatiaľ čo v skutočnosti vo všeobecnej populácii je nepravdivá a alternatívna hypotéza je pravdivá H 1. Táto chyba sa nazýva chyba druhého typu . Zvyčajne sa označuje pravdepodobnosť chyby typu II β . Pravdepodobnosť 1 - p volal mocnosť kritéria .

S pevnou veľkosťou vzorky si môžete podľa vlastného uváženia zvoliť pravdepodobnosť len jednej z chýb α alebo β . Zvýšenie pravdepodobnosti jedného z nich vedie k zníženiu druhého. Je zvykom nastaviť pravdepodobnosť chyby I. typu α - hladina významnosti. Spravidla sa používajú niektoré štandardné hladiny významnosti α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Potom, samozrejme, z dvoch kritérií charakterizovaných rovnakou pravdepodobnosťou α odmietnuť hypotézu, ktorá je skutočne správna H 0, mali by ste akceptovať ten, ktorý je sprevádzaný menšou chybou druhého typu β , t.j. viac energie. Zníženie pravdepodobnosti oboch chýb α A β možno dosiahnuť zväčšením veľkosti vzorky.

Správne rozhodnutie týkajúce sa nulovej hypotézy H 0 môže byť tiež dvoch typov:

Nulová hypotéza bude prijatá H 0, pričom v skutočnosti vo všeobecnej populácii platí nulová hypotéza H 0; pravdepodobnosť takéhoto rozhodnutia 1 - a;

Nulová hypotéza H 0 bude zamietnutá v prospech alternatívy N 1, pričom v skutočnosti v populácii nulová hypotéza H 0 zamietnutá v prospech alternatívy H 1; pravdepodobnosť takéhoto rozhodnutia 1 - β - mocnosť kritéria.

Výsledky riešenia nulovej hypotézy možno ilustrovať pomocou tabuľky 8.1.

Tabuľka 8.1

Štatistické hypotézy sa testujú pomocou štatistické kritérium(nazvime to všeobecne TO), čo je funkcia výsledkov pozorovania.

Štatistické kritérium je pravidlo (vzorec), ktorým sa určuje miera nesúladu medzi výsledkami výberového pozorovania a stanovenou hypotézou H 0 .

Štatistické kritérium, ako každá funkcia výsledkov pozorovania, je náhodná premenná a za predpokladu, že nulová hypotéza je pravdivá. H 0 podlieha nejakému dobre preštudovanému (a tabuľkovému) teoretickému distribučnému zákonu s hustotou distribúcie f(k).

Výber kritéria na testovanie štatistických hypotéz sa môže uskutočniť na základe rôznych princípov. Najčastejšie ho na to využívajú princíp pomeru pravdepodobnosti, čo vám umožňuje zostaviť najsilnejšie kritérium spomedzi všetkých možných kritérií. Jeho podstata spočíva vo výbere takéhoto kritéria TO so známou funkciou hustoty f(k) za predpokladu, že platí hypotéza H 0, takže pre danú hladinu významnosti α bolo by možné nájsť kritický bod K cr.distribúcie f(k), ktorá by rozdelila rozsah hodnôt kritéria na dve časti: rozsah prijateľných hodnôt, v ktorom výsledky pozorovania vzorky vyzerajú najvierohodnejšie, a kritickú oblasť, v ktorej výsledky pozorovania vzorky vyzerajú menej. hodnoverné vzhľadom na nulovú hypotézu H 0.

Ak takéto kritérium TO vybrané a hustota jeho rozloženia je známa, potom úloha testovania štatistickej hypotézy spočíva v tom, že pre danú hladinu významnosti α vypočítajte pozorovanú hodnotu kritéria z údajov vzorky Na pozorovanie a určiť, či je to najpravdepodobnejšie alebo najmenej pravdepodobné vzhľadom na nulovú hypotézu H 0.

Každý typ štatistickej hypotézy sa testuje pomocou zodpovedajúceho kritéria, ktoré je v každom konkrétnom prípade najsilnejšie. Napríklad testovanie hypotézy o forme distribučného zákona náhodnej premennej je možné vykonať pomocou Pearsonovho testu dobrej zhody. χ 2; testovanie hypotézy o rovnosti neznámych hodnôt rozptylov dvoch všeobecných populácií - pomocou kritéria F- Fischer; pomocou kritéria sa testuje množstvo hypotéz o neznámych hodnotách parametrov všeobecných populácií Z- normálne rozložená náhodná premenná a kritérium T- Študentský test a pod.

Volá sa hodnota kritéria vypočítaná podľa špeciálnych pravidiel na základe vzorových údajov sledovaná hodnota kritéria (Na pozorovanie).

Hodnoty kritéria rozdeľujúce množinu hodnôt kritéria na rozsah prijateľných hodnôt(najpravdepodobnejšie vzhľadom na nulovú hypotézu H 0) A kritickej oblasti(oblasť hodnôt, ktoré sú menej pravdepodobné vo vzťahu k tabuľkám rozdelenia náhodných premenných TO, zvolené ako kritérium, sú tzv kritické body (K kr.).

Oblasť prijateľných hodnôt (oblasť akceptácie nulovej hypotézy H 0) TO H 0 nevybočuje.

Kritická oblasť volať množinu hodnôt kritéria TO , podľa ktorej platí nulová hypotéza H 0 zamietnuté v prospech konkurenčného H 1 .

Rozlišovať jednostranný(pravák alebo ľavák) a obojsmerné kritické oblasti.

Ak je konkurenčná hypotéza pravostranná, napr. H1: a > a 0, potom je kritická oblasť pravostranný(Postava 1). Podľa pravostrannej konkurenčnej hypotézy kritický bod (Pravá strana) nadobúda kladné hodnoty.

Ak je konkurenčná hypotéza ľavoruká, napr. H 1: a< а 0 , potom je kritická oblasť ľavák(Obrázok 2). Pri ľavostrannej konkurenčnej hypotéze nadobúda kritický bod záporné hodnoty (K okraj ľavý).

Ak je konkurenčná hypotéza obojstranná, napr. H 1: a¹ 0, potom je kritická oblasť bilaterálne(Obrázok 3). Pri obojstrannej konkurenčnej hypotéze sa identifikujú dva kritické body (K okraj ľavák A Do cr. pravák).


Prijateľný rozsah Kritický

rozsah hodnôt

5. Hlavné problémy aplikovanej štatistiky - popis údajov, odhad a testovanie hypotéz

Základné pojmy používané pri testovaní hypotéz

Štatistická hypotéza je akýkoľvek predpoklad týkajúci sa neznámeho rozdelenia náhodných premenných (prvkov). Tu sú formulácie niekoľkých štatistických hypotéz:

1. Výsledky pozorovania majú normálne rozdelenie s nulovým matematickým očakávaním.
2. Výsledky pozorovania majú distribučnú funkciu N(0,1).
3. Výsledky pozorovania majú normálne rozdelenie.
4. Výsledky pozorovaní v dvoch nezávislých vzorkách majú rovnaké normálne rozdelenie.
5. Výsledky pozorovaní v dvoch nezávislých vzorkách majú rovnaké rozdelenie.

Existujú nulové a alternatívne hypotézy. Nulová hypotéza je hypotéza, ktorá sa má testovať. Alternatívna hypotéza je každá platná hypotéza iná ako nulová hypotéza. Nulová hypotéza je označená H 0, alternatíva - H 1(z Hypothesis - „hypothesis“ (anglicky)).

Výber určitých nulových alebo alternatívnych hypotéz je určený aplikovanými úlohami, ktorým čelí manažér, ekonóm, inžinier alebo výskumník. Pozrime sa na príklady.

Príklad 11. Nulová hypotéza nech je hypotéza 2 z vyššie uvedeného zoznamu a alternatívna hypotéza 1. To znamená, že reálna situácia je opísaná pravdepodobnostným modelom, podľa ktorého sa výsledky pozorovaní považujú za realizácie nezávislých identicky rozdelených náhodných premenných s a distribučná funkcia N(0,σ), kde parameter σ je pre štatistika neznámy. V rámci tohto modelu je nulová hypotéza napísaná takto:

N 0: σ = 1,

a takáto alternatíva:

N 1: σ ≠ 1.

Príklad 12. Nech je nulovou hypotézou stále hypotéza 2 z vyššie uvedeného zoznamu a alternatívnou hypotézou je hypotéza 3 z toho istého zoznamu. Potom sa v pravdepodobnostnom modeli manažérskej, ekonomickej alebo výrobnej situácie predpokladá, že výsledky pozorovania tvoria vzorku z normálneho rozdelenia N(m, σ) pre niektoré hodnoty m a σ. Hypotézy sa píšu takto:

N 0: m= 0, σ = 1

(oba parametre nadobúdajú pevné hodnoty);

N 1: m≠ 0 a/alebo σ ≠ 1

(t.j. buď m≠ 0, alebo σ ≠ 1, alebo m≠ 0 a σ ≠ 1).

Príklad 13. Nechaj N 0 – hypotéza 1 z vyššie uvedeného zoznamu, a N 1 – hypotéza 3 z toho istého zoznamu. Potom je pravdepodobnostný model rovnaký ako v príklade 12,

N 0: m= 0, σ je ľubovoľné;

N 1: m≠ 0, σ je ľubovoľné.

Príklad 14. Nechaj N 0 – hypotéza 2 z vyššie uvedeného zoznamu, a podľa N 1 výsledky pozorovania majú distribučnú funkciu F(X), nezhoduje sa so štandardnou funkciou normálneho rozdelenia F(x). Potom

N 0: F(x) = Ф (x) pred všetkými X(napísané ako F(x) ≡ Ф(x));

N 1: F(x 0) ≠ Ф (x 0) pri niektorých x 0(t.j. to nie je pravda F(x) ≡ Ф(x)).

Poznámka. Tu ≡ je znak identickej zhody funkcií (t. j. zhody pre všetky možné hodnoty argumentu X).

Príklad 15. Nechaj N 0 – hypotéza 3 z vyššie uvedeného zoznamu, a podľa N 1 výsledky pozorovania majú distribučnú funkciu F(X), nebyť normálny. Potom

Pre niektoré m, σ;

N 1: pre ľubovoľné m, nájde sa σ x 0 = x 0(m, σ) také, že .

Príklad 16. Nechaj N 0 – hypotéza 4 z vyššie uvedeného zoznamu, podľa pravdepodobnostného modelu sa vyberú dva vzorky z populácií s distribučnými funkciami F(X) A G(X), byť normálny s parametrami m 1, σ1 a m 2, σ2 v tomto poradí a N 1 – negácia N 0 Potom

N 0: m 1 = m 2, σ 1 = σ 2 a m 1 a σ 1 sú ľubovoľné;

N 1: m 1 ≠ m 2 a/alebo σ1 ≠ σ2.

Príklad 17. Dodatočne za podmienok príkladu 16 vedzme, že σ 1 = σ 2 . Potom

N 0: m 1 = m 2, a > 0 a m 1 a σ sú ľubovoľné;

N 1: m 1 ≠ m 2, a > 0.

Príklad 18. Nechaj N 0 – hypotéza 5 z vyššie uvedeného zoznamu, podľa pravdepodobnostného modelu sa vyberú dva vzorky z populácií s distribučnými funkciami F(X) A G(X) podľa toho a N 1 – negácia N 0 Potom

N 0: F(X) G(X) , Kde F(X)

N 1: F(X) A G(X) - ľubovoľné distribučné funkcie a

F(X) G(X) s niektorými X.

Príklad 19. Za podmienok príkladu 17 sa navyše predpokladá, že distribúcia funguje F(X) A G(X) líšia sa len posunom, t.j. G(X) = F(X- A) pri niektorých A. Potom

N 0: F(X) G(X) ,

Kde F(X) – ľubovoľná distribučná funkcia;

N 1: G(X) = F(X- a), a ≠ 0,

Kde F(X) – ľubovoľná distribučná funkcia.

Príklad 20. Nech je za podmienok príkladu 14 navyše známe, že podľa pravdepodobnostného modelu situácie F(X) - funkcia normálneho rozdelenia s jednotkovým rozptylom, t.j. vyzerá ako N(m, 1). Potom

N 0: m = 0 (tie. F(x) = Ф (x)

pred všetkými X); (napísané ako F(x) ≡ Ф(x));

N 1: m 0

(t.j. to nie je pravda F(x) ≡ Ф(x)).

Príklad 21. Pri štatistickej regulácii technologických, ekonomických, manažérskych alebo iných procesov sa uvažuje so vzorkou odobratou z populácie s normálnym rozdelením a známym rozptylom a hypotézami.

N 0: m = m 0 ,

N 1: m= m 1 ,

kde je hodnota parametra m = m 0 zodpovedá stanovenému priebehu procesu, a prechodu do m= m 1 naznačuje poruchu.

Príklad 22. Pri štatistickej kontrole akceptácie je počet chybných jednotiek produktu vo vzorke predmetom hypergeometrickej distribúcie p = D/ N– úroveň defektov, kde N- objem výrobnej šarže, D– celkový počet chybných jednotiek v dávke. Kontrolné plány používané v regulačnej, technickej a obchodnej dokumentácii (normy, dodávateľské zmluvy atď.) sú často zamerané na testovanie hypotéz

N 0: p < AQL

N 1: p > L.Q.,

Kde AQL - úroveň akceptácie chýb, L.Q. – úroveň odmietnutia chýb (samozrejme AQL < L.Q.).

Príklad 23. Ako indikátory stability technologického, ekonomického, manažérskeho alebo iného procesu sa využíva celý rad charakteristík rozdelení kontrolovaných indikátorov, najmä variačný koeficient. v = σ/ M(X). Musíme otestovať nulovú hypotézu

N 0: v < v 0

podľa alternatívnej hypotézy

N 1: v > v 0 ,

Kde v 0 – nejaká vopred určená hraničná hodnota.

Príklad 24. Nech je pravdepodobnostný model dvoch vzoriek rovnaký ako v príklade 18, označíme matematické očakávania výsledkov pozorovania v prvej a druhej vzorke M(X) A M(U), resp. V mnohých situáciách sa testuje nulová hypotéza

N 0: M(X) = M(Y)

proti alternatívnej hypotéze

N 1: M(X) ≠ M(Y).

Príklad 25. Vyššie sme zaznamenali veľký význam v matematickej štatistike distribučných funkcií, ktoré sú symetrické okolo 0. Pri kontrole symetrie

N 0: F(- X) = 1 – F(X) pred všetkými X, inak F svojvoľný;

N 1: F(- X 0 ) ≠ 1 – F(X 0 ) pri niektorých X 0 , inak F svojvoľný.

V pravdepodobnostno-štatistických metódach rozhodovania sa používajú mnohé iné formulácie problémov na testovanie štatistických hypotéz. Niektoré z nich sú uvedené nižšie.

Špecifická úloha testovania štatistických hypotéz je plne opísaná, keď sú uvedené nulové a alternatívne hypotézy. Výber metódy na testovanie štatistickej hypotézy, vlastnosti a charakteristiky metód sú určené nulovou aj alternatívnou hypotézou. Na testovanie rovnakej nulovej hypotézy v rámci rôznych alternatívnych hypotéz by sa vo všeobecnosti mali použiť rôzne metódy. Takže v príkladoch 14 a 20 je nulová hypotéza rovnaká, ale alternatívne sú odlišné. Preto by sa v podmienkach príkladu 14 mali použiť metódy založené na kritériách zhody s parametrickou rodinou (Kolmogorov typ alebo omega-štvorcový typ) a v podmienkach príkladu 20 metódy založené na Studentovom kritériu alebo Cramerovom kritériu. Welchovo kritérium. Ak v podmienkach príkladu 14 použijeme Studentov t-test, potom to problémy nevyrieši. Ak v podmienkach príkladu 20 použijeme kritérium zhody Kolmogorovovho typu, potom to naopak vyrieši nastolené problémy, aj keď možno horšie ako Studentov t-test, špeciálne upravený pre tento prípad. .

Pri spracovaní reálnych údajov má veľký význam správny výber hypotéz. N 0 a N 1.

Často nastáva situácia, keď typ nulovej hypotézy vyplýva z formulácie aplikovaného problému, ale typ alternatívnej hypotézy nie je jasný. V takýchto prípadoch treba zvážiť alternatívnu hypotézu najvšeobecnejšieho typu a použiť metódy, ktoré problém riešia za všetkých možných podmienok. N 1. Najmä pri testovaní hypotézy 2 (zo zoznamu vyššie) ako nulovej by ste mali použiť N 1 z príkladu 14 a nie z príkladu 20, pokiaľ neexistuje osobitné odôvodnenie pre normalitu rozdelenia výsledkov pozorovania podľa alternatívnej hypotézy.

Predchádzajúce