Konsep dasar yang digunakan dalam menguji hipotesis. Pengujian Hipotesis Nol

Karena statistik sebagai metode penelitian berkaitan dengan data yang pola kepentingan peneliti terdistorsi oleh berbagai faktor acak, sebagian besar perhitungan statistik disertai dengan pengujian beberapa asumsi atau hipotesis tentang sumber data tersebut.

Hipotesis pedagogis (hipotesis ilmiah informasi tentang keunggulan metode tertentu) dalam proses analisis statistik diterjemahkan ke dalam bahasa ilmu statistik dan dirumuskan kembali dalam setidaknya dua hipotesis statistik.

Ada dua jenis hipotesis: tipe pertama - deskriptif hipotesis yang menggambarkan sebab dan akibat yang mungkin terjadi. Tipe kedua - penjelasan : mereka memberikan penjelasan tentang akibat-akibat yang mungkin timbul dari sebab-sebab tertentu, dan juga mengkarakterisasi kondisi-kondisi di mana akibat-akibat itu akan mengikuti, yaitu, mereka menjelaskan karena faktor-faktor dan kondisi-kondisi apa akibat itu akan terjadi. Hipotesis deskriptif tidak memiliki pandangan ke depan, tetapi hipotesis penjelasan memilikinya. Hipotesis penjelas mengarahkan peneliti untuk mengasumsikan adanya hubungan teratur tertentu antara fenomena, faktor, dan kondisi.

Hipotesis dalam penelitian pendidikan mungkin menyarankan bahwa salah satu cara (atau sekelompok cara tersebut) akan lebih efektif dibandingkan cara lainnya. Di sini, asumsi hipotetis dibuat tentang efektivitas komparatif sarana, metode, metode, dan bentuk pelatihan.

Tingkat prediksi hipotetis yang lebih tinggi adalah bahwa penulis studi tersebut berhipotesis bahwa suatu sistem pengukuran tertentu tidak hanya akan lebih baik dari yang lain, namun di antara sejumlah sistem yang mungkin, sistem tersebut tampaknya optimal dari sudut pandang kriteria tertentu. Hipotesis semacam itu memerlukan bukti yang lebih teliti dan karenanya lebih rinci.

Kulaichev A.P. Metode dan alat untuk analisis data di lingkungan Windows. Ed. 3, direvisi dan tambahan - M: InKo, 1999, hlm.129-131

Kamus psikologi dan pedagogi untuk guru dan kepala lembaga pendidikan. –Rostov-n/D: Phoenix, 1998, hal

STATISTIK PEMERIKSAAN STATISTIK

Konsep hipotesis statistik.

Jenis hipotesis. Kesalahan jenis pertama dan kedua

Hipotesa- ini adalah asumsi tentang beberapa sifat dari fenomena yang sedang dipelajari. Di bawah hipotesis statistik memahami setiap pernyataan tentang populasi umum yang dapat diverifikasi secara statistik, yaitu berdasarkan hasil observasi dalam sampel acak. Dua jenis hipotesis statistik dipertimbangkan: hipotesis tentang hukum distribusi populasi dan hipotesis tentang parameter distribusi yang diketahui.

Dengan demikian, hipotesis bahwa waktu yang dihabiskan untuk merakit suatu unit mesin di sekelompok bengkel mesin yang menghasilkan produk dengan jenis yang sama dan mempunyai kondisi produksi teknis dan ekonomi yang kurang lebih sama didistribusikan menurut hukum normal adalah hipotesis tentang hukum distribusi. . Dan hipotesis bahwa produktivitas kerja pekerja dalam dua tim yang melakukan pekerjaan yang sama dalam kondisi yang sama tidak berbeda (sedangkan produktivitas kerja pekerja di setiap tim mempunyai hukum distribusi normal) adalah hipotesis tentang parameter distribusi.

Hipotesis yang ingin diuji disebut batal, atau dasar, dan ditunjuk N 0 . Hipotesis nol ditentang bersaing, atau alternatif, hipotesis, yaitu N 1 . Biasanya, hipotesis yang bersaing N 1 adalah negasi logis dari hipotesis utama N 0.

Contoh hipotesis nol adalah bahwa rata-rata dari dua populasi yang berdistribusi normal adalah sama, maka hipotesis yang bersaing mungkin adalah bahwa rata-rata tersebut tidak sama. Secara simbolis tertulis seperti ini:

N 0: M(X) = M(Y); N 1: M(X) M(Y) .

Jika hipotesis nol (yang diajukan) ditolak, maka terdapat hipotesis yang bersaing.

Ada hipotesis sederhana dan kompleks. Jika suatu hipotesis hanya memuat satu asumsi, maka hipotesis tersebut adalah - sederhana hipotesa. Kompleks hipotesis terdiri dari hipotesis sederhana yang jumlahnya terbatas atau tidak terbatas.

Misalnya hipotesis N 0: P = P 0 (probabilitas tidak diketahui P sama dengan probabilitas hipotetis P 0 ) sederhana, dan hipotesisnya N 0: P < P 0 - kompleks, terdiri dari hipotesis bentuk sederhana yang tak terhitung jumlahnya N 0: P = P Saya, Di mana P Saya- nomor berapa pun, kurang P 0 .

Hipotesis statistik yang dikemukakan mungkin benar atau salah, sehingga perlu dilakukan memeriksa, berdasarkan hasil observasi pada sampel acak; pemeriksaan dilakukan statistik metode, makanya disebut statistik.

Saat menguji hipotesis statistik, digunakan variabel acak yang disusun secara khusus, yang disebut kriteria statistik(atau statistik). Kesimpulan yang dicapai tentang benar (atau salahnya) hipotesis didasarkan pada mempelajari distribusi variabel acak ini menurut data sampel. Oleh karena itu, pengujian statistik terhadap hipotesis bersifat probabilistik: selalu ada risiko kesalahan saat menerima (menolak) hipotesis. Dalam hal ini, ada dua jenis kesalahan yang mungkin terjadi.

Kesalahan jenis pertama adalah hipotesis nol akan ditolak meskipun faktanya benar.

Kesalahan tipe kedua adalah bahwa hipotesis nol akan diterima meskipun hipotesis pesaingnya benar.

Dalam kebanyakan kasus, konsekuensi dari kesalahan ini tidak sama. Apa yang lebih baik atau lebih buruk bergantung pada rumusan masalah yang spesifik dan isi hipotesis nol. Mari kita lihat contohnya. Misalkan dalam suatu perusahaan kualitas produk dinilai berdasarkan hasil sampling. Jika proporsi cacat sampel tidak melebihi nilai yang telah ditentukan P 0 , maka batch tersebut diterima. Dengan kata lain, hipotesis nol yang diajukan: N 0: P P 0 . Jika kesalahan jenis pertama terjadi saat menguji hipotesis ini, maka kami akan menolak produk yang sesuai. Jika terjadi kesalahan jenis kedua, konsumen akan dikirimi produk cacat. Tentu saja, akibat dari kesalahan tipe II bisa jauh lebih serius.

Contoh lain dapat diberikan dari bidang yurisprudensi. Kami akan menganggap pekerjaan hakim sebagai tindakan untuk memverifikasi asas praduga tak bersalah terdakwa. Hipotesis utama yang akan diuji hendaknya merupakan hipotesis N 0 : Terdakwa tidak bersalah. Kemudian hipotesis alternatif N 1 adalah hipotesis: terdakwa bersalah melakukan kejahatan. Jelasnya, pengadilan bisa saja melakukan kesalahan tipe pertama atau kedua saat menjatuhkan hukuman kepada terdakwa. Jika terjadi kesalahan jenis pertama, berarti pengadilan menghukum orang yang tidak bersalah: terdakwa divonis bersalah padahal sebenarnya ia tidak melakukan tindak pidana. Apabila hakim melakukan kesalahan jenis kedua, berarti pengadilan memberikan putusan bebas padahal sebenarnya terdakwa bersalah melakukan tindak pidana. Tentu saja akibat kesalahan jenis pertama bagi terdakwa akan jauh lebih berat, sedangkan akibat kesalahan jenis kedua paling berbahaya bagi masyarakat.

Kemungkinan melakukan kesalahan jenis pertama ditelepon tingkat signifikansi kriteria dan menunjukkan .

Dalam kebanyakan kasus, tingkat signifikansi kriteria dianggap 0,01 atau 0,05. Jika, misalnya, tingkat signifikansi dianggap 0,01, ini berarti bahwa dalam satu dari seratus kasus terdapat risiko membuat kesalahan tipe I (yaitu, menolak hipotesis nol yang benar).

Kemungkinan melakukan kesalahan tipe kedua menunjukkan . Kemungkinan
tidak membuat kesalahan tipe II, yaitu menolak hipotesis nol padahal hipotesis itu salah, disebut kekuatan kriteria.

Tes statistik.

Area kritis

Hipotesis statistik diuji dengan menggunakan variabel acak yang dipilih secara khusus, yang distribusi pasti atau perkiraannya diketahui (kami menyatakannya KE). Variabel acak ini disebut kriteria statistik(atau sederhananya kriteria).

Ada berbagai kriteria statistik yang digunakan dalam praktik: kamu- Dan Z-kriteria (variabel acak ini berdistribusi normal); F-kriteria (variabel acak didistribusikan menurut hukum Fisher-Snedecor); T-kriteria (menurut hukum Siswa); -kriteria (menurut hukum chi-kuadrat), dll.

Himpunan semua nilai kriteria yang mungkin dapat dibagi menjadi dua himpunan bagian yang terpisah: salah satunya berisi nilai kriteria di mana hipotesis nol diterima, dan yang lainnya berisi nilai kriteria yang ditolak.

Himpunan nilai kriteria di mana hipotesis nol ditolak disebut daerah kritis. Kami akan menunjukkan wilayah kritis dengan W.

Himpunan nilai kriteria di mana hipotesis nol diterima disebut bidang penerimaan hipotesis(atau area nilai kriteria yang dapat diterima). Kami akan menyatakan area ini sebagai .

Untuk menguji validitas hipotesis nol berdasarkan data sampel, hitunglah nilai kriteria yang diamati. Kami akan menunjukkannya KE obs.

Prinsip dasar pengujian hipotesis statistik dapat dirumuskan sebagai berikut: jika nilai kriteria yang diamati berada dalam wilayah kritis (yaitu,
), maka hipotesis nol ditolak; jika nilai kriteria yang diamati berada dalam kisaran penerimaan hipotesis (yaitu,
), maka tidak ada alasan untuk menolak hipotesis nol.

Prinsip apa yang harus diikuti ketika membangun kawasan kritis? W ?

Mari kita asumsikan hipotesis itu N 0 sebenarnya benar. Kemudian mencapai kriteria
ke wilayah kritis, karena prinsip dasar pengujian hipotesis statistik, memerlukan penolakan terhadap hipotesis yang benar N 0 , yang berarti melakukan kesalahan tipe I. Oleh karena itu, kemungkinan terkena
ke wilayah tersebut W jika hipotesisnya benar N 0 harus sama dengan tingkat signifikansi kriteria, yaitu

.

Perhatikan bahwa kemungkinan terjadinya kesalahan tipe I dipilih cukup kecil (sebagai aturan,
). Kemudian mencapai kriteria
memasuki wilayah kritis W jika hipotesisnya benar N 0 dapat dianggap sebagai peristiwa yang hampir mustahil. Jika, menurut data observasi sampel, suatu peristiwa
memang terjadi, maka dapat dianggap tidak sesuai dengan hipotesis N 0 (yang pada akhirnya ditolak), namun sesuai dengan hipotesis N 1 (yang pada akhirnya diterima).

Sekarang mari kita berasumsi bahwa hipotesis tersebut benar N 1 . Kemudian mencapai kriteria
ke dalam bidang penerimaan hipotesis berarti menerima hipotesis yang salah N 0 , yang berarti melakukan kesalahan tipe II. Itu sebabnya
.

Sejak kejadian
Dan
saling berlawanan, maka kemungkinan mencapai kriteria tersebut
memasuki wilayah kritis W akan sama dengan kekuatan kriteria jika hipotesis N 1 benar, itu

.

Tentu saja, wilayah kritis harus dipilih sedemikian rupa sehingga, pada tingkat signifikansi tertentu, kekuatan kriterianya dapat dicapai
sudah maksimal. Memaksimalkan kekuatan kriteria akan memastikan kemungkinan minimum terjadinya kesalahan tipe II.

Perlu diingat bahwa sekecil apa pun tingkat signifikansinya, memasukkan kriteria ke dalam wilayah kritis bukanlah hal yang mustahil, namun bukan berarti mustahil. Oleh karena itu, kemungkinan jika hipotesis nol benar maka nilai kriteria yang dihitung dari data sampel masih berada pada wilayah kritis. Menolak hipotesis dalam kasus ini N 0 , kami membuat kesalahan tipe I dengan probabilitas. Semakin kecil , semakin kecil kemungkinan terjadinya kesalahan tipe I. Namun, dengan penurunan, wilayah kritis berkurang, yang berarti semakin kecil kemungkinan nilai observasi untuk masuk ke dalamnya. KE diamati, bahkan ketika hipotesisnya N 0 salah. Pada =0 hipotesis N 0 akan selalu diterima terlepas dari hasil sampelnya. Oleh karena itu, penurunan berarti peningkatan kemungkinan menerima hipotesis nol yang salah, yaitu membuat kesalahan tipe II. Dalam hal ini, kesalahan tipe pertama dan kedua saling bersaing.

Karena tidak mungkin menghilangkan kesalahan jenis pertama dan kedua, setidaknya perlu diupayakan dalam setiap kasus tertentu untuk meminimalkan kerugian akibat kesalahan ini. Tentu saja, diinginkan untuk mengurangi kedua kesalahan secara bersamaan, namun karena keduanya bersaing, penurunan kemungkinan membuat salah satu kesalahan berarti meningkatkan kemungkinan membuat kesalahan lainnya. Satu-satunya jalan serentak mengurangi risiko kesalahan terletak pada meningkatkan ukuran sampel.

Tergantung pada jenis hipotesis yang bersaing N 1 sedang membangun area kritis unilateral (sisi kanan dan kiri) dan bilateral. Titik-titik yang memisahkan wilayah kritis
dari bidang penerimaan hipotesis , ditelepon poin kritis dan menunjukkan k Kreta. Untuk menemukan wilayah kritis perlu diketahui titik-titik kritisnya.

Pengguna tangan kanan wilayah kritis dapat digambarkan dengan ketimpangan
KE>k Kreta. pr, dimana diasumsikan titik kritis tepat k Kreta. pr >0. Daerah tersebut terdiri dari titik-titik yang terletak di sebelah kanan titik kritis k Kreta. pr, artinya mengandung banyak nilai kriteria positif dan cukup besar KE. Mencari k Kreta. pr tentukan terlebih dahulu tingkat signifikansi kriteria. Selanjutnya, titik kritis yang tepat k Kreta. pr ditemukan dari kondisi tersebut. Mengapa persyaratan ini menentukan wilayah kritis sisi kanan? Karena kemungkinan suatu kejadian (KE>k Kreta. dll. ) kecil, maka karena prinsip ketidakmungkinan praktis kejadian yang tidak terduga, kejadian ini tidak boleh terjadi jika hipotesis nol benar dalam satu pengujian. Jika memang terjadi, maka ada nilai observasi kriteria yang dihitung dari data sampel
ternyata lebih banyak lagi k Kreta. dll, maka hal ini dapat dijelaskan dengan fakta bahwa hipotesis nol tidak sesuai dengan data observasi dan oleh karena itu harus ditolak. Jadi persyaratannya
menentukan nilai kriteria di mana hipotesis nol ditolak, dan nilai tersebut merupakan wilayah kritis sisi kanan.

Jika
berada dalam kisaran nilai kriteria yang dapat diterima , itu adalah
< k Kreta. dll, maka hipotesis utama tidak ditolak, karena sesuai dengan data observasi. Perhatikan bahwa kemungkinan mencapai kriteria
ke dalam kisaran nilai yang dapat diterima jika hipotesis nol benar, maka sama dengan (1-) dan mendekati 1.

Harus diingat bahwa mengenai nilai kriteria
ke dalam kisaran nilai yang dapat diterima bukanlah bukti kuat validitas hipotesis nol. Hal tersebut hanya menunjukkan bahwa tidak terdapat perbedaan yang signifikan antara hipotesis yang diajukan dengan hasil sampel. Oleh karena itu, dalam kasus seperti ini mereka mengatakan bahwa data observasi konsisten dengan hipotesis nol dan tidak ada alasan untuk menolaknya.

Pembangunan kawasan kritis lainnya juga dilakukan serupa.

Jadi, akudua arah wilayah kritis digambarkan dengan ketimpangan
KE<k Kreta. aku, dimana k kritik.l<0. Такая область состоит из точек, находящихся по левую сторону от левой критической точки k crit.l, artinya, ini mewakili sekumpulan nilai kriteria negatif, tetapi nilai absolutnya cukup besar. titik kritis k crit.l ditemukan dari kondisi
(KE<k Kreta. aku)
, yaitu probabilitas bahwa kriteria tersebut mengambil nilai kurang dari k crit.l, sama dengan tingkat signifikansi yang diterima jika hipotesis nol benar.

Dua sisi wilayah kritis
dijelaskan oleh pertidaksamaan berikut: ( KE< k krit.l atau KE>k Kreta. pr), dimana diasumsikan bahwa k kritik.l<0 и k Kreta. pr >0. Area seperti itu merupakan sekumpulan nilai kriteria yang nilai absolutnya cukup besar. Poin kritis ditemukan dari persyaratan: jumlah probabilitas kriteria tersebut akan mengambil nilai kurang dari k Kreta. aku atau lebih k Kreta. pr, harus sama dengan tingkat signifikansi yang diterima jika hipotesis nol benar

(KE< k Kreta. aku )+
(KE>k Kreta. dll. )= .

Jika distribusi kriteria KE simetris terhadap titik asal, maka titik-titik kritis akan terletak simetris terhadap nol, jadi k Kreta. aku = - k Kreta. dst. Maka daerah kritis dua sisi menjadi simetris dan dapat digambarkan dengan pertidaksamaan berikut: > k Kreta. dv, dimana k Kreta. dv = k Kreta. mendekati titik kritis k Kreta. dv dapat ditemukan dari kondisi

P(K< -k Kreta. dv )=P(K>k Kreta. dv )= .

Catatan 1. Untuk setiap kriteria KE titik kritis pada tingkat signifikansi tertentu
dapat diketahui dari kondisi tersebut
hanya secara numerik. Hasil perhitungan numerik k kritik diberikan dalam tabel terkait (lihat, misalnya, lampiran 4 – 6 pada file “Lampiran”).

Catatan 2. Prinsip pengujian hipotesis statistik yang dijelaskan di atas belum membuktikan benar atau salahnya. Menerima hipotesis N 0 dibandingkan dengan hipotesis alternatif N 1 tidak berarti bahwa kita yakin akan kebenaran mutlak hipotesis tersebut N 0 - hanya hipotesis N 0 konsisten dengan data pengamatan yang kita miliki, yaitu pernyataan yang cukup masuk akal dan tidak bertentangan dengan pengalaman. Hal ini dimungkinkan dengan bertambahnya ukuran sampel N hipotesa N 0 akan ditolak.

Pada berbagai tahap penelitian dan pemodelan statistik, terdapat kebutuhan untuk merumuskan dan menguji secara eksperimental asumsi (hipotesis) tertentu mengenai sifat dan besarnya parameter yang tidak diketahui dari populasi (populasi) yang dianalisis. Misalnya, seorang peneliti membuat asumsi: “sampel diambil dari populasi normal” atau “rata-rata umum dari populasi yang dianalisis adalah lima.” Asumsi seperti ini disebut hipotesis statistik.

Perbandingan hipotesis yang dikemukakan mengenai populasi umum dengan data sampel yang tersedia, disertai dengan penilaian kuantitatif terhadap tingkat keandalan kesimpulan yang dihasilkan, dilakukan dengan menggunakan satu atau beberapa kriteria statistik dan disebut menguji hipotesis statistik .

Hipotesis yang diajukan disebut nol (primer) . Merupakan kebiasaan untuk menunjukkannya jam 0.

Sehubungan dengan hipotesis (utama) yang dikemukakan, selalu dapat dirumuskan alternatif (bersaing) , bertentangan dengan itu. Hipotesis alternatif (bersaing) biasanya dilambangkan sebagai jam 1.

Tujuan pengujian hipotesis statistik adalah menentukan keabsahan hipotesis utama berdasarkan data sampel jam 0.

Jika hipotesis yang diajukan bermuara pada pernyataan bahwa nilai beberapa parameter populasi tidak diketahui persis sama nilai tertentu, maka hipotesis ini disebut sederhana, misalnya: “rata-rata total pendapatan per kapita penduduk Rusia adalah 650 rubel per bulan”; “Tingkat pengangguran (bagian pengangguran dalam populasi yang aktif secara ekonomi) di Rusia adalah 9%.” Dalam kasus lain hipotesis disebut kompleks.

Sebagai hipotesis nol jam 0 Merupakan kebiasaan untuk mengajukan hipotesis sederhana, karena Biasanya lebih mudah untuk memeriksa pernyataan yang lebih kuat.

Hipotesis tentang bentuk hukum distribusi variabel acak yang diteliti;

Hipotesis tentang nilai numerik dari parameter populasi yang diteliti;

Hipotesis tentang homogenitas dua sampel atau lebih atau karakteristik tertentu dari populasi yang dianalisis;

Hipotesis tentang bentuk umum model yang menggambarkan ketergantungan statistik antar karakteristik, dll.

Karena pengujian hipotesis statistik dilakukan berdasarkan data sampel, yaitu. serangkaian pengamatan terbatas, keputusan mengenai hipotesis nol jam 0 bersifat probabilistik. Dengan kata lain, keputusan seperti itu pasti disertai dengan kemungkinan, meskipun mungkin sangat kecil, untuk menghasilkan kesimpulan yang salah di kedua arah.



Jadi, dalam sebagian kecil kasus α hipotesis nol jam 0 mungkin ditolak, padahal kenyataannya hal tersebut wajar bagi masyarakat umum. Kesalahan ini disebut kesalahan jenis pertama . Dan probabilitasnya biasa disebut tingkat signifikansi dan menunjuk α .

Sebaliknya, pada sebagian kecil kasus β hipotesis nol jam 0 diterima, padahal dalam populasi salah dan hipotesis alternatifnya benar jam 1. Kesalahan ini disebut kesalahan tipe kedua . Probabilitas kesalahan tipe II biasanya dilambangkan β . Kemungkinan 1 - ditelepon kekuatan kriteria .

Dengan ukuran sampel tetap, Anda dapat memilih probabilitas hanya satu kesalahan sesuai kebijaksanaan Anda α atau β . Peningkatan probabilitas salah satu dari mereka menyebabkan penurunan yang lain. Merupakan kebiasaan untuk menentukan kemungkinan kesalahan tipe I α - tingkat signifikansi. Sebagai aturan, beberapa nilai tingkat signifikansi standar digunakan α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Kemudian tentunya dari dua kriteria yang bercirikan probabilitas yang sama α menolak hipotesis yang sebenarnya benar jam 0, Anda harus menerima kesalahan yang disertai dengan kesalahan jenis kedua yang lebih kecil β , yaitu lebih banyak kekuatan. Mengurangi kemungkinan kedua kesalahan tersebut α Dan β dapat dicapai dengan meningkatkan ukuran sampel.

Keputusan yang benar mengenai hipotesis nol jam 0 juga dapat terdiri dari dua jenis:

Hipotesis nol akan diterima jam 0, padahal pada populasi umum hipotesis nolnya benar jam 0; kemungkinan keputusan seperti itu 1 - ;

Hipotesis nol jam 0 akan ditolak demi alternatif lain nomor 1, padahal pada kenyataannya pada populasi hipotesis nol jam 0 ditolak demi alternatif lain jam 1; kemungkinan keputusan seperti itu 1 - β - kekuatan kriteria.

Hasil penyelesaian hipotesis nol dapat diilustrasikan dengan menggunakan Tabel 8.1.

Tabel 8.1

Hipotesis statistik diuji menggunakan kriteria statistik(sebut saja secara umum KE), yang merupakan fungsi dari hasil observasi.

Kriteria statistik adalah suatu aturan (rumus) yang menentukan ukuran ketidaksesuaian antara hasil observasi sampel dan hipotesis yang dinyatakan H 0.

Kriteria statistik, seperti fungsi hasil observasi lainnya, adalah variabel acak dan diasumsikan bahwa hipotesis nol benar jam 0 tunduk pada hukum distribusi teoretis yang dipelajari dengan baik (dan ditabulasikan) dengan kepadatan distribusi f(k).

Pemilihan kriteria untuk menguji hipotesis statistik dapat dilakukan berdasarkan berbagai prinsip. Paling sering mereka menggunakannya untuk ini prinsip rasio kemungkinan, yang memungkinkan Anda membuat kriteria paling kuat di antara semua kriteria yang mungkin. Esensinya bermuara pada pilihan kriteria tersebut KE dengan fungsi kepadatan yang diketahui f(k) asalkan hipotesis H 0 valid, sehingga untuk tingkat signifikansi tertentu α adalah mungkin untuk menemukan titik kritisnya K kr.distribusi f(k), yang akan membagi rentang nilai kriteria menjadi dua bagian: rentang nilai yang dapat diterima, di mana hasil observasi sampel terlihat paling masuk akal, dan wilayah kritis, di mana hasil observasi sampel terlihat kurang masuk akal dengan sehubungan dengan hipotesis nol jam 0.

Kalau kriterianya seperti itu KE dipilih, dan kepadatan distribusinya diketahui, maka tugas menguji hipotesis statistik adalah bahwa untuk tingkat signifikansi tertentu α menghitung nilai kriteria yang diamati dari data sampel Untuk observasi dan menentukan apakah hipotesis tersebut paling masuk akal atau paling tidak masuk akal sehubungan dengan hipotesis nol jam 0.

Setiap jenis hipotesis statistik diuji menggunakan kriteria yang sesuai, yang paling kuat dalam setiap kasus tertentu. Misalnya, pengujian hipotesis tentang bentuk hukum distribusi suatu variabel acak dapat dilakukan dengan menggunakan uji goodness-of-fit Pearson. χ 2; menguji hipotesis tentang persamaan nilai varians dua populasi umum yang tidak diketahui - menggunakan kriteria F- Fischer; sejumlah hipotesis tentang nilai parameter populasi umum yang tidak diketahui diuji menggunakan kriteria Z- variabel dan kriteria acak terdistribusi normal T- Tes siswa, dll.

Nilai kriteria yang dihitung menurut aturan khusus berdasarkan data sampel disebut nilai kriteria yang diamati (Untuk observasi).

Nilai kriteria membagi himpunan nilai kriteria menjadi rentang nilai yang dapat diterima(paling masuk akal sehubungan dengan hipotesis nol jam 0) Dan wilayah kritis(area nilai yang kurang masuk akal dalam kaitannya dengan tabel distribusi variabel acak KE, dipilih sebagai kriteria, disebut titik kritis (K cr.).

Area nilai yang dapat diterima (area penerimaan hipotesis nol H 0) KE jam 0 tidak menyimpang.

Daerah kritis panggil sekumpulan nilai kriteria KE , di mana hipotesis nol jam 0 ditolak demi kepentingan pesaing jam 1 .

Membedakan berat sebelah(kidal kanan atau kiri) dan daerah kritis dua arah.

Jika hipotesis yang bersaing berpihak pada sisi kanan, mis. H 1: a > a 0, maka wilayah kritisnya adalah sisi kanan(Gambar 1). Di bawah hipotesis bersaing sisi kanan, titik kritisnya (Sisi kanan) mengambil nilai positif.

Jika hipotesis yang bersaing adalah kidal, mis. H 1 : a< а 0 , maka wilayah kritisnya adalah kidal(Gambar 2). Berdasarkan hipotesis bersaing sisi kiri, titik kritis mempunyai nilai negatif (K tepi kidal).

Jika hipotesis yang bersaing bersifat dua sisi, mis. H 1 : a¹ sebuah 0, maka wilayah kritisnya adalah bilateral(Gambar 3). Dengan hipotesis persaingan dua sisi, dua titik kritis diidentifikasi (K tepi kidal Dan Ke cr. Pengguna tangan kanan).


Kisaran yang dapat diterima Kritis

jarak nilai

5. Masalah utama statistik terapan - deskripsi data, estimasi dan pengujian hipotesis

Konsep dasar yang digunakan dalam pengujian hipotesis

Hipotesis statistik adalah asumsi apa pun mengenai distribusi variabel acak (elemen) yang tidak diketahui. Berikut rumusan beberapa hipotesis statistik:

1. Hasil observasi berdistribusi normal dengan ekspektasi matematis nol.
2. Hasil observasi mempunyai fungsi distribusi N(0,1).
3. Hasil observasi berdistribusi normal.
4. Hasil observasi pada dua sampel independen mempunyai distribusi normal yang sama.
5. Hasil observasi pada dua sampel independen mempunyai distribusi yang sama.

Ada hipotesis nol dan alternatif. Hipotesis nol adalah hipotesis yang akan diuji. Hipotesis alternatif adalah setiap hipotesis yang valid selain hipotesis nol. Hipotesis nol dilambangkan dengan jam 0, alternatif – jam 1(dari Hipotesis - “hipotesis” (Bahasa Inggris)).

Pilihan hipotesis nol atau alternatif tertentu ditentukan oleh tugas-tugas terapan yang dihadapi seorang manajer, ekonom, insinyur, atau peneliti. Mari kita lihat contohnya.

Contoh 11. Misalkan hipotesis nol adalah hipotesis 2 dari daftar di atas, dan hipotesis alternatif 1. Artinya keadaan sebenarnya digambarkan oleh model probabilistik, yang menurutnya hasil observasi dianggap sebagai realisasi variabel acak independen yang terdistribusi identik dengan a fungsi distribusi N(0,σ), dimana parameter σ tidak diketahui oleh ahli statistik. Dalam model ini, hipotesis nol dituliskan sebagai berikut:

N 0: σ = 1,

dan alternatif seperti ini:

N 1: σ ≠ 1.

Contoh 12. Misalkan hipotesis nol tetap berupa hipotesis 2 dari daftar di atas, dan hipotesis alternatif tetap berupa hipotesis 3 dari daftar yang sama. Kemudian, dalam model probabilistik situasi manajerial, ekonomi atau produksi, diasumsikan bahwa hasil observasi merupakan sampel dari distribusi normal. N(M, σ) untuk beberapa nilai M dan σ. Hipotesis ditulis seperti ini:

N 0: M= 0, σ = 1

(kedua parameter mengambil nilai tetap);

N 1: M≠ 0 dan/atau σ ≠ 1

(yaitu salah satu M≠ 0, atau σ ≠ 1, atau M≠ 0, dan σ ≠ 1).

Contoh 13. Membiarkan N 0 – hipotesis 1 dari daftar di atas, dan N 1 – hipotesis 3 dari daftar yang sama. Maka model probabilistiknya sama seperti pada contoh 12,

N 0: M= 0, σ bersifat arbitrer;

N 1: M≠ 0, σ sewenang-wenang.

Contoh 14. Membiarkan N 0 – hipotesis 2 dari daftar di atas, dan menurut N 1 hasil observasi mempunyai fungsi distribusi F(X), tidak sesuai dengan fungsi distribusi normal standar F(x). Kemudian

N 0: F(x) = (x) di depan semua orang X(ditulis sebagai F(x) ≡ Ф(x));

N 1: F(x 0) ≠ Ф(x 0) Di beberapa x 0(yaitu tidak benar bahwa F(x) ≡ Ф(x)).

Catatan. Di sini ≡ adalah tanda kebetulan fungsi yang identik (yaitu kebetulan untuk semua kemungkinan nilai argumen X).

Contoh 15. Membiarkan N 0 – hipotesis 3 dari daftar di atas, dan menurut N 1 hasil observasi mempunyai fungsi distribusi F(X), tidak bersikap normal. Kemudian

Untuk beberapa M, σ;

N 1: untuk apa pun M, σ ditemukan x 0 = x 0(M, σ) sedemikian rupa sehingga .

Contoh 16. Membiarkan N 0 – hipotesis 4 dari daftar di atas, menurut model probabilitas, diambil dua sampel dari populasi dengan fungsi distribusi F(X) Dan G(X), menjadi normal dengan parameter M 1 , σ 1 dan M 2 , σ 2 masing-masing, dan N 1 – negasi N 0 . Kemudian

N 0: M 1 = M 2, σ 1 = σ 2, dan M 1 dan σ 1 bersifat arbitrer;

N 1: M 1 ≠ M 2 dan/atau σ 1 ≠ σ 2 .

Contoh 17. Beri tahu kami juga berdasarkan ketentuan Contoh 16 bahwa σ 1 = σ 2 . Kemudian

N 0: M 1 = M 2 , σ > 0, dan M 1 dan σ bersifat arbitrer;

N 1: M 1 ≠ M 2, σ > 0.

Contoh 18. Membiarkan N 0 – hipotesis 5 dari daftar di atas, menurut model probabilitas, diambil dua sampel dari populasi dengan fungsi distribusi F(X) Dan G(X) sesuai, dan N 1 – negasi N 0 . Kemudian

N 0: F(X) G(X) , Di mana F(X)

N 1: F(X) Dan G(X) - fungsi distribusi sewenang-wenang, dan

F(X) G(X) dengan beberapa X.

Contoh 19. Misalkan, pada kondisi Contoh 17, diasumsikan juga bahwa fungsi distribusi F(X) Dan G(X) hanya berbeda dalam shift, mis. G(X) = F(X- A) Di beberapa A. Kemudian

N 0: F(X) G(X) ,

Di mana F(X) – fungsi distribusi sewenang-wenang;

N 1: G(X) = F(X- a), sebuah ≠ 0,

Di mana F(X) – fungsi distribusi sewenang-wenang.

Contoh 20. Beri tahu kami juga dalam kondisi Contoh 14 bahwa, menurut model situasi probabilistik F(X) - fungsi distribusi normal dengan varian satuan, mis. seperti N(M, 1). Kemudian

N 0: M = 0 (itu. F(x) = (x)

di depan semua orang X);(ditulis sebagai F(x) ≡ Ф(x));

N 1: M 0

(yaitu tidak benar bahwa F(x) ≡ Ф(x)).

Contoh 21. Ketika mengatur secara statistik proses teknologi, ekonomi, manajerial atau lainnya, sampel diambil dari populasi dengan distribusi normal dan varians yang diketahui, dan hipotesis dipertimbangkan

N 0: M = M 0 ,

N 1: M= M 1 ,

di mana nilai parameternya M = M 0 sesuai dengan jalannya proses yang ditetapkan, dan transisi ke M= M 1 menunjukkan suatu kelainan.

Contoh 22. Dalam pengendalian penerimaan statistik, jumlah unit produk cacat dalam sampel tunduk pada distribusi hipergeometri; P = D/ N– tingkat cacat, di mana N– volume batch produk, D– jumlah total unit yang rusak dalam batch. Rencana pengendalian yang digunakan dalam dokumentasi peraturan, teknis dan komersial (standar, kontrak pasokan, dll.) sering kali ditujukan untuk menguji hipotesis

N 0: P < AQL

N 1: P > LQ.,

Di mana AQL – tingkat penerimaan cacat, LQ. – tingkat penolakan cacat (tentu saja AQL < LQ.).

Contoh 23. Sebagai indikator stabilitas suatu proses teknologi, ekonomi, manajerial atau lainnya, digunakan sejumlah karakteristik distribusi indikator yang dikendalikan, khususnya koefisien variasi. ay = σ/ M(X). Kita perlu menguji hipotesis nol

N 0: ay < ay 0

di bawah hipotesis alternatif

N 1: ay > ay 0 ,

Di mana ay 0 – beberapa nilai batas yang telah ditentukan.

Contoh 24. Misalkan model probabilistik dua sampel sama seperti pada contoh 18, kita nyatakan ekspektasi matematis dari hasil observasi pada sampel pertama dan kedua. M(X) Dan M(kamu) masing-masing. Dalam sejumlah situasi, hipotesis nol diuji

N 0: M(X) = M(Y)

menentang hipotesis alternatif

N 1: M(X) ≠ M(Y).

Contoh 25. Di atas, kami mencatat pentingnya statistik matematika dari fungsi distribusi yang simetris terhadap 0. Saat memeriksa simetri

N 0: F(- X) = 1 – F(X) di depan semua orang X, jika tidak F sewenang-wenang;

N 1: F(- X 0 ) ≠ 1 – F(X 0 ) Di beberapa X 0 , jika tidak F sewenang-wenang.

Dalam metode pengambilan keputusan probabilistik-statistik, banyak rumusan masalah lain untuk menguji hipotesis statistik yang digunakan. Beberapa di antaranya dibahas di bawah ini.

Tugas khusus pengujian hipotesis statistik dijelaskan secara lengkap ketika hipotesis nol dan hipotesis alternatif diberikan. Pilihan metode untuk menguji hipotesis statistik, sifat dan karakteristik metode ditentukan oleh hipotesis nol dan hipotesis alternatif. Untuk menguji hipotesis nol yang sama dengan hipotesis alternatif yang berbeda, secara umum, metode yang berbeda harus digunakan. Jadi, pada contoh 14 dan 20, hipotesis nolnya sama, tetapi hipotesis alternatifnya berbeda. Oleh karena itu, dalam kondisi Contoh 14, metode yang didasarkan pada kriteria kesesuaian dengan keluarga parametrik (tipe Kolmogorov atau tipe omega-kuadrat) harus digunakan, dan dalam kondisi Contoh 20, metode yang didasarkan pada kriteria Student atau Cramer- Kriteria Welch. Jika pada kondisi contoh 14 kita menggunakan kriteria Siswa, maka hal tersebut tidak akan menyelesaikan permasalahan. Jika, dalam kondisi Contoh 20, kita menggunakan kriteria goodness-of-fit tipe Kolmogorov, maka sebaliknya, kriteria tersebut akan menyelesaikan masalah yang diajukan, meskipun mungkin lebih buruk daripada uji-t Student, yang secara khusus diadaptasi untuk kasus ini. .

Saat memproses data nyata, pilihan hipotesis yang tepat sangatlah penting. N 0 dan N 1 .

Seringkali muncul situasi ketika jenis hipotesis nol mengikuti rumusan masalah yang diterapkan, tetapi jenis hipotesis alternatifnya tidak jelas. Dalam kasus seperti itu, seseorang harus mempertimbangkan hipotesis alternatif dari jenis yang paling umum dan menggunakan metode yang memecahkan masalah dalam semua kondisi yang memungkinkan. N 1 . Khususnya, ketika menguji hipotesis 2 (dari daftar di atas) sebagai nol, Anda harus menggunakan N 1 dari Contoh 14, dan bukan dari Contoh 20, jika tidak ada justifikasi khusus terhadap normalitas sebaran hasil observasi berdasarkan hipotesis alternatif.

Sebelumnya