İSTATİSTİK 2
Transkript
İSTATİSTİK 2
İSTATİSTİK 2 Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI 1 [email protected] Güven aralığı ve Hipotez testi Güven aralığı µ? Veriler , bir değer aralığında hangi değeri gösteriyor? (Parametrenin gerçek değeri hakkında bir bilgimiz yok.) Veriler , daha önceden belirlenmiş bir değeri gösteriyor mu? (Parametrenin değeri hakkında bir fikrimiz var.) 2 µ? µ 0? Hipotez nedir? Hipotez, karşılaşılan bir durum hakkında yapılan bir önermedir. İstatistikte, hipotez, bir anakütle paramatresi hakkında yapılan bir önermedir: Mesela, anakütle ortalaması Örnek: Bu şehirdeki ortalama aylık cep telefonu faturası μ = 42TL 3 Hipotez Testi nedir? Bir hipotez testi, iki tür hipotez oluşturmakla başlar: Sıfır hipotezi Alternatif (Karşıt) hipotez Sıfır hipotezi, “arada fark yoktur”, “fark sıfırdır” şeklinde kurulur. Hipotez testi, sıfır hipotezinin (H0) doğru olduğu varsayımı ile başlar. Bir hipotez testinin amacı, sıfır hipotezinin (karşıt hipotez leyhine) reddedilip edilmemesine karar vermektedir. 4 Sıfır hipotezi, H0 Test edilecek varsayımı ifade eder. Örnek: Amerikan evlerindeki ortalama TV sayısı 3’tür. H0 : μ 3 Her zaman bir anakütle parametresi hakkındadır, asla örneklem istatistiği hakkında değildir. H0 : μ 3 5 H0 : X 3 Sıfır hipotezi, H0 Anakütle parametresinin önceden belirlenmiş, bilinen değerinde herhangi bir farklılığın beklenmediğini ifade eden hipotezdir. Her zaman şu işaretleri içerir : “=” , “≤” , “≥” H0’a aykırı yeterli kanıt bulunmadıkça bu hipotez geçerli sayılır. 6 Suçluluğu ispat edilene kadar masum olma durumu gibi. Alternatif (Karşıt) Hipotez, H1 İlgili anakütle parametresinin bilinen değerinde istatistiksel olarak anlamlı farkların beklendiğini ifade eder. 7 Ör. Amerikan evlerindeki ortalama TV sayısı 3 değildir: ( H1: μ ≠ 3 ) Asla şu işaretleri içermez : “=” , “≤” , “≥” Eğer doğru olduğunu destekleyen yeterli kanıt bulunursa, H1 desteklenir ve H0 reddedilir. Alternatif (Karşıt) Hipotez, H1 Eğer amaç, µ ‘nün belirli bir değerden (µ₀), farklı olup olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır : H1: µ ≠ µ₀ Bu durumda, hipotez testine iki-yönlü denir. Eğer amaç, µ ‘nün belirli bir değerden (µ₀) düşük olup olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır : H1: µ < µ₀ Bu durumda, hipotez testine tek yönlü (sol taraflı) denir. Eğer amaç, µ ‘nün belirli bir değerden (µ₀) yüksek olup olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır : H1: µ > µ₀ Bu durumda, hipotez testine tek yönlü (sağtaraflı) denir. 8 Hipotezleri tanımlama Örnek : Anakütle ortalamasının 3 olmadığını test edin. Etaplar: Soruyu istatistiksel olarak yazın : (µ ≠ 3) Sorunun tersini istatistiksel olarak yazın (µ = 3) Alternatif hipotezi seçin (µ ≠ 3) 9 Bağdaşmaz ve bütünü kapsayıcı olacak şekilde olmalı. Yazılmış olan iki önermeden içinde şu işaretlerden birini bulunduranı seçin : ≠, <, > Sıfır hipotezini seçin (µ = 3) Hipotezleri tanımlama Anakütlenin ortalama TV seyretme süresi 12 saat midir? Soruyu istatistiksel olarak yazın : µ = 12 Sorunun tersini istatistiksel olarak yazın: µ ≠ 12 Alternatif hipotezi seçin : H1: Sıfır hipotezini seçin : H0: 10 µ ≠ 12 µ = 12 Hipotezleri tanımlama Anakütlenin ortalama TV seyretme süresi 12 saatten farklı mıdır? µ ≠ 12 Soruyu istatistiksel olarak yazın : Sorunun tersini istatistiksel olarak yazın: µ = 12 Alternatif hipotezi seçin : H1: Sıfır hipotezini seçin : H0: 11 µ ≠ 12 µ = 12 Hipotezleri tanımlama Bir şapkanın ortalama maliyeti 20$’dan az ya da ona eşit midir? Soruyu istatistiksel olarak yazın : µ ≤ 20 Sorunun tersini istatistiksel olarak yazın : µ > 20 Alternatif hipotezi seçin : Sıfır hipotezini seçin : H0: 12 H1: µ > 20 µ = 20 Hipotezleri tanımlama Bir kitapçıda yapılan ortalama harcama 25 $’dan fazla mıdır? Soruyu istatistiksel olarak yazın µ > 25 Sorunun tersini istatistiksel olarak yazın : µ ≤ 25 Alternatif hipotezi seçin : H1: Sıfır hipotezini seçin : H0: 13 µ > 25 µ = 25 Hipotez testinde yapılan hatalar Karar H0’ın red edilmemesi H0’ın reddi 14 Doğal durum H0 Doğru H0 Yanlış Doğru karar Olasılık :1 – α II. Tip hata I. Tip hata Doğru karar Olasılık :1 – β ( testin gücü) Olasılık : α (anlamlılık düzeyi) Olasılık : β I. Ve II. Tip Hatalar arasındaki ilişki I. ve II. Tip hatalar aynı anda gerçekleşemez. I. Tip hata yalnızca H0 doğru olduğunda olur. II. Tip hata yalnızca H0 yanlış olduğunda olur. Eğer I. Tip hata olasılığı artarsa (), II. Tip hata olasılığı azalır (β) 15 Anlamlılık seviyesi () arttıkça, testin gücü de (1 – β) artar. Anlamlılık seviyesi, H0 doğru olduğunda, örneklem istatistiğinin alabileceği pek mümkün olmayan değerlerin oranını verir. Örnekleme dağılımında red bölgesini tanımlar. , ile gösterilir Yaygın kullanılan seviyeler 0,01 ; 0,05 ; 0,10 Araştırmacı tarafından test başlangıcında belirlenir. Testin kritik değer(ler)ini verir. 16 Anlamlılık seviyesi ve Red bölgesi Anlamlılık seviyesi = H0: μ = 3 H1: μ ≠ 3 Kritik değer /2 İki yönlü test /2 0 H0: μ ≤ 3 H1: μ > 3 Sağ taraflı test H0: μ ≥ 3 H1: μ < 3 17 Red bölgesi taralı olarak gösteriliyor. 0 Sol taraflı test 0 Ortalama için Hipotez testi (σ biliniyor) Amaç : Anakütle ortalaması, µ, için hipotez testi uygulamak Varsayımlar: Rasgele örneklem Normal anakütle σ biliniyor Etap 1: Sıfır hipotezi H0 : µ = µ₀, belirlenir. Alternatif hipotez olarak da aşağıdaki 3 durumdan biri belirlenir. H1: µ ≠ µ₀ veya H1: µ < µ₀ veya H1: µ > µ₀ (iki yönlü) 18 (sol taraflı) (sağ taraflı) Ortalama için Hipotez testi (σ biliniyor) Etap 2: Anlamlılık seviyesi α belirlenir Etap 3: Sıfır hipotezinde geçen değerin z değeri hesaplanır. 𝑥 − 𝜇0 𝑧0 = 𝜎/ 𝑛 Step 4: Kritik değerler bulunur ±zα/2 (İki yönlü) 19 veya – zα (Sol taraflı) veya zα (Sağ taraflı) Ortalama için Hipotez testi (σ biliniyor) H0 red edilemez red red İki yönlü 20 red H0 red edilemez Sol taraflı H0 red edilemez red Sağ taraflı Etap 5: Eğer z0 red bölgesine düşüyorsa, H0 reddedilir, yoksa, H0 reddedilmez. Etap 6 : Hipotez testinin sonuçları yorumlanır. Ortalama için Hipotez testi (σ biliniyor) Tek taraflı Test H0: µ = µ0 Ha: µ < or > µ0 Test istatistiği: z x 0 x Red bölgesi: | z | > zα 21 İki taraflı Test H0: µ = µ0 Ha: µ ≠ µ0 Test istatistiği: z x 0 x Red bölgesi: | z | > zα/2 Örnek1: Ortalama için sağ taraflı test Telefon sanayiindeki bir yönetici müşterilerin aylık cep telefonu faturalarında bir artış olduğunu ve artık ortalama faturanın 52TL’nin üstünde olduğunu düşünüyor. Şirket bu düşünceyi test etmek istiyor. ( = 10) Hipotezleri tanımla: H0: μ ≤ 52 ortalama 52 TL‘den yüksek değil. H1: μ > 52 ortalama 52 TL‘den yüksek. (yani, yöneticinin düşüncesini destekleyen yeterli kanıt var.) 22 Örnek1: Red bölgeleri bulunur. Test için anlamlılık seviyesi = 0.10 seçildi. Red bölgesi: H0 red = 0.10 H0 reddedilemez 0 1.28 H0 Reddedilir x μ0 1.28 ise, H0 reddedilir. Eğer z σ/ n 23 Örnek1 : Örneklem sonucu Örneklemden yola çıkarak, test istatistiği hesaplanır Şu değerleri veren bir örneklem varsayıyoruz: n = 64, x = 53.1 ( = 10) Test istatistiği: x μ0 53.1 52 z 0.88 σ 10 n 64 24 Örnek1 : Karar H0 reddilir = 0.10 H0 reddedilemez 1.28 0 z = 0.88 H0 reddedilir H0 reddedilemez çünkü z = 0.88 < 1.28 Yorum: telefon faturalarının 52 TL’nin üstünde olduğunu destekleyen yeterli kanıt yoktur. 25 Örnek 2 «Amerika’da evlerde bulunan ortalama TV sayısı 3’tür» önermesini test edin. (σ = 0.8 olarak varsayalım) Sıfır ve alternatif hipotezleri yazın H0: μ = 3 , H1: μ ≠ 3 (Bu bir iki yönlü test olacaktır) Anlamlılık seviyesini belirleyin Bu test için = 0.05 seçilmiş olsun Örneklem büyüklüğü seçin. n = 100 olacak şekilde bir örneklem seçilmiştir. 26 Örnek 2 Kritik değerleri belirleyin = 0.05 için kritik z değerleri ±1.96’dır. Test istatistiğini hesaplayın Örneklem sonuçlarının şu şekilde olduğunu varsayalım. n = 100, x = 2.84 (σ = 0.8) Öyleyse, test istatistiği : X μ0 2.84 3 0.16 z 2.0 σ 0.8 0.08 n 100 27 Örnek 2 Test istatistiği red bölgesinde mi? Eğer z < –1.96 = 0.05/2 veya z > 1.96 ise, H0’ı H reddedilir reddederiz. Aksi durumda, – z = – 1.96 H0 reddedilmez. 0 = 0.05/2 H0 reddedilemez 0 H0 reddedilir +z = +1.96 z = – 2.0 < – 1.96, Demekki test istatistiği red bölgesinde. 28 Örnek 2 Sonucu yorumla!!! = 0.05/2 H0 reddedilir –z = –1.96 = 0.05/2 H0 reddedilemez 0 H0 reddedilir +z = +1.96 –2.0 z = – 2.0 < – 1.96 olduğu için sıfır hipotezini reddettik. Demekki, Amerika’da evlerde bulunan ortalama TV sayısının 3 olmadığı yönünde yeterli kanıt vardır. 29 Örnek 3 Futbol hakemleri tarafından kuralların yeniden yorumlanması sonucunda maç başına düşen sarı kart sayısında bir artış olması bekleniyor. Şimdiye kadar maç başına düşen ortalama sarı kart sayısı 4, standart sapması da 0,5 olsun. 121 maçlık bir örneklemden elde edilen verilere göre maç başına ortalama 4,7 sarı kart çıktığı hesaplanmıştır. %5’lik anlamlılık seviyesinde, gerçekten sarı kartlarda artış olmuş mudur? • Hipotezleri oluşturun: • H0: μ = 4 , H1: μ ≠ 4 ( İki yönlü test) • Anlamlılık seviyesi 0,05 • Kritik z değerleri ±1,96’dır. 30 Örnek 3 Örneklem ortalaması 𝒙 = 4,7 Test istatiğini hesaplayın: Örneklem büyüklüğü n = 121 x 0 4,7 4 z0 10,94 sx 0,064 H0 reddedilir 0,025 H0 reddedilir 0,025 H0 reddedilmez -1,96 +1,96 10,94 Sonuç ve yorum: z₀ red bölgesine düştüğü için, H0 reddedilir. Demekki,sarı kart sayısında bir artış olduğu konusunda yeterli kanıt vardır. 31
Benzer belgeler
10. bölüm: model kurma: fonksiyonel form seçimi
H0: μ = 3 , H1: μ ≠ 3
(Bu bir iki yönlü test olacaktır)
Anlamlılık seviyesini belirleyin
Bu test için = 0.05 seçilmiş olsun
Örneklem büyüklüğü seçin.
n = 100 olacak şekilde bir örneklem seç...