ünite1
Transkript
ünite1
Ege Üniversitesi Biyometri ve Genetik Anabilim Dalı Bornova İZMİR Dersin Amacı a) öğrencilerin temel İstatistik kavramlarını öğrenmelerini, b) bilimsel karar verme mekanizmasında istatistiksel yöntemlerden faydalanmalarını, c) denemelerin tasarlanmasını ve d) bu denemelerden elde edilen verilerin nasıl analiz edileceğini ve e) yorumlanacağını kavramalarını sağlamaktır. İstatistiğe giriş; Temel istatistik terimler; Verilerin sunulması ve özetlenmesi Tanımlayıcı istatistikler Tıp Denemeleri Kesikli olasılık dağılışları (binom ve poisson dağılışları) Sürekli olasılık dağılışları (normal dağılış) İstatistiksel Tahminleme; Populasyon ortalaması için nokta tahminlemesi; Populasyon ortalaması için aralık tahminlemesi ARA SINAV Hipotez testleri; Popülasyon ortalamasına ait testler (z ve t testleri) Büyük örnek testleri; küçük örnek testleri; İki ortalamanın karşılaştırılması (bağımsız örneklerde) İki ortalamanın karşılaştırılması (Bağımlı örneklerde) Ki-kare ve F dağılışları; Ki-kare dağılışı ve sayımla elde edilen verilerin değerlendirilmesi; Değişkenler arası ilişkiler; Basit doğrusal regresyon ve korelasyon Varyans analizi (ANOVA) ve varsayımları; Tam şansa bağlı deneme deseni (tesadüf parselleri) ve analizi Final Sınavı Kaynaklar-1 1. Püskülcü, H., İkiz, F., Eren, Ş. 2006. İstatistiğe Giriş. Barış Yayınları, Fakülteler Kitabevi, İzmir. 2. Yıldız, N.; Bircan, H. 2003. Araştırma ve Deneme Metotları. Atatürk Üniversitesi Yayınları No: 697. Ziraat Fakültesi No: 305, Ders Kitapları Serisi No: 57, Erzurum. 3. Düzgüneş, O.; Kesici, T.; Kavuncu, O.; Gürbüz, F. 1987. Araştırma ve Deneme Metotları. Ankara Üniversitesi Ziraat Fakültesi Yayınları: 1021, Ders Kitabı: 295, Ankara. 4. Mead, R., and Curnow, R.N., 1983. Statistical Methods in Agriculture and Experimental Biology. Chapman Hall, London. 5. Steel, R.G.D., and Torrie, J.H. 1960. Principles and Procedures of Statistics. Mc Graw Hill, New York. 6. Ott, Lyman, 1988. An introduction to statistical methods and data analysis. PWS-Kent Publishing Company, Boston. Kaynaklar-2 1. WA 900 D184 1991 Daniel, Wayne W. Biostatistics: A Foundation for Analysis in the Health Sciences 2. WA 950 D272 2004 Dawson, Beth Trapp, Robert G. Basic & Clinical Biostatistics Lange Medical Books/ McGrow-Hill NewYork 2004 3. WA 950 G545 2002 Glantz, Stanton A. Primer of Biostatistics McGrow-Hill NewYork 2002 4. WA 950 A733 2002 Armitage, P. Statistical Methods in Medical Research Blackwell Science Oxford 2002 5. WA 950 M922 1995 Motulsky H. Intuitive Biostatistics. İstatistik Nedir? • • 1. Veri Bilimi 2. Neyi içeriyor: AMAÇ – Verilerin toplanması – Verilerin sınıflandırılması – Verilerin özetlenmesi – Verilerin organize edilmesi – Verilerin analizi – Yorumlanması Nicin? ANLAMA KARAR VERME Günlük Hayatta İstatistik • Olaylar (doğum, ölüm vb) hakkında tutulan kayıtlar • Tüm araç ve gerecin, yiyeceklerin ve ilaçların geliştirilmesinde istatistik yöntemler kullanılmıştır. • Tükettiğimiz buğdayın ve ürünlerinden yararlandığımız ineklerin ıslahında yoğun bir şekilde istatistik tekniklerden yararlanılmıştır. • Hava raporlarının hazırlanmasında son derece yoğun istatistik yöntemler kullanılmaktadır. • Bir şehrin değişik sağlık ocağı bölgelerinde çalışan hekim sayısı • Belirli bir zaman dilimi içerinde bir hastanede doğan bebeklerin doğum ağırlıkları, • Belirli bir diş hekimi kliniğinde görülen hastalarda protez gereksinimi veya dolgu gereksinimi • 24 saatlik idrarda kreatinin mg/lt miktarı • 24 saat içinde meydana gelen trafik kazalarında ölümlü vaka sayısı gibi Tarihçe • İstatistik kelimesinin kullanımı Aristo zamanına dayanır. Devlet bazı sayımlar yapmıştır. • İstatistik analiz yaklaşımına ilk adım 17.yy John Graunt (İngiltere) • 17 yy. William Petty “Politik Aritmetik” isimli hayat, sigorta ve ekonomik istatistikler yayınlanmış • Modern istatistik 16 ve 17. yy olasılık teorisi ile gelişme göstermiş. • Olasılığın ilk uygulaması şans oyunlarına yönelik (Galile) • Pascal, Fermat, James ve Daniel Bernoulli, de Moivre, Laplace, Gauss, Simpson, Lagrange, Hermite ve Legendre önemli olasılık kural ve teoremlerini geliştirmiştir. • 19.yy sonunda Sir Francis Galton Regresyon ve Korelasyonu geliştirmiş, Karl Pearson ve C. Spearman psikoloji ve sosyal bilimlere uygulamıştır. • William S.Gosset 1908’de Biometrika’da yayınladığı makale ile yeni bir başlangıç yapmıştır. • Küçük verilerle çalışmak zorunda kalan Gosset bu duruma uygun yöntemler geliştirmiştir ve yazılarını “Student” ismiyle yayınlamıştır. • Ronald A Fisher günlük verilere uygulama yapmıştır. Günümüzde kullanılan bir çok yöntemin ilk fikrini ortaya koymuştur. İstatistik Uygulama Alanları Biyoloji+İstatistik=Biyometri, Biyoistatistik Tıp+İstatistik = Biyoistatistik, Biyometri Ekonomi+İstatistik = Ekonometri Psikoloji+İstatistik = Psikometri Sosyoloji+İstatistik = Sosyometri Tarih+İstatistik = Kliometri Biyoistatistik Biyoloji, tıp ve diğer sağlık bilimlerinde istatistik yöntemlerin uygulanmasını kapsar. Sağlık hizmetlerinde alanları: biyoistatistiğin örnek kullanım 1. Sağlık hizmetlerine yönelik planlama yapılması (bölgeye uygun sağlık hizmetinin verilebilmesi için bina, ekipman ve insan kaynağının nitelik ve niceliği) 2. Sağlık alanına yönelik bilimsel araştırmaların yapılması (klinik, laboratuvar deneyleri) 3. Tanı ve tedaviye yönelik kullanım 4. Toplumda sağlık kalitesini artırıcı önleme amaçlı yaklaşım çalışmaları 5. Toplumsal değişimleri öngörme (geleceğe yönelik sağlık sorumları ve nedenleri) 6. Anatomi ile ilgili çalışmalar 7. Hücreye yönelik çalışmalar 8. Sağlık alanında çalışan insan kaynağının gelişimi ve iyileştirilmesi TEMEL İSTATİSTİK KAVRAMLAR Populasyon: Aynı özelliğe veya ortak özelliğe sahip birimlerin oluşturduğu topluluğa populasyon denir. Populasyon, biyolojik olarak belirli bir türdeki tüm bireyler topluluğu olabilir. Örnek: Dünyadaki tüm insanlar veya dünyadaki tüm süt sığırları gibi. Yer ve zaman gibi daha ayrıntılı tanımlayıcı ortak özellikler olabilir. Bu durumda populasyon Türkiye’deki insanları veya Türkiye’deki Siyah Alaca süt sığırları ifade edebilir. Birim: Bir topluluğu oluşturan ve incelemeye konu olan objelere (insan, bitki veya hayvana) birim veya ünite denir. Parametre: Populasyonun elemanları üzerinde hesaplanan ortalama, varyans, regresyon katsayısı gibi ölçülere parametre denir. TEMEL İSTATİSTİK KAVRAMLAR Örnek: Araştırmaya konu olan bir populasyondan, belli bir örnekleme yöntemi kullanılarak populasyonu temsil edebilecek büyüklükte seçilen, daha az sayıda birimlerin oluşturduğu topluluğa örnek denir. İstatistik: Örnek üzerinden hesaplanan ortalama, varyans, regresyon katsayısı gibi tahminleyicilere istatistik denir. 18 J 19 J Populasyon 18 19 21 J J J Örnek Populasyondaki ortalaması yaş, m=19.2 18 20 20 J Örnek ortalaması, `X, is 20 20 J J J Yaş Temel Kavramlar Popülasyon Örnek ve hacmi Değişken Zaman .aralığı Araştırma nedeni Yeni doğanlar Ege Üniversitesi hastanesinde doğanlar Ağırlık (kg) Boy (m) Son 5 yıl kayıtları Ağırlık ve boy arasındaki ilişkinin belirlenmesi X hastalığına yakalanan tüm bireyler Ege Üniversitesindeki X hastaları 1. Örnek (30 kişi) 2. Örnek (35 kişi) İyileşme süresi (gün) Belirli bir süre 1. Örneklere A ilacı 2. Örneklere B ilacı verilmiş ve hangi ilacın daha etkin olduğu araştırılıyor. Temel Kavramlar Popülasyon Örnek ve hacmi Değişken Zaman .aralığı Araştırma nedeni Tüm kadınlar A bölgesindeki 50 kişilik kadın grubu Bilgi puanı Kurs süresi Eğitim öncesi ve sonrası bilgi düzeyindeki değişim araştırılıyor Tüm hipertansiyon hastaları 50 kişilik örnek Tansiyon ölçüm değerleri (mm/Hg) Belirli bir süre A ilacı 50 kişiye verilmeden sonra tansiyonlar ölçülmüş ve ilacın etki düzeyi belirlenmeye çalışılıyor Parametreler Yunan alfabesi ile istatistikler ise Latin alfabesi ile sembolize edilirler. İstatistik Parametre Ortalama X μ (mü) Varyans S2 σ2 (sigma kare) Standart sapma S σ (sigma) Korelasyon katsayısı r ρ (rho, ro) Örnek büyüklüğü • Populasyondaki bütün bireyleri ölçmek zor, pahalı ve zaman gerektirebilir. • Örnekteki birim sayısına örnek büyüklüğü veya genişliği denir. Örneğin 20 hastada çinko düzeyi ölçüldü ise örnek genişliği 20’dir. – Araştırmacı örnek seçiminde tarafsız davranmalıdır. – Araştırmacı populasyonu iyi tanımalı ve populasyonu temsil edebilecek ve onun hakkında tahminleme yapılabilecek kadar büyük örneklerle çalışmalıdır. – Etik kurallar dikkate alınmalıdır. • Örnek hacmi ve örnekleme yöntemleri istatistiğin önemli bir konusudur. TEMEL İSTATİSTİK KAVRAMLAR VE NOTASYONLAR Gözlem, sayım ve ölçüm sonucu elde edilen bilgi, sembol ve rakamlara veri denir. Değişken: Belli bir sembolle gösterilen ve sembolün değeri sürekli değişen ifadelere değişken denir. Xi = { x1, x2,... , xn } Yani gözlem, sayım ve ölçüm sonucu elde edilen verilerin atandığı terime değişken adı verilir. Boy uzunluğu Canlı Ağırlık Bin dane ağırlığı Saniyede akan su miktarı Gübre miktarı pH düzeyi Kolesterol düzeyi Traktörleri yaşı Bakım harcama düzeyi İlacın ağrıyı kesme süresi Kandaki hormon düzeyi Üretim miktarı Ailelerdeki çocuk sayısı Veri ve Güvenilirlik: İstatistikte toplanan verilerin güvenilirliği büyük önem arz eder. Çünkü istatistikçi elindeki verilerden yararlanarak tahminde bulunur. Hatalı rakamlardan doğru sonuçlar verecek bir yöntem yoktur! “İstatistiksel araçlarınız ne kadar güçlü, ne kadar gelişmiş olursa olsun, unutmamanız gereken tek şey var: Bu verileri okuma yazması olmayan demiryolu bekçileri topladı” Sir John Maynard Keynes Güvenilirlik: Tahminin güvenilirliği başlıca şu noktalara bağlıdır: a) Araştırıcının dürüstlüğüne, b) Yapılan ölçümün hassasiyetine, c) Denemenin sağlıklı yürütülmesine, d) Uygulanan modelin ve yöntemin doğruluğuna. Doğruluk ve Hassasiyet • Doğruluk (accuracy): Bir sonucun gerçek değere ne kadar yaklaştığının ölçütüdür. Mutlak veya bağıl hata (MH, BH) ile verilir. – MH= xö-xg; – %BH=100•(xö-xg)/xg • Hassasiyet-Kesinlik (precision): Aynı olgunun tekrarlamalı ölçüm sonuçlarının birbirine yakınlığının ölçüsüdür. Standart sapma ile bu farklılıklar bulunabilir. Standart sapma ne kadar küçükse tekrarlanan ölçüm değerleri o kadar birbirine yakın ve hassasiyet fazladır denir. Doğruluk ve kesinlik birbirinden bağımsız iki olgudur. Bir analiz sonucu doğru olduğu halde hassas veya hassas olduğu halde doğru olmayabilir. Veri Kantitatif (Nicel) Interval (Aralıklı) Ratio (Orantılı) Kalitatif (Nitel) Nominal (İsimsel) Ordinal (Sıralı) Nitel (Kalitatif) değişkenler Nitel değişkenler; birimlerin kalite, kategorik, yada isimsel olarak belirtilebilen özelliklerini, durumlarını ve pozisyonlarını belirten değişkenlerdir. Bu değişkenlerin verileri isimsel ya da sıralı ölçekle elde edilmişlerdir. İki yada daha fazla kategoriye (alt seçenek, sınıf, grup) ayrılarak sayımla elde edilir. Örnek: cinsiyeti, kan grubu, saç rengi, göz rengi, medeni durum, göz rengi, mesleği, kişinin sigara içip içmemesi, yerleşim yeri, tuttuğu futbol takımı gibi nitelik bildiren durumları açıklayan değişkenlerdir. Nicel (Kantitatif) Değişkenler Birimlerin ölçüm ve tartım sonucu değerleri saptanan sayısal özelliklerini belirten değişkenlerdir. Bu değişkenler değerleri, mekanik ve elektronik araçlara sayısal olarak aralıklı ölçekli yada orantılı ölçekli verileridir. Örnek: boy uzunluğu, vücut ağırlığı, kilosu, kan basıncı gibi özellikler nicel değişkenlerdir. Kesikli Değişken Ölçülen özellik sayı doğrusu üzerinde sadece belirli noktalara atanabiliyorsa bu tip değişkenlere kesikli değişken denir. Bu değişkenler miktar yönünden değişiklik yerine tür yönünden değişiklik gösterir. Dolayısıyla obje ya da birey bir özelliğe sahiptir ya da değildir. Yani kesin değerler alırlar. Nitel değişkenlerin hemen hepsi kesikli değişkendir. Cinsiyet (kız-erkek), medeni durum (bekar, evli, dul vb), göz rengi, sağlık durumu (hasta-sağlam); Başarı durumu(zayıf-orta-iyi-pekiyi); ürün kalitesi (1.kalite,2.kalite,vb) gibi. Sürekli Değişken İki ayrı ölçüm arası kuramsal olarak sonsuz parçaya bölünebilir. Ölçüm söz konusu olduğu için sürekli değişken değerleri her zaman tam değeri vermez. Örneğin; balıkların ağırlıkları, tohum ağırlıkları, tohum çapı, kök sayısı, bitki boyu, ortamdan bakterilerin tüketmiş oldukları şeker miktarı, ineklerin yıllık süt verimleri, yaş, uzunluk, vücut ağırlığı, kan Ph değerleri, kan kolesterol ve şeker düzeyleri, hacim veya alan değerleri gibi ölçme, tartma yoluyla elde edilen dolayısıyla nokta içermesi mümkün olan verilerdir. Noktadan sonraki hane sürekli veri olduğunu gösterir. Örneğin pamuk tohumu: 1.3; 1.32; 1.32076 gr gibi. Bir ineğin bir senelik süt miktarı 3762 kg tartmaya dayandığı için süreklidir. Kantitatif özellikler hem sayma, hem ölçme, hem de tartma yoluyla veri elde edilebilir. Kalitatif İsimsel (nominal) ölçeği • Verilere isim verilerek sınıflandırma ve değerlendirme yapılıyorsa, • Bu durumda aritmetik işlemler kullanılamaz • İstatistik tekniklerin kullanımı sınırlıdır. • Örnek: eşey bilgisi (erkek, dişi); Sigara içme durumu (içen, içmeyen); Saç rengi(siyah, sarı, kumral) Kalitatif Sıralı (ordinal) ölçeği • Verilerdeki sınıflama sıralama şeklinde yapılıyorsa, bu tip ölçekler sıralı ölçeği olarak tanımlanır. • Bu durumda sınıfın birinin diğerinden daha düşük veya daha önemli olduğu söylenebilir. • İsimsel olana göre daha ileri bir tanımlama içerir fakat istatistik teknikler hala sınırlıdır. • Örnek: Başarı durumu(zayıf, orta,iyi,pekiyi); gelir düzeyi(düşük, orta, yüksek); öğrenim sınıfları(1.,2.,3.ve 4. sınıf) Kantitatif Aralık (interval) ölçeği • Bu tip verilerde yapı ordinal veriler gibidir. Aralarındaki fark interval verilerin eşit aralıklı sınıflandırılmasıdır. • Veriler gerçek olmayan bir başlangıç noktasına göre belirlenirler. Başlangıç noktası izafidir. • Aralık ölçeği, iki noktası belirlenen bir aralığı eşit bölümlere ayırarak oluşturulduğu gibi, gerçek olmayan bir noktadan itibaren sabit birimler bölünerek de oluşturulabilir. Fakat veriler birbirinin katı şeklinde ifade edilemezler. • Örnek: Sıcaklık ölçümleri (Celcius, Fahrenheit, Reaumer termometreler); Tarih belirlemede kullanılan takvimler (miladi, hicri, rumi takvimler) • Celcius = (°F – 32) / 1.8 Kantitatif Oran (Ratio) ölçeği • Bu tip ölçeğin oluşturulmasında gerçek bir başlangıç noktası (sıfır noktası) vardır. Veriler birbirinin katı olarak ifade edilebilir. • Diğer ölçeklere göre daha ileri bir tanımlamadır. • İstatistik tekniklerin en yaygın bu ölçekteki verilerde kullanılır • Örnek: Uzunluk ölçüleri; Ağırlık ölçüleri; Alan ölçüleri; Hacim ölçüleri; Zaman ölçüleri (sn, d, s, gün, yıl); Yoğunluk, Basınç, Ses ölçüleri. Veri tipleri neden önemlidir? • İstatistik hesaplamalar ve analizler, değişkenlerin belirli bir ölçekte almasını gerektirir. • Saç renginin ortalamasını hesaplayabilir miyiz? • Eğitim deneyimlerinin ortalamasını hesaplamak ne derece mantıklı olur? • Ortalama, değişkenin aralık veya oran ölçekli olmasını gerektirir. TEMEL İSTATİSTİK NOTASYONLAR Toplama Sembolü: İstatistikte toplama sembolü işareti ile gösterilmekte olup, istatistik formüllerin yazılmasında büyük kolaylık sağlar. Örneğin; x1 + x2 + ... + x n terimi kısaca; şeklinde de ifade edilebilir. Toplama Sembolünün Özellikleri: 1) Xi ve Yi değişkenlerinin toplamı, bunların ayrı ayrı toplamlarına eşittir. TEMEL İSTATİSTİK NOTASYONLAR 2) Xi ve Yi değişkenlerinin farklarının toplamı, bunların ayrı ayrı toplamlarının farklarına eşittir. TEMEL İSTATİSTİK NOTASYONLAR 3) Xi ve Yi değişkenlerinin çarpımlar toplamı, bu değişkenlerin ayrı ayrı toplamlarının çarpımına eşit değildir. TEMEL İSTATİSTİK NOTASYONLAR 4) k sabit bir sayı ise, sabit sayı toplama sembolünün önünde yazılabilir. TEMEL İSTATİSTİK NOTASYONLAR 5) k sabit bir sayı olmak üzere,
Benzer belgeler
İstatistik Dersi Ders Notları
gösterilebilen, sınıflara ayrılan verilerdir.
Sıralanabilen Nitel Veri (Ordinal): Belirli bir miktar
belirtmeyen, bir sıra ya da dereceye göre elde edilen
verilerdir. Öğrencilerin başarı durumu: ...
Slayt 1 - anadolu üniversitesi eczacılık fakültesi
Nicel (Kantitatif) Değişkenler
Birimlerin ölçüm ve tartım sonucu değerleri saptanan sayısal
özelliklerini belirten değişkenlerdir. Bu değişkenler değerleri,
mekanik ve elektronik araçlara sayısal o...