Sayısal yetenekler

İstatistiksel Analiz: Önem ve Güven Aralıkları

Herhangi bir istatistiksel analizde, tüm popülasyondan gelen veriler yerine bir örneklemle çalışmanız muhtemeldir. Bu nedenle sonucunuz tüm popülasyonu temsil etmeyebilir ve örnekleminiz çok iyi değilse aslında çok yanlış olabilir.

Bu nedenle, sonucunuzun doğru olduğundan ve sadece şans eseri oluşmadığından ne kadar emin olduğunuzu ölçmenin bir yoluna ihtiyacınız var. İstatistikçiler bunun için birbiriyle bağlantılı iki kavram kullanır: güven ve önem.

Bu sayfa bu kavramları açıklamaktadır.

İstatistiksel anlamlılık

İstatistikte önem terimi çok özel bir anlama sahiptir. Sonucunuzun tesadüfen meydana gelmemesinin ne kadar muhtemel olduğunu size söyler.

Diyagramda mavi daire tüm popülasyonu temsil etmektedir. Bir örnek aldığınızda, örnekleminiz tüm popülasyondan olabilir. Ancak, daha küçük olması daha olasıdır. Hepsi sarı çemberin içinde olsaydı, nüfusun oldukça büyük bir kısmını kaplamış olurdunuz. Bununla birlikte, şanssız da olabilirsiniz (veya örnekleme prosedürünüzü kötü tasarlamış olabilirsiniz) ve yalnızca küçük kırmızı daire içinden örnek alabilirsiniz. Bu, örnekleminizin tüm popülasyonu temsil edip etmediği konusunda ciddi sonuçlar doğuracaktır.

Nüfusun daha fazlasını kapsamanızı sağlamanın en iyi yollarından biri, daha büyük bir örneklem kullanmaktır. Örnek boyutunuz, sonuçlarınızın doğruluğunu büyük ölçüde etkiler (ve bununla ilgili daha fazla bilgiyi Örnekleme ve Örnek Tasarım sayfamızda bulabilirsiniz).

Bununla birlikte, başka bir unsur da doğruluğu etkiler: popülasyonun kendi içindeki varyasyon. Verilerinizin yayılma ölçülerine bakarak bunu değerlendirebilirsiniz (ve bununla ilgili daha fazla bilgi için, Basit İstatistiksel Analiz sayfamıza bakın). Daha fazla varyasyonun olduğu yerde, tipik olmayan bir numune seçme şansınız daha yüksektir.

Önem kavramı, basitçe örneklem büyüklüğünü ve popülasyon varyasyonunu bir araya getirir ve örnekleme hatası yapmış olma ihtimalinizin sayısal bir değerlendirmesini yapar: yani, örnekleminiz popülasyonunuzu temsil etmiyor.

Önem, sonuçlarınızın tesadüfen oluşma olasılığı olarak ifade edilir ve genellikle p değeri olarak bilinir. Bazı sonuçlar 0,10 ( %10) rapor etmesine rağmen, genellikle bunun belirli bir değerden düşük olmasını istiyorsunuz, genellikle 0,05 ( %5) veya 0,01 ( %1).

Önem Hesaplanıyor

Anlamlılığı hesaplamanın bir yolu, bir z-puanı kullanmaktır. Bu, standart sapma sayısı cinsinden bir veri noktasından ortalamaya olan mesafeyi açıklar (ortalama ve standart sapma hakkında daha fazla bilgi için, Basit İstatistiksel Analiz sayfamıza bakın).

Basit bir karşılaştırma için, z puanı aşağıdaki formül kullanılarak hesaplanır:

$$ z= frac {x # mu} { sigma} $$

(x) veri noktasıdır, ( mu) popülasyon veya dağılımın ortalamasıdır ve ( sigma) standart sapmadır.

Örneğin, bir oyun uygulamasının diğer oyunlardan daha popüler olup olmadığını test etmek istediğimizi varsayalım. Diyelim ki ortalama oyun uygulaması 110’luk bir standart sapma ile 1000 kez indirildi. Oyunumuz 1200 kez indirildi. Z puanı:

$$ z= frac {1200-1000} {110}=1,81 $$

Daha yüksek bir z puanı, sonucun şans eseri oluşma olasılığının düşük olduğunu gösterir.

Z puanınızı p değerine dönüştürmek için standart bir istatistiksel z tablosu kullanabilirsiniz. P değeriniz istediğiniz anlamlılık düzeyinden düşükse, sonuçlarınız anlamlıdır.

Z tablosunu kullanarak, oyun uygulamamızın z puanı (1.81), 0.9649’luk bir p değerine dönüşür. Bu, istediğimiz %5 seviyesinden (0,05) daha iyidir (çünkü 1−0,9649=0,0351 veya %3,5), bu nedenle bu sonucun anlamlı olduğunu söyleyebiliriz.

Z-skorunun aşağıdaki formül kullanılarak hesaplandığı bir popülasyondan bir örneklem için küçük bir fark olduğunu unutmayın:

$$ z= frac {(x- mu)} {( sigma/ sqrt n)} $$

burada x veri noktasıdır (genellikle örnek ortalamanız), µ popülasyon veya dağılımın ortalamasıdır, σ standart sapmadır ve √n örneklem büyüklüğünün kareköküdür.

Bir örnek bunu daha açık hale getirecektir.

Biyoloji öğrencilerinin diğer konularda çalışan akranlarından daha iyi not alma eğiliminde olup olmadıklarını kontrol ettiğinizi varsayalım. 40 biyologdan oluşan bir örneklem için ortalama test notunun 80, standart sapma 5 iken, o üniversite veya okuldaki tüm öğrenciler için 78 olduğunu fark edebilirsiniz.

$$ z= frac {(80-78)} {(5/ sqrt 40)}=2,53 $$

Z tablosunu kullanarak 2,53, 0,9943’lük bir p değerine karşılık gelir. 0.0054 elde etmek için bunu 1’den çıkarabilirsiniz. Bu %1’in altında, yani bu sonucun %1 düzeyinde anlamlı olduğunu ve biyologların bu üniversitedeki ortalama öğrenciye göre testlerde daha iyi sonuçlar elde ettiğini söyleyebiliriz.

Bunun, biyologların diğer konularda çalışanlardan daha zeki veya sınavlardan daha iyi geçtikleri anlamına gelmediğini unutmayın. Aslında bu, biyolojideki testlerin diğer konulardakinden daha kolay olduğu anlamına gelebilir. Önemli bir sonuç bulmak nedenselliğin kanıtı DEĞİLDİR, ancak incelemek isteyebileceğiniz bir sorun olabileceğini size söyler.

Hipotez Geliştirme ve Test etme sayfamızda örnek ortalamaların önemini test etme ve gruplar arasındaki farklılıkları test etme hakkında daha fazla bilgi var.

Güvenilirlik aralığı

Bir güven aralığı (veya güven düzeyi), gerçek değerin içinde bulunduğu belirli bir olasılığa sahip bir değerler aralığıdır.

Etkili bir şekilde, örneğinizin ortalamasının (örneklem ortalaması) örneğinizin alındığı toplam popülasyonun ortalamasıyla (popülasyon ortalaması) aynı olduğundan ne kadar emin olduğunuzu ölçer.

Örneğin, ortalamanız 12,4 ise ve %95 güven aralığınız 10,3-15,6 ise, bu, nüfus ortalamanızın gerçek değerinin 10,3 ile 15,6 arasında olduğundan %95 emin olduğunuz anlamına gelir. Başka bir deyişle, 12.4 olmayabilir, ancak çok farklı olmadığından makul bir şekilde eminsiniz.

Aşağıdaki şema bunu pratikte normal dağılımı izleyen bir değişken için göstermektedir (bunun hakkında daha fazla bilgi için İstatistiksel Dağılımlar sayfamıza bakın).

Bir güven aralığının kesin anlamı, deneyinizi birçok kez yapacak olsaydınız, bu deneylerden oluşturduğunuz aralıkların %95’inin gerçek değeri içereceğidir. Diğer bir deyişle, deneylerinizin %5’inde aralığınız gerçek değeri İÇERMEZ.

Şemadan %5 olasılıkla güven aralığının popülasyon ortalamasını (her iki tarafta %2,5’lik iki ‘kuyruk’) içermediğini görebilirsiniz. Başka bir deyişle, her 20 örnekten veya deneyden birinde, güven aralığı için elde ettiğimiz değer gerçek ortalamayı içermeyecektir: popülasyon ortalaması gerçekte güven aralığının dışında kalacaktır.

Güven Aralığını Hesaplamak

Bir güven aralığı hesaplamak, örnek değerlerinizi ve bazı standart ölçümleri (ortalama ve standart sapma) kullanır (ve bunların nasıl hesaplanacağı hakkında daha fazla bilgi için, Basit İstatistiksel Analiz sayfamıza bakın).

Bir örnekle anlamak en kolay yoldur.

40 kişilik bir grubun boyunu örneklediğimizi ve ortalamanın 159,1 cm ve standart sapmanın 25,4 olduğunu bulduğumuzu varsayalım.

Ortalamamızın tüm insanların boylarının makul bir tahmini olup olmadığını veya özellikle uzun (veya kısa) bir örnek seçip seçmediğimizi bulmalıyız.

Bir güven aralığını hesaplamak için bir formül kullanıyoruz. Bu:

$$ ortalama pm z frac {(SD)} { sqrt n} $$

SD=standart sapma ve n, gözlem sayısı veya örneklem büyüklüğüdür.

Z değeri, seçilen referans dağılımımız için istatistiksel tablolardan alınır. Bu tablolar, belirli bir güven aralığı için z değerini sağlar (örneğin, %95 veya %99).

Bu durumda, insanların boylarını ölçüyoruz ve nüfus yüksekliklerinin (genel olarak) normal bir dağılımı izlediğini biliyoruz (bunun hakkında daha fazla bilgi için İstatistiksel Dağılımlar sayfamıza bakın) Bu nedenle değerleri normal bir dağılım için kullanabiliriz.

%95 güven aralığı için z değeri, normal dağılım için 1,96’dır (standart istatistiksel tablolardan alınmıştır).

Yukarıdaki formülü kullanarak, %95 güven aralığı şu şekildedir:

$$ 159,1 pm 1,96 frac {(25,4)} { sqrt 40} $$

Bu hesaplamayı yaptığımızda, güven aralığının 151,23–166,97 cm olduğunu buluyoruz. Bu nedenle, nüfus ortalamasının bu aralığa düştüğünden %95 emin olduğumuzu söylemek mantıklıdır.

Güven Aralığınızı Değerlendirme

Genel bir kural olarak, küçük bir güven aralığı daha iyidir. Örneklem büyüklüğünüz arttıkça güven aralığı daralacaktır, bu nedenle her zaman daha büyük bir örnek tercih edilir. Örnekleme ve örnek tasarım sayfamızın açıkladığı gibi, ideal deneyiniz tüm popülasyonu içerecektir, ancak bu genellikle mümkün değildir.

Sonuç

Güven aralıkları ve önemi, istatistiksel sonuçlarınızın kalitesini göstermenin standart yollarıdır. Herhangi bir istatistiksel analiz gerçekleştirirken bunları rutin olarak rapor etmeniz beklenir ve genellikle kesin rakamları raporlamanız gerekir. Bu, araştırmanızın geçerli ve güvenilir olmasını sağlayacaktır.

İlgili Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu