Sayısal yetenekler

İstatistiksel Analiz: Korelasyonları Anlamak

En yaygın istatistiksel testlerden biri, iki değişken arasında bir bağlantı olup olmadığını görmektir # yani, bir değişkeni değiştirirseniz, diğeri de değişir mi? Değişkenler arasındaki bu bağlantı türü, korelasyon veya ilişki olarak bilinir.

Bu tür ilişkilendirme hakkında bilgi yararlıdır, çünkü bu, bir değişkenin değişmesi durumunda diğerinin de değişeceğini bildiğiniz anlamına gelir. Daha sonra değişkenlerden birini ölçebilir ve bunu diğerinin seviyesini tahmin etmek için kullanabilirsiniz.

Elbette bununla ilgili uyarılar var: ilişkinin bir veya diğer değişkenin daha yüksek veya daha düşük değerlerinde değişebileceğinin ve sonucunuzun mutlak değil yalnızca bir tahmin olacağının farkında olmanız gerekir. Bununla birlikte, değişkenlerinizden birinin nesnel olarak ölçülmesi çok daha zor olduğunda bu yararlı olabilir.

Nesnel ve öznel veriler arasındaki fark hakkında daha fazla bilgi için Veri Türleri sayfamıza bakın.

İlişkilendirme Tanımlama

Değişkenler arasındaki ilişkiler genellikle olumlu veya olumsuz ve zayıf veya güçlü olarak tanımlanır.

  • Olumlu bir ilişki, bir değişken için yüksek puanların diğeri için yüksek puanlarla oluşma eğiliminde olduğu anlamına gelir.

  • Negatif bir ilişki, bir değişken için yüksek puanların diğeri için düşük puanlarla oluşma eğiliminde olduğu anlamına gelir.

  • Bir değişkenin puanı diğerinin puanını tahmin etmediğinde hiçbir ilişki yoktur.

  • Güçlü bir ilişki, birindeki küçük bir değişikliğin bile diğerindeki bir değişiklikle ilişkilendirilmesidir.

  • Zayıf bir ilişkilendirme ile, diğerinde bir değişiklik görmeden önce birinde daha büyük bir değişiklik gerekebilir veya ilişkilendirmeyi görmek için çok daha fazla veriye ihtiyacınız olabilir.

Korelasyon ve Nedensellik Arasındaki Fark

Bir korelasyon, iki değişken arasındaki bir ilişkidir. Birinin diğerine neden olduğu anlamına gelmez.

Her ikisi de tamamen farklı bir şeyden kaynaklanıyor olabilir veya basitçe bir özelliği gösteren insanların diğerini göstermesi olabilir.

Örneğin, internetten market alışverişi yapanların mağazadan alışveriş yapanlardan daha fazla hazır yemek satın aldığını varsayalım. Bu nedenle ikisi arasında pozitif bir korelasyon vardır.

Ancak, online satın alma eyleminin daha fazla hazır yemek satın almaya neden olması pek olası değildir. İnternetten alışveriş yapanların zamanının kısa olması ve bu nedenle daha fazla hazır yemek satın almaları veya muhtemelen daha genç insanların hem internetten alışveriş yapma hem de hazır yemek satın alma olasılıkları daha yüksektir.

Bir korelasyon örneği ama nedensellik değil: Leylek manzaraları

İsveç’te leylek görülmeleri doğum oranıyla ilişkilidir. Başka bir deyişle, doğum oranı daha yüksek olan şehirler, daha fazla leylek görüldüğünü bildiriyor.

Bu, eski masalların doğru olduğu ve leyleklerin gerçekten bebek doğurduğu anlamına mı geliyor?

Hayır.

Her ikisiyle bağlantılı bir faktör var: kasabanın büyüklüğü. Daha büyük şehirlerin nüfusu daha fazladır, bu nedenle doğum oranı daha yüksektir. Ayrıca leylek görme ihtimali olan daha çok insanı ve leyleklerin çatılarda yuva yapabileceği daha çok evleri var.

Bir Dernek Görmek

Bir ilişkilendirmeyi kontrol etmenin en iyi yollarından biri, x ve y eksenlerindeki iki değişkenli verilerin dağılım grafiğini çizmektir. Genel olarak, bir ilişki varsa, onu grafikten göreceksiniz.

Doğrudan İlişkiler (Doğrusal veya Düz Hat İlişkilendirmeleri)

Bu grafikte, x eksenindeki (altta) değerler arttıkça, y eksenindeki değerler de artar. Bu nedenle iki değişken arasında pozitif bir ilişki vardır. Ayrıca ‘x’in y ile doğru orantılı olduğunu’ söyleyebiliriz.

Bu grafikte, ters etkiyi görebilirsiniz: x eksenindeki değerler arttıkça, y eksenindeki değerler azalır. Dolayısıyla bu grafik, iki değişken arasında negatif bir ilişki (veya ters orantılı bir ilişki) gösterir.

Bu grafiklerin her ikisi de doğrusal veya ‘düz çizgi’ ilişkileri olarak bilinenleri gösterir: bir grafik üzerine çizildiğinde, değişkenler arasındaki ilişki düz bir çizgi gösterir (aşağı yukarı). ‘En uygun çizgi’ veya ‘eğilim çizgisi’ olarak bilinenleri ekleyebilirsiniz ve düz olacaktır:

İlişki olmadığını nasıl anlarsın? Her iki değişkenin de değişmesine veya yalnızca birinin değişmesine bağlı olarak grafikler oldukça farklı görünür.

Bu grafik, iki değişken arasında bir ilişki olmadığını gösterir: biri değişirken diğeri de değişir, ancak herhangi bir belirli modelde değil. Trend çizgisi (aşağı yukarı) yataydır. Bir değişkenin değiştiği ancak diğerinin aynı kaldığı grafikler de görebilirsiniz, örneğin:

Diğer İlişkileri Tanımlama

Bir grafik çizmek, tuhaf bir ilişki olup olmadığını belirlemenize de yardımcı olacaktır. Bu, örneğin, aşağıda gösterildiği gibi, verilerin bir kısmı için pozitif ve geri kalanı için negatif bir ilişkinin olduğu durumları içerebilir. Bu, bir testte korelasyon olmadığını gösterecektir, ancak bu durumda açıkça bir tür ilişki vardır.

Bu örnek, “ters U” ilişkisi olarak bilinir.

Bunun tersi, “U-biçimli” bir ilişki olarak bilinir:

Bu tür ilişkilerin her ikisi de (genel olarak) ikinci dereceden bir denklem kullanılarak tanımlanabilir (ve bunlar hakkında daha fazla bilgi için Eşzamanlı ve İkinci Dereceden Denklemler sayfamızı okumak isteyebilirsiniz).

Üstel ilişki olarak bilinen şeyi de görebilirsiniz:

Burada, x’in değerindeki her bir artış (artış) için, y’nin değeri iki katına çıkar.

Dernekler için İstatistiksel Testler

Burada kullanılan verilerin tümü oldukça açıktır: grafikler iki değişken arasında net bir ilişki olduğunu göstermektedir. Bununla birlikte, gerçek hayat verileri nadiren bu kadar kullanışlıdır.

Bu nedenle, iki değişken arasında ilişki olup olmadığını belirlemek için istatistiksel testleri kullanabilirsiniz.

Test seçiminiz, veri türüne bağlı olacaktır (ve veriler arasındaki ayrımlar hakkında daha fazla bilgi için Veri Türleri sayfamıza bakın).

Sürekli, kategorik veya sıralı veri kullanmanıza bağlı olarak belirli testler vardır.

  • Kategorik veriler için ki-kare testini kullanırsınız (ayrıca χ2 yazılır).

    Bu, değişkenlerin bağımsız olup olmadığını ölçer. Ancak, size ilişkinin türü hakkında hiçbir şey söylemeyecek, sadece bir ilişki olduğunu söyleyecektir.

  • Sürekli veriler için en yaygın test, Pearson ürün-moment korelasyonudur.

    Bu, iki değişken arasındaki bir ilişkinin gücünü ve yönünü ölçer. Yalnızca ilişkinin doğrusal (düz çizgi) olduğu yerlerde kullanılabilir, bu nedenle u şeklinde bir dağılım grafiğiniz varsa, kullanılamaz. Bu durumda, verileri bölümlere ayırabilir veya değerlerinizi sıralayabilir ve bunun yerine bir sıra korelasyonu kullanabilirsiniz.

    Verilerinizin de yaklaşık olarak normal şekilde dağıtılması gerekir (bununla ilgili istatistiksel dağılımlar sayfamızda daha fazla bilgi bulabilirsiniz).

    Bir Pearson korelasyon testi kullanmadan önce, aykırı değerleri de kaldırmanız gerekir (ilk olarak bir dağılım grafiği kullanmak için başka bir neden). Aşağıdaki diyagram, bir Pearson analizi çalıştırmadan önce kaldırılması gereken bir ana aykırı değere sahip (kırmızı halkalı) bir dağılım grafiğini göstermektedir.

  • Dereceler için Kendall sıra sırası korelasyonunu veya Spearman’ın sıra korelasyonunu kullanın.

İstatistiksel Korelasyon Testi Gerçekleştirme

Bu testlerin her biri için temel prosedür aynıdır.

Seçtiğiniz teste özgü standart bir formül kullanarak ve gerektiğinde değişkenlerinizi formüle ekleyerek bir ‘test istatistiğinin’ değerini hesaplarsınız. Daha sonra bu test istatistiğini, istatistiksel bir tablodan elde ettiğiniz istenen anlamlılık düzeyini elde etmek için gereken değerle karşılaştırırsınız. Bu, iki değişkenin bir şekilde ilişkili olma ihtimalinin ne kadar olduğunu gösterir.

Önem ve Güven Aralıkları sayfamızda önemin anlamı hakkında daha çok şey var.

İstatistiksel Yazılım Kullanma

İstatistiksel testleri kullanarak ilişkileri ölçmek karmaşık görünmektedir. Bununla birlikte, pratikte nispeten basittir. El ile yapıyorsanız, standart formüller kullanırsınız ve test istatistiğinizi standart ve yaygın olarak bulunan istatistiksel tablolardan elde edilen değerlerle karşılaştırırsınız. Bununla birlikte, çoğu araştırmacı, tüm işi sizin için yapan istatistiksel yazılım paketleri kullanır. Tüm test istatistiklerini hesaplayacaklar ve hatta bazıları önem düzeyini vurgulayacak.

İlgili Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu