Sayısal yetenekler

Basit İstatistiksel Analiz

Nicel verileri topladıktan sonra, çok sayıda numaraya sahip olacaksınız. Şimdi verilerinizi anlamlandırmak ve verilerinizden bazı çıkarımlar yapmak için bazı istatistiksel analizler yapma zamanı.

Kullanabileceğiniz çok çeşitli olası teknikler vardır.

Bu sayfa, verilerinizi özetlemek için en yaygın tekniklerden bazılarının kısa bir özetini sağlar ve her birini ne zaman kullanacağınızı açıklar.

Verileri Özetleme: Gruplama ve Görselleştirme

Herhangi bir veriyle yapılacak ilk şey onu özetlemektir, bu da onu hikayeyi en iyi anlatacak şekilde sunmaktır.

Başlangıç ​​noktası genellikle ham verileri kategoriler halinde gruplamak ve/veya görselleştirmektir. Örneğin, yaşa göre farklılıklarla ilgilenebileceğinizi düşünüyorsanız, yapmanız gereken ilk şey muhtemelen verilerinizi yaş kategorileri, belki on veya beş yıllık parçalar halinde gruplamaktır.

Özetlemek için kullanılan en yaygın tekniklerden biri grafikler, özellikle her veri noktasını sırayla gösteren çubuk grafikler veya daha geniş kategoriler halinde gruplandırılmış çubuk grafikler olan histogramlar kullanmaktır.

Aşağıda, dört kategoriye göre gruplandırılmış üç veri kümesi kullanan bir örnek gösterilmiştir. Bu, örneğin, 20-29, 30-39, 40-49 ve 50-59 yaş kategorilerine göre gruplandırılmış ‘erkekler’, ‘kadınlar’ ve ‘diğer/cinsiyet belirtilmemiş’ olabilir.

Histograma bir alternatif, her veri noktasını çizen ve bunları bir çizgi ile birleştiren bir çizgi grafiktir. Çubuk grafikteki ile aynı veriler, aşağıdaki çizgi grafikte gösterilir.

Okuldan hatırlayabileceğiniz gibi elle bir histogram veya çizgi grafiği çizmek zor değildir, ancak verileri bir tabloya girdikten sonra elektronik tablolar hızlı ve kolay bir şekilde bir tane çizecek ve sizi herhangi bir sorundan kurtaracaktır. Hatta süreç boyunca size rehberlik edecekler.

Verilerinizi Görselleştirin

Grafik çizmekle ilgili önemli olan şey, size verilerin hemen bir ‘resmini’ vermesidir. Bu önemlidir, çünkü verilerinizin birlikte mi gruplandırıldığını, yayıldığını, yüksek veya düşük değerlere yöneldiğini veya merkezi bir nokta etrafında kümelendiğini size hemen gösterir. Ayrıca, analizden çıkarmak isteyebileceğiniz ‘uç değerlere’, yani çok yüksek veya çok düşük veri değerlerine sahip olup olmadığınızı veya en azından bunların doğru olup olmadığını kontrol etmek için yeniden ziyaret edip etmediğinizi de gösterecektir.

Daha fazla analize başlamadan önce, sadece verilerinize göz atmak için her zaman bir grafik çizmeye değer.

Gruplanmış verileri, bunun gibi bir pasta grafikte de görüntüleyebilirsiniz.

Pasta grafikler en iyi şekilde, her bir grubun göreceli boyutuyla ve toplamın hangi oranının her kategoriye uyduğuyla ilgilendiğinizde kullanılır, çünkü hangi grupların daha büyük olduğunu çok açık bir şekilde gösterirler.

Farklı grafik ve çizelge türleri hakkında daha fazla bilgi için Şemalar ve Grafikler sayfamıza bakın.

Konum Ölçüleri: Ortalamalar

Ortalama, test ettiğiniz şeyin etkisinin boyutu, başka bir deyişle, büyük ya da küçük olup olmadığı hakkında size bilgi verir. Üç ortalama ölçüsü vardır: ortalama, medyan ve mod.

Her birinin hesaplanması hakkında daha fazla bilgi ve hızlı bir hesap makinesi için Ortalamalar sayfamıza bakın.

Çoğu insan ortalama derken, ortalamadan bahsediyorlar. Elde edilen tüm veri değerlerini kullanması ve daha ileri istatistiksel analizler için kullanılabilmesi avantajına sahiptir. Ancak, atipik olarak büyük veya küçük değerler olan ‘aykırı değerler’ tarafından çarpıtılabilir.

Sonuç olarak, araştırmacılar bazen bunun yerine medyanı kullanır. Bu, tüm verilerin orta noktasıdır. Ortanca uç değerler tarafından çarpıtılmaz, ancak daha ileri istatistiksel analizler için kullanılması daha zordur.

Mod, bir veri kümesindeki en yaygın değerdir. Daha fazla istatistiksel analiz için kullanılamaz.

Ortalama, medyan ve mod değerleri aynı değildir, bu nedenle hangi ‘ortalamadan’ bahsettiğinizin net olması gerçekten önemlidir.

Yayılma Ölçüleri: Aralık, Varyans ve Standart Sapma

Araştırmacılar genellikle verilerin yayılmasına, yani verilerin tüm olası ölçüm ölçeğinde ne kadar geniş bir alana yayıldığına bakmak isterler.

Bunun için sıklıkla kullanılan üç önlem vardır:

Aralık, en büyük ve en küçük değerler arasındaki farktır. Araştırmacılar genellikle verilerin orta yarısının aralığı olan çeyrekler arası aralığı, değerlerin %25, ​​alt çeyreklik, %75’e kadar üst çeyreklik olarak aktarırlar (ortanca %50 değeridir). Çeyrekleri bulmak için medyanla aynı prosedürü kullanın, ancak orta nokta yerine çeyrek ve üç çeyrek noktasını alın.

Standart sapma, ortalamanın etrafındaki ortalama yayılımı ölçer ve bu nedenle ortalamaya göre ‘tipik’ uzaklık hissini verir.

Varyans, standart sapmanın karesidir. Bunlar şu şekilde hesaplanır:

  • her bir değerin ortalamadan farkının hesaplanması;
  • her birinin karesini almak (ortalamanın üstünde ve altında olanlar arasındaki herhangi bir farkı ortadan kaldırmak için);
  • farkların karelerinin toplanması;
  • öğe sayısı eksi bire bölünerek.
  • Bu, varyansı verir.

    Standart sapmayı hesaplamak için varyansın karekökünü alın.

    Eğim

    Eğri, veri kümesinin ne kadar simetrik olduğunu veya daha yüksek değerlere veya daha düşük değerlere sahip olup olmadığını ölçer. Daha düşük değerlere sahip bir numune negatif olarak çarpık, daha yüksek değerlere sahip bir numune ise pozitif olarak çarpık olarak tanımlanır.

    Genel olarak konuşursak, örnek ne kadar çarpık olursa, ortalama, medyan ve mod o kadar az çakışacaktır.

    Daha Gelişmiş Analiz

    Ortalama veya medyan gibi bazı temel konum değerlerini hesapladıktan ve aralık ve varyans gibi yayılma düzeyini belirledikten sonra, daha gelişmiş istatistiksel analize geçebilir ve verilerde kalıplar aramaya başlayabilirsiniz.

    İlgili Makaleler

    Bir cevap yazın

    E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

    Başa dön tuşu