İstatistik Bilmeyenler İçin Temel İstatistik Terimleri-1

Burak Doğrul
6 min readMar 17, 2021

İstatistik eğitimi almamış veya daha önce istatistik terimlerini öğrenmemiş olanlar için olabildiğince basit şekilde bazı terimleri dilim döndüğünce açıklamaya çalışacağım. Umarım faydalı olur.

Popülasyon/Ana kütle ( Population )

Bir veya birden fazla özellik için araştırma yapılmak istenen bütün elemanların içinde olduğu kümedir.

Örneğin bir siyasi parti oy oranın öğrenmek ve bu konuda anket yaptırmak istiyor. Oy verme şartlarını sağlayan kişilerin tamamı bizim popülasyonumuzdur. Bir bilgisayar firması yeni bir ürün çıkarmak istiyor ve pazar araştırması yapmak istiyor. Burada tüm bilgisayar sahipleri ve bilgisayara sahip olabilecek potansiyel kişilerin tamamı popülasyondur. Tabi ki böyle bir anketi yapmak çok masraflı ve zaman açısından sorunludur. Bu yüzden hemen aşağıda bahsedeceğimiz örneklem konusu devreye giriyor.

Örneklem ( Sample )

Bir popülasyonun/ana kütlenin/evrenin tüm özelliklerini taşıyan/yansıtan ve hakkında bilgi edinmemizi sağlayan ana kütle parçasıdır. Yukarıdaki örnekler üzerinden gidersek oy verme şartını yerine getiren kişiler içinden istatistiksel yöntemler ile çekilmiş belirli sayıdaki kişi veya diğer örnekteki bilgisayar sahipleri ve potansiyel bilgisayar alıcıları içerisinden çekilmiş bir grup ile bu anketi yapmak ve sonuca ulaşmak hem daha kolay hem de daha az maliyetlidir. Çekilen örneklemin ana kütlenin tüm özelliklerini yansıtması çok kritik öneme sahiptir.

Gözlem Birimi ( Observation Unit )

Bir araştırmada, araştırma sorununun taşıyıcısı olan birey veya verilerden her biridir. Yukarıdaki örnekler üzerinden devam edelim. Ana kütle içerisinden bir örneklem seçtik ve bu örneklemde değer taşıyan bir kişi bizim gözlem birimimizdir. Örneğin anket çalışması yaparken Ordu’da yaşayan birisini seçiyoruz bu bizim gözlem birimimiz. Gözlem birimimiz içerisinde birçok farklı değeri barındırıyor olabilir.

Frekans ( Frequency )

Kısaca bir gözlemde tekrar edilen sayılardır. Daha iyi anlamak açısından bir frekans tablosuna bakalım. Örneğin yukarıda bahsettiğimiz bir anketin 128 kişiyle yapıldığını düşünelim ve bu anket sonucunda anket yapılan kişilerin yaş aralıklarına bakalım. Her bir yaş aralığındaki kişi sayısı bu yaş aralığının frekansıdır. 18–35 yaş aralığının frekansı 18, 45–55 yaş aralığının frekansı 34’dür diyebiliriz.

Değişken ( Variable )

Her bir gözlemin içerisinde taşıdığı, birimden birime farklılık gösteren değerlerdir. Anketimizi yaptık ve artık sonuçlara daha detaylı bakmaya başladık diyelim. Buradaki yaş, eğitim düzeyi, medeni durum ve gelir bizim değişkenlerimizdir.

Değişken Türleri ( Variable Types )

Kategorik/Nitel/Kalitatif Değişken ( Qualitative Variable )

Belli bir özelliğe göre kategorilere ayrılabilen değişkenlerdir. Sınıflandırılabilir(nominal) ve sıralanabilir(ordinal) olmak üzere ikiye ayrılır.

Sınıflandırılabilir Değişken ( Nominal Variable )

Kategorileri homojen, aralarında sayısal bir ilişki olmayan sıralanmamış değişkenlerdir. Örnek vermek gerekirse erkek/kadın, evli/bekar/boşanmış, doğum yeri için şehirler. Buradaki en önemli nokta ise bu kategorilerin sıralanamıyor olmasıdır. Örneğin evli bekardan üstün ya da altta değildir.

Sıralanabilir Değişken ( Ordinal Variable )

Belirli bir özelliğe göre sıraya dizilebilen aralarında ilişki olan değişkendir. Örnek vermek gerekirse eğitim düzeyi (ilkokul/lise/lisans/yüksek lisans/doktora) ya da rütbeler olabilir.

Sayısal/Nicel/Kantitatif Değişken ( Quantitative Variable )

Belirli bir özellik açısından sayısal olarak ifade edilen, miktar ifade eden veridir. Sürekli ya da kesikli olabilir.

Aralık ( Interval )

Mutlak sıfır noktası olmayan ardışık iki birim arasındaki uzaklığın aynı olduğu ölçektir. Mutlak sıfırın olmaması nedir peki. Örneğin “Celcius” olarak değerlendirdiğimizde bugün hava 0(sıfır) derece dediğimiz zaman bu bir yokluğu ifade etmez yani keyfi bir sınırdır.1 derece ve 2 derece arasındaki fark 30 derece ile 31 derece arasındaki aralığa eşittir. 10 ila 30 derece arasındaki artış 30 ile 40 derece arasındaki artışın iki katı yorumunu yapabiliriz ama 40 derece 20 derecenin iki katı diyemeyiz Celcius için. Kelvin için diyebiliriz bunun için ise hemen Oran(ratio) konusuna geçiyoruz.

Oran ( Ratio )

Sıfır değeri başlangıç değeri olan, birimlerin farklılıklarını ne kadar büyük ya da ne kadar küçük olduklarını ifade eden ölçektir. Sıfır değeri yokluğu ifade etmesi gerekir. Örneğin 0(sıfır) kilo bir yokluğu ifade eder ve bu keyfi seçilmiş bir değer değildir.

Merkezi Eğilim Ölçüleri ( Measures of Central Tendency )

Veri grubunu temsil eden değerlerdir. En çok kullanılan merkezi eğilim ölçüleri: aritmetik ortalama, mod, medyan ve kartillerdir. Ortalama ve mod değerleri yanıltıcı olmakla birlikte göz önünde bulundurulması gerekirken en güvenilir merkezi eğilim ölçüleri medyan ve kartil değerleridir. Değerlerin birbirine eşit olması dağılımın simetriliğini, değerlerin birbirinden farklı olması dağılımın çarpıklığını bize gösterir.

Simetrik dağılım ( mod = medyan = ortalama )
Simetrik dağılım ( mod = medyan = ortalama )
Sağa Çarpık ( Aritmetik ortalama > medyan > mod )
Sola çarpık ( mod > medyan > aritmetik ortalama )

Aritmetik Ortalama ( Mean )

Bir ölçüm setindeki değerlerin toplanıp kaç adet değer varsa bu değere bölümüne eşittir. Aşağıdaki gibi 15 kişilik bir sınıfta alınan notların olduğunu varsayalım.

Notların toplamı (20+25+25+40+40+40+40+40+45+50+55+60+65+85+90) : 720

Öğrenci Sayısı: 15

Aritmetik Ortalama (Notların Toplamı/Öğrenci sayısı) : 720 / 15 = 48

Mod ( Mode )

Bir ölçüm setinde en çok tekrar eden değere verilen isimdir. Yukarıdaki gibi 15 kişilik bir sınıfta alınan notların elimizde olduğunu varsayalım. Alınan notlara baktığımız zaman;

20 alan 1 kişi, 25 alan 2 kişi, 40 alan 5 kişi, 45 alan 1 kişi, 50 alan 1 kişi, 55 alan 1 kişi, 60 alan 1 kişi, 65 alan 1 kişi,85 alan 1 kişi ve 90 alanın 1 kişi olduğunu görüyoruz. İşte buradaki 40 değeri veri setimizin mod yani en çok tekrar eden değeridir. Mod değeri bize dağılımın çarpıklığı hakkında bilgi verir.

Medyan/Ortanca ( Median )

Bir ölçüm setini küçükten büyüğe doğru sıraladığımızda tam ortadaki değere verilen isimdir. Ortanca olarak da geçer. Eğer ölçüm setindeki gözlem sayısı tek ise (örneğin 15 ise 8.değer) zaten ortadaki kolayca tespit edebiliyoruz. Eğer gözlem sayısı çift ise ortadaki sayıların aritmetik ortalaması alınır. Şimdi aynı notları bir de küçükten büyüğe doğru sıralayalım ve iki eşit parçaya ayıralım. Ayırdığımızda görüyoruz ki 8. Değer olan 40 değeri medyan(ortanca) değerimiz.

Daha iyi anlaşılması açısından bir de çift sayı olduğunda ne yapmamız gerektiğine bakalım. Bunun için veri setimizin içine 95 alan bir öğrenci ekliyoruz. Ekledikten sonra veri setimizi iki parçaya ayırıyoruz ve ortada kalan iki değerin aritmetik ortalamasını alıyoruz. Yani medyan(ortanca) değerimiz 42,5. Medyan değeri bize dağılımın çarpıklığı hakkında bilgi verir

Kartiller/Dörtte birlik ( Quartiles )

Bir veri setini küçükten büyüğe doğru sıraladığımızda veri setini 4 parçaya ayıran değerlere denir. Önce bir nasıl bulunduğuna bakalım sonra bir örnekle açıklayalım.

Veri seti gözlem sayısı tek ise:

15 kişilik bir sınıfta yaptığımız örneğe bakacak olursak;

Q1 = 1/4 (15+1) = 4.terim = 40

Q3 = 3/4 (15+1) = 12.terim = 60

Q2 = Q3 — Q1 = 12.terim — 4.terim = 8.terim = 40

Veri seti gözlem sayısı çift ise:

16 kişilik bir sınıfta yaptığımız örneğe bakacak olursak;

Q1 = 4.terim ile 5.terimin aritmetik ortalaması = (40+40) / 2 = 40

Q3 = 12.terim ile 13.terimin aritmetik ortalaması = (60+65) / 2 = 62,5

Q2 = 8.terim ile 9.terimin aritmetik ortalaması = (40+45) / 2 = 42,5

Serinin devamı gelecektir. Okuduğunuz için teşekkür ederim.

--

--