İstatistik Nedir? Temel İstatistik Kavramlar Nelerdir?

Kardelen Erdem
3 min readJan 18, 2021

İstatistik Nedir?

İstatistik geçmişte ve günümüzde toplanan tüm verilerin anlamlı bilgiler haline getirilerek çeşitli alanlarda kullanılmak üzere verileri toplama, düzenleme ve verileri anlamlandırma işlemidir. Başka bir deyişle belirli programlar ve tekniklerle verinin anlamla hale getirilmesi, problemin modellenmesi ve gelecek hakkında yorumda bulunulması işlemlerinin genel ismidir.

Peki bahsettiğimiz bu veri nedir?

Veriler nerede bulunur?

İnsanlar nasıl veri üretir?

Tüm bu soruları kısaca yanıtlayalım. Veri bakıldığında çoğunlukla anlaşılmayan farklı türde ve farklı biçimlerde bulunan büyük karmaşık bilgi topluluğudur. Veriler aslında çevremizde ve her anımızda mevcutturlar ancak bizler çoğunlukla ürettiğimiz ve çevremizde olan bilgi topluluklarının farkında olmayız. Farkında dahi olmadığımız verileri üretmemiz bizler için çok kolay. Örnek verecek olursak hepimizin elinde akıllı telefonlarımız, tabletlerimiz, bilgisayarlarımız mevcut ve tüm akıllı cihazlarımız ne zaman nerede bulunduğumuzu hangi sosyal paylaşım sitesinde kaç dakika vakit geçirdiğimizi günün hangi saatlerinde daha aktif olduğumuzu yahut günde kaç adım attığımızı ve bunun gibi bizim farkında dahi olmadığımız birçok bilgiyi kayıt altında tutuyor. Biz bu verileri her gün her saat yapıyoruz bunlar bizler için önemli olmasalar da büyük teknoloji ve yazılım şirketleri için hatta insan davranışlarını inceleyen sosyologlar için büyük önem arz ediyor. Her kurum, kuruluş ya da birey araştırma konusuna göre bizlerin oluşturduğu karmaşık veri yığınlarını alıyor istatistikçiler ve belirli programlar aracılığıyla o karmaşıklığın içinden işine yarayan bilgiyi topluyor ve bilgiyi modelleyip yorumlamak için kullanıyor.

TEMEL İSTATİSTİK KAVRAMLARI

Gözlem Birimi (Deney/İstatistik Birimi):Üzerinde ölçme yapılan canlı ya da cansız olgulardır.

Örnekleme Birimi: Örnekleme seçilen birimdir, bir veya daha fazla gözlem birimi içerebilir.

Kitle (Yığın/ Popülasyon /Evren): Üzerinde araştırma yapılan birimler topluluğudur. Somut ve soyut kitle olmak üzere ikiye ayrılır.

  • Somut Kitle: Kitledeki örnekleme birimlerinin bir listesi (çerçeve) mevcutsa somuttur.

Örnek verecek olursak 2020 yılında Gazi Üniversitesinde öğrenim gören öğrenciler.

NOT: Bir çerçevenin oluşabilmesi için coğrafik ve zamansal sınırların belirtilmiş olması gereklidir.

  • Soyut Kitle: Bir liste oluşturulamıyorsa kitle soyuttur. Kitle soyutsa örnekleme yapılır.

Örnek: Denizdeki balıklar, yds sınavına girecek öğrenciler (çünkü burada zaman belirtilmemiş).

Örnekleme: Kitleyi temsil eden bir alt kümenin seçilmesi işlemi. Kitlenin içindeki her birim gözlem birimi olarak adlandırılır. Başka bir deyişle kitlenin içinden kitleyi temsil edecek şekilde bir alt küme seçilmesi işlemine örnekleme (örneklem) denilir. Örneklemin içindeki her birim ise gözlem (örnekleme) birimidir.

Parametre(Ǫ): Kitleden yani tüm yığından elde edilen değerlerdir.

İstatistik/Tahmin (Ǭ): Örneklemden bulunan değerlere istatistik denir.

  • İstatistikten parametreyi tahmin etme işi ‘Çıkarsama’dir.
  • Her farklı örneklemden bulunan tahmin (Ǭ) değerleri farklılık gösteririr. Bu farklı değerlerden bir dağılım ortaya çıkar istatistikçiler olarak bizler bu dağılımları bulmaya ve modellemeye çalışırız.

Değişken: Birimden birime farklılık gösteren ‘ölçülebilir’ özelliklere değişken adı verilir. Değişkenler hassaslıklarına göre 4 gruba ayrılır.

1)Sınıflama (Nominal): Veriler niteliksel olmalı ve kendi aralarında büyüklük küçüklük anlamında sınıflandırılamaz.

Örnek: cinsiyet

2)Sıralama (Ordinal): Nitel değişkenlerden oluşur ve aralarında sıralama yapılabilir.

Örnek: Eğitim Durumu

3)Eşit Aralıklı (İnterval): Nicel değişkenlerden oluşur. Mutlak sıfır noktası bulunmaz ve negatif değerler alabilir.

Örnek: sıcaklık, zaman

Mutlak sıfır noktası yoksa oransal (yüzdesel) işlemler yapılamaz.

4)Oransal (Oran / Ratio): Nicel değişkenlerden oluşur ve mutlak sıfır noktası vardır. Buradaki sıfır yokluğu ifade eder o yüzden negatif değerler alamaz.

Örnek: Para, Uzunluk

Veri Türleri

Değişken değerlerinin oluşturduğu yapıya veri denir. Veriler 3 kısımda incelenir.

1)Kesit Veri: Zamanın belli bir noktasında birden fazla gözlem biriminden toplanan veridir.

Örnek: İllere göre belirli bir andaki otomobil sayısı

Yani zaman sabit ama gözlem birimleri farklıdır.

2)Zaman Serisi: Farklı zaman noktalarında tek bir gözlemden toplanan veridir.

Örnek: mevsimlere göre işsizlik, aylara göre dondurma satışı

3)Panel (Karma) Veri: Farklı zaman noktalarında birden çok gözlemden toplanan veridir.

Örnek: Ankara’nın 4 semtindeki 5 aylık otomobil satışları

Otokorelasyon: Gözlemlerin kendi içinde ilişkili olma durumudur. Değişkenlerin ilişkili olma durumu ise çoklu doğrusallık (bağlantı) olarak adlandırılır. Değişkenler arasındaki bağımlılık bilgisi kovaryans ile ifade edilir.

NOT: Kovaryans bilgisini dikkate alarak kullanılan yöntemlere ‘Çok Değişkenli Yöntemler’ denir.

Tanımlayıcı İstatistik Araçları Nelerdir? Yazısına buradan ulaşabilirsiniz.

--

--