5.3 Örnekleme Kavramları
Farklı örnekleme yöntemlerini tartışmadan önce bir dizi kavramı açıklamak, konunun geri kalanının daha iyi anlaşılması için iyi olabilir.
Evren:
Herhangi bir çalışmanın evreni, hakkında bilgi toplamak istediğim kişi, nesne ya da vakaların tamamından oluşur. Herhangi bir seçim anketinde bu Türkiye seçmenleriyken, Türkiye’de yaşayan Suriyelilerle ilgili bir çalışma yürütüyorsanız, burada evren bu kişilerin tamamından oluşur. Bizim çalışmalarımızdan örneklere bakarsak: Türkiye’de yaşayan gençler, Türkiye’de çalışan Ermenistan vatandaşları, mevsimlik tarım işçileri, çalışan çocuklar araştırma evreni olarak tanımlanmıştı. Doğal olarak araştırma evrenini araştırma sorumuz çerçevesinde belli kriterlerle sınırlamak mümkün.
Örneğin belli bir coğrafyayla sınırlamak; Çukurova Bölgesi’nde çalışmakta olan mevsimlik tarım işçileri, İstanbul’da çalışan Ermenistan vatandaşları gibi. Bu coğrafi sınırlama anlamına gelir. Seçim çalışmalarında “seçmen” olarak; gençlerle ilgili çalışmalarda “gençlik” olarak yaptığımız tanımlar ise yaş sınırlamalarına işaret eder, seçmenler 18 yaş ve üstünde olmak zorundayken, genç tanımı 15-24, 19-24 ya da 19-29 yaş dilimlerine işaret edebilir. Benzer bir biçimde 18 yaş altı çocuk olarak tanımlanır. Ancak araştırma sorumuz çerçevesinde farklı çocuk grupları evreni oluşturabilir. Yine yaş, engellilik durumu, coğrafi sınırlar, eğitim kademeleri, refakatsiz çocuklar gibi farklı alt kırılımlarla da tarif edilmiş bir evren olabilir.
Her durumda hangi evren tanımlanmışsa, çalışmanın bulguları da bu evreni temsil eder, yani o evrene genellenebilir. Araştırmanın evreni dışında bulunan bir coğrafya ya da yaş grubuna araştırma sonuçlarına dayanarak, çıkarım yapmak yanlış olur.
Evreni bir küme olarak düşünürsek her bileşenine eleman ya da birim adı veriyoruz. Her bir seçmen, genç, çocuk, geçici koruma statüsündeki Suriyeliler ya da mevsimlik tarım işçisi birer birim olarak tanımlanabilir.
Örnekleme Çerçevesi:
Örnekleme çerçevesi, araştırma evreninde yer alan ve ulaşmayı hedeflediğiniz bütün kişi ya da nesnelerin aslında var olmayan bir listesi olarak tanımlanabilir. İdeal bir dünyada bu listeler var olurdu ve erişebilirdik, ama değiliz. Bu açıdan en şanslı çalışmaların kamuoyu araştırmaları ya da seçim anketleri olduğunu söyleyebiliriz. Bu çalışmada evrenin tamamı seçmen listelerinde kayıtlı olur. Ancak nüfusa kaydolmanın, seçmen olarak da kaydolmak anlamına gelmediği bazı durumlar olabilir, bu tür durumlarda bu çalışmalarda dahi örnekleme çerçevesi tam olmaz.
Düşünelim, Türkiye’de geçici koruma altındaki Suriye vatandaşlarıyla bir araştırma çalışması yapmak istiyorsunuz. Örnekleminizin çerçevesi var mı? Bu kişilerin Göç İdaresi’nde kayıtlı olduğunu biliyoruz ama o kayıtlar bizim erişebileceğimiz kayıtlar değil. Coğrafi dağılıma dair kabaca istatistiksel verilere sahibiz, ancak her ilde kaç Suriye vatandaşı olduğunu bilsek bile tam olarak ilçelere ya da mahallelere dağılımı bilmiyoruz. Bu açıdan eksik bir örneklem çerçevesine sahip olduğumuzu söyleyebiliriz, bu önemli bir handikap oluşturur.
Diyelim zorunlu göç ile Denizli’ye gelmiş kişilerle bir anket çalışması yürütmek istiyorsunuz. Örneklem çerçevemiz, yani bu kişilerin bir listesi var mı? Doğal olarak yok. Tıpkı Adana’da çalışmakta olan mevsimlik tarım işçilerinin, çocuk işçilerin, düzensiz göçmen olarak Türkiye’de yaşayan Ermenistan vatandaşlarının listelerinin olmadığı gibi.
Oysa üniversitemizdeki, okulumuzdaki ya da sınıfımızdaki öğrencilerin bir listesi var. Kütüphanemizdeki kitapların bir listesine erişebiliriz. Türkiye’deki köylerle ilgili bir çalışmada örneklem çerçevemiz hazır olabilir, o liste bulunuyor. Ama çalıştığımız çoğu konuda örneklem çerçevesi ideal tariften çok uzakta bu nedenle de örneklem tasarımında yaratıcılık gerekiyor.
Örneklem çerçevenizi oluştururken bazı kişileri ya da nesneleri örnekleminiz dışında bırakabilirsiniz. Örneğin herhangi bir anket çalışmasında, bir sonraki bölümde detaylı bir şekilde tartışacağımız üzere çok ileri yaşlardakilerle görüşme yapmak istemeyebilirsiniz, uzun bir anketin bilişsel yoruculuğunun sağlıklı bir yanıt almanızı engelleyecek olması nedeniyle. O zaman “80 yaş üstüyle görüşmeyeceğim” diyebilirsiniz. Ya da Suriyelilerle ilgili araştırmanızı yürütürken anketleri Türkçe yapmaya karar verdiğinizde, Türkçe bilmeyen ya da az anlayan Suriyelileri araştırma örneklemi dışında bırakmış olursunuz. Seçim anketlerinde hastanelerde anket yapamayacağınızdan dolayı, hastaları dışarıda bırakabilirsiniz; öte yandan lojman ve güvenlikli sitelerde de anket yapmak için içeriye girmeye dair zorluklar olmasında dolayı bu bölgeleri de örneklem çerçevesinin dışında tutabilirsiniz.
Örneklem çerçevenize kimi dahil edip kimi dışarıda bıraktığınızı açık bir biçimde belirttiğiniz müddetçe çok büyük bir sorun olmaz. Ancak araştırma çalışması sonrasında bulgularınızı genellerken; araştırma çerçevesinde yer almayan kişiler hakkında genelleme yapmamanız çok önemli, çünkü örneklem çerçeveniz bu kişileri içermiyor.
Örneklem:
Örneklem, sizin örneklem çerçevenizden araştırma çalışmanız için seçtiğiniz küçük bir grup insan ya da nesne. Niceliksel araştırmaların amacı bu örneklem istatistiklerinden evrenin parametreleri hakkında bir çıkarım yapmak olarak tanımlanıyor. Örnekleminizden elde ettiğiniz ortalama, standart sapma ya da oranlar; evrenin bu parametrelerini tahmin etmek için kullanılıyor.
Örneğin siz elinizdeki bir öğrenci listesinden bir örneklem çektiniz. Bu örneklem olasılıksal çekilmiş olursa bu öğrencilerin yaş ortalamaları olan sayı, örneğin 15 yaş, büyük bir olasılıkla, öğrenci listenizin tamamının yaş ortalamasına çok yakın olur. Arada oluşabilecek farka istatistiksel sapma ya da hata payı diyoruz, onu da hesaplamak mümkün. Ancak burada vurgulanması gereken örnekleme yönteminizin olasılıksal olması koşulu. Örneklem tanımlama sürecine “örnekleme” adı veriyoruz, örneklemenin nasıl tasarlandığı, geçerliliği olup olmayacağını belirliyor.
Merkezi Limit Teoremi:
Hangi evren olursa olsun, o evrenden bir küçük örneklem çekip, evren hakkında genelleme yapmamızı sağlayan matematiksel prensibe Merkezi Limit Teoremi (MLT) diyoruz. Eğer MLT olmasa, örneklemlerden yola çıkarak evren hakkında genelleme yapmamız mümkün olamaz. Onsekizinci yüzyılda keşfedilen bu teoremi şu şekilde özetleyebiliriz:
1) Herhangi bir evrenden -dağılımı ne olursa olsun- rassal olarak çekilen örneklemlerin ortalamalarının dağılımı, normaldir.
2) Herhangi bir evrenden rassal olarak çekilen örneklemlerin ortalaması, evrenin ortalamasına eşittir.
3) Herhangi bir evrenden rassal olarak çekilen örneklemlerin ortalamalarının standart sapması, evrenin standart sapmasının örneklem büyüklüğüne bölümüdür, buna da standart hata denir.
Özetle, MLT, dağılımı ne olursa olsun, herhangi bir evrenden çekilen bir örneklemin ortalamasının, evren ortalamasına belirli bir hata payı içinde yaklaşacağını söyler, böylelikle de elinizdeki rassal olarak çekilmiş örneklemden yola çıkarak, evrenin ortalaması hakkında tahminde bulunabilirsiniz.
İstatistik derslerinin ayrılmaz bir parçası olan MLT üzerine çok sayıda kaynak çevrimiçi olarak erişilebilir durumda, ayrıca kendi kendinize farklı dağılımlarda çalıştırıp sonuçlarını görebileceğiniz simülasyonlar da bulunuyor, bunlara erişebilirsiniz.
Öte yandan asıl akılda tutulması gereken MLT’nin geçerli olabilmesi için örneklemin rassal olarak çekilmesi gerektiğidir. Eğer bir örneklem rassal olarak çekilmemişse; MLT geçerli olmayacağından örneklemden genelleme yapmak mümkün olmaz. Bu da bizi örnekleme biçimlerine getiriyor.
Hata Payı:
MLT’nin bize sağlamış olduğu, küçük örneklemlerle büyük evrenler hakkında tahmin edebilme gücünün olumsuz denebilecek bir yönü de bu tahminin hata içermesi. Başka bir deyişle, ortalaması 100 standart sapması olan bir evrenden 10 kişilik bir örneklem çektiğinizde bir olasılıkla 95, bir olasılıkla 105 ortalamalı örneklemler çekebilirsiniz ama örneklemin ortalamaya yaklaşma olasılığı daha yüksek olur.
Nüfusun ortalamasını bilmediğiniz bir durumda, çekeceğiniz örneklemin belirli bir olasılıkla nüfus ortalamasına yaklaştığını bilirsiniz, nüfus ortalaması belirli bir hata payı içinde sizin çektiğiniz örneklemin ortalamasına yakın olur. Bu hata payına şu şekilde erişebiliriz:
Şekil 5.1 Hata Payı Nasıl Hesaplanır ?
Hata payını hesaplamayı bazı websitelerinin uygulamaları üzerinden de yapabilirsiniz.
Yukarıdaki tabloda yer alan güven düzeyi yapacağınız yüz tahminin kaçında yanlış yapmayı göze alırsınız sorusuna verdiğiniz yanıta bağlı olur. %80 güven düzeyinde yüz tahminin yirmisinin, %99 güven düzeyinde yüz tahminin birinin yanlış olmasını kabul edeceğinizi söylemiş olursunuz.
Çeşitli araştırmaların künyelerinde verilen hata payı işte yukarıdaki formüle bağlı olarak hesaplanıyor. Ancak bu hata payının aşağıda anlatacağımız basit rassal örneklem yöntemiyle hesaplandığını, olasılıklı olmayan örneklem yöntemlerinde hesaplanamayacağını bilmemiz gereklidir.