İSTATİSTİK METODUNA GİRİŞ
İstatistiğin tanımı
İstatistik belirli olayların gözlemlenmesi yoluyla elde edilen verilerin toplanması, işlenmesi ve bu verilerden bir sonuca varılabilmesi için kullanılan tekniklerin tümünü kapsamaktadır. Bir bilim dalı olarak geçmişi ve içinde bulunulan durumu sayısal yöntemlerle analiz ederek gelecek hakkında karar vermeyi kolaylaştırmaktadır. İstatistiğin konusu olan olayları, kendi türünden olayları tam anlamıyla temsil edip edemediğine bakarak ikiye ayırabiliriz. Buna göre olaylar tipik olay ve kollektif olay olarak ayrılabilir.
Tipik olay birbirinin tam benzeri olaylardır. Gerekli koşullar oluştuğunda hep aynı şekilde tekrar eden olaylardır. Fiziksel ve kimyasal olaylar tipik olay olarak örnek verilebilirler.olaylar birbirinin aynısı olduğundan bunlardan sadece bir tanesi oluşturduğu topluluğu temsil edebilir.Hidrojen ve oksijenin belirli koşullarda suyu meydana getirmesi tipik bir olaydır.
Kollektif olay ise birbirine benzemeyen , ortak yönleri olmasına karşın aralarında farklılıklar bulunan olaylardır. Genellikle canlı varlıklarla ilgili olaylar kollektif olay olarak adlandırılırlar. Nüfus kollektif olay için iyi bir örnektir. Nüfusu oluşturan bireylerin, insan olmak ve aynı bölgede veya ülkede yaşamak gibi ortak özellikleri olmasına rağmen cinsiyet,yaş,meslek gibi çeşitli özellikler bakımından farklıdırlar.
Teorik olarak tipik olaylarla kollektif olaylar birbirlerinden kolayca ayrılabilirse de gerçekte aralarında çok kesin bir çizgi çekilememektedir. Olayların tipik ve kollektif olarak ayrılması bunları etkileyen nedenlere bağlıdır. Olayları etkilen nedenler de genel neden ve rastsal neden olarak ikiye ayrılır. Genel nedenler aynı topluluktaki bütün olaylar üzerinde hep aynı yönde ve aynı derecede etkindir. Rastsal nedenler ise olayları zıt yönlerde ve çeşitli derecelerde etkilerler. Örneğin verimi etkileyen çeşitli faktörlerden toprağın cinsi ve iklim genel neden; hava değişimleri, uygulanan tarımsal teknikler, tohumun kalitesi gibi faktörler rastsal neden olarak tanımlanabilir. Büyük sayılar kanununa göre (Bernoulli) gözlem sayısı arttıkça sonuçlar rastsal nedenlerin etkisinden kurtulmaktadır. Bu kanunun işleyişine en iyi örnekler rastsal faktörlerin en belirgin olduğu şans oyunları olarak gösterilmektedir. İstatistiğin konusunu tipik olayların değil, kollektif olayların oluşturduğunu söyleyebiliriz.
Ana kütle
Ana kütle kollektif olay özelliğinde ve aynı cinsten(homojen) birimlerin meydana getirdiği topluluktur. Birimler tamamen aynı özelliklere sahip olmasalar da , bazı ortak yanlarının bulunması gereklidir.örneğin yıl bir kütle olarak alınırsa günler birimdir. Kütleler çeşitli şekillerde sınıflandırılabilirler. Birimleri sayılabilen kütlelere belirli kütle, sayılamayanlara belirsiz kütle adı verilir. Bir ülkenin nüfusu, bir şehirdeki binalar belirli kütle,bir nehirdeki balıklar, ormandaki karıncalar sayılamayacağı için belirsiz kütledir. Kütleler sürekli süreksiz olarak da sınıflanabilirler. Arsa ,tarla gibi birbirine bitişik olan birimler sürekli,insan, otomobil gibi birimler süreksiz kütleleri oluştururlar.
Birim
Kütleyi oluşturan kollektif olayların her birine birim adı verilir. Canlılar(insan,hayvan) sosyal bir kuruluş(aile,şirket) bir olay(doğum,ölüm,evlenme) birim olarak kabul edilir. Birimler mutlaka sayılabilir veya ölçülebilir özelliklere sahip olmalıdırlar. Birimler aynı zamanda homojen olmalıdırlar. İstatistikte homojenlik eşitlik anlamına gelir. Aynı tanıma uygun birimler biçimsel homojenlik tanımına uymaktadır.
Örnek
Anakütle bütün birimlerin oluşturduğu topluluktur. Anakütleden seçilen birimlerin oluşturduğu alt topluluk örnek olarak adlandırılır. Bir firmada satın alınan hammaddenin tamamı anakütleyi, kalite kontrolü için alınan parça örneği oluşturur.
Vasıf (nitelik) ve şık
Birimlerin sahip oldukları ve birbirlerinden ayırdedilmelerine yarayan özellikler vasıf olarak adlandırılır. Nüfus sayımında birim insandır. İnsanların yaş, boy ,medeni durum gibi özellikleri vasıftır. Belli bir vasıf çeşitli biçimlerde ortaya çıkabilir. Bu ortaya çıkış biçimleri de şık adını alır. Örneğin medeni durumun , “evli”, “bekar”, “boşandı”, “dul” şeklinde 4 şıkkı vardır.
İstatistik analiz
İlk bilgilerin toplanması (rölöveler) aşamasında araştırmanın konusu ve birimlerin tarifi yapılır. Rölövenin zamanı ve kapsamı belirlenir. İkinci aşamada toplanan veriler matematik ve istatistik analizlere uygun, düzenli duruma getirilir. Verilerin tasnifi ve gruplaması yapılır. Üçüncü aşamada düzenlenmiş ve gruplandırılmış veriler tablolar ya da grafikler şeklinde sunulur. Son aşamada ise çeşitli yöntemler kullanarak eğilimler ortaya çıkarılır, olaylar arasındaki ilişkiler bulunur ve karar verilerek sonuca ulaşılır.
VERİLERİN TOPLANMASI
Araştırmalarda elde edilen veriler genellikle düzensiz ham verilerdir. Toplanan veriler kolay ve anlaşılır bir biçimde düzenlenebilir. Bu düzenleme çeşitli şekillerde yapılabilir.verileri küçükten büyüye doğru sıralayıp düzenli hale getiren yöntemlerden bir tanesi gövde-yaprak (stem –and-leaf) görüntüsü yöntemidir. Yöntemde sayılar basamaklarına ayrılarak bir kısmı gövde bir kısmı da yaprak şeklinde gösterilir.
Örnek: Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir.
22 76 6 23 54 31
30 27 35 19 71 48
17 30 48 28 105 22
63 41 26 37 35 44
11 41 64 65 52 63
8 34 38 32 43 30
Bu verileri gövde-yaprak şeklinde düzenleyelim:
gövde yaprak
10 5
7 1, 6
6 3,3,4,5
5 2,4
4 1,1,3,4,8,8
3 0,0,0,1,2,4,5,5,7,8
2 2,2,3,6,7,8
1 1,7,9
0 6,8
gövde-yaprak gösteriminde verilerin rank değeri de belirlenerek bazı istatistik ölçülerin hesaplanması kolaylaşır. Rank için ilk veri 1 den başlayacak şekilde tüm veriler sırayla numaralandırılır.06 ya 1, 08 e 2, 11 e 3 , 17 ye 4 rank numarası verilerek devam edilir.Veriler derecelendirildikten sonra istatistikte çok kullanılan bir ortalama ölçüsü medyan kolaylıkla hesaplanabilir. Medyan sıranmış bir dizide tam ortadaki elemanın değeridir. Eğer dizinin eleman sayısı çift ise ortadaki iki elemanın aritmetik ortalaması alınır. Örnekteki verilere uygularsak;
Veri sayısı 32 olduğu için 18. ve 19. elemanların ortalaması alınacaktır. Her iki elemanın değeri de 35 olduğundan (35+35 )/2 = 35 medyan değeridir
Aşağıdaki veri grubunu gövde-yaprak şeklinde düzenleyiniz.(60 adet)
5,9 7,7 8,9 5,2 7,3 7,7 6,3 7,3 5,7 5,6
5,6 6,7 6,9 7 7,3 6,2 6,5 6,5 9,2 7,1
4,1 4,9 7,5 7,5 9,6 7,9 5,3 5,5 6,1 6,1
8,3 8,1 8,1 4,5 7,3 9,4 5,8 6,7 6,7 6,9
6,9 7,1 6,9 7,7 7,7 8,1 8,7 6,5 6,7 9,1
7,1 6,3 5,1 7,3 8,3 8,9 9,3 5,7 6 5,9
gövde yaprak
9. 1,2,3,4,6
8. 1,1,1,3,3,7,9,9
7. 0,1,1,1,3,3,3,3,3,5,5,7,7,7,7,9
6. 0,1,1,2,3,3,5,5,5,7,7,7,7,9,9,9,9
5. 1,2,3,5,6,6,7,7,8,9,9
4. 1,5,9
Sınıflama
İncelenen vasfın aynı şıkkına sahip birimleri kümeler halinde bir araya getirme işlemine sınıflama (tasnif) denir. Vasıfların çeşitli şıklarının kütlede kaç defa tekrarlandığını gösteren sayılar frekans adını alır. Bir sınıfa düşen veri sayısı o sınıfın frekansıdır diyebiliriz. Verilerin sınıflar ve bu sınıflara karşı gelen frekanslar şeklinde düzenlenmesine frekans dağılımı veya frekans tablosu denir.
Örnek: 100 kişilik bir sınıfta öğrenciler yaş vasfının şıklarına göre sınıflanıyor.
Yaş ( şıklar ) frekans(n)
18 21
19 25
20 30
21 18
22 6
toplam 100
Ele alınan vasfın şıkları çok sayıda ise sınıflamada sorun çıkabilir. Bu durumda gruplamaya başvurulur.
Gruplama
Bir vasfın birbirine yakın olan şıklarını bir araya getirmeye gruplama denir. Örneğin meslek istatistikleri yapılırken serbest çalışan doktor,avukat,dişçi,tüccar gibi meslekler “serbest meslekler” grubuna alınmaktadır. Gruplama ile toplanan veriler hakkında daha geniş ve açık bilgiler alınabileceği gibi, her gruba düşen frekans sayısı da büyür. Gruplamanın bu yararları yanında bazı sakıncaları da vardır. Örneğin grup sınırlarının belirtilmesi önemli bir sorundur. Günlük gelirleri “12-16 dolar”, “16-20 dolar” gibi grupladığımızda , 16 doların hangi gruba gireceği belirsizdir. Bu durumda “12-16 dolardan az”, “16-20 dolardan az” şeklinde bir gruplamaya gidilmelidir. Gruplamada grup sayısı genellikle 7-20 arasında tutulmaktadır. Nicel vasıflara göre yapılan gruplamada gruplara “sınıf”, gruba girebilecek en küçük şıkkın değerine “ sınıf alt sınırı”, en büyük şıkkın değerine de “sınıf üst sınırı”, bunlar arasındaki farka “sınıf aralığı” ve sınıf sınırlarının aritmetik ortalamasına “sınıf ortalaması” adı verilir.
Örnek:1993 verileri kullanılarak dünyadaki 30 büyük şehir nüfuslarına göre gruplandırılarak
frekans dağılımları gösterilmektedir.
Nüfus grupları(*1000 kişi) şehir sayısı(frekans)
3000 - 4000 den az 6
4000 - 5000 den az 6
5000 - 6000 den az 4
6000 - 7000 den az 6
7000 - 8000 den az 2
8000 - 9000 den az 4
9000 ve üzeri 2
Yukarıdaki örnekte 3000-4000 den az sınıfının alt sınırı ”3000”, üst sınırı “4000” , sınıf aralığı “ 4000-3000=1000” ve ortalaması “(3000+4000)/2=3500” olarak bulunur. “9000 ve üzeri” sınıfı ise açık sınıf aralığı olarak tanımlanır.
__________________
Hiç yorum yok:
Yorum Gönder