Histogram

October 10, 2011

Matematik öğretim programında 8. sınıfta yer alan histogram konusunda bazı kafa karışıklıkları bulunmaktadır. Özellikle histogramın nasıl oluşturulacağı hakkında farklı kaynaklarda çelişkili bilgiler bulunmaktadır. Histogramla ilgili en sık karşılaştığımız soru ise grup genişliğinin belirlenmesi ile ilgilidir. Bu yazıda bu konuya açıklık getirmek istiyorum.

Histogramlar özetlenmiş veri sıklığı (frekansı) bilgisinin sütunlarla temsil edildiği grafiklerdir. Histogramlar bir veri kümesinin dağılımını özetlemek amacıyla kullanılır. Aşağıda belirli bir veri kümesi için oluşturulmuş sıklık tablosu ve histogram görünmektedir.

Örnek:

Bir bağdaki 29 adet ceviz ağacının yükseklikleri şöyledir;

28, 13, 19, 15, 14, 21, 17, 21, 16, 18, 20, 20, 19, 19, 21, 22, 22, 22, 23, 23, 23, 24, 24, 24, 24, 26, 25, 27, 28


Yükseklik aralığı

Ağaç sayısı (sıklık)

13-15 3

16-18

3

19-21

8

22-24

10

25-27

3

28-30

2

image001

Histogramla ilgili Kafalar Neden Karışık?

Matematik öğretim programında 8. Sınıf düzeyinde işlenen bu konu hakkında farklı kaynaklarda birbiri ile çelişen bilgiler göze çarpmaktadır.

Özellikle grup genişliğinin belirlenmesi konusu bazen tam bir karışıklığa dönüşmektedir.

Bu karışıklığın kaynağında öğretim programlarının ilk sürümünde grup genişliğinin “tek sayı” olarak belirlenmesinin “tavsiye” edilmesi bulunmaktadır. Bu tavsiyeyi pek çok ikincil kaynak bir kural olarak algılamış ve buna göre sorular hazırlamıştır.

Oysa grup genişliğinin tek sayı alınması sadece belirli durumlarda işe yarayabilen bir uygulamadır, çift sayı da alınabilir.

Bakanlık bu durumu program kitabında düzeltti. Fakat hem bu düzeltmenin yeterince bilinmemesinden, hem de gereğinden fazla karışık yazılmasından dolayı kafalar hala karışık.

Aşağıda bu konuda kısa bir açıklama bulunmaktadır.

Histogramda Grup Genişliğinin Belirlenmesi

Histogram oluşturulurken açıklığın hesap yapılarak “bulunması“, grup sayısı ve grup genişliğinin takdir edilerek “belirlenmesi” gerekmektedir.

Açıklık (a): Veri kümesindeki en büyük değer ile en küçük değer arasındaki fark.

Grup sayısı (s): Grafikteki sütun sayısıdır. Her sütun bir gruba ait sıklığı temsil eder. Grup sayısı, karar verilerek elde edilen bir değerdir. Dağılımı yeterince iyi yansıtabilecek bir seçim yapılır.

Grup genişliği (g): Her bir veri grubunun genişliğidir. Belirtilen aralıkta kaç tane değer olduğu sütunda özetlenmektedir. Grup genişliği açıklık ve grup sayısı dikkate alınarak belirlenen bir değerdir. Grup genişliği belirlenirken aşağıdaki eşitsizlik dikkate alınarak g için en küçük doğal sayı değeri seçilir. Bölüm bir doğal sayı olduğunda da, yine eşitsizlik gereği (hiç bir verinin grafiğin kapsama alanı dışında kalmaması için) bir üst doğal sayı grup genişliği olarak alınır.

(Not: Bazı özel histogram çizimlerinde her grubun ortasında bir doğal sayı değeri belirleyebilmek için g’nin tek sayı olması tercih edilir.)

Örnek:

Açıklık 52 olarak bulunup grup sayısı 10 olarak belirlendiğinde:

image003

Bu sonucu dikkate alarak grup genişliği 6 olarak belirlenebilir.

Örnek bir uygulama için:

http://www.stat.sc.edu/~west/javahtml/Histogram.html