Print
Ade Setiawan
Category: Analisis Data Eksploratif

gambar box-plotBaik histogram dan stem-and-leaf plots berguna untuk memberikan gambaran ukuran tendensi sentral dan kesimetrisan data pengamatan. Penyajian grafis lainnya yang bisa merangkum informasi lebih detail mengenai distribusi nilai-nilai data pengamatan adalah Box and Whisker Plots atau lebih sering disebut dengan BoxPlot atau Box-Plot (kotak-plot) saja. Seperti namanya, Box and Whisker, bentuknya terdiri dari Box (kotak) dan whisker.

Box-Plot merupakan ringkasan distribusi sampel yang disajikan secara grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan.
Pada artikel Mengenal Box-Plot (Box and Whisker Plots) ini akan diuraikan secara rinci mengenai manfaat Box-Plot dalam menjelaskan ukuran tendensi sentral serta rincian detail bagian-bagian dari Box-Plot.

Pada gambar di bawah, Box adalah kotak berwarna hijau dan Whisker garis berwarna biru.

 

gambar box-plot

Box-Plot merupakan ringkasan distribusi sampel yang disajikan secara grafis yang bisa menggambarkan bentuk distribusi data (skewness), ukuran tendensi sentral dan ukuran penyebaran (keragaman) data pengamatan. Terdapat 5 ukuran statistik yang bisa kita baca dari boxplot, yaitu:

Dari gambar di atas, sepintas kita bisa menentukan beberapa ukuran statistik, meskipun tidak peris sekali. Nilai statistik pada badan Boxplot: Nilai median ≈ 76, Nilai Q1≈ 69, nilai Q3 ≈ 87, nilai maksimum ≈ 99, nilai minimum 48, serta nilai-nilai di luar badan Boxplot yang merupakan nilai outlier berturut-turut sekitar 36, 38 dan 43. Sebaran data tidak simetris, tapi menjulur ke arah kiri (negatively skewness). Darimana kita bisa menentukan ukuran statistik dan interpretasi tersebut?? Ok, untuk mengetahui perkiraan nilai tersebut, sebelumnya kita harus mengenal dulu bagian-bagian dari boxplot. Di bawah ini diperlihatkan rincian detail boxplot beserta cara penentuan batas-batasnya.

bagian-bagian box-plot

Boxplots dapat membantu kita dalam memahami karakteristik dari distribusi data. Selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/panjang boxplot) juga dapat digunakan untuk menilai kesimetrisan sebaran data. Panjang kotak menggambarkan tingkat penyebaran atau keragaman data pengamatan, sedangkan letak median dan panjang whisker menggambarkan tingkat kesimetrisannya.

Kemiringan (Skewness)

Kemiringan (Skewness)

Keunggulan Boxplots dibanding dengan Histogram, dotplot, dan stemplot sangat terasa pada saat kita ingin membandingkan sebaran beberapa kelompok data secara bersamaan. Sebagai contoh, perhatikan gambar berikut:

box-plot untuk grup data

Box-Plot Grup Data

Kita bisa mengetahui beberapa gambaran informasi dari gambar tersebut. Nilai median untuk tiga kelompok data adalah sama. Selanjutnya,…. bagaimana mengenai penyebaran (keragaman) dan kesimetrisannya?? Silahkan Anda interpretasi sendiri, sebagai latihan…. :-) --lihat panduan pada uraian di atas-- (catatan: Interpretasi pada perbandingan ketiga boxplot di atas, tidak memperhatikan asumsi distribusi statistik. Ingat, ukuran pusat yang digunakan adalah median bukan mean! Grafik boxplot di atas merupakan analisis non-parametrik) Terdapat sedikit perbedaan bentuk Box-plot yang di generate beberapa software statistik, baik dalam bentuknya (tepi whisker, median), ukuran pusat yang digunakan (median atau mean), maupun arah penggambarannya (ada yang digambarkan secara horizontal dan ada yang vertical). Namun pada prinsipnya sama. Box-plot pada contoh di atas dibuat dengan menggunakan Software SPSS. Software Statistica (Statsoft), misalnya, memperbolehkan kita memilih antara median atau rata-rata untuk dasar pembuatan Box-Plot-nya. Apabila nilai mean yang digunakan pada Box-plotnya, maka whisker dan batas untuk outlier/ekstrimnya menggunakan nilai Standar Deviasi (SD) bukan IQR.

Teknik pembuatan box-plot

http://mathforum.org/library/drmath/view/52188.html

Hits: 13284