Statistika Dasar Sekolah Menengah

Deskripsi

Laman web ini dimaksudkan untuk memberikan kesempatan kepada para pengunjung (guru/siswa) untuk melakukan latihan terkait materi statistika sekolah lanjutan.

Objektif

Secara umum pengguna/ siswa diharapkan dapat menyusun dan memodifikasi tabel frekuensi dan perhitungan ukuran pemusatan serta penyebarannya. Secara lebih detail, hasil yang harus dicapai siswa adalah sebagai berikut ini.
  1. Dapat mengaktifkan data yang sesuai dengan kebutuhan analisis, atau dapat mengimpor datanya sendiri untuk dieksplorasi.
  2. Dapat menyatakan jenis-jenis, skala dari masing-masing faktor atau variabel yang ada pada data (seperti jenis faktor, variabel, skala interval, ordinal, nominal)
  3. Dapat menampilkan visualisasi grafik yang sesuai dengan kebutuhan (misalnya memeriksa kenormalan data, memeriksa hubungan antar variabel, homogeinitas variansi, memeriksa pengaruh faktor)
  4. Secara lebih detail dapat melakukan uji untuk peneriksaan asumsi (uji kenormalan, uji homogeinitas variansi)
  5. Dapat melakukan uji yang tepat sesuai keperluan/ tujuan (misalnya uji beda, uji hubungan)
  6. Dapat menjelaskan kaitan antara hasil yang diperoleh dengan teori (rumus) terkait.
  7. Dapat menafsirkan luaran hasil analisis (baik tingkat signifikansi maupun tingkat kecocokan)
  8. Dapat melaporkan secara tertulis dan sistematis hasil ekplorasi yang diperoleh, dengan menggunakan minimal 2 jenis data/ variabel.

Petunjuk Umum

  1. Setiap kali anda berlatih menerapkan analisis statistika, anda wajib mencoba minimal untuk dua (dua) kasus yang berbeda.
  2. Buat interpretasi dari hasil yang anda peroleh baik dalam konteks terminologi statistika, maupun dalam bahasa ilmiah secara umum. MIsalnya apa artinya jika hasil ujinya signifikan, apa makna dari nilai $p-val$ yang diperoleh.
  3. Buat laporan secara naratif dan sistematis dari hasil anda melakukan analisis statistika dan lengkapi laporan anda dengan rujukan teori ringkas atau rumus yang sesuai.
  4. Bonus: Bagi mereka yang bisa menuli slaporann dalam format HTML, dan rumus-rumus matematikanya ditampilkan dengan $\LaTeX$ akan diberikan bonus sebanyak (+7) poin.

Teori

1. Aktivasi Data

Anda dapat mengaktifkan data dari database R, atau data yang anda miliki dalam format khusus (Tex atau CSV). Jika anda memiliki data dalam format excel, untuk saat ini anda harus mengkonversinya ke bentuk teks atau CSV (klik!!) terlebih dahulu.

Pilihan Data

Khusus untuk Import Data, cari file:
Header: , Pemisah: , Kutipan:
Catatan: Saat memperbarui data (ke dua kali dst ...), CHECK!/ "reset" posisi Grafik Regresi ke tanpa faktor/garis), KLIK!!!

Luaran 1. Data Aktif


  
Tampilan yang lebih rinci dari data dapat dilihat pada Lampiran.
Cermati variabel-variabel/ faktor-faktor yang ada, selanjutnya pilih analisis yang sesuai kondisi data, sebaliknya pilih variabel/faktor sesuai analisis yang akan dilakukan.

Navigasi: Input Data Eksplorasi Data Uji Beda Mean Uji Anova Uji Regresi

2. Eksplorasi Data

2.1. Eksplorasi Data Global

Untuk mendapatkan gambaran variabel-varabel yang berhubungan, dapat dihitung matriks korelasi ataupun matriks diagram pencar dari (minimal 2) variabel kuantitatif/numerik.

Tes Library



Grafik

Matriks Korelasi

Matriks korelasi dari variabel-variabel kuantitatif


Matriks Diagram Pencar

Untuk mendapatkan gambaran variabel-bariabel yang berhubungan, selain matriks korelasi dapat juga dibuat matriks diagram pencar secara global, dari variabel-variabel terpilih di atas.
Gambar 1. Grafik Diaram Pencar

2.2. Eksplorasi Grafik Faktor

Jenis Grafik (Pilih Diagram Lingkaran, Batang atau Garis)
Frekuensi

2.3. Eksplorasi Grafik Variabel Respon

Menghitung Ukuran Pemusatan secara manual dari Tabel frekuensi

Menghitung Mean


Ilustrasi dengan R



Menghitung pendekatan banyaknya kelas interval dengan formula Sturges menggunakan $\displaystyle k=1+\frac{10}{3}\;\; \left[^{10}\log (N)\right]$
Tabel frekuensi interval


Dengan Mean Sementara/Tebakan
Menghitung mean $(\mu_T$=MeanT melalui mean sementara $\mu_0$=MnSemtr yang diambil dari sembarang kelas/interval. $$\mu_T=\mu_0+\frac{\sum\left[f_i(M_{Ti}-\mu_0)\right]}{\sum f_i} $$ Dengan $M_{Ti}$ adalah titik tengah interval/kelas ke-$i$ dari $k$-kelas interval $$\mu_R=\frac{\sum X_i}{N} $$ Dengan $X_{i}$ adalah data asli (data kasar) ke-$i$ dari seluruh $N$ pengamatan Mean dengan kelas tebakan

MeanT=MnSemtr + (SigmadX/SigmaF)

Kelas tebakan:


Mean langsung dari Tabel
$$\mu_T=\frac{\sum f_iM_i}{N} $$ Dengan $M_{i}$ adalah titik tengah (main) interval ke-$i$ dan $f_i$= frekuensi kelas interval.
Mean langsung dari data asli
$$\mu_R=\frac{\sum X_i}{N} $$ Dengan $X_{i}$ adalah data asli (data kasar) ke-$i$ dari seluruh $N$ pengamatan
Mean (tanpa tebakan)


Mengitung Median

Untuk mengitung median, perlu ditentukan terlebih dahulu kelas median, yaitu kelas/ interval yang memuat batas frekuensi kumulatif 50% $$\text{Med}=M_b+p\left(\frac{N/2-F_b}{f_m}\right) $$ Dengan $M_b$=batas bawah kelas median, $p$ lebar interval kelas median, $N$ banyaknya data (Total frekuensi) $F_b$ frekuensi kumulatif dibawah kelas median, $f_m$ frekuensi kelas median. MedianR dihitung kangsung dari data asli (data kasar) sebelum dikelompokkan
Kuartil Qr (Q1, Q2 = Median, Q3): Kelas Interval yang memuat Q:

Mengitung Modus

Modus dihitung dengan terlebih dahulu menentukan kelas modus, yaitu kelas yang memiliki frekuensi tertinggi. $$\text{Mod}=M_b+p\left(\frac{df_b}{df_b+df_a}\right) $$ Dengan $M_b$=batas bawah kelas modus, $p$= lebar interval kelas modus, $df_b$= selisih frekuensi kelas modus dengan frekuensi sebelumnya, $df_a$= selisih frekuensi kelas modus dengan frekuensi sesudahnya
Modus


Gambar 2. Grafik Histogram Variabel ($Y$)
(Catatan: $Y$ harus bersekala interval)

Modifikasi tabel

Modifikasi jumlah interval
Banyaknya kelas interval: .
Gambar 2. Grafik Histogram Variabel ($Y$) Jenis Grafik
(Catatan: $Y$ harus bersekala interval)

Gambar 3. Grafik Histogram ($Y$) dengan Ogive

Menggabungkan interval yang berdekatan

Tabel frekuensi interval Sturges Asli


Nomor kelas interval yang ingin digabungkan: , sampai dengan: .
Hasil penggabungan

Gambar 2. Grafik Histogram Variabel ($Y$) Jenis Grafik


2.3. Uji Kenormalan Respon

Sumber Bacaan

  1. Akaike. 1972. Information theory and extension of maximum likelihood theory. In B.N. Petrov and F.Csahi, editors, 2nd Symposium on Information Theory: 267--281
  2. J.M. Chamber and T.J. Hastie. 1992. Statistical Model in S. Chapman and Hall, London.
  3. W.N. Venables and B.D. Ripley.1994. Modern Applied Statistics with S-plus. Springer.
  4. Cook, R.D 1998. Regression Graphics, Ideas for Studying Regression through Graphics. Wiley International Publ.
  5. Cook, R.D & Weisberg, S. 1999. Applied Regression Including Computing & Graphics. Wiley International Publ.
  6. Hay-Jahans, C. 2012. An R Companion to Linear Statistical Models . CRC Pres.
  7. Sheather, S. 2009. A Modern Appoach to Regression with R. Springer
  8. Tirta, IM 2009. Analisis Regresi dengan R . Jember Uniersity Press
  9. Tirta, IM. 2014. Bab 5. Eksplorasi Data. Presentasi dan Analisis Data dengan R. Unej Press
  10. Sahbaba B. 2012. Chapter 3. Data Exploration Biostatistics with R . Springer
  11. Wright, D.B. & K. London, 2009. Modern Regression Techniques Using R A Practical Guide for Students and Researchers. Sage
  12. Wikipedia. Normality Test http://en.wikipedia.org/wiki/Normality_test [Akses 28 Oktober 2014]