Sabtu, 11 Desember 2010

statistics

    MENGENAL ILMU STATISTIK SECARA SEDERHANA


 
 Secara umum, Ilmu statistik ada 2 jenis yaitu :
- Statistik Deskriptif (Memberikan informasi tentang kinerja dari sebuah proses).
- Statistik Inferensial (Memberikan informasi tentang prediksi yang berhubungan dengan kinerja sebuah proses atau Peluang).
Data
data adalah sekumpulan fakta, angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai referensi dalam mengambil keputusan.
Jenis Data
Data variable : disebut juga data continues atau measurement. Data ini berasal dari hasil pengukuran dan nilainya berada dalam suatu interval atau jangkaun tertentu, contoh : Hasil pengukuran berat badan dari 46 Inspector di PQA, hasill pengukuran panjang Frame Main DV28EC selama 1 bulan, dll.
Data attribute : disebut juga data diskrit atau data non continues. Umumnya data ini merupakan hasil perhitungan dan berupa bilangan bulat, contoh : Jenis suku bangsa Inspector PQA, jenis kelamin (pria/ wanita), jumlah karyawan yang tidak masuk per hari, dll.
Alasan Perlunya Pengumpulan Data
a. Untuk mengumpulkan fakta-fakta tentang suatu masalah atau kesempatan yang dapat dikuantifikasi.
b. Untuk menyampaikan fakta-fakta ini dalam bahasa yang sama.
c. Untuk menetapkan informasi mendasar tentang sebuah proses.
d. Untuk mengukur jumlah dan arah perubahan-perubahan yang terjadi.
e. Untuk membandingkan gambaran proses sebelumnya dan sesudahnya
f. Untuk memfasilitasi analisa keuntungan (Cost Benefit Analysis) dari solusi yang diusulkan.
g. Untuk mengkuantifikasi dampak dari sebuah solusi.


Populasi dan sample
Populasi ialah keseluruhan object yang ingin kita ukur dan analisa. Sedang sample ialah sebagian (kecil) dari populasi dimana kita benar-benar melakukan pengukuran dan dengan ini kita dapat menarik kesimpulan.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita mengumpulkan informasi tentang suatu populasi tanpa kita harus meneliti secara keseluruhan


Jenis-Jenis Sampling

sampling dikategorikan menjadi 2, yakni :
Sampel Judgmental
1. Sampel dipilih berdasarkan pengetahuan dan pengalaman.
2. Hanya sebagian kecil dari populasi yang diikutsertakan dalam proses seleksi.
3. Sampel dianggap mewakili populasi.
4. Contoh : PT. Livatech bermaksud mengadakan customer satisfication survey. Dari 20 customer yang ada hanya diambil sample 5 customer yang utama saja dengan pertimbangan kelima customer tersebut ordernya diatas 100.000 Part/ bulan.
Sampel Statistical
1. Sampe dipilih secara acak.
2. Seluruh populasi diikutsertakan dalam proses seleksi.
3. Sampel mewakili seluruh populasi.
4. Contoh : PQA mengambil sampel Shaft PU (L) DV28EC dari 10 box yang ada dengan masing-masing box diambil 50 Pcs secara acak.
Metode Sampling
 ada 3 metode sampling, yakni :
1. Systematic sampling : Dalam pengambilan sampel, metode ini menekankan pengambilan yang teratur dengan interval frekuensi yang jelas, misalnya : setiap pengambilan sampel dilakukan diawal shift, pengambilan sampel setiap kelipatan 100 Pcs, dll.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya dibantu dengan statistical software (MINITAB). Metode ini dipandang cukup aman dari bias.
3. Stratified sampling : Ciri khas dari metode sampling ini adalah adanya penggolongan sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini baru dilakukan pengambilan sampel secara sistematik maupun random.
Pengukuran Central Tendency
Untuk mengukur Central Tendency (diterjemahkan secara bebas = ukuran letak) biasanya menggunakan indikator-indikator mean (rata-rata), median (nilai tengah) dan modus (nilai yang sering muncul).
Mean (rata-rata) ialah jumlah semua observasi dibagi dengan banyaknya jumlah data. Nilai mean sangat dipengaruhi oleh nilai-nilai yang ekstrim.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil hingga terbesar (diranking). Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika banyaknya data ganjil maka median sama dengan nilai data yang tepat berada ditengah-tengah. Namun jika banyaknya data genap maka median sama dengan rata-rata dari dua nilai yang berada ditengah. Hal inilah yang dapat dikatakan bahwa median sama dengan 50th percentile atau kuartile kedua (Q2). Sebagai informasi tambahan saja bahwa median umumnya digunakan pada distribusi yang miring (skew) sedang distribusi yang seimbang umumnya memakai mean.
Modus adalah nilai yang paling sering muncul. 

Pengukuran Variasi
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum dipakai adalah :
- Range (jangkauan) ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.

Dengan sedikit penjelasan diatas tentunya kita akan mengetahui bahwa dengan rata-rata saja tidak cukup untuk membuat suatu kesimpulan dari data yang kita analisa. Kita perlu mengukur variasi tentunya. Untuk lebih jelasnya, perhatikan contoh berikut ini :
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut (dalam Juta Rupiah). Tujuan dari survey ini adalah untuk membuktikan apakah bisa dikatakan gaji karyawan di Batam itu “rata-rata sama Rp. 3.000.000,00”?
Dengan melihat data diatas belum dapat dikatakan bahwa dua group yang mempunyai mean dan median sama itu dikategorikan sama secara statistik.
Jenis Distribusi
1. Discrete distributions (untuk non continuous data).
2. Continuous distributions.
Bentuk-bentuk Distribusi
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed (Positif), bila rata-rata > median
- Left Skewed (Negatif), bila rata-rata <>

Continuous Distributions
Distribusi yang umum dipakai pada jenis Continous distribution, antara lain :
1. Normal Distributions Banyak kejadian yang muncul secara acak (random) menghasilkan data dengan distribusi bell shaped. Kurva yang menghubungkan puncak-puncak batang disebut Kurva Peluang Normal yang digunakan untuk meng-estimasi Distribusi Normal dari kejadian-kejadian yang muncul secara acak (random). Dalam kasus-kasus yang umum terjadi, asumsi yang digunakan dalam analisis adalah bahwa data yang kita dapatkan terdistribusi dengan normal dan simetris. Hal ini berarti bahwa kita perlu terlebih dahulu menguji bisa tidaknya suatu group dikatakan terdistribusi secara normal. Dan jika anda menggunakan statistical software (MINITAB), menu pilihan untuk menguji kenormalan distribusi telah tersedia dan juga dapat melihat bentuk dari kurvanya (simetris ataukah miring).
2. Exponential Distribution Secara sederhana distribusi eksponensial dapat dijelaskan sebagai suatu distribusi dari data-data yang menggambarkan periode (waktu) ataupun ruang diantara dua kejadian. Contoh yang paling umum dalam penerapan distribusi eksponensial ini adalah dalam mengukur periode kerusakan sebuah mesin (MTBF = Mean Time Between Failure)
Pengujian Perbedaan Rata-Rata dari Dua Distribusi Kontinyu
Secara Umum, hypothesis dapat dinyatakan dalam persamaan berikut :
Untuk menguji rata-rata dengan test hypothesis biasanya dilakukan dengan t-test, dengan langkah sederhana berikut :
1. Definisikan parameter yang diujikan dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001)
3. Tentukan besar sampel dan lakukan t-test pada data tersebut dengan statistical software (MINITAB) atau software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho

Pengujian Perbedaan antara Dua proporsi
Untuk pengujian proporsi, persamaan yang umum dipakai adalah
Langkah pengujiannya hampir sama dengan t-test untuk rata-rata, yaitu :
1. Definisikan parameter yang diuji dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001).
3. Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan MINITAB atupun software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho .
Pengujian Perbedaan Rata-Rata antara 2 group dengan Variance yang berbeda
Pengujian hipotesis untuk rata-rata, pada umumnya menggunakan asumsi bahwa variasi dari 2 group yang diuji adalah sama. Jika asumsi tadi tidak bisa kita gunakan maka kita harus melakukan test yang pada statistical software MINITAB disebut dengan “Separate-Variance t-test” (Untuk Lebih lengkapnya silahkan pelajari tentang MINITAB).
Pengujian Perbedaan Variances antara 2 group yang berbeda
Kembali ke konsep awal bahwa untuk mengetahui apakah variasi antara 2 group yang akan diuji secara statistik dapat dianggap sama atau tidak, diperlukan suatu pengujian untuk menguji variance yang dikenal dengan F-test. Dan mengulang pembahasan sebelumnya bahwa jika variance kedua group yang diuji secara statistik bisa dianggap sama maka dapat menggunakann “pooled-variance t-test” tetapi jika tidak bisa dianggap sama maka digunakan “separate-variance t-test”. Persamaan umum pengujian variances yang sering dipakai :
Analysis of Variances (ANOVA)
Jika diperhatikan sejauh ini penjelasan hanya menyentuh pada 2 group data saja. Lantas bagaimanakah kaidah pengujian untuk yang lebih dari 2 group data, misalnya : 4 group atau bahkan 10 group. Untuk menjawab “tuntutan” ini maka digunakanlah kaidah ANOVA.
Sebagai contoh saja kita mempunyai 4 group data, kita dapat mengujinya apakah keempat group tersebut mempunyai rata-rata yang sama ataukah tidak, Ingat hanya dalam sekali pengujian. Secara sederhana dapat ditampilkan dengan hipotesis berikut :
Ho = Semua rata-rata dari populasi adalah sama
Ha = Tidak semua rata-rata dari populasi adalah sama Jika kita bermaksud menguji hanya satu variable maka menu yang kita pilih adalah one-way ANOVA tetapi jika ada dua variable yang akan diuji maka menggunakan two-way ANOVA.
Dan mengingat pembahasan ANOVA sangat panjang, alangkah baiknya jika diperdalam dengan membaca buku-buku Statistik

4 komentar:

  1. muhamad rizky setyawan12 Desember 2010 pukul 18.46

    wah pusingnya ngitungin statistik, apa ada rumus cepatnya ndak, kyk rumuse pak hadi guru matematika???hehehe

    BalasHapus
  2. hohoh....pusing yah??? namanya jug abelajar... yadah gud lak dehhh yahhh soobbb...

    BalasHapus
  3. smnggggtttttt,ok,hdplah dngn senyumn,,,,,,,,

    BalasHapus
  4. waw, baca artikel ini bikin pusing, haha ! semangat dan sukses ya belajar statistik :) :)

    BalasHapus

halaman

hak cipta oleh masfuhurrizqi iman. Diberdayakan oleh Blogger.