Senin, 20 Desember 2010

analisis regresi

TEORI ANALISIS REGRESI LINIER
MENGENAL ANALISIS REGRESI

Bab ini membahas masalah pengenalan analisis regresi dan teori regresi. Setelah selesai membaca bagian ini maka pembaca akan dapat memahami:
  • Pengertian regresi linear
  • Konsep-konsep dasar dalam regresi
  • Kegunaan teknik analisis regresi

2.1  Pengertian
Untuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Gujarati (2006) mendefinisikan analisis regresi sebagai kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung.

2.2  Tujuan
Tujuan menggunakan analisis regresi ialah
·        Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas.
·        Menguji hipotesis karakteristik dependensi
·        Untuk meramalkan nilai rata-rata variabel bebas dengan didasarkan pada nilai variabel bebas diluar jangkaun sample.

2.3   Asumsi
Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb:
·        Model regresi harus linier dalam parameter
·        Variabel bebas tidak berkorelasi dengan disturbance term (Error) .
·        Nilai disturbance term sebesar 0 atau dengan simbol  sebagai berikut: (E (U / X) = 0
·        Varian untuk masing-masing error term (kesalahan) konstan
·        Tidak terjadi otokorelasi
·        Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris.
·        Jika variabel bebas lebih dari satu, maka antara variabel bebas (explanatory) tidak ada hubungan linier yang nyata

2.4  Persyaratan Penggunaan Model Regresi
Model kelayakan  regresi linear didasarkan pada hal-hal sebagai berikut:
a.       Model regresi dikatakan layak  jika angka signifikansi pada ANOVA sebesar < 0.05
b.      Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini diketahui jika angka Standard Error of Estimate < Standard Deviation
c.       Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji T. Koefesien regresi signifikan jika T hitung > T table (nilai kritis)
d.      Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi yang sangat tinggi atau sangat rendah antar variabel bebas. Syarat ini hanya berlaku untuk regresi linier berganda dengan variabel bebas lebih dari satu.
e.       Tidak terjadi otokorelasi. Terjadi otokorelasi jika angka Durbin dan Watson (DB) sebesar < 1 dan > 3
f.        Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2 semakin besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi semakin baik. Nilai r2 mempunyai karakteristik diantaranya: 1) selalu positif, 2) Nilai r2 maksimal sebesar 1. Jika Nilai r2 sebesar 1 akan mempunyai arti kesesuaian yang sempurna. Maksudnya seluruh variasi dalam variabel Y dapat diterangkan oleh model regresi. Sebaliknya jika r2 sama dengan 0, maka tidak ada hubungan linier antara X dan Y.
g.       Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y)
h.       Data harus berdistribusi normal
i.         Data berskala interval atau rasio
j.        Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas (disebut juga sebagai variabel predictor) sedang variabel lainnya variabel tergantung (disebut juga sebagai variabel response)

2.5  Linieritas
Ada dua macam linieritas dalam analisis regresi, yaitu linieritas dalam variabel dan linieritas dalam parameter. Yang pertama, linier dalam variabel merupakan nilai rata-rata kondisional variabel tergantung yang merupakan fungsi linier dari variabel (variabel) bebas. Sedang yang kedua, linier dalam parameter  merupakan fungsi linier parameter dan dapat tidak linier dalam variabel.

2.6  Uji Hipotesis
Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu: tingkat signifikansi atau probabilitas (α) dan tingkat kepercayaan atau confidence interval. Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran tingkat signifikansi mulai dari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat signifikansi adalah probabilitas melakukan kesalahan tipe I, yaitu kesalahan menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada umumnya ialah sebesar 95%, yang dimaksud dengan tingkat kepercayaan ialah tingkat dimana sebesar 95% nilai sample akan mewakili nilai populasi dimana sample berasal. Dalam melakukan uji hipotesis terdapat dua hipotesis, yaitu:
  • H0 (hipotessis nol)  dan H1 (hipotesis alternatif)

Contoh uji hipotesis misalnya rata-rata produktivitas pegawai sama dengan 10 (μ x= 10), maka bunyi hipotesisnya ialah:
  • H0: Rata-rata produktivitas pegawai sama dengan 10
  • H1: Rata-rata produktivitas pegawai tidak sama dengan 10

Hipotesis statistiknya:
  • H0: μ x= 10
  • H1: μ x > 10 Untuk uji satu sisi (one tailed) atau
  • H1: μ x < 10
  • H1: μ x ≠ 10 Untuk uji dua sisi (two tailed)

Beberapa hal yang harus diperhatikan dalam uji hipotesis ialah;
  • Untuk pengujian hipotesis kita menggunakan data sample.
  • Dalam pengujian akan menghasilkan dua kemungkinan, yaitu pengujian signifikan secara statistik jika kita menolak H0 dan pengujian tidak signifikan secara statistik jika kita menerima H0.
  • Jika kita menggunakan nilai t, maka jika nilai t yang semakin besar atau menjauhi 0, kita akan cenderung menolak H0; sebaliknya jika nila t semakin kecil atau mendekati 0  kita akan cenderung menerima H0.
2.7  Karakteristik Model yang Baik
Model dikatakan baik menurut Gujarati (2006), jika memenuhi beberapa kriteria seperti di bawah ini:
·        Parsimoni: Suatu model tidak akan pernah dapat secara sempurna menangkap realitas; akibatnya kita akan melakukan sedikit abstraksi ataupun penyederhanaan dalam pembuatan model.
·        Mempunyai Identifikasi Tinggi: Artinya dengan data yang ada, parameter-parameter yang diestimasi harus mempunyai nilai-nilai yang unik atau dengan kata lain, hanya akan ada satu parameter saja.
·        Keselarasan (Goodness of Fit): Tujuan analisis regresi ialah menerangkan sebanyak mungkin variasi dalam variabel tergantung dengan menggunakan variabel bebas dalam model. Oleh karena itu, suatu model dikatakan baik jika eksplanasi diukur dengan menggunakan nilai adjusted r2 yang setinggi mungkin.
·        Konsitensi Dalam Teori: Model sebaiknya segaris dengan teori. Pengukuran tanpa teori akan dapat menyesatkan hasilnya.
·        Kekuatan Prediksi: Validitas suatu model berbanding lurus dengan kemampuan prediksi model tersebut. Oleh karena itu, pilihlah suatu model yang prediksi teoritisnya berasal dari pengalaman empiris.

2.8  Ringkasan
Analisis regresi berbeda dengan analisis korelasi. Jika analisis korelasi digunakan untuk melihat hubungan dua variable; maka analisis regresi digunakan untuk melihat pengaruh variable bebas terhadap variable tergantung serta memprediksi nilai variable tergantung dengan menggunakan variable bebas. Dalam analisis regresi variable bebas berfungsi untuk menerangkan (explanatory) sedang variable tergantung berfungsi sebagai yang diterangkan (the explained).  Dalam analisis regresi data harus berskala interval atau rasio. Hubungan dua variable bersifat dependensi. Untuk menggunakan analisis regresi diperlukan beberapa persyaratan yang harus dipenuhi.


statistika deskriptif dan statistika inferensial

Statistika adl ilmu yg mempelajari bagaimana merencanakan mengumpulkan menganalisis menginterpretasi dan mempresentasikan data. Statistika merupakan ilmu yg berkenaan dgn data sedang statistik adl data informasi atau hasil penerapan algoritma statistika pada suatu data. Beberapa istilah statistika antara lain: populasi sampel unit sampel dan probabilitas.
Ada dua macam statistika yaitu statistika deskriptif dan statistika inferensial. Statistika deskriptif berkenaan dgn deskripsi data misal dari menghitung rata-rata dan varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau grafik sehingga data mentah lbh mudah “dibaca” dan lbh bermakna. Sedangkan statistika inferensial lbh dari itu misal melakukan pengujian hipotesis melakukan prediksi observasi masa depan atau membuat model regresi.
Statistika deskriptif berkenaan dgn bagaimana data dapat digambarkan dideskripsikan) atau disimpulkan baik secara numerik (misal menghitung rata-rata dan deviasi standar) atau secara grafis (dalam bentuk tabel atau grafik) utk mendapatkan gambaran sekilas mengenai data tersebut sehingga lbh mudah dibaca dan bermakna.
Statistika inferensial berkenaan dgn permodelan data dan melakukan pengambilan keputusan berdasarkan analisis data misal melakukan pengujian hipotesis melakukan estimasi pengamatan masa mendatang (estimasi atau prediksi) membuat permodelan hubungan (korelasi regresi ANOVA deret waktu) dan sebagainya.

sejarah statistika


Sejarah Statistika

Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai “ilmu tentang negara (state)”.
Pada awal abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai pengumpulan dan klasifikasi data”. Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang dalam matematika, terutama probabilitas.
Cabang statistika yang pada saat ini sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem sampel berukuran kecil).
Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika.
Bidang-bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.
Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika, tetapi sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak terkait dengan matematika melihat dari sejarah dan aplikasinya.
Di Indonesia, kajian statistika sebagian besar masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen tersendiri maupun tergabung dengan matematika. ( Sumber : Wikipedia.org).

Jumat, 17 Desember 2010

pengertian statistika dan manfaatnya

Sebagian besar orang pasti sudah lumayan familier bila mendengar kata statistika. Jika ditanya sejak kapan mereka mengenal statistika mungkin sebagian besar orang akan menjawabnya “ oh saat saya mulai sekolah, hmm mungkin sekitar SMP atau SMA”. Tetapi sadarkah anda, sebenarnya kita mengenal statistika semenjak kita lahir. Tanpa kita sadari saat lahir, kita sudah dikenalkan yang namanya statistika. Hal yang paling sederhana misalnya : berat dan panjang badan kita saat lahir. Namun karena saat itu kita masih sangat kecil dan belum bisa berpikir, dan merasakan apa-apa jadi kita tidak mengetahuinya.
Seringkali kita tidak menyadari bahwa dalam kehidupan kita sehari-hari kita seringkali sudah melakukan penelitian, misalnya dalam membeli suatu barang yang berharga mahal seperti komputer, kita tentu saja melakukan penelitian ke toko-toko komputer untuk membandingkan harga, fitur, maupun jaminannya. Memilih pacar ataupun calon suami/istri mungkin juga bisa digolongkan sebagai penelitian. Namun tentu saja kedua macam penelitian ini berbeda dengan penelitian yang biasa kita baca di jurnal ilmiah, karena mungkin dalam melakukan penelitian tersebut kita seringkali tidak menggunakan metode ilmiah melainkan terkadang hanya emosi saja, terlebih lagi dalam hal mencari pacar.

PENGERTIAN STATISTIKA
Sebelum bicara lebih lanjut tentang statistika, kita perlu mencari tau apa sebenarnya statistika itu. Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Atau statistika adalah ilmu yang berusaha untuk mencoba mengolah data untuk mendapatkan manfaat berupa keputusan dalam kehidupan.
Istilah ‘statistika’ (bahasa Inggris: statistics) berbeda dengan ‘statistik’ (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data.
Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif.
Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.(http://wartawarga.gunadarma.ac.id/2009/09/statistika-dan-psikologi/)
Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi), maupun di bidang bisnis, ekonomi, dan industri). Statistika juga digunakan dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum), serta jajak cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.
ESENSI STATISTIKA
Ada tiga hal yang sangat penting dari statistika yaitu:
  • Data yang tersedia / data historis.
Merupakan suatu nilai numerik yang diperoleh dari keterangan masa lampau. Diolah menjadi informasi yang nantinya berguna dalam menentukan keputusan
  • Kriteria Keputusan
Dalam Statistika kita sering dihadapkan pada beberapa pilihan. Masing-masing pilihan memiliki nilai/ manfaat dan konsekuensi yang harus diambil atau dengan kata lain kita harus menentukan keputusan. Dari pilihan-pilihan tersebut akan muncul berbagai kriteria keputusan. Sama halnya dengan pilihan, masing-masing kriteria keputusan memiliki manfaat dan akibat bagi kita
  • Ada Keputusan
MANFAAT STATISTIKA
Manfaat statistika dalam kehidupan sehari-hari sangat beragam sebagai contoh sederhana:
  • Bagi ibu-ibu rumah tangga mungkin tanpa disadari mereka telah menerapkan statiska. Dalam membelanjakan uang untuk kebutuhan keluarganya sering melakukan perhitungan untung rugi, berapa jumlah uang yang harus dikeluarkan setiap bulannya untuk uang belanja, listrik, dll.
  • Sebagai mahasiswa, selain statistika dipelajari secara formal sebenarnya kita sudah menggunakannya dalam perhitungan Indeks prestasi.
  • Dalam dunia bisnis, para pemain saham atau pengusaha sering menerapkan statistika untuk memperoleh keuntungan. Seperti peluang untuk menanamkan saham.
  • Sedangkan dalam bidang industri, statistika sering digunakan untuk menentukan keputusan. Contohnya berapa jumlah produk yang harus diproduksi dalam sehari berdasarkan data historis perusahaan, apakah perlu melakukan pengembangan produk atau menambah varian produk, perlu tidaknya memperluas cabang produksi, dll.
Jadi statistika sebenarnya sangat penting bagi kita, dapat berguna dalam menentukan keputusan meskipun kadangkala penggunaannya tidak kita sadari.

prospek kerja statistika

Pasti kita sering sekali ditanya orang mengenai lapangan kerja apa nantinya setelah lulus sarjana dari jurusan kuliah kita. Apalagi jurusan yang masih jarang terdengar oleh orang alias masih langka. Gak terkecuali adalah program studiku yaitu STATISTIKA. Seperti pertanyaan; “Itu statistika kalau dah lulus kemana?”, “Nantinya jurusan itu kerja dimana?”, “Lulusan statistika kerjanya pada dimana?”, dan lain sebagainya. Mudah memang bagi kamu yang kuliah di jurusan yang hkhalayak ramai sudah mengerti seperti kedokteran, teknik arsitek, dll. Tapi kalau STATISTIKA masih asing bagi beberapa orang, tentunya untuk pertanyaan-pertanyaan di atas perlu penjelasan lebih lanjut.

Terus, kalau diriku sendiri ditanya seperti itu, jawabanku apa? Mudah sekali... sebab STATISTIKA semua bidang bisa! Yah paling dasar orang-orang pada tau apa itu BPS. Tapi gak cuma itu saja, di perusahaan berbagai bidang membutuhkan statistikawan. Kalau penjelasan mengenai lapangan kerja lulusan statistika berikut aku kutip dari website prodi Statistika Undip.

Prospek kerja sarjana Statistika dapat menempati posisi peneliti, CEO serta staff pada bagian Electronic Data Processing, System Analyst, Quality Control, Planning, Controlling and Production, dll. pada berbagai bidang :
1. Lembaga pemerintahan (Depdagri, Diknas, Depkeu, Dephan dll)
2. Sektor industri/jasa keuangan (perbankan, asuransi, bursa saham, BUMN)
3. Industri strategis (PT. PAL, PT.KAI, PT.PLN, PT.GAS, dll)
4. Bidang industri perangkat lunak dan komputer (perancangan sistem,
programming, desain grafis, dll)
5. Bidang industri penerbitan dan percetakan.
6. Industri telekomunikasi (telematika, Telkom)
7. Industri pengolahan data dan informasi (BPS, LSI, Barometer, LRI, dll)
8. Bidang riset dan pengembangan (LIPI, BATAN, LAPAN, BPPR,
Marketing Riset Informasi, dll)
9. Bidang akademik, sebagai dosen di PTN dan PTS terkemuka.

Tuh kan, pada intinya di semua bidang statistika dibutuhkan....

Eitss, sebelumnya aku mau menjelaskan sesuatu. Perihal lapangan kerja. Apakah selalu lulusan sebuah jurusan pasti akan bekerja di bidang jurusan tersebut? Contohnya aku statistika, apakah aku pasti nanti setelah lulus bekerja di tempat yang sesuai dengan statistika? Jawabannya gak selalu!

Ujung-ujungnya emang takdir, semua di tangan Allah. Tapi juga kita harus berusaha. Banyak juga loh, lulusan sebuah jurusan yang pekerjaannya nanti tidak sejalur dengan bidangnya itu. Sebab apa mau dikata, otak kita juga mempengaruhi. Bakat kita dimana juga kadang menjadi hal yang patut diperhitungkan. Oleh itu skill kita lainnya juga harus diasah.

Sabtu, 11 Desember 2010

statistics

    MENGENAL ILMU STATISTIK SECARA SEDERHANA


 
 Secara umum, Ilmu statistik ada 2 jenis yaitu :
- Statistik Deskriptif (Memberikan informasi tentang kinerja dari sebuah proses).
- Statistik Inferensial (Memberikan informasi tentang prediksi yang berhubungan dengan kinerja sebuah proses atau Peluang).
Data
data adalah sekumpulan fakta, angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai referensi dalam mengambil keputusan.
Jenis Data
Data variable : disebut juga data continues atau measurement. Data ini berasal dari hasil pengukuran dan nilainya berada dalam suatu interval atau jangkaun tertentu, contoh : Hasil pengukuran berat badan dari 46 Inspector di PQA, hasill pengukuran panjang Frame Main DV28EC selama 1 bulan, dll.
Data attribute : disebut juga data diskrit atau data non continues. Umumnya data ini merupakan hasil perhitungan dan berupa bilangan bulat, contoh : Jenis suku bangsa Inspector PQA, jenis kelamin (pria/ wanita), jumlah karyawan yang tidak masuk per hari, dll.
Alasan Perlunya Pengumpulan Data
a. Untuk mengumpulkan fakta-fakta tentang suatu masalah atau kesempatan yang dapat dikuantifikasi.
b. Untuk menyampaikan fakta-fakta ini dalam bahasa yang sama.
c. Untuk menetapkan informasi mendasar tentang sebuah proses.
d. Untuk mengukur jumlah dan arah perubahan-perubahan yang terjadi.
e. Untuk membandingkan gambaran proses sebelumnya dan sesudahnya
f. Untuk memfasilitasi analisa keuntungan (Cost Benefit Analysis) dari solusi yang diusulkan.
g. Untuk mengkuantifikasi dampak dari sebuah solusi.


Populasi dan sample
Populasi ialah keseluruhan object yang ingin kita ukur dan analisa. Sedang sample ialah sebagian (kecil) dari populasi dimana kita benar-benar melakukan pengukuran dan dengan ini kita dapat menarik kesimpulan.
Dalam suatu penelitian atau observasi terhadap suatu object ekosistem yang jumlah populasinya besar. Metode sampling akan dipilih dengan mempertimbangkan keterbatasan waktu, biaya dan kepraktisan. Sampling secara statistik memungkinkan kita mengumpulkan informasi tentang suatu populasi tanpa kita harus meneliti secara keseluruhan


Jenis-Jenis Sampling

sampling dikategorikan menjadi 2, yakni :
Sampel Judgmental
1. Sampel dipilih berdasarkan pengetahuan dan pengalaman.
2. Hanya sebagian kecil dari populasi yang diikutsertakan dalam proses seleksi.
3. Sampel dianggap mewakili populasi.
4. Contoh : PT. Livatech bermaksud mengadakan customer satisfication survey. Dari 20 customer yang ada hanya diambil sample 5 customer yang utama saja dengan pertimbangan kelima customer tersebut ordernya diatas 100.000 Part/ bulan.
Sampel Statistical
1. Sampe dipilih secara acak.
2. Seluruh populasi diikutsertakan dalam proses seleksi.
3. Sampel mewakili seluruh populasi.
4. Contoh : PQA mengambil sampel Shaft PU (L) DV28EC dari 10 box yang ada dengan masing-masing box diambil 50 Pcs secara acak.
Metode Sampling
 ada 3 metode sampling, yakni :
1. Systematic sampling : Dalam pengambilan sampel, metode ini menekankan pengambilan yang teratur dengan interval frekuensi yang jelas, misalnya : setiap pengambilan sampel dilakukan diawal shift, pengambilan sampel setiap kelipatan 100 Pcs, dll.
2. Random sampling : Pengambilan sampel ini dilakukan secara acak dan umumnya dibantu dengan statistical software (MINITAB). Metode ini dipandang cukup aman dari bias.
3. Stratified sampling : Ciri khas dari metode sampling ini adalah adanya penggolongan sebuah group yang sangat besar menjadi sub-group dan dalam sub-group ini baru dilakukan pengambilan sampel secara sistematik maupun random.
Pengukuran Central Tendency
Untuk mengukur Central Tendency (diterjemahkan secara bebas = ukuran letak) biasanya menggunakan indikator-indikator mean (rata-rata), median (nilai tengah) dan modus (nilai yang sering muncul).
Mean (rata-rata) ialah jumlah semua observasi dibagi dengan banyaknya jumlah data. Nilai mean sangat dipengaruhi oleh nilai-nilai yang ekstrim.
Median ialah Nilai tengah dari sederetan data yang sudah terurut mulai dari nilai terkecil hingga terbesar (diranking). Median tidak dipengaruhi oleh nilai-nilai yang ekstrim. Jika banyaknya data ganjil maka median sama dengan nilai data yang tepat berada ditengah-tengah. Namun jika banyaknya data genap maka median sama dengan rata-rata dari dua nilai yang berada ditengah. Hal inilah yang dapat dikatakan bahwa median sama dengan 50th percentile atau kuartile kedua (Q2). Sebagai informasi tambahan saja bahwa median umumnya digunakan pada distribusi yang miring (skew) sedang distribusi yang seimbang umumnya memakai mean.
Modus adalah nilai yang paling sering muncul. 

Pengukuran Variasi
Pengertian variasi dalam konteks ini diterjemahkan sebagai ukuran penyebaran.
Parameter-paremeter yang umum dipakai adalah :
- Range (jangkauan) ialah perbedaan antara nilai terbesar dengan nilai terkecil.
- Variance ialah rata-rata kuadrat jarak dari tiap-tiap titik ke rata-rata.
- Standar deviasi merupakan akar dari variance.

Dengan sedikit penjelasan diatas tentunya kita akan mengetahui bahwa dengan rata-rata saja tidak cukup untuk membuat suatu kesimpulan dari data yang kita analisa. Kita perlu mengukur variasi tentunya. Untuk lebih jelasnya, perhatikan contoh berikut ini :
Ada 3 buah perusahaan multinasional di Batam sedang disurvey, sampling dilakukan dengan mengambil 5 orang karyawan tiap-tiap perusahaan dengan hasil berikut (dalam Juta Rupiah). Tujuan dari survey ini adalah untuk membuktikan apakah bisa dikatakan gaji karyawan di Batam itu “rata-rata sama Rp. 3.000.000,00”?
Dengan melihat data diatas belum dapat dikatakan bahwa dua group yang mempunyai mean dan median sama itu dikategorikan sama secara statistik.
Jenis Distribusi
1. Discrete distributions (untuk non continuous data).
2. Continuous distributions.
Bentuk-bentuk Distribusi
- Simetris, bila rata-rata = median atau angka skewness = 0
- Right Skewed (Positif), bila rata-rata > median
- Left Skewed (Negatif), bila rata-rata <>

Continuous Distributions
Distribusi yang umum dipakai pada jenis Continous distribution, antara lain :
1. Normal Distributions Banyak kejadian yang muncul secara acak (random) menghasilkan data dengan distribusi bell shaped. Kurva yang menghubungkan puncak-puncak batang disebut Kurva Peluang Normal yang digunakan untuk meng-estimasi Distribusi Normal dari kejadian-kejadian yang muncul secara acak (random). Dalam kasus-kasus yang umum terjadi, asumsi yang digunakan dalam analisis adalah bahwa data yang kita dapatkan terdistribusi dengan normal dan simetris. Hal ini berarti bahwa kita perlu terlebih dahulu menguji bisa tidaknya suatu group dikatakan terdistribusi secara normal. Dan jika anda menggunakan statistical software (MINITAB), menu pilihan untuk menguji kenormalan distribusi telah tersedia dan juga dapat melihat bentuk dari kurvanya (simetris ataukah miring).
2. Exponential Distribution Secara sederhana distribusi eksponensial dapat dijelaskan sebagai suatu distribusi dari data-data yang menggambarkan periode (waktu) ataupun ruang diantara dua kejadian. Contoh yang paling umum dalam penerapan distribusi eksponensial ini adalah dalam mengukur periode kerusakan sebuah mesin (MTBF = Mean Time Between Failure)
Pengujian Perbedaan Rata-Rata dari Dua Distribusi Kontinyu
Secara Umum, hypothesis dapat dinyatakan dalam persamaan berikut :
Untuk menguji rata-rata dengan test hypothesis biasanya dilakukan dengan t-test, dengan langkah sederhana berikut :
1. Definisikan parameter yang diujikan dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001)
3. Tentukan besar sampel dan lakukan t-test pada data tersebut dengan statistical software (MINITAB) atau software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho

Pengujian Perbedaan antara Dua proporsi
Untuk pengujian proporsi, persamaan yang umum dipakai adalah
Langkah pengujiannya hampir sama dengan t-test untuk rata-rata, yaitu :
1. Definisikan parameter yang diuji dalam Ho dan Ha
2. Pilih confidence interval yang diinginkan, misalnya 95% atau 99% atau 99,9% (alpha =0,05 atau 0,01 atau 0,001).
3. Tentukan besar sampel dan lakukan Z-test pada data yang sudah kita siapkan dengan MINITAB atupun software lainnya.
4. Jika nilai p kurang dari nilai alpha kita dapat merejectkan Ho dan memilih Ha dengan tingkat keyakinan sebesar (1-p)*100% (karena kita melakukan two-tail test. Dan jangan lupa harga harga nilai p yang didapat dikalikan dengan 2 sebelum dibandingkan dengan nilai alpha.
5. Jika nilai p lebih dari atau sama dengan alpha maka bisa dikatakan bahwa kita tidak punya bukti yang kuat untuk merejectkan Ho .
Pengujian Perbedaan Rata-Rata antara 2 group dengan Variance yang berbeda
Pengujian hipotesis untuk rata-rata, pada umumnya menggunakan asumsi bahwa variasi dari 2 group yang diuji adalah sama. Jika asumsi tadi tidak bisa kita gunakan maka kita harus melakukan test yang pada statistical software MINITAB disebut dengan “Separate-Variance t-test” (Untuk Lebih lengkapnya silahkan pelajari tentang MINITAB).
Pengujian Perbedaan Variances antara 2 group yang berbeda
Kembali ke konsep awal bahwa untuk mengetahui apakah variasi antara 2 group yang akan diuji secara statistik dapat dianggap sama atau tidak, diperlukan suatu pengujian untuk menguji variance yang dikenal dengan F-test. Dan mengulang pembahasan sebelumnya bahwa jika variance kedua group yang diuji secara statistik bisa dianggap sama maka dapat menggunakann “pooled-variance t-test” tetapi jika tidak bisa dianggap sama maka digunakan “separate-variance t-test”. Persamaan umum pengujian variances yang sering dipakai :
Analysis of Variances (ANOVA)
Jika diperhatikan sejauh ini penjelasan hanya menyentuh pada 2 group data saja. Lantas bagaimanakah kaidah pengujian untuk yang lebih dari 2 group data, misalnya : 4 group atau bahkan 10 group. Untuk menjawab “tuntutan” ini maka digunakanlah kaidah ANOVA.
Sebagai contoh saja kita mempunyai 4 group data, kita dapat mengujinya apakah keempat group tersebut mempunyai rata-rata yang sama ataukah tidak, Ingat hanya dalam sekali pengujian. Secara sederhana dapat ditampilkan dengan hipotesis berikut :
Ho = Semua rata-rata dari populasi adalah sama
Ha = Tidak semua rata-rata dari populasi adalah sama Jika kita bermaksud menguji hanya satu variable maka menu yang kita pilih adalah one-way ANOVA tetapi jika ada dua variable yang akan diuji maka menggunakan two-way ANOVA.
Dan mengingat pembahasan ANOVA sangat panjang, alangkah baiknya jika diperdalam dengan membaca buku-buku Statistik

halaman

hak cipta oleh masfuhurrizqi iman. Diberdayakan oleh Blogger.