MENGHITUNG KERAGAMAN SAMPEL DAN STANDAR DEVIASI

Apa itu Standar Deviasi??

Standar Deviasi mengukur sebaran data diantara nilai mean. Jika kamu ingin membandingkan beberapa data yang memiliki mean yang sama tetapi dalam rentang berbeda, standar deviasi bisa digunakan, misalnya mean dari dua sebaran data adalah sama, tetapi salah satu kelompok data lebih tersebar rentangnya, maka ia dikatakan memiliki ilai standar deviasi yang tinggi, sebaliknya jika rentang antara data dalam kelompok adalah kecil, maka nilai standar deviasinya akan rendah.


Bagaimana menghitung Standar Deviasi??

Formula baku untuk menghitung standar deviasi adalah sebagai berikut :


Ilustrasi :
Nilai ujian matematika dari 10 siswa adalah :

9  5  7  7  6  5  4  8  9  10  5  7  8  5  4  4  3  7  10  9

Hitunglah standar deviasinya......

Jawab.

1. Untuk menghitung standar deviasi kita perlu mencari mean terlebih dahulu,




2. Kemudian kita akan mencari formula untuk (xi – μ2) dengan cara mengurangkan xdengan mean (μ) lalu kita kuadratkan,


x1 = (9 – 6,6)2 = (2,4)2 = 5,76
x2 = (5 – 6,6)2 = (-1,6)2 = 2,56
x3 = (7 – 6,6)2 = (0,4)2 = 0,16
x4 = (7 – 6,6)2 = (0,4)2 = 0,16
x5 = (6 – 6,6)2 = (0,6)2 = 0,36
x6 = (5 – 6,6)2 = (-1,6)2 = 2,56
x7 = (4 – 6,6)2 = (-2,6)2 = 6,76
x8 = (8 – 6,6)2 = (1,4)2 = 1,96
x9 = (9 – 6,6)2 = (2,4)2 = 5,76
x10 = (10 – 6,6)2 = (3,4)2 = 11,56
x11 = (5 – 6,6)2 = (-1,6)2 = 2,56
x12 = (7 – 6,6)2 = (0,4)2 = 0,16
x13 = (8 – 6,6)2 = (1,4)2 = 1,96
x14 = (5 – 6,6)2 = (-1,6)2 = 2,56
x15 = (4 – 6,6)2 = (-2,6)2 = 6,76
x16 = (4 – 6,6)2 = (-2,6)2 = 6,76
x17 = (3 – 6,6)2 = (-3,6)2 = 12,96
x18 = (7 – 6,6)2 = (0,4)2 = 0,16
x19 = (10 – 6,6)2 = (3,4)2 = 11,56
x20 = (9 – 6,6)2 = (2,4)2 = 5,76


Maka hasil yang kita peroleh :

5,76   2,56   0,16   0,16   0,36   2,56   6,76   1,96   5,76   11,56   2,56   0,16   1,96   2,56   6,76   6,76   12,96   0,16   11,56   5,76

3. Setelah menghitung formula (xi – μ2) di atas, kita akan jumlahkan semua nilai yang kita peroleh pada langkah 2,

5,76+2,56+0,16+0,16+0,36+2,56+6,76+1,96+5,76+11,56+2,56+0,16+1,96+2,56+6,76+6,76+12,96+ 0,16+11,56+5,76 = 88,8

4. Kita masukkan rumus berikut ini :


= 1/20 * 88,8 = 4,44

Nilai yang kita peroleh dari langkah 4 ini adalah 4,44, kita kenal juga sebagai keragaman sampel (sample variance).

5. Kemudian mencari nilai standar deviasi kita tinggal cari akar kuadrat dari nilai keragaman sampel,


dengan demikian nilai standar deviasi yang kita peroleh dari nilai 20 siswa tersebut adalah 2,11.(yoso)

MODEL AUTOREGRESSIVE (AR) TIME SERIES

click to get the pdf version

Ketika sebuah pengamatan tidak lepas dari pengamatan masa lalunya, kita dapat menyusun sebuah model dari data masa lalu tersebut. Kegiatan menghubungkan sebuah pengamatan dalam bentuk data time series terhadap nilai masa lalunya kita kenal sebagai model autoregresif. Model ini seringkali digunakan dalam peramalan ekonomi. Konsep dasarnya adalah mengestimasi nilai peramalan dengan cara meregresikan nilai pengamatan aktual dengan nilai pengamatan masa lalu, itulah model autoregresif (AR).

Sangatlah logis jika nilai masa lalu sebuah variabel memiliki kekuatan untuk memprediksi nilai peramalan yang akan datang. Model autoregresif sebenarnya sangat sederhana, ia menggunakan hasil pengamatan yang baru saja dilakukan untuk memprediksi nilai masa depan. Misalnya katakanlah pengamatan tahunan Yt akan diprediksi menggunakan data Yt-1 atau 1 tahun ke belakang, demikian juga bulan, kuartal atau semester.

Dalam peramalan time series, Yt disebut juga sebagai first order autoregressive, dengan persamaan sebagai berikut :
Dimana :
Yt = first order autoregressive / variabel dependen
β0, β1 = koefisien regresi
Yt-1 = nilai lag variabel dependen dalam first order autoregressive
μt = error

Jika kita memiliki model AR1 yang diketahui parameternya seperti berikut ini :

β0 = 1; β1 = 0,6; dan σ = 0,05

Jika diketahui Yt = 8, maka prediksi kita untuk first order autoregressive (Yt-1) tinggal memasukkan nilai-nilai tersebut ke dalam model AR1 :

Yt-1 = 1 + (0,8)(8) + μt-1 = 7,4 + μt-1

Karena menggunakan selang kepercayaan 95%

(7,4 - 1; 7,4 + 1) = (6,4 ; 8,4)


Kita akan menyusun model autoregresif (AR3) time series untuk data consumer price index Islandia selama 20 Tahun mulai dari Tahun 1999 hingga Tahun 2018, data dalam bentuk xls bisa kamu ambil disini,
Persamaan untuk 3rd order autoregressive yang kita gunakan menjadi :


Data :


Sederhana saja untuk menyusun data lag, 1st order, 2nd order, 3rd order, dan seterusnya, data hanya diturunkan 1 tahun ke depan,


Untuk meregresikan data CPI dengan AR1, AR2 dan AR3 dengan excel cukup pilih Menu Data - Data Analysis - Regression,


di kotak dialog Regression isikan data variabel dependen, dan variabel independen seperti berikut, data variabel dependen dimulai dari tahun 2002, karena data lag 3 dimulai dari tahun 2002,


Kemudian hasilnya,


Model AR3 yang kita peroleh tidak signifikan, signifikansi model adalah 2,27, sedangkan variabel lag yang signifikan hanya lag 2 dengan P-value sebesar 0,07. Untuk dasar menjalankan regresi linier dan teorinya kamu bisa baca lagi di bahasan ini.

Persamaan yang kita peroleh dari model AR3 adalah :

Yt-3 = 2,79 + 1,74(lag1) – 0,97(lag2) + 0,22(lag3)

Berikut ini hasil regresi dengan model AR2 :

Persamaan yang kita peroleh dari Model AR2 adalah :

Yt-2 = 2,76 + 1,6(lag1) – 0,63(lag2)

REGRESI NON LINIER DENGAN PROSEDUR ESTIMASI KURVA


click to get the pdf version

Model regresi linier yang kita ketahui dalam pemodelan variabel dependen (Y) dengan beberapa variabel independen (X) adalah seperti berikut ;

Y = b0 + b1X1 + b2X2 + b3X3 + .... + bnXn

Kalau kita plotkan grafik dalam bentuk scatterplot bisa kita lihat pola sebaran data variabel independen mengikuti garis linier terhadap variabel dependen,


Kita lihat plot residual untuk regresi linier, tersebar secara merata, ini merupakan asumsi dari regresi linier,


Berikut ini adalah model regresi Non Linier secara umum;


Y =𝑓(X1, β1) + 𝜀

dimana : 
Y = variabel dependen yang akan digunakan untuk menghitung pemodelan
f = fungsi dari model regresi
X1 = vektor variabel bebas (independen)

β1 = vektor parameter yang belum diketahui
𝜀 = residual atau error

Asumsi dalam persamaan regresi non linier :
  • Error terdistribusi secara normal,
  • Keragaman bersifat homogen (Var(ϵi) = σ2 untuk i)
  • Error independen (Cov(ϵi, ϵj) = 0 untuk i, j)

Beberapa persamaan lain yang biasa digunakan untuk Regresi Non Linier :
  • Von Bertalanffy-Richard
  • Michaelis-Menten
  • Model Logistik

Regresi non linier menggunakan estimator model kuadrat terkecil (least square) non linier untuk membuat estimasi terhadap parameter. Seperti halnya estimator model kuadrat terkecil regresi linier, estimator NLS berguna untuk meminimalkan jumlah sum of squared errors (SSE). Formulanya seperti berikut ini :

Estimator NLS terhadap β adalah :

dimana :
X* adalah matriks turunan parsial dari model terkait dengan parameter
Parameternya dihitung secara terus menerus dengan persamaan tersebut hingga mendapatkan nilai SSE yang paling kecil. Prosedur ini dikenal sebagai iterasi.

Contoh scatterplot pola non linier adalah seperti gambar berikut ini :


Bagaimana menentukan model non linier untuk data yang kita miliki, kita akan lakukan prosedur curve fit pada SPSS versi 25, bagi yang belum punya softwarenya bisa beli disini.

Kita memiliki data efek waktu pemasangan iklan terhadap penjualan produk kosmetik "BELLA LUNA", waktu pemasangan iklan dinyatakan dalam bulan, sedangkan variabel bebas kita gunakan nilai penjualan sesaat setelah iklan berhenti ditayangkan atau masih ditayangkan.

Nilai negatif (-) mengindikasikan bulan sesudah iklan ditayangkan terhadap waktu penjualan, nilai 0 mengindikasikan waktu penayangan iklan pada bulan yang sama dengan penjualan, sedangkan nilai positif (+) mengindikasikan waktu iklan masih tayang setelah penjualan. Nilai penjualan dinyatakan dalam Ribuan Dollar US.

Data xls nya dapat kamu ambil disini,

 

Untuk mengambil data dari excel, seperti biasa kita pilih File - Import Data - Excel,


Pilih data kamu, open,


dan sudah masuk ke dalam jendela IBM SPSS versi 25,


Untuk prosedur curve fitting di IBM SPSS versi 25 kita dapat masuk ke tab Analyze - Regression - Curve Estimation,


Masukkan pada kotak dialog curve estimation, variabel dependen Sales, dan variabel independen month, kita coba dulu plotkan kurva linier,


Hasilnya,

Mari kita lihat nilai R-square = 0,001, dan nilai signifikansi sangat tidak signifikan, 0,916 lebih besar dari nilai kritik α = 0,05, sangat mengerikan bukan??lebih lagi plot datanya,



Oleh karena itu kita akan coba model lain, 


Hasilnya ;

Baik model kubik maupun kuadratik sama signifikan, pilih aja model yang paling simpel yaitu kuadratik, dengan demikikan model regresi non linier yang kita peroleh sesuai koefisien regresi adalah ;

Y = 216,8 + 2,53X1 - 4,87X2

Persamaan regresi yang kita peroleh mengikuti pola parabola (kuadratik), karena persamaan inilah yang menjelaskan model non linier yang paling baik.(yoso)

UJI T SATU SAMPEL (INDEPENDEN)

click to get the pdf version

Uji t sampel tunggal membandingkan mean dari dua kelompok yang berbeda untuk menentukan apakah terdapat bukti statistik bahwa mean populasi dari kelompok tersebut berbeda nyata satu dengan yang lain, uji ini biasa juga dikenal sebagai, uji t independen, uji pengukuran t independen, student t-test, unpaired t-test, dan unrelated t-test.

Uji t sampel tunggal biasanya digunakan untuk menguji beberapa kasus antara lain :
  • Perbedaan statistik dari mean antara dua kelompok populasi,
  • Perbedaan statistik dari mean antara dua intervensi,
  • Perbedaan statistik dari mean antara dua skor yang berubah.
Uji t sampel tunggal ini hanya membedakan mean untuk hanya dua kelompok saja, ia tidak dapat digunakan untuk membandingkan lebih dari dua kelompok populasi, jika terdapat lebih dari dua kelompok populasi, kamu bisa gunakan uji ANOVA (lihat bahasannya disini).

Untuk melakukan uji t sampel tunggal, data yang digunakan harus memenuhi persyaratan sebagai berikut :
  • Variabel dependen adalah kontinyu (interval atau rasio),
  • Variabel independen adalah kategorik (dua atau lebih kelompok),
  • Kasus dengan sampel yang terdiri dari dua kelompok variabel yaitu terikat dan bebas yang saling terkait (misalnya gender dengan waktu yang dihabiskan menonton TV),
  • Sampel yang diambil bersifat independen atau berdiri sendiri; artinya tidak ada hubungan antara subjek pada setiap sampel, tidak satupun dari subjek dalam satu kelompok populasi dapat mempengaruhi subjek pada kelompok populasi lainnya.
  • Data sampel bersifat acak saja dari setiap populasi,
  • Data terdistribusi normal, (untuk mengetahui ini lihat pada bahasan uji normalitas data disini),
  • Keragaman bersifat homogen (data tidak memiliki keragaman yang besar atau perbedaan tidak terlalu jauh),
  • Tidak terdapat pencilan, sama dengan poin di atas, data tidak ada yang sangat berbeda dari lainnya.
Hipotesis
Hipotesis nol (H0) dan alternatifnya (H1) dapat dinyatakan sebagai berikut :

H0 = µ1 = µ(mean dari dua kelompok populasi adalah sama)
H1 = µ1 ≠ µ(mean dari dua kelompok populasi tidak sama)

atau dalam bentuk lain :

H0 = µ1 - µ2 = 0 (perbedaan antar dua mean populasi sama dengan 0)
H1 = µ1 - µ2 ≠ 0 (perbedaan antar dua mean populasi tidak sama dengan 0)

dimana µdan µ2 merupakan mean populasi untuk kelompok 1 dan 2, berturut-turut.

Uji Levene dalam Uji t Sampel Tunggal

Uji t sampel tunggal mengasumsikan keragaman populasi bersifat homogen, jika menggunakan software SPSS, maka akan dimasukkan juga Uji Levene jika kamu menjalankan uji ini. Hipotesis yang digunakan untuk Uji Levene adalah :

H0: σ12 - σ22 = 0 (keragaman populasi kelompok 1 dan kelompok 2 adalah sama)

H1: σ12 - σ22 ≠ 0 (keragaman populasi kelompok 1 dan kelompok 2 tidak sama)
Jika kita menolak Hipotesis Nol Uji Levene, maka keragaman antara dua kelompok populasi menjadi tidak sama, oleh karena itu asumsi keragaman populasi bersifat homogen akan tertolak.

Perlu kita ketahui bahwa output dari uji t sampel tunggal terdapat dua baris yaitu "equal variances assumed" dan "equal variances not assumed". Jika uji Levene mengindikasikan bahwa keragaman adalah sama antar dua kelompok (nilai p-value besar), maka kita akan melihat output pada baris "equal variances assumed", namun jika keragaman tidak sama antar kedua kelompok, maka hasil output yang kita lihat adalah pada baris "equal variances not assumed".

Ilustrasi

Di Desa Y diambil sampel sebanyak 31 orang karyawan dan ditanya berapa menit per hari mereka menghabiskan waktu untuk menonton TV setelah bekerja, data diambil secara acak antara responden pria dan wanita, datanya adalah sebagai berikut, bisa juga kamu download data xls disini :


Data tadi berasal dari file excell, untuk analisis ini kita ilustrasikan menggunakan IBM SPSS versi 25, jika belum punya yang terbaru kamu bisa beli disini.

Untuk memindahkan data dari excel ke SPSS kamu bisa pilih di tab File - Import Data - Excel,


Di kotak dialog open data pilih data excel kamu - open,


Lihat data sudah ditampilkan di jendela SPSS,


Sebelum melakukan analisis kita akan lihat dulu standar deviasi dan mean antar dua kelompok variabel tersebut, di tab Analyze - Compare Mean - Mean, Masukkan variabel WatchSpend ke kotak independent variable,



Hasilnya ditampilkan di output sebagai berikut ;


Hasil mean menunjukkan bahwa rata-rata pria menghabiskan waktu lebih banyak 10,71 menit menonton TV daripada wanita (114,71 - 104).

Dengan demikian H0 yang kita bangun adalah :


H0 = µ1 = µ2 (mean dari dua kelompok populasi adalah sama)



Mari kembali kita lihat sebaran keragaman dua kelompok melalui diagram batang daun, di SPSS kamu bisa pilih tab Analyse - Descriptive Statistics - Explore,





Di jendela explore, masukkan variabel WatchSpend ke dependent variables, dan factor list isikan Sex, centang plot, dan OK,


Lihat output diagram batang daunnya,


Lihat rentang keragamanan variabel WatchSpend, untuk pria (male) menghabiskan lebih banyak waktu menonton daripada wanita (female), ini menunjukkan keragaman antara dua kelompok populasi tidak sama, atau dengan kata lain kita terima H1 dari hipotesis Uji Levene yang menyatakan :

H1: σ12 - σ22 ≠ 0 (keragaman populasi kelompok 1 dan kelompok 2 tidak sama)

Karena asumsi keragaman pada uji Levene ditolak (tolak H0), maka output yang kita gunakan adalah pada baris "equal variances not assumed", lihat kembali penjelasan pada Uji Levene di atas, dengan demikian kita masuk ke uji t sampel tunggal, dengan Analyze - Compare Means - One Sample T-test, 


Masukkan WatchSpend dalam test variable, klik option untuk menentukan selang kepercayaan,


Lihat outputnya, IBM SPSS versi 25 sudah memisahkan asumsi pada Uji Levene dan memilih nilai t secara otomatis,



Lihat nilai sig.(2-tailed) adalah 0,000 artinya p kurang dari 0,001 lebih dari selang kepercayaan yang kita harapkan yaitu α = 0.05, dengan demikian kita dapat menolak H0 dan menyimpulkan bahwa mean antara pria dan wanita dalam menghabiskan waktu menonton TV berbeda secara sigifikan, atau dengan kata lain :

  • Terdapat perbedaan signifikan antara mean dua kelompok populasi (t29 = 21,96, p kurang dari 0,001),
  • Rata-rata waktu menonton pria lebih lama 10,71 menit daripada wanita.
  • download data hasil uji t satu sampel dalam bentuk file SPSS disini.
Untuk bahasan mengenai uji t berpasangan kamu bisa lihat disini.

MODEL DEKOMPOSISI TIME SERIES

click to get the pdf version

Dekomposisi time series adalah sesuatu yang sering kita dengan dalam subjek ekonometrika khususnya peramalan bisnis dan data ekonomi. Dalam bentuk umumnya, dekomposisi time series klasik mengasumsikan bahwa serangkaian peristiwa yang terjadi di masa lampau tidak terlepas dari tiga komponen pokok yang kemudian dikombinasikan untuk menghasilkan data yang sedang diamati. keempat komponen ini adalah trend, siklik, komponen musiman dan acak (irregular). Komponen ini biasanya dinyatakan dalam Tt, St, Et, dan Yt. Formula yang biasa digunakan untuk dekomposisi adalah :

Dekomposisi Aditif : Yt = Tt + St + Et



Dekomposisi Multiplikatif : Yt = Tt x St x Et


Peramalan metode dekomposisi time series sebenarnya sudah sangat tua, dulu digunakan untuk menghitung orbit planet-planet oleh para ahli astronomi. Persons (1919) merupakan tokoh pertama yang secara jelas mengungkapkan bahwa time series disusun atas 4 jenis fluktuasi, antara lain
  1. kecenderungan jangka panjang atau trend sekuler,
  2. pergerakan siklik yang mempengaruhi trend jangka panjang, pola siklik ini akan mencapai puncaknya selama periode kemajuan industri dan mencapai titik terendahnya pada periode depresi, naik dan turunnya tergantung pada siklus bisnis,
  3. pergerakan musiman (seasonal movement) yang terjadi setiap tahun, bentuknya tergantung sifat dari data itu sendiri,
  4. keragaman residual yang berubah mempengaruhi variabel-variabel yang diperhitungkan, atau peristiwa-peristiwa besar seperti perang dan kekacauan suatu negara dapat mempengaruhi banyaknya variabel yang digunakan.
Keempat keragaman tersebut telah diasumsikan saling lepas antara satu dengan yang lainnya dan ditunjukkan melalui model dekomposisi aditif berikut ini :

Xt = Tt + Ct + St + It

dimana Xt adalah rangkaian peristiwa yang diamati, Tt adalah trend jangka panjang, Ct adalah siklus bisnis, dan St adalah musiman dan I adalah ketidak-teraturan (irregulars).
Jika terdapat saling keterkaitan diantara beberapa komponen tersebut, maka hubungannya ditunjukan melalui model multipllikatif yaitu :

Xt = Tt x Ct x St x It

dimana St dan It ditunjukkan pada proporsi terhadap trend-siklik Tt Ct. Pada beberapa kasus, percampuran antara model aditif - multiplikatif digunakan.

Berikut ini adalah data "unadjusted real consumer expenditure" negara Z sejak Tahun 1999 hingga 2017, data diambil per kuartal mulai dari Maret 1999, untuk latihan dan coba-coba, data aslinya bisa kamu ambil disini.



Kita plot datanya, apakah mengandung trend?



Ya, data mengandung trend dan pola musiman, untuk menghitung peramalan dengan dekomposisi time series, kita akan smoothing data dengan moving average, weighted average, detrended (menghilangkan trend), dan menentukan nilai musiman sehingga diperoleh data seasonal adjusted.

Tahap pertama adalah menentukan moving average, karena menggunakan data kuartal maka akan kita susun 4 periode moving average, misalnya nilai 4 MA untuk Juni 1999 diambil dari rataan periode Maret 1999 - Juni 1999 - Sep 1999 - Des 1999, proses perataan 4 MA berasal dari 4 periode waktu guna mendapatkan data yang smooth,



Setelah itu menambahkan proses smoothing dengan weighted average (lihat bahasan peramalan dengan weighted average disini), proses ini menggunakan rataan data dari 2 periode 4 MA.

Seperti yang kita ketahui langkah weighted average memerlukan bobot (weight), penekanan ini akan kita berikan pada data yang sudah di smoothing melalui proses 4 moving average, kemudian dirata-rata kembali dari 2 periode 4 moving average, menjadi data 5 weighted average. Perlu diketahui proses smoothing ini dilakukan untuk mengeliminasi komponen acak (irregular).



Setelah mendapatkan nilai 5 moving average, kita akan lakukan prosedur detrend pada data agar trend tidak mendominasi, Proses detrend dilakukan dengan membagi data aktual dengan weighted average, hasil detrend memisahkan antara komponen trend dan siklik, sedangkan siklik dihilangkan dengan proses smoothing, data detrend nantinya akan kita gunakan untuk mencari komponen musiman,



Komponen musiman diperoleh dari perataan detrend pada setiap periodenya, untuk lebih jelasnya mengenai indeks musiman, kamu bisa baca bahasan peramalan menggunakan indeks musiman disini. Misalnya komponen musiman untuk bulan Maret, diperoleh dari perataan detrend (data aktual yang telah dipisahkan dari komponen siklik dengan smoothing) pada setiap bulan Maret, begitu pula dengan Juni, September, dan Desember. Berikut ini adalah indeks musiman yang diperoleh:



Setelah diperoleh komponen musiman, maka kita peroleh data aktual dengan seasonal adjusment (SA Yt). Inilah yang merupakan hasil peramalan model dekomposisi time series.



Mari kita lihat perbandingan data aktual unadjusted real consumer expenditure negara Z (Yt) dengan data seasonal adjusted (SA Yt) dengan dekomposisi time series.



Nilai peramalan tidak mengandung periode siklik dan acak yang menonjol, setelah melalui proses smooth, weighted, musiman hingga diperoleh nilai seasonal adjusted.(yoso)

Masih bingung??download aja data excelnya disini, bisa langsung dilihat rumus-rumusnya.


download bahasan ini dalam bentuk pdf