KONSEP HETEROSKEDASTISITAS DAN DETEKSINYA DENGAN UJI PARK

click to get the pdf version

Apa itu heteroskedastisitas???coba kita lihat uraian berikut, 

Asumsi OLS V(εj) = σ2 untuk j=1,2,...n, dimana keragaman dari error adalah konstan, ini adalah Asumsi data bersifat homoskedastik. Jika error tidak memiliki keragaman konstan maka dikatakan bersifat heteroskedastis

Error dapat meningkat ketika nilai variabel bebas (independen) meningkat. Misalnya sebuah model mengenai harapan hidup di suatu negara Y dimana variabel dependen yang digunakan adalah harapan hidup. Negara dengan tingkat migrasi dan fertility rate rendah tentunya akan memiliki harapan hidup yang rendah. Tetapi negara dengan tingkat migrasi dan fertility rate yang tinggi akan tinggi pula angka harapan hidupnya. Hal itu menyebabkan tinggi juga jumlah kelahiran maupun tingkat migrasi di negara tersebut, tetapi untuk negara dengan harapan hidup tinggi tersebut, hal lain selain dua variabel tersebut akan berpeluang menjadi tinggi juga di negara tersebut. Karena itu keragaman di negara Y akan menjadi lebih besar oleh variabel lain selain dua variabel bebas tadi, karena itulah terjadi masalah heteroskedastisitas

Bisa dikatakan pula bahwa error pada negara yang lebih besar mungkin memiliki keragaman yang lebih besar daripada error yang terjadi pada negara yang lebih kecil. Pendapatan pajak dari negara yang lebih besar mungkin lebih volatil daripada penerimaan pajak negara kecil. 

Error juga bisa meningkat jika nilai variabel independen menjadi ekstrim ke satu arah, kemudian dengan sedikit penyesuaian bisa menjadi ekstrim ke arah lain. Katakanlah nilai yang tadinya negatif dan besar, bisa tiba-tiba menjadi positif dan besar. Pengukuran error dapat menyebabkan masalah heteroskedastisitas juga. Beberapa responden mungkin akan memberikan hasil survey yang lebih akurat daripada responden lain. 

Atau misalnya hubungan yang tak masuk akal dimana pendapatan akan menyebabkan perbedaan belanja antara orang Korea dan orang Jepang, bukan perbedaan pendapatan yang menjadi fokus, tetapi orang Korea dan orang Jepang. Hal yang normal adalah perbedaan pendapatan akan mempengaruhi besarnya belanja seseorang, entah darimanapun asalnya.

Masalah heteroskedastisitas dapat menyebabkan estimasi OLS kita menjadi tidak BLUE (best linear unbiased estimator), artinya jika terjadi masalah heteroskedastisitas pada data maka  standar error akan menjadi bias, uji signifikansi model bisa saja memberikan hasil terlalu tinggi atau terlalu rendah. Dengan demikian uji statistik yang menggunakan standar error akan menjadi tidak valid.

Bagaimana cara mendeteksi masalah heteroskedastisitas??

Cara pertama adalah dengan metode grafik residual, Cukup dengan plot residual atau squared residual terhadap variabel independen atau predicted value variabel dependen. Jika terdapat sebuah pola, maka terdapat hubungan antara residual dengan X atau Xβ. Untuk uji heteroskedastisitas metode grafik residual kamu bisa lihat disini.

Salah satu uji untuk deteksi heteroskedastisitas adalah uji park, Uji Park ini dikembangkan oleh Park pada tahun 1966 (Park, 1966). Dengan data yang kita miliki sebagai ilustrasi berikut ini:


Tahap-tahap uji:

1. Langkah menginput dan mengimpor data serta menjalankan regresi.
Untuk langkah input data tidak perlu diterangkan lebih jauh karena telah dibahas pada bahasan regresi dengan eviews, kamu bisa lihat bahasannya disini.

2. Setelah itu kita akan membuat variabel baru, katakanlah disini res2 dengan menggunakan rumus resid^2, karena pada uji heteroskedastisitas kita akan bermain dengan residual kuadrat, langkahnya dilakukan dengan mengklik tombol Genr seperti berikut ini:

lalu isikan dengan res2 = resid^2, seperti berikut:


3. Setelah itu residual tadi akan kita regresikan dengan menggunakan persamaan ln(res2)=b0 + b1X1 + b2X2 + b3X3 + e. yaitu dengan memilih menu QUICK - ESTIMATE EQUATION - kemudian isikan log(res2) c x1 x2 x3 - lalu klik OK seperti berikut ini:


4. Setelah itu output akan didapatkan seperti berikut ini:


Kita dapat melihat koefisien yang dihasilkan dengan uji Park ini yaitu:
Log(res2) = 6,19 + 0,047 X1 - 0,01 X2 - 0,45 X3
t-statistik     (2,66)     (0,86)       (-0,28)     (-0,44)
p-value        (0,015)   (0,39)        (0,78)      (0,66)

Dari output diatas dapat kita lihat bahwa koefisien masing-masing variabel independen bersifat tidak signifikan, maka dengan demikian dapat kita simpulkan bahwa model yang kita kembangkan tidak mengandung masalah Heteroskedastisitas.