Tutorial Cara Mengatasi Outlier dengan SPSS

Cara Mengatasi Outlier dengan SPSS

Setelah kita belajar bersama tentang outlier, maka selanjutnya dalam artikel ini kita akan membahas bagaimana caranya mengatasi outlier dengan SPSS. Jika para pembaca sekalian sudah mempelajari artikel kami tentang outlier, maka kami anggap anda semua sudah paham alasan perlunya outlier ini di atasi. Bagaimana cara mengatasi outlier? Bagaimana cara mengatasi outlier dengan SPSS? baik univariat maupun multivariat? Baiklah langsung saja kita bahas. Pada dasarnya ada 2 tahap, yaitu tahap deteksi dan mengatasi.

Catatan Penting: Dalam bahasan ini, kita membahas Outlier dalam artian Outlier pada Regresi Linear. Sedangkan outlier pada data atau pada sebuah variabel, kami bahas pada artikel: Membuang outlier dengan Excel.

Deteksi Outlier

Langkah pertama adalah melakukan deteksi outlier. Dalam hal ini yang dideteksi adalah outlier univariat dan multivariat sekaligus. Caranya kita harus melakukan uji regresi linear seperti biasanya. Jika belum paham cara melakukan regresi linear dengan SPSS, anda bisa pelajari pada artikel-artikel kami di website ini. Sederhananya perhatikan langkah berikut:

Buat dataset untuk regresi linear berganda seperti gambar di bawah ini. Untuk mempermudah, anda bisa download file secara lengkap DISINI.

Dataset Regres Linear Deteksi Outlier
Dataset Regres Linear Deteksi Outlier

 

Setelah itu lakukan regresi seperti cara berikut: Klik Analyze pada Menu -> Regression -> Linear. Kemudian masukkan variabel yang akan dianalisis.

Langkah Regres Linear Deteksi Outlier

 

Klik tombol SAVE. Maka akan terbuka jendela seperti di bawah ini. Kemudian klik Studentized dan Mahalanobis. Lalu tekan tombol Continue.

Save Regresi Linear Deteksi Outlier

 

Jika sudah kembali ke jendela utama, klik OK. Selanjutnya lihat Output.

Casewise Diagnostics Deteksi Outlier

 

Anda dapat melihat bahwa pada output terdapat tabel Casewise Diagnostics, hal itu menunjukkan bahwa terdapat observasi atau sampel dengan nilai absolut studentized residual lebih dari 3. Maka observasi tersebut menjadi outlier.

Langkah terakhir di atas, hanya dapat mendeteksi adanya outlier univariat saja. Untuk mendeteksi outlier univariat, maka anda harus melakukan langkah berikut: pada menu, klik Transform -> Compute Variable. Jika jendela baru terbuka, ketikkan target variable: Probabilitas Mahalanobis. Dan ketikkan kode ekspresi pada Numeric Expression sebagai berikut: CDF.CHISQ(Mah,3). Penjelasan kode: Mah: Mahalanobis Distance. 3 adalah banyaknya jumlah variabel bebas.

Probabilitas Mahalanobis

 

Mengatasi Outlier

Sebenarnya cara pertama yang kita lakukan adalah melakukan transformasi data untuk mereduksi adanya outlier tersebut. Untuk mempelajari caranya, anda bisa baca artikel kami tentang transformasi data. Dalam hal ini kita coba untuk mengatasinya dengan cara membuang outlier tersebut dari analisis regresi linear berganda, yaitu dengan langkah sebagai berikut: Pada menu, klik Data -> Select Case -> Pilih if condition satisfied -> tekan tombol If.

Select Case Deteksi Outlier

 

Jika jendela baru terbuka, maka selanjutnya pada kolom isian ekspresi, ketikkan kode sebagai berikut: Abs(SRE_1)<3 and Probabilitas Mahalanobis>0.001. Maksud kode: Abs: Absolut, SRE_1: Studentized Residual.

Ekspresi Select Case Deteksi Outlier

 

Artinya kita akan membuang observasi yang mempunyai nilai absolut studentized residual lebih dari 3 dan/atau probabilitas kurang dari 0.001. Kemudian tekan tombol Continue. Di jendela utama tekan OK. Lihat pada dataset, ada tanda yang menunjukkan bahwa beberapa observasi dikeluarkan dari analisis.

Mengatasi outlier dengan SPSS

Sampai di sini kita sudah berhasil mengeluarkan outlier. Apa yang harus kita lakukan selanjutnya? Jawabannya mudah, yaitu ulangi regresi linear berganda seperti langkah pertama, kemudian cek ulang apakah masih ada outlier. Jika sudah tidak ada, tentunya lihat dan nilai apakah ada masalah asumsi klasik lainnya. Jika ada, maka pandai-pandailah untuk mengatasinya. Dan anda bisa mempelajari semua cara untuk mengatasi masalah asumsi klasik di website kami ini.

By Anwar Hidayat

20 KOMENTAR

  1. Selamat malam, saya sedang menguji normalitas untuk regresi linier sederhana. Tetapi data saya tidak normal. Padahal saat dilakukan deteksi outliar tdk terdapat data yg ouyliar. Mohon bantuanya.

  2. Selamat pagi mas anwar. Nama saya Njar. Saya ingin bertanya. Data saya 0, (desimal) dan dan ada yg negatif. Seberannya juga tidak merata 0,-ribuan. Say cek outliernya tidak ada oulier pdahal data tidak normal. Apa yg harus say lakukan agar data normal?

    • Lakukan transformasi. Jika yang tidak normal adalah residual, maka periksa variabel terikat terikat anda, apakah berdistribusi normal atau tidak.

  3. Selamat pagi mas anwar, saya sudah melakukan transformasi menggunakn log,ln,sqrt tapi tetap datanya tidak normal. Data saya 0, dan ada yg negative juga. Transformasi apa untuk data yg bernilai desimal dan negative? Terima kasih

    • Ya memang benar, bahwa setiap memasukkan variabel lag ke dalam model, atau melakukan transformasi lag atau difference dalam model dapat mengatasi masalah autokorelasi. Namun perlu diperhatikan juga bahwa setiap tranformasi ini menyebabkan model berubah sesuai dengan model transformasinya.

  4. salam saya mau bertanya, saya memiliki penelitian dengan 3 variabel x dan 1 variabel y, penelitian saya memiliki total 609 data setelah saya coba transformasi dengan lg,ln, dan sqrt ada 1 variabel yang tidak bisa lulus heteros, bahkan setelah dibuang hingga tersisa 21 data variabel tersebut tidak dapat lulus heteros, bagaimana penyelesaiannya? terimakasih sebelumnya

    • Jika terdapat masalah heteroskedastisitas yang kemungkinan besar disebabkan oleh salah satu variabel saja, maka sebaiknya anda menggunakan metode weighted least square (WLS) yaitu regresi dengan pembobot. Dimana pembobot dalam model wls tersebut adalah variabel yang menjadi penyebab terjadinya heteroskedastisitas.

  5. permisi kak saya menguji normalitas data sudah saya uji namun tidak terdistribusi normal ketika saya mentransformasikan data kok N saya menjadi berkurang yaa ? Mohon penjelasannya

    • Jika N atau jumlah observasi berkurang setelah transformasi,maka berarti terdapat data yang tidak sesuai dengan model tranformasi yang telah dilakukan. Misalnya untuk tranformasi logaritma natural tidak bisa dilakukan pada data 0 atau negatif. Sehingga jika dilakukan tranformasi logaritma natural, maka setiap sampel dengan nilai 0 atau negatif secara otomatis akan error. Jadi ketika dilakukan analisis selanjutnya menggunakan data hasil transformasi maka jumlah sampel berkurang. Kesimpulannya adalah: tranformasi yang dipilih harus disesuaikan dengan data variabel.

  6. cara untuk mengatasi outlier adalah salah satunya dengan melakukan winsorizing menurut jurnal acuan yang saya gunakan, apakah bisa melakukan winsorize dengan aplikasi SPPS? Jika bisa, bagaimana caranya Pak? Terima kasih.

    • Bisa. Cara melakukan winsorizing pada aplikasi SPSS adalah lebih dahulu lakukan uji deskriptif dan tampilkan tabel percentile. Kemudian langkah kedua lakukan recode atau melakukan tranformasi pada data yang menjadi nilai extreme. Nilai extreme tersebut mengacu pada nilai tabel percentile pada uji deskriptif sebelumnya, dimana dikatakan nilai extreme jika nilainya kurang dari 5 persen atau lebih dari 95 persen pada tabel percentile. Transformasi yang dilakukan adalah mengubah setiap data yang nilainya kurang dari 5 persen percentile menjadi senilai 5 persen percentile. Dan setiap data yang nilainya lebih dari 95 persen percentile juga diubah menjadi senilai 95 persen percentile. Lain waktu akan saya buatkan tutorialnya.

TINGGALKAN KOMENTAR

Please enter your comment!
Please enter your name here

1
WhatsApp Kami: Jasa Olah Data
Exit mobile version