Pengertian Data Outlier Univariat dan Multivariat

1
1561

Data Outlier

Data Outlier disebut juga dengan data pencilan. Pengertian dari Outlier adalah data observasi yang muncul dengan nilai-nilai ekstrim, baik secara univariat ataupun multivariat. Yang dimaksud dengan nilai-nilai ekstrim dalam observasi adalah nilai yang jauh atau beda sama sekali dengan sebagian besar nilai lain dalam kelompoknya. Misalkan nilai ujian siswa dalam satu kelas yang berjumlah 40 siswa, sebanyak 39 siswa mendapatkan nilai ujian dalam kisaran 70 sampai 80. Kemudian ada 1 siswa yang nilainya sangat melenceng dari lainnya, yaitu mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut memiliki nilai ekstrem sehingga disebut sebagai pencilan.

Diagram Data Outlier

Gambarannya seperti gambar di bawah ini:

Contoh Diagram Data Outlier
Contoh Data Outlier

 

Data pencilan dalam penelitian harus mendapatkan perlakuan khusus, karena dapat menyebabkan terjadinya bias pada hasil penelitian. Namun semuanya masih tergantung pada tujuan penelitian, sebab apabila nilai-nilai ekstrim yang dimaksud memang diupayakan untuk dinilai keberadaannya atau dinilai fenomenanya, maka pencilan tersebut dibiarkan saja. Namun apabila tujuan penelitian adalah untuk generalisasi, apalagi untuk menentukan sebuah model prediksi seperti dalam regresi linear, maka data tersebut harus mendapatkan perlakuan khusus. Apakah perlakuan tersebut? yaitu kita bisa melakukan transformasi data jika nilai ekstrim masih bisa dikurangi jaraknya dengan kelompok yang lainnya. Jika terlalu jauh, maka anda bisa mengeluarkan data yang menyimpang tersebut dari penelitian.

Studentized Residual

Sebuah contoh dalam analisis regresi linear, munculnya outlier dilihat dari nilai studentized residual. Studentized residual adalah nilai residual yang distandarisasi berdasarkan nilai mean dan standart deviasi. Apabila nilai absolut dari studentized residual lebih dari 3, maka observasi yang bersangkutan adalah sebagai outlier univariat. Untuk mengetahui outlier multivariat pada regresi linear bisa dilihat dari nilai leverage atau nilai probabilitas mahalanobis. Jika nilai probabilitas mahalanobis kurang dari 0,001 maka observasi yang bersangkutan menjadi outlier multivariat.

Outlier Univariat

Apa yang dimaksud dengan outlier univariat? Outlier univariat adalah outlier yang disebabkan oleh variabel terikat atau variabel dependen. Dapat diartikan yaitu apabila variabel dependen terdapat outlier, maka besar kemungkinan akan terjadi outlier univariat. Apabila hal ini dibiarkan tanpa adanya perlakuan, maka dapat menyebakan masalah normalitas residual pada regresi linear. Dan tentunya nilai R dan R Squared akan menjadi Bias. Bias dalam regresi linear adalah nilai R Square tidak benar dalam menjelaskan variabel terikat. Bisa saja nilai R Square tinggi, namun sesungguhnya sebaliknya.

Outlier Multivariat

Apa yang dimaksud dengan outlier multivariat? Outlier Multivariat adalah outlier yang disebabkan oleh sekumpulan variabel bebas atau variabel independen. Apabila satu atau beberapa variabel bebas terdapat nilai-nilai ekstrim, maka ada kemungkinan bisa terjadi outlier multivariat.

Nah, demikian penjelasan singkat tentang outlier. Apabila anda tertarik untuk mempelajari cara menentukan outlier dalam regresi linear dengan SPSS, bisa anda pelajari artikel selanjutnya, yaitu Outlier Regresi Linear dengan SPSS.

By Anwar Hidayat

1 KOMENTAR

Cobalah Menjadi Pandai! Berikan Komentarnya Ya......