Pengertian Data Outlier Univariat dan Multivariat

Data Outlier

Data Outlier disebut juga dengan data pencilan. Pengertian dari Outlier adalah data observasi yang muncul dengan nilai-nilai ekstrim, baik secara univariat ataupun multivariat. Yang dimaksud dengan nilai-nilai ekstrim dalam observasi adalah nilai yang jauh atau beda sama sekali dengan sebagian besar nilai lain dalam kelompoknya. Misalkan nilai ujian siswa dalam satu kelas yang berjumlah 40 siswa, sebanyak 39 siswa mendapatkan nilai ujian dalam kisaran 70 sampai 80. Kemudian ada 1 siswa yang nilainya sangat melenceng dari lainnya, yaitu mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut memiliki nilai ekstrem sehingga disebut sebagai pencilan.

Diagram Data Outlier

Gambarannya seperti gambar di bawah ini:

Contoh Data Outlier

Data pencilan dalam penelitian harus mendapatkan perlakuan khusus, karena dapat menyebabkan terjadinya bias pada hasil penelitian. Namun semuanya masih tergantung pada tujuan penelitian, sebab apabila nilai-nilai ekstrim yang dimaksud memang diupayakan untuk dinilai keberadaannya atau dinilai fenomenanya, maka pencilan tersebut dibiarkan saja. Namun apabila tujuan penelitian adalah untuk generalisasi, apalagi untuk menentukan sebuah model prediksi seperti dalam regresi linear, maka data tersebut harus mendapatkan perlakuan khusus. Apakah perlakuan tersebut? yaitu kita bisa melakukan transformasi data jika nilai ekstrim masih bisa dikurangi jaraknya dengan kelompok yang lainnya. Jika terlalu jauh, maka anda bisa mengeluarkan data yang menyimpang tersebut dari penelitian.

Studentized Residual

Sebuah contoh dalam analisis regresi linear, munculnya outlier dilihat dari nilai studentized residual. Studentized residual adalah nilai residual yang distandarisasi berdasarkan nilai mean dan standart deviasi. Apabila nilai absolut dari studentized residual lebih dari 3, maka observasi yang bersangkutan adalah sebagai outlier univariat. Untuk mengetahui outlier multivariat pada regresi linear bisa dilihat dari nilai leverage atau nilai probabilitas mahalanobis. Jika nilai probabilitas mahalanobis kurang dari 0,001 maka observasi yang bersangkutan menjadi outlier multivariat.

Outlier Univariat

Apa yang dimaksud dengan outlier univariat? Outlier univariat adalah outlier yang disebabkan oleh variabel terikat atau variabel dependen. Dapat diartikan yaitu apabila variabel dependen terdapat outlier, maka besar kemungkinan akan terjadi outlier univariat. Apabila hal ini dibiarkan tanpa adanya perlakuan, maka dapat menyebakan masalah normalitas residual pada regresi linear. Dan tentunya nilai R dan R Squared akan menjadi Bias. Bias dalam regresi linear adalah nilai R Square tidak benar dalam menjelaskan variabel terikat. Bisa saja nilai R Square tinggi, namun sesungguhnya sebaliknya.

Outlier Multivariat

Apa yang dimaksud dengan outlier multivariat? Outlier Multivariat adalah outlier yang disebabkan oleh sekumpulan variabel bebas atau variabel independen. Apabila satu atau beberapa variabel bebas terdapat nilai-nilai ekstrim, maka ada kemungkinan bisa terjadi outlier multivariat.

Nah, demikian penjelasan singkat tentang outlier. Apabila anda tertarik untuk mempelajari cara menentukan outlier dalam regresi linear dengan SPSS, bisa anda pelajari artikel selanjutnya, yaitu Outlier Regresi Linear dengan SPSS.

By Anwar Hidayat

This article was last modified on 29 Maret 2017 03:17

Share
Anwar Hidayat

Founder dan CEO dari Statistikian Sejak 2012. Melayani jasa bantuan olah dan analisis data menggunakan berbagai aplikasi statistik, seperti: SPSS, STATA, Minitab, EViews, AMOS, SmartPLS dan Excel. Silahkan WhatsApp: 08816050259. Biaya 100 ribu sd 300 ribu Sesuai Beban. Proses 1 sd 3 Hari Tergantung Antrian.

View Comments

Recent Posts

Variabel PLS SEM, Data, Model Hubungan dan Asumsinya

Variabel PLS SEM, Data, Model Hubungan dan Asumsinya Variabel PLS SEM Sebelum kita coba tutorial PLS SEM dalam aplikasi smartPLS,…

20 Desember 2018 00:14

PLS SEM: Pengukuran Kecocokan Model (Inner dan Outer)

Pengukuran Kecocokan Model PLS SEM Dalam bahasan kali ini kita akan melanjutkan artikel sebelumnya yaitu tentang partial least square. Sebelumnya…

25 Agustus 2018 22:15

Partial Least Square (PLS), Pengertian, Fungsi, Tujuan, Cara

Pengertian Partial Least Square (PLS), Fungsi, Tujuan, Cara dan Algoritma Partial least square atau yang biasa disingkat PLS adalah jenis analisis…

25 Agustus 2018 16:12

Hipotesis Penelitian dan Hipotesis Statistik Dalam Perbedaan

Perbedaan Hipotesis Penelitian dan Hipotesis Statistik Apa yang dimaksud dengan hipotesis penelitian? Apa yang dimaksud dengan hipotesis statistik? Apa perbedaan…

23 Mei 2018 01:14

Pengertian Simple Random Sampling, Jenis dan Contoh

Pengertian Simple Random Sampling, Jenis dan Contoh Pengertian Simple Random Sampling Dalam kesempatan ini akan kami coba sharing tentang pengertian…

16 Februari 2018 01:22

Penjelasan dan Tutorial Regresi Linear Berganda

Penjelasan dan Tutorial Regresi Linear Berganda Dalam kesempatan ini, saya akan coba menjelaskan tentang Regresi Linear Berganda serta tutorial regresi…

1 Januari 2018 17:58