Untuk memilih uji normalitas apa yang tepat dalam penelitian atau kasus statistik yang kita alami. Semua uji normalitas (jarque bera, skewness kurtosis, shapiro wilk, shapiro francia, lilliefors, cramer von mises dan anderson darling) tidak ada yang menolak H0 dari normalitas dalam berapapun jumlah sampel. Namun uji shapiro wilk sudah tidak reliabel pada jumlah sampel 2000 dan uji shapiro francia sudah tidak reliabel pada jumlah sampel mencapai 5000. Sedangkan Jarque Bera dan Skewness Kurtosis terus menunjukkan performa yang konsisten pada berbagai jumlah sampel.



Pilihan Uji Normalitas Univariate

Uji normalitas univariate banyak sekali macamnya, baik berdasarkan grafik atau angka. Berdasarkan grafik antara lain: Normal PP Plot, Normal QQ Plot, Normal Detrend QQ Plot, Histogram, Boxplot dan Stem-leaf. Sedangkan berdasarkan angka antara lain: Jarque Bera, Skewness Kurtosis, Shapiro Wilk, Shapiro Francia, Ryan Joiner, Lilliefors, Cramer Von Mises, Anderson Darling, Kolmogorov Smirnov dan banyak lainnya.

Begitu banyaknya uji yang tersedia, kadang kita kesulitan untuk memilih uji normalitas apa yang tepat dalam penelitian atau kasus statistik yang kita alami. Tentunya tidak ada salahnya jika kita mencoba untuk mempelajari uji apa yang kiranya paling tepat atau paling valid.

Berikut akan kita bahas, uji coba atau studi kasus berbagai uji normalitas dalam berbagai kasus. Dalam bahasan ini kita menggunakan hasil uji coba yang dilakukan oleh Nornadiah Mohd Razali dan Yap Bee Wah dalam Journal berjudul "Power Comparisons of Shapiro-wilk, Klomogorov Smirnov, Lilliefors And Anderson Darling-Tests. Faculty of Computer and Mathematical Science, University Teknologi MARA, 40450 Shah Alam, Selangor, Malaysia."

Grafik Uji Normalitas pada Platykurtic Distributions

Grafik Uji Normalitas pada Paltykurtic Distributions
Grafik Uji Normalitas pada Paltykurtic Distributions

Grafik di atas menunjukkan simulasi hasil 4 macam uji normalitas (SW: Shapiro Wilk, KS: Kolmogorov Smirnov, LF: Lilliefors, AD: Anderson Darling) dengan Alfa 5% pada Distribusi Tidak Normal Simetris dengan nilai Kurtosis kurang dari 3 atau yang disebut dengan distribusi Platykurtic. Shapiro Wilk beda dari pada yang lain hingga jumlah sampel 30 dan tetap stabil hingga 50 sampel, namun mendadak probabilitasnya meningkat tajam setelah 50 sampel sampai 200 sampel kemudian cenderung stagnan pada probabilitas 1 mulai sampel 300 sampai 2000. Anderson Darling sedikit menyerupai Shapiro Wilk, meningkat tajam setelah 50 sampel dan stagnan pada probabilitas 1 sejak sampel 400. Lilliefors Meningkat tajam mulai sampel 50 kemudian meningkat lebih tajam lagi pada sampel 100 dan probabilitasnya mendekati 1 setelah sampel 200 kemudian stagnan pada probabilitas 1 sejak sampel 1000. Sedangkan kolmogorov smirnov mulai menunjukkan peningkatan sejak sampel 100 dan meningkat lebih tajam sejak sampel 500 kemudian mencapai probabilitas 1 sejak sampel 2000.

Grafik Uji Normalitas pada Leptokurtic Distributions

Grafik Uji Normalitas pada Leptokurtic Distributions
Grafik Uji Normalitas pada Leptokurtic Distributions

Grafik di atas menunjukkan Shapiro Wilk, Anderson Darling dan Lilliefors secara berurutan probabilitasnya meningkat tajam sejak sampel 50. Pada sampel 200 mendekati probabilitas 1 dan mencapai probabilitas 1 pada sampel 300 kemudian stagnan sampai sampel 2000. Sedangkan kolmogorov smirnov meningkat tajam sejak sampel 100 dan selanjutnya mencapai probabilitas 1 sejak sampel 1000 dan terus stagnan sampai sampel 2000.

Berdasarkan hasil uji coba pada kedua distribusi simetris tidak normal di atas, uji shapiro wilk menunjukkan performa paling bagus pada sampel kecil di bawah 50 diikuti anderson darling dan lilliefors. Sedangkan kolmogorov smirnov berada diurutan berikutnya namun dapat bertahan kemampuannya sampai sampai sampel 1000.

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5).

Grafik Uji Normalitas pada Distribusi Gamma (4,5)
Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5)

Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (4,5) dengan skewness 1 dan kurtosis 4,5, shapiro wilk kemudian diikuti anderson darling dan lilliefors meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 200. Khusus lilliefors masih dapat bertahan hingga sampel 300, namun pada sampel 200 sudah mendekati probabilitas 1. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 100 dan mencapai probabilitas 1 pada sampel 1000.

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5).

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5)
Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5)

Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (1,5) dengan skewness 2 dan kurtosis 9, shapiro wilk kemudian diikuti anderson darling meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 50. Khusus lilliefors masih dapat bertahan hingga sampel 100. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 50 dan mencapai probabilitas 1 pada sampel 100.

Dari kedua distribusi asimetris di atas, menunjukkan bahwa sebaiknya shapiro wilk dan anderson darling digunakan pada sampel 50 atau kurang. Sedangkan Uji lilliefors dan kolmogorov smirnov sebaiknya digunakan pada sampel kurang dari 100.

Peringkat Uji Normalitas Pada Berbagai Distribusi
Peringkat Uji Normalitas Pada Berbagai Distribusi

Peringkat Uji Normalitas Pada Semua Distribusi
Peringkat Uji Normalitas Pada Semua Distribusi

Berdasarkan kedua tabel di atas, peringkat pertama kekuatan uji normalitas ditempati oleh uji shapiro wilk kemudian secara berurutan diikuti anderson darling, lilliefors dan kolmogorov smirnov.

Selanjutnya kita bahas lebih jauh tentang uji normalitas di atas serta beberapa uji lainnya. Kita akan menggunakan hasil uji coba yang dilakukan oleh “Park, Hun Myoung. 2008. Univariate Analysis and Normality Test Using SAS, Stata, and SPSS. Working Paper. The University Information Technology Services (UITS) Center for Statistical and Mathematical Computing, Indiana University.” Data yang digunakan didapatkan secara acak dari distribusi standard normal dengan sebuah seed dari 1.234.567 dalam aplikasi SAS dengan setiap peningkatan jumlah sampel, nilai mean, median skewness dan kurtosis mendekati 0 dan standard deviasi tetap bernilai 1.

Uji normalitas pada 10000 sampel
Uji normalitas pada 10000 sampel

Semua tabel di atas menunjukkan bahwa semua uji normalitas (jarque bera, skewness kurtosis, shapiro wilk, shapiro francia, lilliefors, cramer von mises dan anderson darling) tidak ada yang menolak H0 dari normalitas dalam berapapun jumlah sampel. Namun uji shapiro wilk sudah tidak reliabel pada jumlah sampel 2000 dan uji shapiro francia sudah tidak reliabel pada jumlah sampel mencapai 5000. Sedangkan Jarque Bera dan Skewness Kurtosis terus menunjukkan performa yang konsisten pada berbagai jumlah sampel.
Catatan: Kolmogorov smirnov di dalam tabel adalah uji Lilliefors yang merupakan koreksi dari uji kolmogorov smirnov.

Berikut beberapa aplikasi statistik yang mendukung uji normalitas:

Uji Normalitas pada Berbagai Aplikasi Statistik
Uji Normalitas pada Berbagai Aplikasi Statistik

Tabel di atas menunjukkan bahwa Jarque Bera dan Skewness Kurtosis menggunakan distribusi chi-square pada degree of freedom 2. Jarque Bera dapat kita hitung secara manual sedangkan skewness kurtosis dengan aplikasi STATA. Skewness kurtosis valid pada jumlah sampel lebih atau sama dengan 9. Uji shapiro wilk valid pada jumlah sampel 7 sd 2000 dan dapat kita gunakan pada aplikasi SAS, STATA dan SPSS. Mirip dengan shapiro wilk, uji ryan joiner dapat kita gunakan pada aplikasi minitab. Sedangkan shapiro francia yang merupakan koreksi dari shapiro wilk, valid pada sampel 5 sd 5000 sampel dan dapat digunakan pada aplikasi STATA. Uji lilliefors, cramer von mises, anderson darling dan kolmogorov smirnov menggunakan Empirical Distribution Function (EDF). Lilliefors terdapat pada aplikasi SAS, SPSS dan minitab. Cramer Von Mises pada aplikasi SAS. Anderson darling pada aplikasi SAS dan minitab. Sedangkan kolmogorov smirnov terdapat pada aplikasi SPSS.
Catatan: Fungsi kolmogorov pada STATA tidak digunakan untuk uji normalitas.

Berdasar berbagai pandangan para pakar statistik beserta berbagai uji coba, berikut penulis sampaikan uji normalitas yang sebaiknya digunakan pada berbagai jumlah sampel.

Uji Normalitas Terbaik pada Berbagai Ukuran Sampel
Uji Normalitas Terbaik pada Berbagai Ukuran Sampel

Keterangan:
v : Valid digunakan
v(T) : Pilihan yang baik digunakan
v(T)* : Pilihan yang terbaik.

Untuk sampel 3 sd 4, jarque bera yang harus digunakan. Sampel 5 sd 6 seharusnya menggunakan shapiro francia. Pada sampel 7 sd 50 sebaiknya menggunakan shapiro wilk atau shapiro francia.  Untuk sampel 51 sd 200 sebaiknya menggunakan uji lilliefors. Sedangkan untuk sampel yang lebih besar dari 200 sebaiknya menggunakan uji skewness kurtosis atau jarque bera karena kedua uji tersebut terus konsisten performanya pada berapapun jumlah sampel. Uji shapiro wilk dan ryan joiner hanya valid sampai 2000 sampel, sedangkan uji shapiro francia valid hingga 5000 sampel.

Apabila anda hanya memiliki aplikasi SPSS, sebaiknya menggunakan uji shapiro wilk pada sampel 7 sd 50, menggunakan uji lilliefors pada sampel 51 sd 200 dan menggunakan uji kolmogorov smirnov jika sampel lebih dari 200. Apabila anda hanya memiliki aplikasi SAS, untuk sampel kecil 7 sd 50 anda bisa menggunakan uji shapiro wilk dan anderson darling. pada sampel 51 sd 200 sebaiknya menggunakan lilliefors. Untuk sampel lebih dari 200 anda bisa menggunakan cramer von mises. Apabila hanya memiliki aplikasi STATA, untuk sampel 5 sd 50 anda bisa menggunakan shapiro francia, bila sampel 7 sd 50 anda bisa memilih shapiro wilk atau shapiro francia. Sedangkan untuk sampel lebih dari 50 anda gunakan uji skewness kurtosis. Apabila hanya memiliki aplikasi minitab, anda bisa menggunakan uji ryan joiner dan anderson darling pada sampel 7 sd 50. Untuk sampel yang lebih besar anda gunakan uji lilliefors.

Demikian penjelasan kami perihal pilihan uji normalitas univariate. Semoga bermanfaat.

Statistikian

Statistikian

Blog Untuk Mempelajari Jenis Uji Statistik, Penelitian, SPSS dan Statistik Berbasis Komputer seperti excel, Stata dan Minitab. Bantuan Olah dan Analisa Data, SMS: 085748695938.

Tinggalkan Komentar:

1 comments:

Tinggalkan Komentar Anda Di Sini