Pilihan Uji Normalitas Berdasarkan Software-Jumlah Sampel

5
935

Pilihan Uji Normalitas Univariate

Jenis Uji Normalitas

Uji normalitas univariate banyak sekali macamnya, baik berdasarkan grafik atau angka. Berdasarkan grafik antara lain: Normal PP Plot, Normal QQ Plot, Normal Detrend QQ Plot, Histogram, Boxplot dan Stem-leaf. Sedangkan berdasarkan angka antara lain: Jarque Bera, Skewness Kurtosis, Shapiro Wilk, Shapiro Francia, Ryan Joiner, Lilliefors, Cramer Von Mises, Anderson Darling, Kolmogorov Smirnov dan banyak lainnya. Karena banyak pilihan uji normalitas itulah, dalam kesempatan ini kita akan membahas tentang pilihan uji normalitas yang tepat.

Begitu banyaknya uji yang tersedia, kadang kita kesulitan untuk memilih uji normalitas apa yang tepat dalam penelitian atau kasus statistik yang kita alami. Tentunya tidak ada salahnya jika kita mencoba untuk mempelajari uji apa yang kiranya paling tepat atau paling valid.

Uji Coba Normalitas

Berikut akan kita bahas, uji coba atau studi kasus berbagai uji normalitas dalam berbagai kasus. Dalam bahasan ini kita menggunakan hasil uji coba yang dilakukan oleh Nornadiah Mohd Razali dan Yap Bee Wah dalam Journal berjudul “Power Comparisons of Shapiro-wilk, Klomogorov Smirnov, Lilliefors And Anderson Darling-Tests. Faculty of Computer and Mathematical Science, University Teknologi MARA, 40450 Shah Alam, Selangor, Malaysia.”

Grafik Uji Normalitas pada Platykurtic Distributions

Grafik Uji Normalitas pada Paltykurtic Distributions
Grafik Uji Normalitas pada Paltykurtic Distributions

Grafik di atas menunjukkan simulasi hasil 4 macam uji normalitas (SW: Shapiro Wilk, KS: Kolmogorov Smirnov, LF: Lilliefors, AD: Anderson Darling) dengan Alfa 5% pada Distribusi Tidak Normal Simetris dengan nilai Kurtosis kurang dari 3 atau yang disebut dengan distribusi Platykurtic.

Probabilitas Shapiro Wilk

Shapiro Wilk beda dari pada yang lain hingga jumlah sampel 30 dan tetap stabil hingga 50 sampel, namun mendadak probabilitasnya meningkat tajam setelah 50 sampel sampai 200 sampel kemudian cenderung stagnan pada probabilitas 1 mulai sampel 300 sampai 2000. Anderson Darling sedikit menyerupai Shapiro Wilk, meningkat tajam setelah 50 sampel dan stagnan pada probabilitas 1 sejak sampel 400.

Probabilitas Lilliefors

Lilliefors Meningkat tajam mulai sampel 50 kemudian meningkat lebih tajam lagi pada sampel 100 dan probabilitasnya mendekati 1 setelah sampel 200 kemudian stagnan pada probabilitas 1 sejak sampel 1000. Sedangkan kolmogorov smirnov mulai menunjukkan peningkatan sejak sampel 100 dan meningkat lebih tajam sejak sampel 500 kemudian mencapai probabilitas 1 sejak sampel 2000.

Grafik Uji Normalitas pada Leptokurtic Distributions

Grafik Uji Normalitas pada Leptokurtic Distributions
Grafik Uji Normalitas pada Leptokurtic Distributions

Grafik di atas menunjukkan Shapiro Wilk, Anderson Darling dan Lilliefors secara berurutan probabilitasnya meningkat tajam sejak sampel 50. Pada sampel 200 mendekati probabilitas 1 dan mencapai probabilitas 1 pada sampel 300 kemudian stagnan sampai sampel 2000. Sedangkan kolmogorov smirnov meningkat tajam sejak sampel 100 dan selanjutnya mencapai probabilitas 1 sejak sampel 1000 dan terus stagnan sampai sampel 2000.

Berdasarkan hasil uji coba pada kedua distribusi simetris tidak normal di atas, uji shapiro wilk menunjukkan performa paling bagus pada sampel kecil di bawah 50 diikuti anderson darling dan lilliefors. Sedangkan kolmogorov smirnov berada diurutan berikutnya namun dapat bertahan kemampuannya sampai sampai sampel 1000.

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5).

Grafik Uji Normalitas pada Distribusi Gamma (4,5)
Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5)

Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (4,5) dengan skewness 1 dan kurtosis 4,5, shapiro wilk kemudian diikuti anderson darling dan lilliefors meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 200. Khusus lilliefors masih dapat bertahan hingga sampel 300, namun pada sampel 200 sudah mendekati probabilitas 1. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 100 dan mencapai probabilitas 1 pada sampel 1000.

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5).

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5)
Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5)

Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (1,5) dengan skewness 2 dan kurtosis 9, shapiro wilk kemudian diikuti anderson darling meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 50. Khusus lilliefors masih dapat bertahan hingga sampel 100. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 50 dan mencapai probabilitas 1 pada sampel 100.

Kesimpulan Uji Normalitas Pada Distribusi Asimetris

Dari kedua distribusi asimetris di atas, menunjukkan bahwa sebaiknya shapiro wilk dan anderson darling digunakan pada sampel 50 atau kurang. Sedangkan Uji lilliefors dan kolmogorov smirnov sebaiknya digunakan pada sampel kurang dari 100.

Peringkat Uji Normalitas Pada Berbagai Distribusi
Peringkat Uji Normalitas Pada Berbagai Distribusi
Peringkat Uji Normalitas Pada Semua Distribusi
Peringkat Uji Normalitas Pada Semua Distribusi

Berdasarkan kedua tabel di atas, peringkat pertama kekuatan uji normalitas ditempati oleh uji shapiro wilk kemudian secara berurutan diikuti anderson darling, lilliefors dan kolmogorov smirnov.

Probabilitas Uji Normalitas Berdasarkan Software

Selanjutnya kita bahas lebih jauh tentang uji normalitas di atas serta beberapa uji lainnya. Kita akan menggunakan hasil uji coba yang dilakukan oleh “Park, Hun Myoung. 2008. Univariate Analysis and Normality Test Using SAS, Stata, and SPSS. Working Paper. The University Information Technology Services (UITS) Center for Statistical and Mathematical Computing, Indiana University.”

Sumber Data Uji Coba Pilihan Uji Normalitas

Data yang digunakan didapatkan secara acak dari distribusi standard normal dengan sebuah seed dari 1.234.567 dalam aplikasi SAS dengan setiap peningkatan jumlah sampel, nilai mean, median skewness dan kurtosis mendekati 0 dan standard deviasi tetap bernilai 1.

Uji normalitas pada 10000 sampel
Uji normalitas pada 10000 sampel

Semua tabel di atas menunjukkan bahwa semua uji normalitas (jarque bera, skewness kurtosis, shapiro wilk, shapiro francia, lilliefors, cramer von mises dan anderson darling) tidak ada yang menolak H0 dari normalitas dalam berapapun jumlah sampel. Namun uji shapiro wilk sudah tidak reliabel pada jumlah sampel 2000 dan uji shapiro francia sudah tidak reliabel pada jumlah sampel mencapai 5000. Sedangkan Jarque Bera dan Skewness Kurtosis terus menunjukkan performa yang konsisten pada berbagai jumlah sampel.

Catatan: Kolmogorov smirnov di dalam tabel adalah uji Lilliefors yang merupakan koreksi dari uji kolmogorov smirnov.

Spesikasi Uji Normalitas Berdasarkan Jumlah Sampel

Berikut beberapa aplikasi statistik yang mendukung uji normalitas:

Pilihan Uji Normalitas
Kemampuan Software Dalam Pilihan Uji Normalitas

Di atas adalah tabel pilihan uji normalitas berdasarkan kemampuan atau validitas software statistik terhadap jumlah sampel yang digunakan. Tabel di atas menunjukkan bahwa Jarque Bera dan Skewness Kurtosis menggunakan distribusi chi-square pada degree of freedom 2. Jarque Bera dapat kita hitung secara manual sedangkan skewness kurtosis dengan aplikasi STATA. Skewness kurtosis valid pada jumlah sampel lebih atau sama dengan 9. Uji shapiro wilk valid pada jumlah sampel 7 sd 2000 dan dapat kita gunakan pada aplikasi SAS, STATA dan SPSS. Mirip dengan shapiro wilk, uji ryan joiner dapat kita gunakan pada aplikasi minitab.

Sedangkan shapiro francia yang merupakan koreksi dari shapiro wilk, valid pada sampel 5 sd 5000 sampel dan dapat digunakan pada aplikasi STATA. Uji lilliefors, cramer von mises, anderson darling dan kolmogorov smirnov menggunakan Empirical Distribution Function (EDF). Lilliefors terdapat pada aplikasi SAS, SPSS dan minitab. Cramer Von Mises pada aplikasi SAS. Anderson darling pada aplikasi SAS dan minitab. Sedangkan kolmogorov smirnov terdapat pada aplikasi SPSS.

Catatan: Fungsi kolmogorov pada STATA tidak digunakan untuk uji normalitas.

Spesifikasi Uji Normalitas Berdasarkan Jumlah Sampel Oleh Para Pakar

Berdasar berbagai pandangan para pakar statistik beserta berbagai uji coba, berikut penulis sampaikan uji normalitas yang sebaiknya digunakan pada berbagai jumlah sampel.

Pilihan Uji Normalitas
Validitas Pilihan Uji Normalitas Pada Berbagai Jumlah Sampel

Keterangan:
v : Valid digunakan
v(T) : Pilihan yang baik digunakan
v(T)* : Pilihan yang terbaik.

Prioritas Pilihan Uji Normalitas Berdasarkan Berbagai Jumlah Sampel

Untuk sampel 3 sd 4, jarque bera yang harus digunakan. Sampel 5 sd 6 seharusnya menggunakan shapiro francia. Pada sampel 7 sd 50 sebaiknya menggunakan shapiro wilk atau shapiro francia.  Untuk sampel 51 sd 200 sebaiknya menggunakan uji lilliefors. Sedangkan untuk sampel yang lebih besar dari 200 sebaiknya menggunakan uji skewness kurtosis atau jarque bera karena kedua uji tersebut terus konsisten performanya pada berapapun jumlah sampel. Uji shapiro wilk dan ryan joiner hanya valid sampai 2000 sampel, sedangkan uji shapiro francia valid hingga 5000 sampel.

Prioritas Pilihan Uji Normalitas Berdasarkan Ketersediaan Software

Apabila anda hanya memiliki aplikasi SPSS, sebaiknya menggunakan uji shapiro wilk pada sampel 7 sd 50, menggunakan uji lilliefors pada sampel 51 sd 200 dan menggunakan uji kolmogorov smirnov jika sampel lebih dari 200.

Apabila anda hanya memiliki aplikasi SAS, untuk sampel kecil 7 sd 50 anda bisa menggunakan uji shapiro wilk dan anderson darling. pada sampel 51 sd 200 sebaiknya menggunakan lilliefors. Untuk sampel lebih dari 200 anda bisa menggunakan cramer von mises.

Apabila hanya memiliki aplikasi STATA, untuk sampel 5 sd 50 anda bisa menggunakan shapiro francia, bila sampel 7 sd 50 anda bisa memilih shapiro wilk atau shapiro francia. Sedangkan untuk sampel lebih dari 50 anda gunakan uji skewness kurtosis.

Apabila hanya memiliki aplikasi minitab, anda bisa menggunakan uji ryan joiner dan anderson darling pada sampel 7 sd 50. Untuk sampel yang lebih besar anda gunakan uji lilliefors.

Demikian penjelasan kami perihal pilihan uji normalitas univariate. Semoga artikel yang membahas tentang Pilihan Uji Normalitas berdasarkan berbagai pertimbangan ini akan bermanfaat untuk para peneliti atau mahasiswa.

By Anwar Hidayat


5 KOMENTAR

  1. 1. Ingin bertanya gan, ada yg ingin memilih uji normalitas, dan sepengetahuan bahwa uji normalitas “shapiro wilk” itu paling optimal digunakan untuk sample dibawah 50, yg saya ingin tanyakan dalam kasus uji beda dua kelas yang “setiap kelas ada 30 siswa” apakah dapat dikatakan samplenya 30 sehingga uji sphapiro dapat dipakai… atau jumlah sampel 60 karena dijumlah semua. Karena ada beberapa pengujian jika pakai kolmogorov normal, pakai lili normal, sedangkan pakai spiro ada yang tidak normal (2 kelas, setiap kelas 29-31 siswa). Terimakasih sebelumnya…

    2. soalnya kalo pake kolmogorov pasti normal kalo pakai sphiro jadi tak normal..

    3. Kelas ke 1 eksperimen dan kelas ke 2 kontrol… saya pribadi pberpendapat samplenya dihitung 30.. kalo 60 itu respondennya.. masalahnya kalau pakai sphiro gak normal kalau pakai lili dan kolmo jadi normal… apakah pakai uji nonparametrik atau pakai uji lili karena normal.. meskipun kolmogorov itu untuk sample besar…

    • Tergantung uji hipotesisnya, sebab uji normalitas adalah syarat atau asumsi dari sebuah uji hipotesis. Jika melihat kasus anda, ada kelompok kontrol dan eksperimen, berarti anda akan menilai perbedaan antara kedua kelas tersebut. Maka anda idealnya menggunakan uji independen t test. Syarat normalitas pada independen t test adalah pada variabel terikat per kelompok. Jadi pada kasus anda ada 2 uji normalitas yaitu pada masing-masing kelompok, dimana per kelompok adalah 30 orang. nanti akan beda halnya jika menggunakan uji paired t test, yang diuji adalah selisih antara x dan y.

Cobalah Menjadi Pandai! Berikan Komentarnya Ya......