Independent T Test & Mann Whitney U Test

With Multivariate Analysis & Effect Size
Engine Code by Anwar Hidayat – www.statistikian.com

Tahap 1: Input Data Kasus (Grid View)

💡 Tips: Maksimal 1000 Baris.
NoID_RespondenGrup_MetodeY_KognitifY_AfektifY_Psikomotorik
1
2
3
4
5

Dokumentasi Akademik ST-Engine: Independent T-Test & Mann-Whitney U Test

Dikembangkan Oleh:

ANWAR HIDAYAT

Founder dan CEO www.statistikian.com

Alat ini dikembangkan oleh Anwar Hidayat. Aplikasi komputasi komparasi desain sampel bebas (independent measures) ini beroperasi sepenuhnya melalui Custom JavaScript Math Engine murni. Alat ini menghadirkan analisis kelayakan asumsi, pengujian parametrik dan non-parametrik, efek ukuran (Effect Size), serta ekstensi multivariat secara independen di sisi klien (client-side).

Dokumentasi ini menguraikan dasar teoretis, formula analitis, serta pedoman operasional alat ST-Engine Comparative Analysis (Between-Subjects Design). Serangkaian pengujian komparatif sampel bebas difungsikan untuk mendeteksi perbedaan parameter sentral di antara dua kelompok observasi yang saling lepas dan tidak beririsan (misalnya kelompok eksperimen dan kelompok kontrol).

Lanjutkan membaca fondasi teoretis, rumus matematis, dan panduan lengkap instrumen analisis ini.

1. Teori Dasar: Definisi, Tujuan, dan Fungsi Desain Sampel Bebas

Dalam metode penelitian komparatif, rancangan sampel bebas (between-subjects design) digunakan ketika peneliti membandingkan dua kelompok entitas yang sama sekali berbeda dan tidak memiliki keterikatan satu sama lain. Tujuan fungsional dari pengujian ini adalah untuk mengevaluasi hipotesis nol (H0) yang menyatakan bahwa rata-rata (atau pemeringkatan median) dari kedua populasi yang menjadi sumber penarikan sampel tersebut adalah identik atau tidak memiliki perbedaan yang signifikan. Uji ini banyak diaplikasikan dalam studi perbandingan efektivitas dua metode pembelajaran, pengujian khasiat dua jenis obat, atau perbedaan karakteristik antara dua demografi (seperti jenis kelamin laki-laki dan perempuan) (Montgomery & Runger, 2014).

Instrumen parametrik standar untuk keperluan ini adalah Independent Samples T-Test, yang berlandaskan pada distribusi-t yang diperkenalkan oleh William Sealy Gosset (Student, 1908). Penerapan *Student’s T-Test* mensyaratkan beberapa asumsi mendasar: (1) unit observasi saling bebas, (2) data pada variabel terikat berskala interval atau rasio, (3) data dalam setiap kelompok berdistribusi normal, dan (4) varians dari kedua kelompok tersebut adalah sama (homogenitas varians). Asumsi homogenitas varians secara formal diuji menggunakan Levene’s Test for Equality of Variances (Levene, 1960). Apabila uji Levene menunjukkan nilai probabilitas (P-Value) > 0.05, maka asumsi homogenitas varians terpenuhi, dan estimasi *Student’s T-Test* dengan varians tergabung (pooled variance) dapat dilaporkan (Agresti, 2013).

Namun, dalam praktiknya, asumsi homogenitas varians sering kali tidak terpenuhi. Jika data berdistribusi normal tetapi varians antar kelompok terbukti heterogen (P-Value Levene < 0.05), penggunaan *Student’s T-Test* standar akan memicu bias galat penarikan kesimpulan. Untuk mengatasi kendala ini, literatur statistika mewajibkan penggunaan Welch’s T-Test. Modifikasi yang dikembangkan oleh B.L. Welch (1947) ini menyesuaikan derajat kebebasan (degrees of freedom) dan perhitungan standar error tanpa melakukan penyatuan varians, sehingga konklusi yang dihasilkan tetap valid meskipun varians kelompok asimetris (Welch, 1947).

Apabila data menunjukkan pelanggaran asumsi normalitas yang serius (berdasarkan uji Shapiro-Wilk atau Kolmogorov-Smirnov), pendekatan parametrik berbasis rata-rata menjadi tidak representatif. Dalam kondisi ini, instrumen alternatif non-parametrik yang direkomendasikan adalah Mann-Whitney U Test (Mann & Whitney, 1947). Metode ini tidak menguji selisih rata-rata absolut, melainkan mengurutkan seluruh data observasi ke dalam sebuah pemeringkatan (ranks) tunggal secara berurutan. Pengujian kemudian menganalisis apakah terdapat dominasi proporsional jumlah peringkat yang lebih tinggi pada salah satu kelompok. Penggunaan pemeringkatan ini memberikan ketahanan (robustness) yang sangat tinggi terhadap kehadiran nilai pencilan ekstrem (outliers) yang biasanya merusak perhitungan rata-rata pada distribusi parametrik (Siegel & Castellan, 1988).

Selain menilai signifikansi perbedaan melalui P-Value, pelaporan penelitian modern menuntut penyajian ukuran efek (effect size) untuk menilai signifikansi praktis. Indikator ukuran efek yang lazim disertakan mencakup Cohen’s d, Hedges’ g, dan Glass’s Delta (Cohen, 1988). Sementara itu, ketika desain eksperimen mengukur berbagai variabel terikat secara simultan pada dua kelompok yang sama, pengujian univariat secara terpisah akan memperbesar probabilitas galat keluarga (family-wise error rate). Guna memitigasi hal ini, analisis harus dikendalikan melalui uji Hotelling’s $T^2$, sebuah teknik multivariat yang mengkalkulasi signifikansi sentroid rata-rata pada ruang berdimensi p secara serentak (Hotelling, 1931).

2. Formula Tiap Tahap Analisis dan Relevansinya

W = \frac{(N-k) \sum_{i=1}^k N_i (Z_{i.} - Z_{..})^2}{(k-1) \sum_{i=1}^k \sum_{j=1}^{N_i} (Z_{ij} - Z_{i.})^2}
Levene’s Test (Homogenitas Varians): Digunakan untuk menguji kesetaraan varians antar kelompok. Z_{ij} merepresentasikan selisih absolut antara nilai observasi dan rata-rata (atau median) kelompoknya. Signifikansi W memandu apakah peneliti harus memilih Student’s T-Test atau Welch’s T-Test (Levene, 1960).
t_{Student} = \frac{\bar{X}_1 - \bar{X}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \quad \text{dimana} \quad s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}}
Student’s T-Test: Kalkulasi standar rasio perbedaan rata-rata terhadap standar error tergabung (s_p). Relevan digunakan hanya apabila asumsi normalitas dan homogenitas varians terpenuhi (Student, 1908).
t_{Welch} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \quad ; \quad df = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}
Welch’s T-Test: Penyesuaian uji t ketika varians antar kelompok asimetris. Formula ini tidak menyatukan varians, dan mengadopsi koreksi derajat kebebasan (df) Satterthwaite untuk mencegah galat penarikan kesimpulan pada varians heterogen (Welch, 1947).
U_1 = n_1 n_2 + \frac{n_1(n_1+1)}{2} - R_1 \quad ; \quad Z = \frac{U - \mu_U}{\sigma_U}
Mann-Whitney U Test: Mengalkulasi nilai U berdasarkan penjumlahan total peringkat dari kelompok pertama (R_1). Formula asimtotik Z menyertakan penyebut standar deviasi (\sigma_U) yang dikoreksi bila terdapat himpunan data bernilai kembar (ties) (Mann & Whitney, 1947).
d = \frac{\bar{X}_1 - \bar{X}_2}{s_p} \quad ; \quad g = d \times \left(1 - \frac{3}{4(n_1+n_2)-9}\right)
Cohen’s d & Hedges’ g: Cohen's d menstandardisasi deviasi rata-rata ke dalam format metrik yang bebas skala. Hedges' g memberikan faktor koreksi khusus untuk menghilangkan bias estimasi ukuran efek pada sampel berkapasitas kecil (Cohen, 1988).

3. Arsitektur Perangkat Lunak

Sistem analitis ini dibangun menggunakan prinsip operasi murni di sisi klien (Client-Side Computing) berbasis Custom JavaScript Math Engine tanpa bergantung pada perpustakaan komputasi eksternal maupun peladen internet (server).

  • Otonomi Probabilitas dan Matriks: Nilai P-Value diekstraksi melalui fungsi distribusi polinomial asimtotik (CDF normal, t, dan F). Operasional multivariat difasilitasi oleh algoritma inversi matriks Gauss-Jordan yang dikonstruksi ke dalam bahasa dasar peramban.
  • Efisiensi Non-Parametrik: Uji permutasi Monte Carlo me-render 999 rotasi matriks acak secara dinamis di dalam RAM komputer lokal pengguna, yang memberikan kalkulasi nilai signifikan empiris bebas asumsi distribusi dengan kecepatan waktu pemuatan (load time) mendekati nol detik.

4. Panduan Manual Penggunaan Alat Analisis

A. Persiapan Data (Format Matriks)

  • Matriks data disusun secara vertikal (kolom merepresentasikan variabel, baris merepresentasikan subjek). Tentukan satu kolom yang memuat variabel pengelompokan (kategorikal) yang berisi dua kode (misal: “A” dan “B” atau “1” dan “2”).
  • Klik tombol Data Simulasi untuk mengisi kanvas input secara kilat dengan himpunan data tiruan yang memiliki distribusi normal maupun asimetris guna menguji fungsionalitas algoritma.

B. Pemetaan Variabel (Mapping)

  • Klik tombol Kunci Data & Lanjutkan Pemetaan untuk merekam data.
  • Variabel Pengelompokan (Group): Masukkan kolom yang berfungsi sebagai pemisah sampel (hanya diizinkan variabel yang mengandung dua identitas kelompok independen).
  • Variabel Dependen/Uji: Masukkan variabel-variabel kontinu yang hendak diukur perbedaannya (diizinkan lebih dari satu variabel untuk memicu panel analisis multivariat).

C. Diagram Alur Algoritma

Parsing Matriks → Uji Asumsi Normalitas (Shapiro-Francia/K-S) → Uji Homogenitas (Levene's Test) → Pemilihan Metode Otomatis (Student vs Welch) → Uji Mann-Whitney U Test → Kalkulasi Effect Size & Power → Uji Hotelling's T-Square & Monte Carlo (Bila multivariat) → Simpulan Naratif.

D. Cara Baca Output Inferensial

  • Navigasi Uji (Kuning): Sistem akan mendiagnosis kelayakan distribusi dan varians data. Jika disimpulkan berdistribusi normal, perhatikan hasil di Kawasan 1 (Parametrik Biru). Jika syarat normalitas tidak terpenuhi, pedomani Kawasan 2 (Non-Parametrik Hijau).
  • Independent T-Test (Kawasan 1): Apabila hasil Levene’s Test melaporkan varians homogen, gunakan baris Student’s T-Test (Equal Variances Assumed). Apabila varians tidak homogen, rujuklah baris Welch’s T-Test (Equal Variances Not Assumed). Jika P-Value < 0.05, maka H0 ditolak yang menegaskan perbedaan rata-rata yang nyata.
  • Mann-Whitney U (Kawasan 2): Tinjau kolom P-Value pada statistik uji Mann-Whitney. Jika signifikan, H0 median tidak setara diverifikasi.
  • Analisis Multivariat: Berlaku ketika variabel independen ganda disertakan. Signifikansi F-statistik dari Hotelling $T^2$ menegaskan kemampuan intervensi pemisah kelompok dalam mengubah profil variabel secara keseluruhan secara serentak.

5. Manfaat Aplikasi (Kelebihan & Kekurangan)

  • Kelebihan: Menyelaraskan seluruh prosedur analisis yang sebelumnya tersebar di berbagai menu software terpisah (Levene, T-Test, Mann-Whitney, Hotelling, Power) ke dalam satu tuas eksekusi otomatis. Jaminan privasi penuh (tanpa unggahan cloud). Algoritma penentuan keputusan memberikan rute analisis logis guna mencegah misinterpretasi data oleh pengguna amatir.
  • Kekurangan: Algoritma Monte Carlo yang mengandalkan fungsi pembangkit acak pada JavaScript memberikan fluktuasi nilai probabilitas kecil pada uji permutasi multivariat setiap kali iterasi ulang dijalankan. Limitasi kapasitas pemrosesan RAM menolak operasi himpunan data yang berkapasitas sangat raksasa. Pendekatan asimtotik p-value dapat memiliki diferensiasi marjinal pada nilai sampel mikro dibandingkan metode exact lookup table.

6. Daftar Pustaka

  • Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons.
  • Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Lawrence Erlbaum Associates.
  • Hotelling, H. (1931). The generalization of Student’s ratio. The Annals of Mathematical Statistics, 2(3), 360-378.
  • Levene, H. (1960). Robust tests for equality of variances. In I. Olkin et al. (Eds.), Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling (pp. 278-292). Stanford University Press.
  • Mann, H. B., & Whitney, D. R. (1947). On a test of whether one of two random variables is stochastically larger than the other. The Annals of Mathematical Statistics, 18(1), 50-60.
  • Montgomery, D. C., & Runger, G. C. (2014). Applied Statistics and Probability for Engineers (6th ed.). John Wiley & Sons.
  • Siegel, S., & Castellan, N. J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd ed.). McGraw-Hill.
  • Student. (1908). The probable error of a mean. Biometrika, 6(1), 1-25.
  • Welch, B. L. (1947). The generalization of “Student’s” problem when several different population variances are involved. Biometrika, 34(1/2), 28-35.

Daftar Tool Analisis Statistik Online Statistikian
Scroll to Top
Jasa Olah dan Analisis Statistik Oleh Statistikian Tahun 2024