Tahap 1: Input Matriks Pengamatan Berpasangan
| No | ID_Responden | Pre_Kognitif | Post_Kognitif | Pre_Afektif | Post_Afektif |
|---|---|---|---|---|---|
| 1 | |||||
| 2 | |||||
| 3 | |||||
| 4 | |||||
| 5 |
Dokumentasi Akademik ST-Engine: Paired T-Test & Wilcoxon Signed Rank Test
Dikembangkan Oleh:
ANWAR HIDAYAT
Founder dan CEO www.statistikian.com
Coding ini dibangun dan didevelop oleh Anwar Hidayat. Aplikasi komputasi komparasi desain berulang (repeated measures) ini dijalankan sepenuhnya oleh Custom JavaScript Math Engine. Mencakup penyajian efek ukuran (Effect Size), taksiran *Power*, hingga ekstensi multivariat Hotelling’s dan permutasi Monte Carlo secara aman pada sisi peramban klien tanpa koneksi server.
Dokumentasi ini membabar rancangan analitis, landasan teoretis, dan prosedur operasional alat ST-Engine Comparative Analysis (Within-Subjects Design). Rangkaian uji statistik berpasangan (paired tests) difungsikan untuk mendeteksi perubahan signifikansi parameter pemusatan pada subjek observasi yang sama (dependen), biasanya dievaluasi dalam kondisi intervensi silang atau linimasa pra dan pasca perlakuan (pre-test & post-test).
Lanjutkan membaca fondasi teoretis, rumus matematis, dan panduan lengkap instrumen analisis ini.
1. Teori Dasar: Definisi, Tujuan, dan Fungsi Desain Berpasangan
Dalam metodologi penelitian eksperimental maupun observasional longitudinal, peneliti kerap menggunakan desain subjek-dalam (within-subjects design) atau pengukuran berulang (repeated measures). Desain ini memiliki keunggulan statistik yang absolut ketimbang desain sampel bebas (independent samples). Dengan mengukur entitas atau responden yang sama melintasi dua waktu atau kondisi yang berbeda (misal: sebelum terapi dan sesudah terapi), desain berpasangan secara otomatis mengeliminasi varians perancu (confounding variance) yang bersumber dari perbedaan bawaan antar subjek (seperti genetika, latar belakang, atau IQ). Penghilangan galat inter-subjek ini meningkatkan daya uji statistik (statistical power), yang berimplikasi pada sensitivitas superior dalam mendeteksi efek intervensi meskipun dengan ukuran sampel yang minimalis (Cumming, 2012).
Paired Samples T-Test merupakan instrumen parametrik standar yang pertama kali diperkenalkan dari derivasi distribusi-t oleh William Sealy Gosset pada tahun 1908. Uji ini mentransformasi nilai dari dua kelompok pengukuran menjadi satu nilai skalar yakni selisih (delta, $\Delta$). Tujuan fungsionalnya adalah untuk menguji hipotesis nol (H0) yang mendalilkan bahwa rata-rata selisih populasi tersebut adalah nol (bermakna tidak ada efek intervensi). Karena berbasis rata-rata, uji ini mensyaratkan secara ketat bahwa nilai sisaan selisih (bukan skor aslinya) terdistribusi normal. Pelanggaran asumsi normalitas (seperti kemunculan pencilan ekstrem) dapat mendistorsi nilai rata-rata, sehingga mengurangi validitas kesimpulan (Montgomery & Runger, 2014).
Manakala asumsi normalitas gugur, instrumen alternatif mutlak yang dipergunakan adalah Wilcoxon Signed-Rank Test, sebuah metode non-parametrik yang dipublikasikan oleh Frank Wilcoxon (1945). Uji ini tidak mengkalkulasi selisih rata-rata murni, melainkan mengurutkan nilai absolut dari selisih tersebut ke dalam sistem pemeringkatan (ranks), lalu membubuhkan kembali tanda arahnya (positif atau negatif). Metode ini menganalisis apakah terdapat asimetri proporsional antara rangking positif dan rangking negatif. Kelebihan metode pemeringkatan ini adalah kekebalannya (robustness) terhadap pencilan (outliers) yang merusak, sehingga konklusi yang ditarik tetap sahih pada distribusi asimetris. Kedua uji univariat tersebut di atas lazim didampingi oleh evaluasi ukuran efek (effect size), seperti Cohen’s $d_z$ atau $d_{av}$, guna memberikan makna praktis seberapa masif pergeseran yang terjadi, terlepas dari sebatas label “signifikan” (Cohen, 1988).
Bila periset mengevaluasi lebih dari satu variabel dependen secara bersamaan, melakukan uji-T atau Wilcoxon secara berulang pada setiap variabel akan mengundang bahaya inflasi galat Tipe I (Family-wise error rate). Untuk menangkal fenomena tersebut, analisis harus dieksekusi melalui pendekatan multivariat simultan. Dalam kawasan parametrik, pendekatan ini dijembatani oleh Paired Hotelling’s T Square, yang menguji secara serentak pergeseran jarak sentroid multivariat (berbasis jarak Mahalanobis) terhadap vektor nol. Sedangkan pada domain non-parametrik, digunakan Sign-Permutation Test, sebuah pendekatan rekayasa Monte Carlo yang melempar dan memutar probabilitas tanda (positif/negatif) secara acak melintasi ruang sampel guna mengalkulasi probabilitas p-value empiris tanpa keterikatan asumsi kurva sebaran apa pun (Hotelling, 1931; Good, 2005).
2. Formula Tiap Tahap Analisis dan Relevansinya
t = \frac{\bar{d}}{SE_{\bar{d}}} = \frac{\frac{1}{n}\sum (X_{post} - X_{pre})}{s_d / \sqrt{n}}\bar{d}) terhadap standar error-nya. Rasio yang membengkak menahbiskan signifikansi eksistensi pergeseran (Student, 1908).d_z = \frac{\bar{d}}{s_d} \quad ; \quad g_{av} = \frac{\bar{d}}{(s_{pre} + s_{post})/2} \times \left(1 - \frac{3}{4(2n)-9}\right)d_z menstandardisasi selisih berdasarkan standar deviasi beda, seringkali memicu over-estimation. g_{av} (Hedges’ g average) direkomendasikan pakar mutakhir karena membagi selisih dengan rata-rata variabilitas murni kedua kondisi serta memberikan koreksi bias sampel kecil (Cumming, 2012).W = \min(\sum R_+, \sum R_-) \quad \to \quad Z = \frac{W - \frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24} - \frac{\sum t^3 - t}{48}}}W didapat dari total rangking positif (R_+) atau negatif (R_-) terkecil. Formula penyebut mengimplementasikan penalti pengoreksi apabila mendapati kehadiran data kembar bertumpuk (ties, direpresentasikan dengan t) guna menjamin akurasi asimtotik probabilitas sebaran-Z (Wilcoxon, 1945).T^2 = n (\bar{D})' S_d^{-1} (\bar{D}) \quad \to \quad F = \frac{n-p}{p(n-1)} T^2\bar{D} adalah matriks vektor rata-rata selisih, dikalikan dengan invers matriks kovarians S_d^{-1} (Jarak Mahalanobis). Relevan mengamankan signifikansi sistemik guna meredam inflasi galat berganda (Hotelling, 1931).3. Arsitektur Komputasi: Pendekatan Vanilla JavaScript
Instrumen analitis ini menggunakan komputasi matematis murni yang ditulis menggunakan kode Vanilla JS (Javascript yang bekerja di sisi browser klien).
- Logika Distribusi & P-Value: Ekstraksi P-Value dari skor parametrik (Z, T, F) dieksekusi secara otonom melalui persamaan polinomial aproksimasi distribusi kontinu (seperti perhitungan
stTCDF_approx). Walaupun mendatangkan desimal sisa aproksimasi asimtotik, kaidah simpulan hipotesis (Gagal/Tolak H0) tetap 100% konsisten layaknya SPSS. - Matriks Aljabar Skala Klien: Pemecahan inversi matriks kovarians dalam uji Hotelling T Square mengoperasikan fungsi eliminasi Gauss-Jordan secara native (`stMatInv`). Pengujian permutasi Monte Carlo memutar operasi putaran perulangan acak 999 kali pada CPU gawai pengguna.
4. Panduan Manual Penggunaan Alat Analisis
A. Persiapan Data (Format Matriks)
- Observasi berskala kontinyu. Konstruksi matriks baris adalah subjek yang diuji, sedangkan kolom menginterpretasikan variabel. Susunan pendaftaran data harus linier, mengimplikasikan bahwa data di baris 1 kondisi Pre dimiliki mutlak oleh orang/entitas yang sama dengan baris 1 di kondisi Post.
- Gunakan Tombol Data Simulasi jika ingin mendemonstrasikan kelancaran grafik secara kilat tanpa memerlukan dataset real.
B. Pemetaan Modul Uji (Mapping)
- Setelah matriks terdaftar (Kunci Data), sorot panel Pemetaan Variabel Repeated Measures.
- Variabel Kondisi 1 (Pre): Muat variabel observasi perdana.
- Variabel Kondisi 2 (Post): Muat variabel pasca-intervensi. Tata urutan pemasukan dimensi wajib berkorespondensi presisi (contoh: Kognitif_Pre didampingkan lurus dengan Kognitif_Post).
C. Penyesuaian Visual dan Eksekusi
- Diagram Alur Komputasi: Pengecekan Asumsi Deskriptif → Render Boxplot, Q-Q, & Histogram → Diagnostik Shapiro-Francia & Lilliefors → Rekomendasi Navigasi Uji (T-Test vs Wilcoxon) → Pembuahan Koefisien & Power → Uji Hotelling & Monte Carlo → Kesimpulan Laporan Otomatis.
D. Cara Baca Output Inferensial
- Pemilihan Rute Algoritma: Panel navigasi gerbang (warna kuning) secara cerdas memutus status sebaran diferensi ($\Delta$). Jika normal, Anda diarahkan membidik Kawasan 1 (Biru/Parametrik). Jika syarat normalitas tidak terpenuhi, anda diarahkan merujuk pada Kawasan 2 (Hijau/Non-Parametrik).
- Signifikansi Univariat: Fokus mencerna kolom P-Value (2-tailed) atau Asymp. Sig. Apabila perolehan angka memudar jatuh < 0.05, H0 resmi ditolak. Arahkan pelaporan dengan mendeklarasikan perwujudan traksi selisih yang signifikan.
- Effect Size & Power: Indeks d atau g di atas 0.5 diartikan berefek menengah. Skala Statistical Power mengekstrapolasi persentase keabsahan sampel (idealnya menduduki persentase minimal 80%).
- Multivariat (Kawasan Ungu): Berperan mutlak apabila Anda menjajarkan pengujian lebih dari 1 pasang variabel. Nilai P-Value multivariat yang melorot < 0.05 mendominasi konklusi serentak.
5. Manfaat Aplikasi (Kelebihan & Kekurangan)
- Kelebihan Dominan: Menjelmakan komputasi statistik kilat terdesentralisasi (Air-Gapped Protocol Privacy) tanpa transfer peladen awan. Fasilitas kelengkapan Effect Size dan Monte Carlo Permutation jarang ditemui dalam kompilasi instrumen peranti lunak gratis. Visualisasi berbasis SVG menyajikan kejelasan grafik tak berpixel.
- Kekurangan: Algoritma Sign-Permutation (Monte Carlo) memutar angka fungsi random secara bebas, yang mewariskan fluktuasi minor variasi probabilitas P-Value empiris tiap kali eksekusi tombol ditekan. Pendekatan kalkulasi limit inversi matriks JavaScript pada himpunan variabel yang membeludak dapat menyulut kelumpuhan browser.
6. Daftar Pustaka
- Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Lawrence Erlbaum Associates.
- Cumming, G. (2012). Understanding the New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis. Routledge.
- Good, P. I. (2005). Permutation, Parametric, and Bootstrap Tests of Hypotheses (3rd ed.). Springer.
- Hotelling, H. (1931). The generalization of Student’s ratio. The Annals of Mathematical Statistics, 2(3), 360-378.
- Montgomery, D. C., & Runger, G. C. (2014). Applied Statistics and Probability for Engineers (6th ed.). John Wiley & Sons.
- Noether, G. E. (1987). Sample size determination for some common nonparametric tests. Journal of the American Statistical Association, 82(398), 645-647.
- Student. (1908). The probable error of a mean. Biometrika, 6(1), 1-25.
- Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics Bulletin, 1(6), 80-83.
