Cross Tabulation With Statistics For Nominal Data

Engine Code by Anwar Hidayat – www.statistikian.com

1. Input Data Responden Mentah (Grid View)

💡 Tips: Paste data observasi mentah. Boleh teks/kategori.
NoID_PasienTreatment_GrupStatus_Kesembuhan
1
2
3
4
5

Butuh Bantuan Analisis Data Profesional?

Serahkan pada ahlinya! Kami bantu olah data Skripsi/Tesis Anda hingga tuntas. Akurat, Cepat, dan Bergaransi. Menggunakan aplikasi SPSS, STATA, EVIEWS, LISREL, SMARTPLS, AMOS, JASP, MINITAB, EXCEL, R STUDIO.

💬 Konsultasi Jasa Olah Data (WhatsApp)

Dokumentasi Akademik ST-Engine: Analisis Chi-Square & Crosstabs

Dikembangkan Oleh:

ANWAR HIDAYAT

Founder dan CEO www.statistikian.com

Coding ini dibangun dan didevelop oleh Anwar Hidayat untuk menyediakan instrumen analisis tabulasi silang berskala industri berbasis Pure JavaScript Math Engine. Menghadirkan probabilitas asimtotik Pearson, Yates’ Correction, perhitungan hipergeometrik Fisher’s Exact Test dengan Log-Gamma, serta estimasi Odds Ratio secara riil tanpa ketergantungan server backend.

Dokumentasi ini menguraikan spesifikasi teoretis dan panduan operasional dari instrumen ST-Engine Chi-Square & Crosstabulation Analysis. Uji Chi-Square (Kai-Kuadrat) merupakan fondasi utama dalam statistika non-parametrik yang ditujukan untuk menguji hipotesis independensi (keterkaitan) antara dua variabel yang diukur pada skala kategorikal (nominal atau ordinal).

1. Teori Dasar: Definisi, Tujuan, dan Fungsi Uji Chi-Square

Uji Chi-Square Pearson untuk independensi (Pearson’s Chi-Square Test of Independence) pertama kali diformulasikan oleh pelopor statistika modern, Karl Pearson, pada tahun 1900. Metode ini merupakan sebuah kerangka analisis non-parametrik yang dirancang secara spesifik untuk menganalisis dan mengevaluasi data frekuensi yang disusun dalam format tabel kontingensi (crosstabulation). Secara fundamental, uji Chi-Square digunakan untuk menetapkan apakah terdapat interaksi asosiatif atau hubungan yang signifikan secara statistik antara dua variabel kategorikal, atau apakah distribusi frekuensi observasi antarkategori tersebut hanyalah produk dari kebetulan matematis yang acak (Pearson, 1900).

Tujuan objektif dari pengoperasian uji Chi-Square adalah untuk membandingkan matriks frekuensi aktual (observed frequencies) yang diperoleh secara empiris dari sampel penelitian, melawan matriks frekuensi teoretis (expected frequencies). Frekuensi ekspektasi ini adalah distribusi nilai yang secara logis seharusnya muncul apabila hipotesis nol (H0)—yakni kedua variabel bersifat saling bebas (independen) dan tidak memiliki relasi—dinyatakan benar. Apabila disparitas (jarak selisih) antara observasi empiris dan ekspektasi teoretis tersebut membesar dan melampaui toleransi ambang kritis yang diizinkan oleh distribusi Chi-Square, maka peneliti memiliki justifikasi yang absolut untuk menolak hipotesis nol, sehingga kesimpulan mengarah pada adanya asosiasi antarvariabel yang nyata (Agresti, 2013).

Meskipun memiliki keandalan yang luar biasa, uji Pearson Chi-Square mengikat peneliti pada beberapa prasyarat asumsi asimtotik yang ketat. Asumsi yang paling krusial, sebagaimana didalilkan oleh Cochran (1952), adalah terkait kelayakan frekuensi harapan. Cochran merumuskan aturan praktis (*rule of thumb*) bahwa uji Chi-Square akan kehilangan presisinya dan memproduksi P-Value yang keliru apabila lebih dari 20% total sel dalam tabel kontingensi memiliki frekuensi harapan (expected count) di bawah angka 5, atau jika terdapat satu pun sel yang memiliki frekuensi harapan kurang dari 1. Pada tabel bivariat berdimensi kecil (khususnya 2×2), ukuran sampel yang terbatas sering kali memicu probabilitas penolakan H0 yang berlebihan (*over-rejection*).

Untuk menetralisir kelemahan struktural pada matriks 2×2, dua pendekatan korektif akademis diperkenalkan. Pertama, Yates’ Continuity Correction (Yates, 1934), yang secara mekanis mengurangkan nilai 0.5 dari selisih absolut observasi dan ekspektasi sebelum dikuadratkan. Koreksi ini menekan nilai statistik Chi-Square agar tidak menggelembung pada sampel yang minim. Kedua, yang jauh lebih superior, adalah Fisher’s Exact Test (Fisher, 1922). Alih-alih bergantung pada kurva distribusi aproksimasi asimtotik (yang rentan bias), uji Fisher mengkalkulasi probabilitas kemunculan persis dari tabel kontingensi yang bersangkutan melalui distribusi hipergeometrik permutasi eksak. Oleh karena itu, pada tabel 2×2 yang melanggar asumsi kecukupan frekuensi Cochran, pelaporan *Fisher’s Exact Test* diwajibkan secara mutlak dalam publikasi medis dan biostatistika (Agresti, 2013).

Selain menetapkan keberadaan (signifikansi) hubungan, analisis tabulasi silang menuntut peneliti untuk menakar kekuatan (kadar) dari relasi tersebut. Untuk mengkuantifikasinya, analisis ini mengadopsi ukuran asosiasi simetris (symmetric measures) seperti koefisien Phi (khusus tabel 2×2), Cramer’s V (Cramer, 1946) untuk tabel berdimensi bebas, dan Contingency Coefficient. Di ranah epidemiologi, analisis ini dilengkapi dengan penaksir risiko, yaitu Odds Ratio (OR) dan Relative Risk (RR), yang berfungsi mendeskripsikan secara konkret berapa kali lipat peluang kerentanan pemaparan suatu grup dibandingkan grup lainnya dalam sebuah tabel kasus-kontrol (Hosmer, Lemeshow, & Sturdivant, 2013).

2. Formula Tiap Tahap Analisis dan Relevansinya

\chi^2 = \sum_{i=1}^{r} \sum_{j=1}^{c} \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \quad \text{dimana} \quad E_{ij} = \frac{R_i \times C_j}{N}
Pearson Chi-Square & Frekuensi Ekspektasi: Rumus sentral pengujian independensi. O_{ij} melambangkan frekuensi aktual (observasi) pada baris i kolom j, manakala E_{ij} mewakili nilai ekspektasi yang dihitung dari hasil kali total marginal baris (R_i) dan kolom (C_j) dibagi populasi N. Formula ini relevan untuk menjustifikasi diskrepansi matriks (Pearson, 1900).
\chi^2_{Yates} = \sum_{i=1}^{2} \sum_{j=1}^{2} \frac{(|O_{ij} - E_{ij}| - 0.5)^2}{E_{ij}}
Yates’ Continuity Correction: Koreksi penalti absolut matematis yang dirancang spesifik untuk menyelaraskan distribusi diskret pada tabel kontingensi berdimensi murni 2×2 ke dalam bentuk kontinu dari distribusi Chi-Square, menghindari over-estimasi P-Value (Yates, 1934).
p = \frac{(a+b)! (c+d)! (a+c)! (b+d)!}{a! b! c! d! N!}
Fisher’s Exact Test: Menghitung probabilitas eksak (tanpa aproksimasi) dari terbentuknya komposisi sel (a,b,c,d) di tabel 2×2 mengikuti fungsi probabilitas hipergeometrik. Relevansinya mutlak krusial saat sampel kecil (N < 20) atau sel E_{ij} < 5 (Fisher, 1922). Karena operasi faktorial rentan mengalami overflow, aplikasi ini menggunakan log-gamma (\ln \Gamma) untuk presisi sempurna.
V = \sqrt{\frac{\chi^2}{N \times \min(r-1, c-1)}} \quad ; \quad \Phi = \sqrt{\frac{\chi^2}{N}}
Cramer’s V & Koefisien Phi: Menormalkan metrik Chi-Square (yang secara alamiah sensitif terhadap ukuran N) menjadi indeks berskala 0 hingga 1. Cramer’s V berperan sebagai parameter Effect Size (besaran efek) yang mengkuantifikasi kadar kekuatan hubungan asosiasi antarkategori (Cramer, 1946).
OR = \frac{a \times d}{b \times c} \quad ; \quad RR = \frac{a / (a+b)}{c / (c+d)}
Odds Ratio (OR) & Relative Risk (RR): Metrik penduga risiko pada rancangan riset potong lintang atau klinis 2×2. OR membandingkan probabilitas ganjil kemunculan peristiwa di antara dua kelompok, sedangkan RR memaparkan kelipatan risiko secara langsung (Hosmer et al., 2013).

3. Arsitektur Perangkat Lunak dan Komparasi Ekuivalensi

Alat ini dikonstruksi secara utuh memanfaatkan infrastruktur 100% Pure JavaScript Math Engine tanpa bergantung sedikit pun pada antarmuka peladen (backend) R-WASM maupun Python.

Kesamaan dan Ekuivalensi (Akurasi 99% – 100%):

  • Pearson, Likelihood, & Symmetric Measures: Nilai Chi-Square, p-value asimtotik, Phi, Contingency Coefficient, dan Cramer’s V yang dicitrakan oleh *tool* ini akan terkalibrasi kembar secara absolut dengan perangkat IBM SPSS (Modul *Crosstabs*). Sistem agregasi matriks frekuensinya dirancang presisi.
  • Log-Gamma Fisher Exact Test: JavaScript murni akan lumpuh (Infinity) bila menghitung faktorial `170!`. Untuk mengakalinya, alat ini mereplikasi metode *Log-Gamma* yang digunakan oleh R Studio. Sehingga, probabilitas Fisher’s Exact pada matriks 2×2 akan sangat akurat dan identik dengan peranti software biostatistik berlisensi.

Limitasi Komputasi (Perbedaan Teknis):

  • Fisher Exact pada Matriks Besar (>2×2): SPSS melalui ekstensi eksaknya, atau R Studio (dengan simulate.p.value=TRUE), memiliki fasilitas untuk menghitung Fisher Exact Test pada tabel raksasa (misal 4×4) menggunakan metode Monte Carlo atau algoritma jaringan iteratif yang sangat menguras beban prosesor. Alat JavaScript ini secara protektif membatasi uji Fisher hanya untuk tabel 2×2 agar memori RAM peramban (browser) Anda tidak mati membeku (*crash*).

4. Panduan Manual Penggunaan Alat Analisis

A. Persiapan Data dan Unggah CSV

  • Format Data: Siapkan himpunan data baris mentah (*raw cases*). Pastikan data kategorikal telah terisi. Data boleh berupa angka (*dummy coding*) atau berupa teks langsung (seperti “Pria”, “Wanita”). Tidak boleh terdapat sel bernilai kosong (missing).
  • Metode Input: Anda dapat mengimpor dokumen .csv atau secara simpel menyeleksi sel dari Excel, menyalin (*copy*), dan menempelkannya (*paste*) di atas area matriks tabel ST-Engine.
  • Tombol Data Simulasi: Tersedia bagi Anda yang ingin mengaktifkan penciptaan seribu baris (*mock data*) rekayasa otomatis untuk membedah fungsionalitas logika tabulasi aplikasi secara kilat.

B. Pemetaan Variabel Silang (Crosstab Mapping)

  • Klik tombol Kunci Data & Lanjut Pemetaan.
  • Pada loket yang tersedia, proyeksikan satu parameter ke Variabel Baris (X) / Paparan (misalnya Status Merokok) dan satu parameter lainnya ke Variabel Kolom (Y) / Kejadian (misalnya Kanker Paru).
  • Bilik Variabel Layer (Z) / Kontrol disediakan secara opsional jika Anda menargetkan pengujian stratifikasi (*layered crosstab*), di mana tabulasi dan nilai Chi-Square akan dipecah secara berjenjang mematuhi substrata variabel ketiga.

C. Pemilihan Opsi Statistik

  • Chi-Square Tests: Menjalankan uji Pearson, Fisher (bila 2×2), Likelihood Ratio, dan Linear-by-Linear.
  • Symmetric Measures: Memicu pengeluaran ukuran kekuatan relasi (Cramer’s V, Phi).
  • Risk/Odds Ratio: Secara khusus disediakan jika tabulasi menghasilkan silang 2×2, melaporkan estimasi kelipatan risiko beserta pita taksiran (CI 95%).

D. Cara Baca Tabel Output

  • Tabel Crosstabulation (Matriks Induk): Perhatikan baris Expected Count. Jika ada nilai yang bertengger di bawah angka 5, waspadai hasil Chi-Square Pearson dan lihat catatan peringatan uji (Aturan Cochran).
  • Chi-Square Tests (Signifikansi): Bila tabel Anda berdimensi 2×2, prioritaskan membaca nilai P-Value pada baris Fisher’s Exact Test atau Continuity Correction. Jika p-value < 0.05, maka relasi antar-variabel dinyatakan Signifikan (H0 ditolak). Untuk tabel > 2×2, pergunakan baris Pearson Chi-Square.
  • Symmetric Measures (Besaran Efek): Cramer’s V di atas 0.25 mengisyaratkan asosiasi moderat, sementara angka yang melebihi 0.5 menahbiskan derajat asosiasi ikatan yang kuat antar fitur.
  • Risk Estimate: Jika nilai Odds Ratio (OR) tercatat di angka 3.5, ini dimaknai bahwa kelompok referensi (baris pertama) memiliki tendensi peluang kecenderungan 3.5 kali lipat lebih berisiko mengalami kejadian (kolom pertama) dibandingkan kelompok kedua.
  • Kesimpulan Pakar Otomatis: Blok kuning di area basis akan menerjemahkan p-value dan parameter secara verbal akademik, menghindarkan Anda dari misinterpretasi penulisan bab simpulan tesis.

5. Manfaat Aplikasi (Kelebihan & Kekurangan)

  • Kelebihan: Bekerja menembus batas kelajuan instan seketika (0 detik penundaan/zero load time). Tidak memerlukan instalasi ekstensi backend. Menyajikan pemecahan Risk Estimate eksak yang krusial untuk mahasiswa keperawatan/kedokteran tanpa keharusan mengoperasikan SPSS. Integrasi proteksi privasi matriks absolut secara *offline*.
  • Kekurangan: Absennya perluasan komputasi Fisher’s Exact Monte Carlo untuk matriks raksasa di luar dimensi 2×2 akibat pembatasan daya gedor pemrosesan RAM JavaScript di sisi gawai peramban pengguna.

6. Daftar Pustaka

  • Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons.
  • Cochran, W. G. (1952). The \(\chi^2\) test of goodness of fit. The Annals of Mathematical Statistics, 23(3), 315-345.
  • Cramer, H. (1946). Mathematical Methods of Statistics. Princeton University Press.
  • Fisher, R. A. (1922). On the interpretation of \(\chi^2\) from contingency tables, and the calculation of P. Journal of the Royal Statistical Society, 85(1), 87-94.
  • Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression (3rd ed.). John Wiley & Sons.
  • Pearson, K. (1900). On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 50(302), 157-175.
  • Yates, F. (1934). Contingency tables involving small numbers and the \(\chi^2\) test. Supplement to the Journal of the Royal Statistical Society, 1(2), 217-235.
Daftar Tool Analisis Statistik Online Statistikian
Scroll to Top
Jasa Olah dan Analisis Statistik Oleh Statistikian Tahun 2024