Tahap 1: Input Matriks Data Observasi Ordinal

📂 Unggah CSV Catatan: Mendukung pengisian (*paste*) masif dari Excel.

No	ID_Responden	Pendidikan_X1	Pendapatan_X2	Status_Y1	Kinerja_Y2
1
2
3
4
5

Dokumentasi Akademik ST-Engine: Analisis Korelasi Ordinal

Dikembangkan Oleh:

ANWAR HIDAYAT

Founder dan CEO www.statistikian.com

Coding ini dibangun dan didevelop oleh Anwar Hidayat untuk menyediakan instrumen pengujian korelasi non-parametrik (Spearman, Kendall, Somers’ d, dan Gamma) berbasis 100% Pure JavaScript Math Engine. Menjamin perhitungan probabilitas asimtotik secara offline tanpa membebani server eksternal, sangat responsif dan aman untuk ekosistem WordPress.

Dokumentasi ini menguraikan spesifikasi analitis, landasan teoretis, serta prosedur operasional ST-Engine Ordinal Correlation Matrix. Korelasi ordinal merupakan pilar dalam statistika non-parametrik yang ditujukan untuk mengukur kekuatan dan arah asosiasi monotonik antara dua variabel yang diukur setidaknya pada skala peringkat (ordinal), atau pada data kontinu yang tidak memenuhi asumsi normalitas (distribusi asimetris).

1. Teori Dasar: Definisi, Tujuan, dan Fungsi Korelasi Ordinal

Dalam analisis statistika bivariat, pengujian korelasi ditujukan untuk mengkuantifikasi derajat hubungan atau asosiasi antara dua peubah. Jika Koefisien Korelasi Product-Moment Pearson mengasumsikan adanya hubungan linearitas murni dan distribusi normal bivariat berskala rasio/interval, korelasi ordinal mengambil pendekatan non-parametrik yang jauh lebih fleksibel. Analisis korelasi ordinal secara fundamental berfungsi untuk mengukur asosiasi monotonik (monotonic relationship). Hubungan monotonik mendeskripsikan kondisi di mana ketika nilai satu variabel meningkat, variabel lainnya juga cenderung meningkat (atau menurun), tanpa mensyaratkan bahwa laju peningkatan tersebut harus konstan atau membentuk garis lurus yang sempurna (Siegel & Castellan, 1988).

Tujuan primer penggunaan alat analisis korelasi ordinal adalah untuk mengevaluasi data kuesioner skala Likert, pemeringkatan preferensi, atau evaluasi data kuantitatif yang mengalami pelanggaran asumsi parametrik berat (seperti adanya heteroskedastisitas ekstrem atau pencilan/outliers yang tidak dapat dieliminasi). Dalam pengolahan data ordinal, arsitektur perhitungan tidak lagi memanipulasi nilai mentah (raw data), melainkan mentransformasikannya terlebih dahulu ke dalam sistem urutan peringkat (ranks) atau membedah interaksi antar pasangan observasi (pairwise comparisons) (Agresti, 2013).

Secara epistemologis, koefisien korelasi ordinal dipecah menjadi dua paradigma komputasi utama:

Paradigma Berbasis Peringkat (Rank-Based Correlation): Metodologi ini dipelopori oleh Charles Spearman pada tahun 1904. Koefisien Spearman’s Rho (\rho) secara hakikat merupakan aplikasi dari korelasi Pearson biasa yang dieksekusi setelah seluruh data mentah dikonversi menjadi angka peringkat fraksional. Metode ini sangat tangguh dan populer karena sensitivitasnya yang selaras dengan nilai korelasi linear pada data berperingkat, serta kemampuannya mengoreksi data kembar (tied ranks) secara proporsional (Spearman, 1904).
Paradigma Berbasis Pasangan (Pairwise-Based Correlation): Metodologi ini dikembangkan oleh Maurice Kendall pada tahun 1938. Alih-alih merangking seluruh deret observasi, metode ini memecah observasi menjadi pasangan-pasangan silang (pairwise) untuk mendeteksi apakah pasangan tersebut bergerak searah (Concordant Pairs / C) atau berlawanan arah (Discordant Pairs / D). Paradigma ini melahirkan Kendall’s Tau (\tau). Konsep Concordant mendeskripsikan observasi i dan j di mana jika X_i > X_j maka Y_i > Y_j. Sebaliknya, Discordant terjadi jika X_i > X_j namun Y_i < Y_j. Perbandingan ini dipandang secara akademis memberikan interpretasi probabilitas yang lebih murni dan robust (kebal) terhadap data matriks bujur sangkar dengan ikatan silang yang padat (Kendall, 1938).

Keluarga korelasi berbasis pasangan (Concordant-Discordant) memiliki turunan yang menangani persoalan asimetri dan data kembar (ties) dengan pendekatan yang spesifik. Kruskal's Gamma (\gamma) (Goodman & Kruskal, 1954) mengabaikan sama sekali pasangan data yang bernilai kembar, sehingga cenderung menghasilkan koefisien yang lebih tinggi (overestimasi). Oleh karenanya, Gamma kurang direkomendasikan pada tabel tabulasi silang yang padat. Untuk mengatasi kelemahan ini, Somers' d (Somers, 1962) diperkenalkan. Somers' d bersifat asimetris; ia mendemosntrasikan daya peramalan prediktif dengan memperhitungkan pasangan yang kembar pada variabel terikat (dependen), namun mengabaikan pasangan yang kembar pada variabel penjelas. Fleksibilitas ini menjadikan Somers' d sangat esensial dalam penelitian yang mensyaratkan arah hubungan satu arah yang terdefinisi secara teoretis (misalnya: tingkat pendidikan [X] memprediksi tingkat jabatan [Y], bukan sebaliknya).

2. Formula Tiap Tahap Analisis dan Relevansinya

\rho = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)} \quad \text{atau (Koreksi Ties):} \quad \frac{\text{Cov}(R_X, R_Y)}{\sigma_{R_X} \sigma_{R_Y}}

Spearman's Rho (\rho): Pada keberadaan data kembar yang masif, aplikasi ini menggunakan formula koreksi dengan menghitung korelasi Pearson secara langsung pada peringkat fraksional rata-rata (mid-ranks). Relevansinya adalah memberikan penaksiran linear monotonik yang presisi tanpa bias urutan (Spearman, 1904).

\tau_b = \frac{C - D}{\sqrt{(C + D + T_X) (C + D + T_Y)}}

Kendall's Tau-b (\tau_b): Koefisien simetris yang menormalisasi selisih pasangan searah (C) dan berlawanan (D) terhadap proporsi data kembar pada sumbu X (T_X) dan sumbu Y (T_Y). Merupakan koefisien paling krusial dan paling disarankan untuk matriks tabulasi silang bujur sangkar berdimensi sama (Kendall, 1938).

\gamma = \frac{C - D}{C + D}

Kruskal's Gamma (\gamma): Koefisien yang sepenuhnya mengeliminasi kalkulasi seluruh pasangan yang memiliki ikatan kembar (ties). Relevan digunakan secara terbatas hanya apabila tujuan riset semata-mata memprediksi probabilitas keteraturan tanpa mempertimbangkan ketidakpastian ikatan observasi (Goodman & Kruskal, 1954).

d_{Y|X} = \frac{C - D}{C + D + T_Y} \quad ; \quad d_{X|Y} = \frac{C - D}{C + D + T_X}

Somers' d (Asimetris): Modifikasi derivatif yang menghukum (memberi penalti) pembagi terhadap proporsi data kembar pada variabel dependen saja. Rumus ini secara logis sangat diandalkan ketika arah kausalitas atau daya prediksi teoretis di antara dua variabel telah teridentifikasi secara jelas sejak awal (Somers, 1962).

3. Arsitektur Perangkat Lunak dan Komparasi Ekuivalensi

Alat analitik ST-Engine ini dikonstruksi tanpa mendelegasikan perintah kepada sistem server komputasi awan. Sistem digerakkan murni oleh Custom JavaScript Math Engine:

Ekuivalensi Algoritma (Kesamaan 99% dengan SPSS/R): Pencarian probabilitas korelasi Spearman, nilai Concordant-Discordant, Tau-b, Gamma, hingga Somers' d diformulasikan dari landasan teoretis murni. Hasil desimal koefisien yang dicetak akan identik mutlak dengan software standar komersial maupun perintah cor.test(method="spearman") pada R Studio.
Perbedaan Teknis (Asimtotik P-Value): Dalam menaksir probabilitas signifikansi (P-Value), alat ini mengkalkulasi probabilitas fungsi Z-Score normal standar berbasis galat varians asimtotik (ord_NormCDF). Pendekatan asimtotik ini identik dengan SPSS pada sampel besar (N > 30). Namun, untuk matriks sampel mikro (N < 15), software berbayar biasanya melengkapinya dengan Exact Permutation Test yang menghasilkan angka P-Value sedikit berbeda. Mengingat limitasi komputasi *browser*, pendekatan asimtotik adalah yang paling optimal dan tetap sah secara akademik.

4. Panduan Manual Penggunaan Alat Analisis

A. Persiapan Data dan Input CSV

Format Matriks: Data observasi harus berupa nilai numerik (skala likert, peringkat, atau interval). Dilarang menyertakan sel kosong (missing values).
Mekanisme Input: Blok lembar kerja spreadsheet (Excel) lalu rekatkan (*paste*) langsung pada kisi (Grid) koordinat pertama. Opsi lain, gunakan fasilitas Unggah CSV.
Pembangkitan Data Simulasi difasilitasi untuk mendemonstrasikan kelayakan sebaran data ordinal (1 hingga 5 skala Likert).

B. Pemetaan Data Silang (Cross-Mapping)

Klik tombol Kunci Data & Lanjutkan Pemetaan.
Alokasikan variabel ke Himpunan Baris (X) dan Himpunan Kolom (Y). Anda dapat menguji hingga 10 variabel X melawan 10 variabel Y secara simultan.

C. Penyesuaian Opsi Analisis dan Diagram Alur

Opsi Ekstraksi: Dihimbau untuk mencentang seluruh parameter analisis (Heatmap Crosstab, Korelasi Simetris, Asosiasi Asimetris, dan Visualisasi Kepadatan).
Diagram Alur Algoritma: Parsing CSV → Deteksi Peringkat (Ranks) → Pembentukan Matriks Silang Concordant-Discordant → Kalkulasi Z-Score Asimtotik → Pembuatan Matriks Korelasi Keseluruhan → Render Tabel Rincian Individual (Bivariat).

D. Cara Baca Tabel Output

KAWASAN 1 (Matriks Heatmap Keseluruhan): Merupakan dashboard cepat untuk menilai asosiasi linear. Sel berwana pekat mengindikasikan korelasi Spearman yang dominan. Simbol bintang dua (**) mengesahkan tingkat signifikansi P-Value di bawah 0.01.
KAWASAN 2 (Rekapitulasi Signifikansi): Menginformasikan Proporsi Data Kembar (*Ties*). Jika angka ini tergolong ekstrim (misal > 25%), maka peneliti dihimbau merujuk kepada koefisien Kendall's Tau-b alih-alih Spearman, karena Tau-b mengakomodasi penalti atas himpunan *ties*.
Fokus Analisis Bivariat (Crosstab & Asimetris): Di bagian ini disajikan matriks tabulasi silang. Pada tabel Daya Prediktif Asimetris, perhatikan kolom P-Value. Jika signifikansi tervalidasi (< 0.05), pergunakan Somers' d Asymmetric (X memprediksi Y) bila kerangka penelitian menetapkan status satu arah.
Visualisasi Kepadatan (Bubble Scatter-Plot): Menggantikan scatter plot konvensional yang tidak fungsional pada data Likert yang bertumpuk. Gelembung raksasa (Bubble) yang menanjak secara diagonal memperlihatkan traksi asosiasi monotonik positif yang nyata secara visual.

5. Manfaat Aplikasi (Kelebihan & Kekurangan)

Kelebihan Ekstrem: Tidak menggunakan beban backend server atau unduhan library statis R-WASM yang memperlambat laju awal (*Zero Load Time*). Desain Crosstab yang diarsir berdasar matriks pewarnaan memberikan panduan visual instan yang melampaui pelaporan SPSS klasik. Jaminan kerahasiaan data 100%.
Kekurangan Bawaan: Metode komputasi berbasis JavaScript untuk menghitung silang pasangan data ordinal menuntut ongkos memori O(N²). Akibatnya, pemrosesan observasi di atas batas rentang masif (N > 2000 baris) berisiko menyulut kebekuan responsivitas antarmuka (*tab freeze*). Selain itu, probabilitas p-value disandarkan pada kalkulasi asimtotik, bukan komputasi permutasi eksak.

6. Daftar Pustaka

Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons.
Baltagi, B. H. (2005). Econometric Analysis of Panel Data (3rd ed.). John Wiley & Sons.
Cox, D. R. (1958). The regression analysis of binary sequences. Journal of the Royal Statistical Society: Series B, 20(2), 215-232.
Goodman, L. A., & Kruskal, W. H. (1954). Measures of association for cross classifications. Journal of the American Statistical Association, 49(268), 732-764.
Gujarati, D. N. (2004). Basic Econometrics (4th ed.). McGraw-Hill.
Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression (3rd ed.). John Wiley & Sons.
Kendall, M. G. (1938). A new measure of rank correlation. Biometrika, 30(1/2), 81-93.
McCullagh, P., & Nelder, J. A. (1989). Generalized Linear Models (2nd ed.). Chapman and Hall/CRC.
McFadden, D. (1974). Conditional logit analysis of qualitative choice behavior. In P. Zarembka (Ed.), Frontiers in Econometrics (pp. 105-142). Academic Press.
Siegel, S., & Castellan, N. J. (1988). Nonparametric Statistics for the Behavioral Sciences (2nd ed.). McGraw-Hill.
Somers, R. H. (1962). A new asymmetric measure of association for ordinal variables. American Sociological Review, 57(6), 799-811.
Spearman, C. (1904). The proof and measurement of association between two things. The American Journal of Psychology, 15(1), 72-101.

Daftar Tool Analisis Statistik Online Statistikian

Ordinal Correlation Matrix Engine