Engine TSLS / Instrumental Variables Analysis | library R with R-WASM | JS Code by Anwar Hidayat

STATISTIKIAN tool From www.statistikian.com

Memeriksa Kesiapan Mesin R…

Tahap 0: Input Matriks Data

NoPendapatan_YEdukasi_X1_EndoUmur_X2_EksoJarakSekolah_Z1_InstBuku_Z2_Inst
1
2

Tahap 1: Alokasi Himpunan Variabel TSLS

(Pilih tepat 1 variabel target numerik)
(Prediktor numerik yang bermasalah/bias)
(Instrumen numerik $\ge$ Variabel Endogen)
(Prediktor kontrol yang valid)

Mengeksekusi Statistik Deskriptif (JS Native)…

Tahap 2: Diagnostik Dasar

Catatan Pra-Pemrosesan: Kolom teks (seperti nama perusahaan/tahun) akan bernilai 0 pada statistik deskriptif. Jika Anda mendapati P-Value NaN di regresi akhir, itu berarti Anda memasukkan kolom Teks ke dalam model. Harap pastikan hanya variabel Numerik yang dimasukkan ke kotak Y, X, Z, dan Eksogen.

Mengirim Data Numerik ke Mesin R…

Tahap 3 & 4: Regresi Tahap Pertama & Uji Validitas

Mesin R mengeksekusi Tahap 1 dan Diagnostik IV…

Tahap 5: Model Final (Second-Stage TSLS Regression)

Mesin R mensubstitusi nilai Fitted & mengkoreksi Standard Error…

Butuh Bantuan Olah Data Ekonometrika?

Pusing dengan Error atau Asumsi yang Tidak Terpenuhi? Percayakan analisis Anda pada Ahlinya.
Penyelesaian Cepat, Akurat, dan Bergaransi oleh Tim Statistikian.

💬 Chat WhatsApp Anwar Hidayat

Dokumentasi Akademik ST-Engine: Two-Stage Least Squares (TSLS)

Dikembangkan Oleh:

ANWAR HIDAYAT

Founder dan CEO www.statistikian.com

Aplikasi ekonometrika ini dibangun dan didevelop oleh Anwar Hidayat. Dioperasikan melalui arsitektur R-WASM (WebR) yang mengeksekusi komputasi bahasa R murni di dalam peramban (*browser*) pengguna secara tertutup (client-side). Alat ini menjamin presisi matriks Instrumental Variable (IV) dan kelengkapan uji diagnostik yang setara mutlak dengan perangkat lunak komersial industri.

Dokumentasi ini membentangkan landasan teoretis, spesifikasi matematis, dan panduan operasional dari instrumen ST-Engine Two-Stage Least Squares (TSLS). Metode TSLS merupakan teknik estimasi regresi Instrumental Variables (IV) yang secara khusus dikembangkan dalam disiplin ilmu ekonometrika guna mengoreksi patologi endogenitas, sebuah kondisi di mana asumsi independensi pada regresi kuadrat terkecil biasa (OLS) tidak terpenuhi secara serius.

Lanjutkan membaca fondasi teoretis ekstensif, rumus matematis, dan manual operasional instrumen analisis ini.

1. Teori Dasar: Definisi, Tujuan, dan Fungsi Metode TSLS

Dalam pemodelan regresi linear menggunakan Ordinary Least Squares (OLS), eksistensi Teorema Gauss-Markov mendikte bahwa penaksir regresi akan memiliki sifat yang tidak bias (unbiased) serta konsisten hanya apabila variabel-variabel penjelas (independen) bersifat eksogen. Eksogenitas mengimplikasikan bahwa tidak terdapat korelasi sedikit pun antara variabel penjelas dengan galat sisaan (error term) di dalam persamaan. Namun, pada berbagai fenomena sosiologis dan ekonomi observasional yang kompleks, rukun eksogenitas ini kerap runtuh, melahirkan masalah yang diistilahkan sebagai Endogenitas (Wooldridge, 2012). Endogenitas dapat bersumber dari tiga anomali struktural: (1) penghilangan variabel penting yang masuk ke dalam galat (omitted variable bias), (2) kesalahan dalam pengukuran variabel prediktor (measurement errors), dan (3) kausalitas dua arah yang terjadi secara simultan antara variabel independen dan variabel dependen (simultaneous causality) (Gujarati, 2004).

Konsekuensi matematis dari pengabaian masalah endogenitas tidak dapat diremehkan. Ketika sebuah variabel penjelas berkorelasi dengan galat sisaan, penaksir OLS bukan sekadar kehilangan efisiensinya, melainkan menjadi bias dan tidak konsisten. Artinya, meskipun periset secara teoretis menambahkan jumlah sampel observasi hingga tak terhingga, nilai koefisien hasil estimasi OLS tidak akan pernah menyatu (konvergen) ke parameter populasi yang sebenarnya. Untuk menetralisir bias matematis ini, metode Instrumental Variables (IV) diaplikasikan. Teknik IV bekerja dengan memperkenalkan variabel proksi eksternal—yang disebut sebagai Instrumen ($Z$)—yang secara fungsional ditugaskan untuk menggantikan bagian dari variabel endogen ($X$) yang tercemar oleh korelasi dengan galat (Stock & Watson, 2011).

Persyaratan legalitas sebuah variabel agar diakui sebagai Instrumen ($Z$) yang valid sangatlah ketat dan disandarkan pada dua aksioma pokok. Pertama, aksioma Relevansi (Relevance): Instrumen $Z$ harus secara statistik memiliki korelasi yang kuat dan bermakna terhadap variabel endogen $X$. Kedua, aksioma Eksogenitas (Exogeneity atau Instrument Validity): Instrumen $Z$ secara konseptual tidak boleh memiliki korelasi dengan galat sisaan pada persamaan struktural variabel dependen $Y$. Dengan kata lain, $Z$ tidak boleh memengaruhi $Y$ secara langsung, melainkan pengaruhnya hanya boleh disalurkan mutlak melalui variabel endogen $X$ (Baltagi, 2005). Prosedur operasional komputasi yang paling luas digunakan untuk memecahkan model variabel instrumen adalah Two-Stage Least Squares (TSLS).

Sesuai dengan nomenklaturnya, algoritma TSLS membedah estimasi ke dalam dua tahap komputasi regresi OLS berurutan (sekuensial). Pada Tahap Pertama (First Stage), variabel prediktor endogen diregresikan terhadap seluruh kumpulan instrumen ($Z$) beserta variabel eksogen lainnya yang ada di dalam sistem. Tujuan dari tahap pertama ini bukan untuk melakukan penarikan kesimpulan kausal, melainkan semata-mata untuk mengisolasi dan memurnikan porsi variasi variabel endogen yang berkorelasi murni dengan instrumen (bebas dari galat). Variasi yang berhasil dimurnikan ini kemudian disimpan dalam bentuk nilai prediksi (*fitted values*). Pada Tahap Kedua (Second Stage), variabel dependen utama diregresikan menggunakan variabel eksogen dan nilai prediksi variabel endogen yang dihasilkan dari tahap pertama tersebut. Karena nilai prediksi ini secara teoretis kini telah dibersihkan dari korelasi dengan galat struktural, penaksir OLS yang dihasilkan pada tahap kedua diklasifikasikan sebagai penaksir yang konsisten, menyajikan interpretasi pengaruh kausalitas yang sesungguhnya (Gujarati, 2004).

Untuk melegitimasi penggunaan TSLS secara akademik, serangkaian uji diagnostik wajib dilaporkan dalam naskah penelitian. Hausman Test difungsikan untuk mendiagnosis signifikansi keberadaan endogenitas awal; ia mengkomparasi deviasi antara matriks penaksir OLS standar dan penaksir TSLS. Jika selisihnya tidak signifikan (P-Value > 0.05), endogenitas tidak terbukti, dan model OLS yang lebih efisien dianjurkan. Apabila peneliti memasukkan variabel instrumen lebih banyak dari pada jumlah variabel endogen (kondisi *overidentified*), Sargan Test diaktifkan untuk memeriksa aksioma eksogenitas instrumen. Terakhir, Weak Instrument F-Test pada tahap pertama dievaluasi. Berlandaskan ketentuan empiris Staiger dan Stock (1997), instrumen dianggap tidak lemah dan relevan manakala rasio uji F melampaui angka ambang batas 10. Penggunaan instrumen yang lemah (F < 10) dapat menyebabkan distribusi TSLS menjadi kacau, membahayakan validitas interval kepercayaan (Staiger & Stock, 1997).

2. Formula Tiap Tahap Analisis dan Relevansinya

\text{Cov}(X_k, u) \neq 0
Bias Endogenitas OLS: Pernyataan matematis yang membuktikan keruntuhan asumsi Gauss-Markov. Terjadinya korelasi non-nol antara variabel penjelas X_k dan galat u menyebabkan penaksir koefisien OLS menjadi bias mutlak dan tidak konsisten (Wooldridge, 2012).
X_{\text{endo}} = \pi_0 + \pi_1 Z_1 + \dots + \pi_m Z_m + \pi_n X_{\text{exo}} + v
Persamaan Tahap Pertama (First Stage): Variabel yang terjangkit endogenitas diregresikan dengan menggunakan seluruh Instrumen (Z) dan variabel Eksogen (X_{exo}). Persamaan ini relevan untuk mencetak dan mengekstraksi nilai probabilitas teoretis murni, \hat{X}_{\text{endo}}, yang diyakini bebas dari galat struktural awal (Gujarati, 2004).
Y = \beta_0 + \beta_{\text{TSLS}} \hat{X}_{\text{endo}} + \beta_n X_{\text{exo}} + u
Persamaan Tahap Kedua (Second Stage): Estimasi model struktural pamungkas. Model regresi ini mengeksekusi \hat{X}_{\text{endo}} sebagai substitusi variabel endogen asli. Nilai \beta_{\text{TSLS}} yang diperoleh dari sini divalidasi sebagai penaksir kausalitas murni yang konsisten secara asimtotik (Baltagi, 2005).
H = (\hat{\beta}_{\text{TSLS}} - \hat{\beta}_{\text{OLS}})' [ \text{Var}(\hat{\beta}_{\text{TSLS}}) - \text{Var}(\hat{\beta}_{\text{OLS}}) ]^{-1} (\hat{\beta}_{\text{TSLS}} - \hat{\beta}_{\text{OLS}}) \sim \chi^2
Uji Spesifikasi Hausman (Endogenitas): Mengkomparasi stabilitas jarak selisih antara penduga OLS dan TSLS. P-Value < 0.05 pada uji Hausman mengkonfirmasi keabsahan bahwa variabel yang dicurigai secara nyata mengandung endogenitas, membenarkan penggunaan prosedur TSLS secara absolut (Hausman, 1978).
\text{Statistik Sargan} = n \times R_u^2 \sim \chi^2_{(m-k)}
Sargan Overidentification Test: Menguji keabsahan instrumen manakala jumlah instrumen melampaui jumlah variabel endogen. Sisaan residu TSLS diregresikan terhadap semua instrumen. P-Value > 0.05 menetapkan validitas, menyatakan instrumen tidak berkorelasi dengan galat dan layak digunakan (Sargan, 1958).

3. Arsitektur Perangkat Lunak

Alat diagnostik ST-Engine ini diarsiteki bukan menggunakan komputasi hampiran buatan tangan, melainkan beroperasi mendompleng performa perpustakaan rill ekonometrika R-WASM (WebR) pada sisi klien.

  • Otonomi Komputasi R: Seluruh arsitektur regresi tahap pertama dan tahap kedua dieksekusi secara asali dengan memanggil fungsi `lm()` biner sistem bahasa R yang disematkan dalam memori RAM peramban (*browser*) Anda. Metodologi ini menjamin penaksiran koefisien beserta Uji Hausman dan Sargan selaras 100% dengan paket perangkat lunak STATA atau EViews.
  • Interaksi Vanilla JS: Antarmuka DOM (manipulasi matriks masukan, panel pemetaan variabel, render tabel, dan pembacaan CSV) diotomatisasi penuh menggunakan Vanilla JavaScript tanpa menggunakan komponen API *backend server*, menjamin isolasi dan kerahasiaan kepemilikan matriks data observasi.

4. Panduan Manual Penggunaan Alat Analisis

A. Persiapan Data (Format Matriks) dan Upload

  • Data masukan dikonfigurasi ke dalam susunan dimensi tabular vertikal (baris sebagai tahun/subjek, kolom sebagai kuantifikasi variabel). Tidak ada toleransi terhadap nilai rumpang (missing values).
  • Lakukan penyalinan rentang basis data (misal dari lembar kerja Excel) ke tabel Grid masukan, atau pilih dokumen .csv menggunakan antarmuka tombol Unggah CSV.
  • Manfaatkan utilitas Data Simulasi untuk mempelajari kerangka analisis TSLS dengan pangkalan data buatan yang diinjeksikan fenomena korelasi endogen di dalamnya.

B. Pemetaan Relasi Variabel (Mapping)

  • Klik tombol Kunci Data & Lanjut Pemetaan.
  • Variabel Dependen Utama (Y): Letakkan variabel yang posisinya dipengaruhi oleh seluruhan sistem (Target Utama).
  • Variabel Endogen (X Bermasalah): Tempatkan variabel prediktor yang diyakini secara metodologi menyalahi aksioma independensi akibat terjangkit korelasi parsial dengan *error term*.
  • Variabel Eksogen (Bebas dari Masalah): (Opsional) Tempatkan variabel independen standar yang diasumsikan murni dan tidak berkorelasi dengan sisaan.
  • Variabel Instrumen (Z): Komponen substitusi eksternal. Diperlukan minimal jumlah instrumen sama dengan atau lebih banyak dari jumlah variabel endogen. Instrumen harus memiliki dasar korelasi teoretis dengan variabel endogen.

C. Diagram Alur WebR

Inisialisasi Lingkungan Biner WebR → Pengecekan Syarat Identifikasi Model (Under/Exact/Over) → Regresi First Stage & Ekstraksi F-Value Instrumen → Ekstraksi Fitted Values Endogen → Regresi Second Stage → Kalkulasi Vektor Residual TSLS vs OLS → Operasi Matriks Uji Hausman → Regresi Auxiliari Uji Sargan → Rendering Laporan TSLS.

D. Cara Baca Output Inferensial

Catatan: Keseluruhan hasil di tabel output diinterpretasikan secara berjenjang guna memastikan keabsahan asimtotik model sebelum menginterpretasi persamaan.

  • Weak Instrument Test (First Stage F-Test): Jika F-Value instrumen terdeteksi jatuh meluncur di bawah angka 10, instrumen Anda divonis “Lemah”. Peneliti sangat dihimbau untuk berburu referensi substitusi variabel instrumen lain (Staiger & Stock, 1997).
  • Hausman Test of Endogeneity: Berfungsi membenarkan justifikasi model TSLS. Apabila P-Value < 0.05, ini menahbiskan secara tegas bahwa endogenitas benar-benar eksis pada model, dan penyelesaian TSLS adalah mutlak. Jika P-Value > 0.05, OLS klasik lebih disarankan.
  • Sargan Overidentification Test: Ditampilkan khusus jika instrumen melebihi parameter endogen. Pada uji ini, justifikasi instrumen yang baik mewajibkan P-Value > 0.05 (gagal tolak H0). H0 mendalilkan bahwa seluruh instrumen valid dan tidak berafiliasi dengan residu.
  • Tabel Estimasi Second Stage TSLS: Rangkuman model struktural murni. Evaluasi kolom P-Value. Signifikansi (p < 0.05) pada koefisien menerjemahkan pengaruh kausalitas hakiki antar peubah tanpa bias endogenitas.

5. Manfaat Aplikasi (Kelebihan & Kekurangan)

  • Kelebihan Superior: Melampaui kapabilitas perangkat lunak IBM SPSS konvensional yang kerap kali tidak membekali sarana uji diagnostik terpadu Hausman dan Sargan di dalam modul dasar. Sistem mengedepankan keamanan privasi (*Local Data Encryption*) dengan mengelakkan *server backend*. Tabel diagnostik dirancang secara inklusif dengan penuntun teks AI di penghujung eksekusi yang merumuskan hipotesis akhir secara koheren.
  • Kekurangan Operasional: Arsitektur fondasi WebR mengharuskan fase inisialisasi awal (*Cold Start Latency*) mengunduh serpihan berkas biner penunjang seberat ~25MB di peramban yang merampas durasi rata-rata 10 hingga 20 detik pada akses pertama kali. Limitasi fungsional bahasa *client-side* mendesak analisis data di atas skala raksasa (>10.000 observasi) dibatasi guna menghindari kebekuan prosesor.

6. Daftar Pustaka

  • Baltagi, B. H. (2005). Econometric Analysis of Panel Data (3rd ed.). John Wiley & Sons.
  • Gujarati, D. N. (2004). Basic Econometrics (4th ed.). McGraw-Hill.
  • Hausman, J. A. (1978). Specification tests in econometrics. Econometrica, 46(6), 1251-1271.
  • Sargan, J. D. (1958). The estimation of economic relationships using instrumental variables. Econometrica, 26(3), 393-415.
  • Staiger, D., & Stock, J. H. (1997). Instrumental variables regression with weak instruments. Econometrica, 65(3), 557-586.
  • Stock, J. H., & Watson, M. W. (2011). Introduction to Econometrics (3rd ed.). Pearson.
  • Wooldridge, J. M. (2012). Introductory Econometrics: A Modern Approach (5th ed.). Cengage Learning.

Daftar Tool Analisis Statistik Online Statistikian
Scroll to Top
Jasa Olah dan Analisis Statistik Oleh Statistikian Tahun 2024