1. Input Data (Grid View)
| No | Var_X1 | Var_X2 | Var_Y |
|---|---|---|---|
| 1 | |||
| 2 | |||
| 3 | |||
| 4 | |||
| 5 |
Dokumentasi Akademik ST-Engine: Regresi Linear Berganda & Asumsi Klasik
Dikembangkan Oleh:
ANWAR HIDAYAT
Founder dan CEO www.statistikian.com
Alat analisis ini dibangun dan didevelop oleh Anwar Hidayat. Dioperasikan melalui Custom JavaScript Math Engine murni secara client-side, instrumen ini mengeksekusi penaksiran matriks OLS (Ordinary Least Squares) berserta uji diagnostik asumsi klasik secara komprehensif, presisi, dan menjaga privasi data Anda dari intervensi server eksternal.
Dokumentasi ini menguraikan dasar teoretis, spesifikasi matematis, dan panduan penggunaan instrumen ST-Engine Multiple Linear Regression (MLR). Regresi linear berganda adalah landasan utama dalam ekonometrika dan statistika terapan yang digunakan untuk memodelkan hubungan linear antara satu variabel terikat (dependen) yang berskala kontinu dengan dua atau lebih variabel bebas (independen).
Lanjutkan membaca referensi teoretis, rumus matematis, dan panduan lengkap instrumen analisis ini.
1. Teori Dasar: Definisi, Tujuan, dan Fungsi Regresi Linear Berganda
Regresi linear berganda (Multiple Linear Regression) merupakan perluasan dari regresi linear sederhana yang dirancang untuk menganalisis hubungan asosiatif dan prediktif ketika sebuah fenomena dipengaruhi oleh sejumlah variabel penduga secara simultan. Dalam berbagai disiplin ilmu, kelangkaan suatu peristiwa yang hanya didikte oleh faktor tunggal membuat model regresi sederhana menjadi tidak realistis. Oleh karena itu, pengikutsertaan beberapa variabel bebas secara serentak ke dalam persamaan regresi bertujuan untuk meningkatkan akurasi penjelasan variabilitas variabel terikat, serta mengurangi galat sisaan (residual error) (Gujarati, 2004).
Tujuan utama analisis ini adalah memprediksi nilai rata-rata variabel dependen berdasarkan nilai konstanta tertentu dari himpunan variabel independen, serta untuk mengevaluasi besaran pengaruh masing-masing prediktor secara parsial dengan asumsi variabel prediktor lainnya dianggap konstan (ceteris paribus). Estimasi parameter koefisien dalam model regresi linear berganda umumnya diselesaikan menggunakan Metode Kuadrat Terkecil Biasa (Ordinary Least Squares / OLS). Konsep dasar OLS adalah meminimalkan jumlah kuadrat sisaan (Sum of Squared Residuals), yaitu selisih kuadrat antara nilai observasi aktual dengan nilai yang diprediksi oleh garis atau bidang regresi (Greene, 2003).
Berdasarkan Teorema Gauss-Markov, penaksir OLS diakui sebagai BLUE (Best Linear Unbiased Estimator)—penaksir linear yang tidak bias dan memiliki varians minimum—apabila memenuhi serangkaian asumsi klasik yang mendasarinya (Wooldridge, 2012). Oleh karena itu, penerapan regresi OLS mewajibkan proses diagnostik yang ketat terhadap residu model. Jika asumsi-asumsi ini tidak terpenuhi, taksiran koefisien dapat menjadi bias, tidak efisien, dan inferensi uji statistik (P-Value) menjadi tidak valid.
Rangkaian Uji Asumsi Klasik yang diakomodasi oleh model ini meliputi:
- Uji Normalitas Sisaan (Residual Normality): Asumsi ini menyatakan bahwa galat (error term) dalam populasi harus berdistribusi normal. Asumsi ini krusial untuk validitas pembentukan batas kepercayaan dan pengujian t serta F, terutama pada ukuran sampel yang kecil. Pelanggaran terhadap asumsi ini sering diatasi dengan transformasi data atau penambahan sampel berdasarkan Teorema Limit Pusat (Thode, 2002).
- Uji Multikolinearitas (Multicollinearity): Memastikan tidak adanya korelasi linear sempurna atau yang sangat tinggi di antara variabel-variabel independen dalam model. Jika multikolinearitas muncul, nilai standar error koefisien regresi akan membengkak (*variance inflation*), membuat variabel independen yang sebenarnya bermakna menjadi secara statistik tidak signifikan (Marquardt, 1970).
- Uji Homoskedastisitas (Homoscedasticity): Asumsi bahwa varians dari sisaan bersifat konstan untuk setiap kombinasi nilai variabel independen. Fenomena ketidakkonstanan varians (heteroskedastisitas) umumnya mendistorsi standar error, sehingga simpulan pengujian hipotesis menjadi meragukan (Breusch & Pagan, 1979).
- Uji Autokorelasi (Autocorrelation): Berfokus pada data observasi yang memiliki dimensi waktu (time series) atau tata ruang (spatial), untuk memastikan bahwa galat pada satu observasi tidak memiliki interdependensi dengan galat pada observasi lainnya. Autokorelasi positif akan menyebabkan uji-T memproduksi nilai yang terlalu optimis, mendorong terjadinya kesalahan inferensial (Durbin & Watson, 1950).
2. Formula Tiap Tahap Analisis dan Relevansinya
\hat{\beta} = (X'X)^{-1}X'Y\hat{\beta} dihitung melalui inversi matriks persilangan variabel bebas (X'X)^{-1} dikalikan matriks X'Y. Persamaan aljabar ini menghasilkan penduga dengan jumlah kuadrat sisaan terminimum (Gujarati, 2004).R^2 = 1 - \frac{\sum e_i^2}{\sum (Y_i - \bar{Y})^2} \quad ; \quad R^2_{adj} = 1 - \left( \frac{(1 - R^2)(n - 1)}{n - k - 1} \right)Adjusted R^2 memberikan penalti korektif atas penambahan variabel prediktor yang tidak relevan (Theil, 1971).VIF_j = \frac{1}{1 - R_j^2} \quad ; \quad \text{Tolerance}_j = 1 - R_j^2R_j^2 diperoleh dari meregresikan prediktor X_j terhadap sisa prediktor lainnya. Nilai VIF > 10 mengindikasikan eksistensi multikolinearitas patologis yang mencederai stabilitas taksiran (Marquardt, 1970).LM = \frac{1}{2} \sum_{i=1}^n \left( \frac{e_i^2}{\hat{\sigma}^2} - 1 \right)^2 \sim \chi^2_{(p)}d = \frac{\sum_{t=2}^n (e_t - e_{t-1})^2}{\sum_{t=1}^n e_t^2}3. Arsitektur Perangkat Lunak
Instrumen analitis ini dioperasikan sepenuhnya menggunakan infrastruktur 100% Custom JavaScript Math Engine. Tidak ada ketergantungan pada API luar atau konektivitas terhadap library backend seperti R-WASM.
- Logika Inversi Matriks: Penyelesaian koefisien regresi ($\beta$) mengeksekusi perhitungan eliminasi Gauss-Jordan (`st_matInv`) dalam lingkungan klien. Hasil yang disajikan dari kalkulasi ini dijamin ekuivalen mutlak dengan keluaran aplikasi SPSS dan fungsi `lm()` di perangkat R Studio.
- Efisiensi Asimtotik: Evaluasi uji formal T, F, dan probabilitas sebaran kenormalan (Shapiro-Wilk dan Kolmogorov-Smirnov) diaproksimasi menggunakan fungsi polinomial kontinu yang ditenagai oleh mesin matematis internal, mempersembahkan laporan yang konsisten dan akurat secara statistik.
4. Panduan Manual Penggunaan Alat Analisis
A. Persiapan Matriks Data dan Import
- Susun basis data dengan baris yang mewakili jumlah subjek observasi, dan kolom mewakili indikator variabel berskala rasio/interval.
- Salin (Copy) rentang matriks data dari spreadsheet (Microsoft Excel), lalu lekatkan (Paste) secara mendatar pada kisi koordinat (Grid) yang tersedia. Pemanfaatan fasilitas Upload CSV sangat dianjurkan bila baris data memanjang signifikan.
B. Pemetaan Analisis Variabel (Mapping)
- Klik tombol Kunci Data & Lanjut Pemetaan.
- Bilik Dependen (Y): Masukkan tepat satu variabel pengamatan sasaran (terikat).
- Bilik Independen/Prediktor (X): Masukkan rangkaian variabel penyebab (bebas). Alat membatasi hingga 15 parameter prediktor independen dalam sekali analisis untuk menjaga keandalan pengalokasian memori.
C. Pemilihan Opsi Statistik
- Opsi Asumsi Klasik: Sistem telah mencentang seluruh pendeteksi galat. Centang pengujian *Glejser Test* atau *Breusch-Pagan* guna merumuskan pengujian heteroskedastisitas. Gunakan *Normality Residual (K-S/SW)* untuk menelaah normalitas sisaan model.
D. Diagram Alur Sistem
Parsing CSV → Gauss-Jordan Matrix Inversion $(X'X)^{-1}$ → OLS Coefficient Generation → Sisaan Residual Extraction → Breusch-Pagan & Glejser Execution → VIF & Tolerance Calculation → T-CDF & F-CDF Approximation → ANOVA & Coefficient Render → AI Auto Conclusion.
E. Cara Baca Tabel Output
- Tabel Model Summary: Menjelaskan kapabilitas model melalui nilai Adjusted $R^2$. Nilai 0.60 mengisyaratkan bahwa 60% keragaman variabel terikat dijelaskan secara sinergis oleh himpunan parameter independen yang diajukan.
- Tabel ANOVA (Simultan): Merupakan tes kelayakan model. Jika P-Value (Sig.) terhitung < 0.05, ini menahbiskan kesimpulan bahwa serentetan variabel independen secara simultan memegang peranan krusial terhadap fluktuasi variabel terikat.
- Tabel Coefficients (Parsial): Tinjau kolom signifikansi (Sig.) masing-masing prediktor. Nilai < 0.05 menyatakan dampak parsial yang bermakna. Kolom *Unstandardized Beta* mendedahkan persamaan matematis.
- Tabel Diagnostik Asumsi: Perhatikan rekomendasi nilai rujukan. VIF harus < 10 (bebas Multikolinearitas). Nilai P-Value Heteroskedastisitas dan Normalitas residual dipersyaratkan > 0.05 untuk memperoleh model *Best Linear Unbiased Estimator* (BLUE) yang utuh.
5. Manfaat Aplikasi (Kelebihan & Kekurangan)
- Kelebihan Utama: Menghapus durasi jeda penantian (zero load time) akibat ketiadaan koneksi unduh R-WASM. Keseluruhan asuransi data observasi tertutup secara aman dalam ruang pengolahan peramban internal. Menghadirkan penafsiran narasi berbasis kecerdasan komputasi (*AI Conclusion*) di penutup laporan untuk menyederhanakan pelaporan penelitian.
- Kekurangan Bawaan: Penyelesaian operasi matriks perkalian kubik $O(N^3)$ di JavaScript rentan menimbulkan pelambatan layar (browser tab freeze) manakala dipaksakan untuk mengeksekusi puluhan prediktor bersilang pada sampel berukuran di atas rentang seribu baris pengamatan. P-Value hasil uji diturunkan dari perhitungan hampiran (asimtotik) yang memperbolehkan deviasi margin sekian koma dibandingkan perhitungan tabel eksak bahasa tingkat rendah (C/Fortran).
6. Daftar Pustaka
- Breusch, T. S., & Pagan, A. R. (1979). A simple test for heteroscedasticity and random coefficient variation. Econometrica, 47(5), 1287-1294.
- Durbin, J., & Watson, G. S. (1950). Testing for serial correlation in least squares regression: I. Biometrika, 37(3/4), 409-428.
- Greene, W. H. (2003). Econometric Analysis (5th ed.). Prentice Hall.
- Gujarati, D. N. (2004). Basic Econometrics (4th ed.). McGraw-Hill.
- Marquardt, D. W. (1970). Generalized inverses, ridge regression, biased linear estimation, and nonlinear estimation. Technometrics, 12(3), 591-612.
- Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis (5th ed.). John Wiley & Sons.
- Student. (1908). The probable error of a mean. Biometrika, 6(1), 1-25.
- Theil, H. (1971). Principles of Econometrics. John Wiley & Sons.
- Thode, H. C. (2002). Testing for Normality. CRC Press.
- Wooldridge, J. M. (2012). Introductory Econometrics: A Modern Approach (5th ed.). Cengage Learning.
