Interprestasi Regresi Logistik dengan SPSS

Setelah anda mempelajari tutorial Regresi Logistik dengan SPSS, maka saatnya kita belajar interprestasi regresi logistik dengan SPSS. Langsung saja anda buka output yang dihasilkan!

Jasa Analisis Data Statistik Tahun 2024 Statistikian Untuk Skripsi Tesis Disertasi

Case Processing Summary Regresi Logistik

Di atas pada tabel Case Processing Summary adalah ringkasan jumlah sampel, yaitu sebanyak 200 sampel.

Di atas adalah kode variabel dependen. Yaitu kategori “Tidak Mengalami Kanker” dengan kode 0 dan “Mengalami Kanker” dengan kode 1. Oleh karena yang diberi kode 1 adalah “Mengalami Kanker”, maka “Mengalami Kanker” menjadi referensi atau efek dari sebab. Sebab yang dimaksud adalah kejadian yang dihipotesiskan sebagai penyebab munculnya efek atau masalah. Dalam hal ini, merokok (kode 1) dan ada riwayat keluarga (kode 1) menjadi sebab yang dapat meningkatkan resiko terjadinya kanker paru (kode 1).

Iteration History: Interprestasi Regresi Logistik dengan SPSS

Iteration History

Di atas: Tabel Iteration History pada block 0 atau saat variabel independen tidak dimasukkan dalam model: N=200 mendapatkan Nilai -2 Log Likelihood: 276,939.

Degree of Freedom (DF) = N – 1 = 200-1=199. Chi-Square (X2) Tabel Pada DF 199 dan Probabilitas 0.05 = 232,912.

Nilai -2 Log Likelihood (276,939) > X2 tabel (232,912) sehingga menolak H0, maka menunjukkan bahwa model sebelum memasukkan variabel independen adalah TIDAK FIT dengan data.

Classification Table: Interprestasi Regresi Logistik dengan SPSS

Classification Table

Di atas pada tabel Classifacation Table: Merupakan tabel kontingensi 2 x 2 yang seharusnya terjadi atau disebut juga frekuensi harapan berdasarkan data empiris variabel dependen, di mana jumlah sampel yang memiliki kategori variabel dependen referensi atau akibat buruk (kode 1) yaitu “Mengalami Kanker” sebanyak 104. Sedangkan yang “Tidak mengalami Kanker” sebanyak 96 orang. Jumlah sampel sebanyak 200 orang. Sehingga nilai overall percentage sebelum variabel independen dimasukkan ke dalam model sebesar: 104/200 = 52,0%.

Variabel Dalam Persamaan Tahap Beginning: Interprestasi Regresi Logistik dengan SPSS

Variabel Dalam Persamaan Tahap Beginning

Jasa Olah Data Statistik Tesis Skripsi Di Statistikian

Variables In The Equation Block 0 Regresi Logistik

Di atas pada tabel Variables in The Equation: Saat sebelum var independen di masukkan ke dalam model, maka belum ada variabel independen di dalam model. Nilai Slope atau Koefisien Beta (B) dari Konstanta adalah sebesar 0,080 dengan Odds Ratio atau Exp(B) sebesar 1,083. Nilai Signifikansi atau p value dari uji Wald sebesar 0,572.

Perlu diingat bahwa nilai B identik dengan koefisien beta pada Ordinary Least Square (OLS) atau regresi linear. Sedangkan Uji Wald identik dengan t parsial pada OLS. Sedangkan Exp(B) adalah nilai eksponen dari B, maka Exp(0,080) = 1,083.

Variabel Tidak Dalam Persamaan Tahap Beginning: Interprestasi Regresi Logistik dengan SPSS

Variabel Tidak Dalam Persamaan Tahap Beginning

Variables Not In The Equation Block 0 Regresi Logistik

Di atas pada tabel Variables not in the Equation: Menunjukkan variabel yang belum dimasukkan ke dalam model regresi, yaitu variabel X1 dan X2. Di mana X1 adalah variabel merokok dan X2 adalah variabel riwayat keluarga.

Tahap Entry Variabel: Interprestasi Regresi Logistik dengan SPSS

Tahap Entry Variabel

Jasa Olah dan Analisis Statistik BSI Anwar H 2024 Tesis Skripsi

Iteration History Block 1 Regresi Logistik

Di atas pada tabel Iteration history Block 1 atau saat variabel independen dimasukkan dalam model: N=200. Degree of Freedom (DF) = N – jumlah variabel independen – 1 = 200-2-1=197. Chi-Square (X2) Tabel Pada DF 197 dan Prob 0.05 = 230,746.

Nilai -2 Log Likelihood (207,575) < X2 tabel (230,746) sehingga menerima H0, maka menunjukkan bahwa model dengan memasukkan variabel independen adalah FIT dengan data. Hal ini berbeda dengan Block Beginning di atas, di mana saat sebelum variabel independen dimasukkan ke dalam model, model TIDAK FIT dengan data.

Hasil Omnibus Test

Nilai X2 69,394 > X2 tabel pada DF 2 (jumlah variabel independen 2) yaitu 5,991 atau dengan signifikansi sebesar 0,000 (< 0,05) sehingga menolak H0, yang menunjukkan bahwa penambahan variabel independen DAPAT memberikan pengaruh nyata terhadap model, atau dengan kata lain model dinyatakan FIT.

Interprestasi Regresi Logistik dengan SPSS: Jawaban Hipotesis

Perlu diingat jika pada OLS untuk menguji signifikansi simultan menggunakan uji F, sedangkan pada regresi logistik menggunakan nilai Chi-Square dari selisih antara -2 Log likelihood sebelum variabel independen masuk model dan -2 Log likelihood setelah variabel independen masuk model. Pengujian ini disebut juga dengan pengujian Maximum likelihood.

Sehingga jawaban terhadap hipotesis pengaruh simultan variabel independen terhadap variabel dependen adalah menerima H1 dan menolak H0 atau yang berarti ada pengaruh signifikan secara simultan merokok dan riwayat keluarga terhadap kejadian kanker paru oleh karena nilai p value Chi-Square sebesar 0,000 di mana < Alpha 0,05 atau nilai Chi-Square Hitung 69,364 > Chi-Square tabel 5,991.

Pseudo R Square

Di atas pada tabel Model Summary: Untuk melihat kemampuan variabel independen dalam menjelaskan variabel dependen, digunakan nilai Cox & Snell R Square dan Nagelkerke R Square. Nilai-nilai tersebut disebut juga dengan Pseudo R-Square atau jika pada regresi linear (OLS) lebih dikenal dengan istilah R-Square.

Nilai Nagelkerke R Square sebesar 0,391 dan Cox & Snell R Square 0,293, yang menunjukkan bahwa kemampuan variabel independen dalam menjelaskan variabel dependen adalah sebesar 0,391 atau 39,1% dan terdapat 100% – 39,1% = 60,9% faktor lain di luar model yang menjelaskan variabel dependen.

Hosmer and Lemeshow Test

Hosmer and Lemeshow Test adalah uji Goodness of fit test (GoF), yaitu uji untuk menentukan apakah model yang dibentuk sudah tepat atau tidak. Dikatakan tepat apabila tidak ada perbedaan signifikan antara model dengan nilai observasinya.

Hosmer and Lemeshow Regresi Logistik

Nilai Chi Square tabel untuk DF 1 (Jumlah variabel independen – 1) pada taraf signifikansi 0,05 adalah sebesar 3,841. Karena nilai Chi Square Hosmer and Lemeshow hitung 13,671 > Chi Square table 3,841 atau nilai signifikansi sebesar 0,000 (< 0,05) sehingga menolak H0, yang menunjukkan bahwa model TIDAK dapat diterima dan pengujian hipotesis TIDAK dapat dilakukan sebab ada perbedaan signifikan antara model dengan nilai observasinya.

Oleh karena dalam tutorial Interprestasi regresi logistik dengan SPSS ini, nilai Hosmer and Lemeshow Test menolak H0, sebaiknya anda mencoba untuk membuat agar nilai Hosmer and Lemeshow Test menerima H0.

Jasa Olah dan Analisis Statistik BSI Anwar H

Cara Mengatasi Hosmer Lemeshow

Caranya adalah dengan mengubah model persamaan regresi logistik dengan menambahkan variabel interaksi antar variabel independen. Misal pada kasus di sini, dengan menambahkan variabel interaksi antara X1 dan X2.

Lebih jelasnya akan saya bahas pada bagian akhir dalam artikel ini yaitu pada bagian VARIABEL INTERAKSI. Sehingga anda untuk sementara bisa melanjutkan pembelajaran ini, seolah-olah hasil uji Hosmer and Lemeshow Test menerima H0.

Classification Result

Classification Table Block 1 Regresi Logistik

Berdasarkan tabel Classification Table di atas, jumlah sampel yang tidak mengalami kanker 78 + 18 = 96 orang. Yang benar-benar tidak mengalami kanker sebanyak 78 orang dan yang seharusnya tidak mengalami kanker namun mengalami, sebanyak 18 orang. Jumlah sampel yang mengalami kanker 27 + 77 = 104 orang. Yang benar-benar mengalami kanker sebanyak 27 orang dan yang seharusnya mengalami kanker namun tidak mengalami, sebanyak 77 orang.

Dalam Interprestasi regresi logistik dengan SPSS: Tabel di atas memberikan nilai overall percentage sebesar (78+77)/200 = 77,5% yang berarti ketepatan model penelitian ini adalah sebesar 77,5%.

Pendugaan Parameter

Jasa Olah Data dan Analisis Data Statistik Untuk Tesis Skripsi BSI 2024

Variables In The Equation Block 1 Regresi Logistik

Lihat tabel Variabel in the equation di atas: semua variabel independen nilai P value uji wald (Sig) < 0,05, artinya masing-masing variabel mempunyai pengaruh parsial yang signifikan terhadap Y di dalam model. X1 atau merokok mempunyai nilai Sig Wald 0,000 < 0,05 sehingga menolak H0 atau yang berarti merokok memberikan pengaruh parsial yang signifikan terhadap kejadian kanker paru. X2 atau riwayat keluarga mempunyai nilai Sig Wald 0,031 < 0,05 sehingga menolak H0 atau yang berarti riwayat keluarga memberikan pengaruh parsial yang signifikan terhadap kejadian kanker paru.

Odds Ratio

Besarnya pengaruh ditunjukkan dengan nilai EXP (B) atau disebut juga ODDS RATIO (OR). Variabel Merokok dengan OR 6,277 maka orang yang merokok (kode 1 variabel independen), lebih beresiko mengalami kanker paru (kode 1 variabel dependen) sebanyak 6,277 kali lipat di bandingkan orang yang tidak merokok (kode 0 variabel independen). Nilai B = Logaritma Natural dari 6,277 = 1,837. Oleh karena nilai B bernilai positif, maka merokok mempunyai hubungan positif dengan kejadian kanker.

Variabel Riwayat Keluarga dengan OR 2,645 maka orang yang ada riwayat keluarga (kode 1 variabel independen), lebih beresiko mengalami kanker paru (kode 1 variabel dependen) sebanyak 2,645 kali lipat di bandingkan orang yang tidak ada riwayat keluarga (kode 0 variabel independen). Nilai B = Logaritma Natural dari 2,645 = 0,973. Oleh karena nilai B bernilai positif, maka riwayat keluarga mempunyai hubungan positif dengan kejadian kanker.

Persamaan Regresi Logistik

Berdasarkan nilai-nilai B pada perhitungan di atas, maka model persamaan yang dibentuk adalah sebagai berikut:

Ln P/1-P = -1,214 + 1,837 Rokok + 0,973 Riwayat Keluarga.

Jasa Bantuan Analisis Statistik Tesis Skripsi Disertasi

Atau bisa menggunakan rumus turunan dari persamaan di atas, yaitu:

Probabilitas = exp(-1,214 + 1,837 Rokok + 0,973 Riwayat Keluarga) / 1 + exp(-1,214 + 1,837 Rokok + 0,973 Riwayat Keluarga).

Contoh Penggunaan Persamaan Regresi Logistik

Misalkan sampel yang merokok dan ada riwayat keluarga, maka merokok=1 dan riwayat keluarga=1. Jika dimasukkan ke dalam model persamaan di atas, maka sebagai berikut:

Probabilitas atau Predicted = (exp(-1,214 + (1,837 x 1) + (0,973 x 1))) / (1 + exp(-1,214 + (1,837 x 1) + (0,973 x 1))).

Probabilitas atau Predicted = (exp(-1,214 + (1,837) + (0,973))) / (1 + exp(-1,214 + (1,837) + (0,973))).

Probabilitas atau Predicted = 0.8315.

Nilai Predicted Regresi Logistik

Oleh karena Predicted: 0,8315 > 0,5 maka nilai Predicted Group Membership dari sampel di atas adalah 1. Di mana 1 adalah kode mengalami kanker. Jadi jika sampel merokok (kode 1) dan ada riwayat keluarga (kode 1) maka prediksinya adalah mengalami kanker (kode 1). Jika seandainya sampel yang bersangkutan ternyata faktanya tidak mengalami kanker (kode 0) maka sampel tersebut keluar dari nilai prediksi.

Besarnya perbedaan atau yang disebut dengan Residual = Predicted Group Membership – Predicted. Pada kasus di atas di mana orang yang merokok dan ada riwayat keluarga namun faktanya tidak mengalami kanker, maka Residual = 0 – 0,8315 = -0,8315.

Di atas adalah grafik klasifikasi dari observed group dan predicted group membership.

Outlier

Nilai Outlier

Casewise Diagnostics Regresi Logistik

Agar anda paham Interprestasi Regresi Logistik dengan SPSS, maka perhatikan output di atas, yaitu output hasil deteksi outlier atau data pencilan. Pada kasus dalam tutorial ini tidak ada outlier dengan notifikasi seperti di atas, yaitu: The casewise plot is not produced because no outliers were found. Seandainya ada outlier, maka tampilan akan berubah dalam bentuk tabel yang berisi daftar sampel yang menjadi outlier beserta nilai Studentized Residual.Dinyatakan outlier apabila nilai Absolut dari Studentized Residual dari sampel tersebut lebih dari 2 (> 2). Di mana Studentized Residual adalah standarisasi berdasarkan Mean dan standart deviasi dari nilai Residual yang telah dibahas di atas.

Variabel Interaksi

Variabel interaksi adalah variabel yang merupakan hasil interaksi antar variabel independen. Variabel ini ada kalanya diperlukan untuk dimasukkan ke dalam model regresi logistik dengan alasan karena secara substantif memang ada hubungan antar variabel independen atau untuk mengatasi masalah Goodness of Fit Test di mana menolak H0.

Caranya adalah dengan menambahkan variabel interaksi ke dalam variabel independen, yaitu pada saat memasukkan variabel independen, seleksi variabel-variabel independen yang akan diinteraksikan, kemudian klik tombol “‘>a*b>'”.

Selanjutnya lakukan proses seperti yang sudah dijelaskan di atas. Demikian tutorial Interprestasi regresi logistik dengan SPSS, semoga bermanfaat bagi para peneliti atau mahasiswa.

By Anwar Hidayat

Hubungi Kami Via Aplikasi WhatsApp: Jasa Analisis Data

39 komentar untuk “Interprestasi Regresi Logistik dengan SPSS”

Anwar Hidayat
7 Maret 2016 pada 20:21
Ya, atau lakukan transformasi
Balas
Sarjono Se
7 Maret 2016 pada 18:26
Thx Mr Anwar ini sangat membantu
Balas
fina ginting
7 Maret 2016 pada 20:20
jika ada outliner, apakah data outliner nya hrs dibuang? tks
Balas
Anwar Hidayat
6 April 2016 pada 18:59
Itu maksudnya EXP(-1.214 + (1.837) + (0.973)) dibagi 1 + exp(-1,214 + (1,837) + (0,973)) atau dengan format yang benar: (exp(-1,214 + (1,837) + (0,973))) / (1 + exp(-1,214 + (1,837) + (0,973))). Maka hasilnya adalah: 0,8315.
Balas
1. Abel
  3 April 2017 pada 10:28
  cara hitungnya gmn pak bisa muncul angka 0,8315 saya coba gak dapet2 pak, thanks infonya
  Balas
  1. Anwar Hidayat
    3 April 2017 pada 17:06
    Masukkan ke excel formula ini jika excel anda berbahasa inggris: =(EXP(-1.214 + (1.837) + (0.973))) / (1 + EXP(-1.214 + (1.837) + (0.973))). Jika berbahasa indonesia gunakan formula berikut: =(exp(-1,214 + (1,837) + (0,973))) / (1 + exp(-1,214 + (1,837) + (0,973)))
    Balas
Iman
6 April 2016 pada 18:57
Saya koreksi, hasil dari Probabilitas atau Predicted = exp(-1,214 + (1,837) + (0,973)) / 1 + exp(-1,214 + (1,837) + (0,973)) = 2,569 / 3,569. Probabilitas atau Predicted = 0,7198 bukan 0.8315. Bagaimana ?
Balas
Anwar Hidayat
25 Mei 2016 pada 17:14
Ya, trims juga
Balas
Muhammad Ridha
25 Mei 2016 pada 17:13
Terima kasih..sangat bermanfaat
Balas
Nathasya
10 Januari 2017 pada 15:18
Sore, saya mau tanya apakah odds ratio wajib digunakan?
Balas
1. Anwar Hidayat
  12 Januari 2017 pada 01:02
  Tergantung kepada tujuan penelitian dan hipotesis anda
  Balas
Qiqi
17 Januari 2017 pada 14:48
Selamat sore. Terimakasih atas ilmu yang dibagikan disini, sangat membantu.
Apakah ada penjelasan jika menggunakan eviews dalam pengolahan data?
Terimakasih.
Balas
1. Anwar Hidayat
  19 Januari 2017 pada 00:59
  Maaf, untuk eviews tidak ada, sebab saya lebih sering menggunakan aplikasi STATA, menurut saya STATA lebih powerfull
  Balas
nurul hasanah
18 Januari 2017 pada 17:14
Kalau cuma ingin lihat pengaruh variabel x ke variabel y liat di tabel apa ya?
Balas
1. Anwar Hidayat
  19 Januari 2017 pada 01:01
  Silahkan anda lihat pada tabel variables in the equation.
  Balas
nurwahidamakmur
8 Februari 2017 pada 08:06
ka bagaimana klw nilai exp. (B) < 1 ka??
Balas
1. Anwar Hidayat
  18 Februari 2017 pada 02:17
  Silahkan hitung menggunakan excel
  Balas
Ellis Prestia
11 Februari 2017 pada 11:58
terimakasih, ini sangat membantu saya dalam mengerjakan skripsi saya.
Balas
1. Anwar Hidayat
  18 Februari 2017 pada 03:00
  Terima kasih sudah berkunjung
  Balas
ully
12 April 2017 pada 13:20
siang mas
Balas
Arista Pratiwi
3 Juli 2017 pada 00:06
Bagaimana cara menghilangkan outlier di regresi logistik? apakah sama halnya dengan regresi linier?
Balas
1. Anwar Hidayat
  3 Juli 2017 pada 16:13
  Sama saja, bisa menggunakan nilai studentized residual. Batasannya adalah nilai studentized residual > 2 maka sebagai outlier.
  Balas
  1. Rara lioo
    14 Juni 2024 pada 14:26
    Maaf pak, bagaimana cara melihat studentized residualnya? dikarenakan tidak muncul pada data view spssnya, terima kasih banyak sebelumnya
    Balas
    1. Anwar Hidayat
      17 Agustus 2024 pada 16:01
      Saat melakukan uji regresi logistik dengan SPSS, pada opsi silahkan anda centang tentang casewise diagnostics dan residual.
      Balas
Sita Dewi
21 Juli 2017 pada 01:25
Wah Terima kasih ilmunya sangat bermanfaat.
Adakah tutorial dan interprestasi utk uji asumsi klasiknya?
Balas
nia
31 Juli 2017 pada 19:46
kak klo nilai omnibus qt tinggi lbh dari 0,05 gmn cara mengatasinya yah?
Balas
1. Anwar Hidayat
  6 Agustus 2017 pada 00:55
  Pilih variabel bebas yang hanya berkorelasi dengan variabel terikat
  Balas
Junto
22 Agustus 2017 pada 02:48
kak mau tanya perbedaan block 0 dan block 1 itu apa?
klo saya mau uji ketepatan klasifikasi regresi berarti saya harus ambil yang dari block 0 atau block 1?
nah yang saya tanyakan di atas itu adalah hasil output dari bawah ini, sekalian minta tolong penjelasan cara membaca hasil output nya dong kak.
Block 0 : Beginning Block
Classification Table a,b
Predicted
Bukan
Perata Perata Percentage
Observed Laba Laba Corretct
step Perata Bukan
0 Laba Perata 0 13 ,0
Laba
Perata
Laba 0 13 100,0
Overall
Percentage 50,0
a. Constant in included in the model
b. The cut value is ,500
Block 1 : Method = Enter
Classification Table a
Predicted
Bukan
Perata Perata Percentage
Observed Laba Laba Corretct
step Perata Bukan
1 Laba Perata 7 6 53,8
Laba
Perata
Laba 3 10 76,9
Overall
Percentage 65,4
a. The cut value is ,500
Terima Kasih
Balas
1. Anwar Hidayat
  31 Agustus 2017 pada 15:30
  Block 0 itu sebelum variabel bebas dimasukkan ke dalam model. Sedangkan block 1 saat variabel bebas dimasukkan ke dalam model. Jadi untuk interpretasi hasil penelitian, maka gunakan data block 1. Selengkapnya silahkan anda bisa gunakan jasa bantuan olah dan analisis data dengan whatsapp saya: 081373337354.
  Balas
Fitri
21 Agustus 2018 pada 13:08
mas mau tanya, kalau uji goodness fit test nya tidak terpenuhi (maupun dengan cara yg dianjurkan) apakah uji regresi lainnya tidak dapat digunakan?
Balas
1. Anwar Hidayat
  23 Oktober 2018 pada 21:19
  Dicari solusinya agar GOF dapat FIT.
  Balas
Mayeske
21 Agustus 2018 pada 18:16
Kalo omnibusnya lebih besar dari 0,05 itu bagaimana ya
Balas
1. Anwar Hidayat
  23 Oktober 2018 pada 21:18
  Berarti secara simultan semua variabel bebas tidak signifikan dalam menjelaskan variabel terikat atau hipotesis terima H0.
  Balas
adi
2 Januari 2021 pada 22:19
apakah uji regresi logistik dgn tabel 2×4 bgmn mas…
Balas
1. Anwar Hidayat
  25 Januari 2021 pada 12:14
  Uji Regresi Logistik atau disebut Logit, bisa digunakan untuk variabel terikat dengan 2 katagori atau disebut data Dikotomi, misalnya Hitam dan Putih, Baik dan Buruk, Tinggi dan Rendah, yang mana biasanya menggunakan koding 1 dan 0. Sedangkan jika variabel terikatnya data kualitatif Nominal (bukan Ordinal) dengan kategori > 2, misalnya Baik, Cukup dan Buruk atau kode 0, 1 dan 2, maka analisis yang tepat adalah model regresi logistik multinomial. Sedangkan jika data ordinal atau bertingkat, anda gunakan model regresi logistik ordinal atau biasa disebut regresi ordinal. Lebih lengkap anda bisa baca artikel kami tentang Berbagai Jenis Regresi Berganda.
  Balas
Siti Murdiyati
26 Juli 2021 pada 22:45
Boleh tau kak, dimana ya bisa download tabel chi square x2 df 1-200?
Aku cuma ketemu yang 1-100 aja
Balas
1. Anwar Hidayat
  6 Agustus 2021 pada 03:05
  Gunakan fungsi atau formula Chiinv atau chi square invers pada aplikasi Excel agar bisa menghitung chi square tabel pada df berapapun… Baca artikel saya tentang chi square tabel menggunakan Excel, trims
  Balas
Febi
27 Juli 2021 pada 23:28
masyaAllah, gara2 sidang suruh alih analisis dadakan alhasil berantakan yg mulanya ga paham logit.
Tapi tulisan ini sangat sangat membantu saya.
Terima kasih banyak, semoga barokah ilmunya selalu mengalir. Aamiin
Balas
1. Anwar Hidayat
  6 Agustus 2021 pada 03:04
  Terima kasih sudah berkunjung. Amin.
  Balas