Memilih Transformasi Data dengan STATA

14
1497

Memilih Transformasi Data dengan STATA

Memilih jenis transformasi data merupakan kegiatan yang kadang sangat membosankan, sebab memaksa kita untuk melakukan percobaan berkali-kali untuk menentukan transformasi apa yang tepat pada data yang tidak berdistribusi normal. Namun dengan adanya aplikasi Statistik, kebosanan itu sedikit berkurang. Apalagi dengan aplikasi STATA, sebab aplikasi statistik yang satu ini telah dibekali dengan satu fitur, yaitu mendeteksi kenormalan data secara otomatis. Berikut kita pelajari tutorial Transformasi data dengan STATA.

Deteksi tersebut dapat dilakukan dengan beberapa metode, antara lain: Metode Deteksi Histogram, QQ Plots dan Skewness-Kurtosis.

Tujuan Transformasi Data

Apa maksud keterangan di atas? tentunya anda bertanya-tanya. Baiklah, kami berikan sebuah ilustrasi: Anda akan melakukan sebuah uji parametris yang mengharuskan data anda pada variabel berdistribusi normal. Ciri-ciri data berdistribusi normal antara lain: berdasarkan nilai uji normalitas skewness-kurtosis menunjukkan p value > 0,05, histogram berbentuk kurve normal dan dalam Normal QQ Plots, plots yang ada mengikuti garis fit line. Ada saatnya data anda ternyata tidak berdistribusi normal dan anda menginginkan untuk melakukan transformasi. Kemudian anda pusing untuk memilih transformasi apa yang dapat membuat data anda berubah menjadi normal. Nah, disinilah STATA memberikan kemudahan karena hanya dengan satu kali klik, kita sudah dapat menentukan metode transformasi apa yang tepat.

Agar anda mudah memahami tutorial ini, sebaiknya anda pelajari artikel kami:

  1. Transformasi Data,
  2. Normalitas Pada STATA,
  3. Normalitas Pada SPSS,
  4. Normalitas Pada Minitab.

Tutorial Transformasi Data dengan STATA

Langsung saja kita masuk pada bahasan tutorial. Kita mempunyai 1 variabel yang berdistrubusi tidak normal. Contoh seperti pada data dalam file kerja tutorial ini yang menggunakan 100 sampel.

Sebaiknya untuk mempermudah anda, kami anjurkan download file kerja STATA ini: Non Normalitas.dta.

Kita cek apakah data memang tidak berdistribusi normal. Berikut hasilnya dengan menggunakan uji skewness-kurtosis:

Memilih Transformasi Data dengan STATA
Memilih Transformasi Data dengan STATA

Nilai Prob>chi2 di atas sebesar 0,0000 di mana kurang dari 0,05 berarti data berdistribusi tidak normal.

Cara memilih transformasi data dengan STATA

Untuk menentukan model transformasi apa yang tepat, maka pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional plots and test, klik Ladder of powers. Kemudian isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!

Fungsi Ladder
Fungsi Ladder

Berdasarkan hasil di atas, lihat nilai P(chi2), nilai > 0,05 menunjukkan model transformasi tersebut dapat membuat variabel berdistribusi normal. Maka model yang tepat antara lain: 1/(square root) atau inverse square root, inverse dan 1/square atau inverse square.

Dari ketiga model transformasi yang tepat, model inverse memberikan nilai terbesar (0,550), maka model inverse selayaknya dipilih sebagai model transformasi pada data anda.

Memilih Transformasi Data dengan STATA menggunakan Histogram

Untuk memperkuat penilaian anda, dapat menggunakan deteksi histogram. Caranya sebagai berikut:

Pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional plots and test, klik Ladder of powers histogram. Kemudian isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!

Transformasi data dengan STATA
Transformasi data dengan STATA

Dari beberapa histogram di atas, model inverse, inverse square root (1/sqrt) dan inverse square (1/square) memberikan bentuk histogram yang paling mendekati kurve normal. Dan model inverse adalah yang terbaik.

Memilih Transformasi Data dengan STATA menggunakan QQ Plots

Selanjutnya kita bisa kuatkan lagi dengan deteksi Normal Quantile Plots dengan cara:

Pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional plots and test, klik Ladder of powers quantile-normal plots. Kemudian isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!

Transformasi data dengan STATA menggunakan QQ Plots
Transformasi data dengan STATA menggunakan QQ Plots

Dari beberapa normal quantile plots di atas, model inverse, inverse square root (1/sqrt) dan inverse square (1/square) memberikan bentuk di mana plot-plot mengikuti garis lurus fit line. Dan model inverse adalah yang terbaik.

Untuk membuktikan, mari kita coba melakukan transformasi dengan metode inverse kemudian dilakukan uji skewness-kurtosis. Dan ternyata hasilnya sesuai dengan deteksi di atas. Lihat di bawah ini:

Normalitas STATA
Normalitas STATA

Nilai Prob>chi2 sebesar 0,5498 yang apabila dibulatkan menjadi 0,550 dimana sama persis dengan deteksi di atas.

Cara melakukan transformasi dengan aplikasi STATA, silahkan baca artikel kami tentang: Cara Transformasi dengan STATA.

By Anwar Hidayat

14 KOMENTAR

  1. Mas, mau nanya dari hasil transformasi data di STATA menunjukkan bahwa transformasi yang yang disarankan adalah: dengan menggunakan transformasi "identity" output P(chi2) terbesar.
    Mta tlg gimana dengan metode transformasi "identity". makasih.

  2. Selamat malam mas, mau tanya apabila variabel dependen ada nilai positif dan nilain negatif apakah bisa di regres menggunakan metode OLS biasa? software yang saya gunakan adalah STATA 12. Terimakasih sebelumnya

  3. selamat malam pak, saya oe. sy sudah menggunakan uji K- S untuk melihat apakah data sy terdistribusi normal atau tidak dan ternyata tidak terdistribusi normal. apakah saya harus transformasi data atau memilih uji lain. terima kasih 🙂

  4. Transformasi hanya dianjurkan untuk uji regresi. Pada uji regresi silahkan lakukan transformasi yang berbeda tiap variabel, tetapi bentuk persamaannya mengikuti transformasinya. Misal Y dengan Square, X1 dengan Square Root dan X2 dengan Logaritma. Maka Rumus persamaannya: Y^2 = Alfa + Beta Akar(X1) + Beta LN(X2)

  5. selamat malam pak, saya menggunakan uji K-S dan ternyata tidak terdistribusi normal… kalau saya menggunakan tranform invers pada dependent variable saya, apakah harus dilakukan hal yang sama pada independent variables? bagaimana dengan adanya dummy variable? sedangkan kalau tidak di transformasi berarti hasil significance nya akan berbanding terbalik. Terima kasih pak:)

  6. selamat malam mas, saya mau nanya apakah data dalam bentuk persentase (%) dapat ditransformasi dengan log? cara interpretasi hasil regresi nya bagaimana nantinya?

    • Persentase sebenarnya identik dengan desimal, hanya saja dalam persentase bersifat absolut artinya tidak ada negatif, jadi bisa ditransformasi dengan log dengan cara ubah ke data desimal dulu. Log adalah kebalikan dari eksponen, sehingga interprestasinya cukup dibalik dengan operasi eksponen. Itu saja caranya.

Cobalah Menjadi Pandai! Berikan Komentarnya Ya......