About the author

Anwar Hidayat

Founder dan CEO dari Statistikian Sejak 2012. Melayani jasa bantuan olah dan analisis data menggunakan berbagai aplikasi statistik, seperti: SPSS, STATA, Minitab, Eviews, AMOS dan Excel. Silahkan SMS/WA/LINE/Telegram ke: 081373337354. Biaya 100 ribu sd 300 ribu Sesuai Beban. Proses 1 sd 3 Hari Tergantung Antrian.

Related Articles

43 Comments

  1. 1

    Anwar Hidayat

    Kalau 1 variabel merupakan 1 item soal, maka perlu transformasi ke interval. Tapi jika 1 variabel terdiri dari lebih dari 1 item soal, maka tidak perlu transformasi karena sudah merupakan data interval

    Reply
  2. 2

    Anonymous

    mas mau tanya, apakah proses transfoemasi ini wajib dilakukan untuk data ordinal (kuesioner) yang akan dilakukan analsis melalui regresi???

    Reply
  3. 3

    Anonymous

    Terima kasih 🙂

    Reply
  4. 4

    Anwar Hidayat

    Uji validitas dan reliabilitas itu menggunakan populasi yang berbeda dengan populasi penelitian, di mana waktunya juga berbeda, maka data juga beda, transformasi ini dilakukan untuk keperluan analisa data hasil penelitian bukan uji coba

    Reply
  5. 5

    Mari Amsar

    Maaf Pak mau bertanya. Transformasi ordinal ke interval ini dilakukan pada saat sebelum uji validitas atau sesudah uji validitas?

    Reply
  6. 6

    Anwar Hidayat

    Seharusnya objek sama, tetapi tiap objek mempunyai atribut lebih dari 1, atribut tersebutlah yang kita ukur. Begitu pada penelitian kuantitatif.

    Reply
  7. 7

    riza alhusna

    maaf mau tanya, bolehkah kita menggunakan data primer dan sekunder secara bersamaan dalam satu penelitian, tetapi dengan objek yang berbeda.
    misal:
    X1—> primer (kuesioner)
    X2—> sekunder (bentuknya data)
    Y—-> sekunder (bentuknya data)
    dan antara X1 dan X2 beda objek penelitian, Y objeknya sama dengan X2
    kalau bisa, bagaimana cara mengolah data tersebut?

    Terima Kasih

    Reply
  8. 8

    Anwar Hidayat

    Untuk menentukan uji statistik yang akan digunakan perlu banyak pertimbangan, meliputi: Tujuan penelitian, Bentuk Hipotesa, Jumlah Variabel, Skala Data. Untuk uji non parametris masih mempertimbangkan jumlah Sampel, bentuk pasangan atau sumber data. Untuk uji komparatif non parametris masih memperhatikan bentuk pasangan, jumlah pasangan, ties, arah pengaruh, sumber data, besarnya kategori dan jumlah kategori sama atau tidak antar variabel.

    Reply
  9. 9

    Anwar Hidayat

    Sedangkan untuk uji parametris masih banyak sekali syarat atau yang disebut dengan asumsi.

    Reply
  10. 10

    roni richard

    mas mw tanya.. peneltianku semuanya skala nominal menggunakan instrumen Pertanyaan Terbuka.. analisis yang cocok apa ya???

    Reply
  11. 12

    hendri harliawan

    mau nanya lagi mas,, kalo kita menghitung analisis regresi berganda, apakah yang kita masukkan itu adalah skor total dari setiap variabel yang kita mau analisis (setelah dimasukkan ke data interval) mas ya?

    Reply
  12. 13

    Anwar Hidayat

    Data nominal tidak bisa ditransformasi jadi data interval/rasio

    Reply
  13. 14

    Nurul Diyan Aditya

    mas mau tanya, jika variabel X data sekunder berupa nominal angka sedang variabel Y data sekunder berupa rasio (di laporan keuangan) bagaimana cara konversi variabel X supaya setara dengan variabel Y dalam pengujian lazimnya variabel X dan variabel Y setara (bentuk datanya sama kalau Y rasio maka X juga rasio) ?

    Reply
  14. 15

    Anwar Hidayat

    Ordinal atau interval pada skala likert itu banyak pendapat, yang penting pada uji pearson adalah data berbentuk angka atau kuantitatif dan berdistribusi normal. Tapi anda harus bedakan, uji pearson ini untuk uji validitas atau untuk uji hipotesa. Kalau untuk uji validitas, tidak perlu banyak persyaratan.

    Reply
  15. 16

    Anonymous

    Mau tanya, jika sewaktu uji validitas tidak di transformasi, berarti rumus perhitungan yang digunakan rank spearman bukan product moment karna datanya masih ordinal? benar demikian?

    Lalu, mau tanya apakah product moment dpt digunakan untuk data ordinal dengan jumlah sampel yang besar? Apa alasannya?
    Trims..

    Reply
  16. 17

    Anwar Hidayat

    Melihat kasus anda di mana jumlah sampel kecil kurang dari 50, maka sebaiknya gunakan uji Shapiro Wilk, yaitu dengan cara Explore.

    Reply
  17. 18

    Anonymous

    pak sayamau tanya, kalo saya mau melkaukan uji t2 sampel dependen dengan spss, kan harus dilakukan uji normalitas dulu. nah uji normalitas yang cocok untuk 2 sampel dependen ini yang amna ya pak? pada menu spss, (analized, descriptive, explore) atau (analized, non-parametic test, legacy dialog, one sampel ks)? data uji yg saya punya untuk 1 sampel ada 12 (perlakuan a = 6 data, dan perlakuan b = 6 data)
    terima kasih pak.

    Reply
  18. 19

    Anwar Hidayat

    Uji validitas dilakukan pada per variabel, jadi bukan pada semua variabel sekaligus

    Reply
  19. 20

    Anonymous

    Slamat pagi pak. Saya mau tanya. Jika dalam kuesioner, terdapat campuran variabel nominal dan ordinal. Yang nominal contohnya dikotomus/2 kategori yaitu puas atau tidak puas. Sedangkan yg ordinal, 3 kategori sangat ramah, cukup ramah, kurang ramah. Yang ingin saya tanyakan, apakah bisa diuji validitasnya secara bersama2 jika skala datanya berbeda dengan 1 rumus? Atau harus dipisah? Bagaimana ya pak? Terimakasih

    Reply
  20. 21

    Anwar Hidayat

    Atasi dengan persamaan inverse log natural, persamaan weighted. Dan asumsi klasik laiinya harus terpenuhi semua pada persamaan tersebut.

    Reply
  21. 22

    Anonymous

    Pak, mau tanya kalo saya pake data sekunder bulanan selama tiga tahun, lolos uji normalitas namun tidak lolos uji heteroskedasitas gimana pak solusinya?

    Reply
  22. 23

    Anwar Hidayat

    Dipisah pada masing-masing variabel

    Reply
  23. 24

    Anonymous

    Pak, minta ijin mau tanya.. jika dalam satu kuisioner terdapat lima variabel dan jumlah item2 pada variabel tersebut 23 item.. apakah untuk uji validitasnya mesti dipisahkan setiap variabel atau bisa di uji sekaligus 23 item dari 5 variabel tersebut? Terima kasih sebelumnya..

    Reply
  24. 25

    Anwar Hidayat

    Misalkan seperti kasus anda, X1 dan X2 serta Y. Dari awal X1 sudah linear dengan Y, sedangkan X2 tidak linear dengan Y, maka diperlukan transforasi supaya X2 bisa linear dengan Y, harapannya nanti nilai R dan R Squares bisa tinggi, sebab salah satu tujuan membentuk model regresi linear adalah mencari persamaan regresi yang terbaik. Apabila dalam kasus di atas, semua X dan Y ditransformasi dengan cara yang sama, bisa jadi malah semua X tidak linear dengan Y, meski asumsi lain terpenuhi. Jadi kesimpulannya, tidak masalah ditransformasi dengan cara berbeda, tetapi persamaan regresi yang dibuat nantinya juga diubah sesuai dengan transformasinya. Misal X1 dengan Square, X2 dengan Square Root, Y tetap, maka persamaan regresinya: Y = Beta Constanta + Beta Square(X1) + Beta (Square Root(X2) + e. Dan meskipun seumpama ditransformasi dengan cara yang sama pada semua variabel, persamaan regresinya jangan tetap seperti data asli, misal: Y = Beta Constanta + Beta X1 + Beta X2 + e. Jadi juga harus mengikuti transformasinya. Berbeda halnya jika kasus transformasi dibutuhkan pada uji selain regresi, misal uji independen t test, maka transformasi seragam memang diperlukan. Trims.

    Reply
  25. 26

    Anwar Hidayat

    Apa yang disampaikan oleh saudara Anonyous di atas tentang uji normalitas pada paired t test, yaitu pada selisihnya, sudah saya bahas di artikel saya tentang paired t test. Dan perihal pilihan uji normalitas yang tepat, memang banyak sekali, namun perlu diingat bahwa untuk sampel kecil kurang dari 50, uji shapiro wilk adalah yang paling baik dan paling banyak dianjurkan oleh para pakar. Uji yang juga dianjurkan pada sampel < 50 adalah uji Shapiro francia, shapiro dengan koreksi royston, serta uji ryan joiner. Untuk sampel antara 51 sampai dengan 200 dianjurkan menggunakan uji Lilliefors. Untuk sampel > 200 kita bisa menggunakan uji 1 sampel Kolmogorov Smirnov, Anderson Darling, Skewness Kurtosis dan Jarque Bera. Trims.

    Reply
  26. 27

    Anwar Hidayat

    Perihal uji normalitas pada selisih dalam paired t test, juga sudah saya ajarkan caranya dalam artikel: Paired T Test dengan Excel.

    Reply
  27. 28

    Anwar Hidayat

    Tidak tepat jika saudara anonymous langsung memberikan banyak pilihan uji pada satu kasus penelitian. sebab perlu diperhatikan baik-baik, bahwa pilihan uji statistik bukan hanya berdasarkan pada skala data saja. Sebab pertimbangan lain banyak sekali, terutama bentuk hipotesa. Bentuk hipotesa asosiatif, harus dijawab dengan uji asosiatif. Bentuk hipotesa komparatif, harus dijawab dengan uji komparatif. selain itu juga pertimbangan tujuan penelitian, sumber data (bebas atau berpasangan), banyaknya variabel, ties, banyaknya kategori, symmetris tau tidak. Jadi untuk memahami pilihan uji ini, silahkan pelajari masing-masing uji yang ada dengan teliti dan seksama. Trims.

    Reply
  28. 29

    Anonymous

    Sedikit menambahkan,

    Misalkan kita sedang dalam kasus regresi linear berganda dengan 2 variabel bebas, katakanlah X1 dan X2. Misalkan, setelah dilakukan pengujian normalitas terhadap residual, ternyata distribusi dari residual tidak normal.

    Nah, misalkan dilakukanlah proses transformasi. Nah perlu diingat bahwa dalam proses transformasi, harus dilakukan SECARA SERAGAM. Maksudnya adalah misalkan variabel tak bebas Y ditransformasi menjadi bentuk AKAR y, begitu juga variabel bebas X1 harus ditransformasi menjadi bentuk AKAR X1, dan begitu juga variabel bebas X2 harus ditransformasi menjadi bentuk AKAR X2 (seragam dalam bentuk AKAR).

    Sebagaimana kata Andy Field dalam bukunya yang berjudul "Discovering Statistics Using SPSS", Halaman 154, menyatakan bahwa "Remeber that you must apply the SAME TRANSFORMATION TO ALL VARIABLES (you CANNOT, for example, apply a log transformation to one variable and a square root transformation to another if they are to be used in the same analysis)".

    Reply
  29. 30

    Anonymous

    "pak sayamau tanya, kalo saya mau melkaukan uji t2 sampel dependen dengan spss, kan harus dilakukan uji normalitas dulu. nah uji normalitas yang cocok untuk 2 sampel dependen ini yang amna ya pak? pada menu spss, (analized, descriptive, explore) atau (analized, non-parametic test, legacy dialog, one sampel ks)? data uji yg saya punya untuk 1 sampel ada 12 (perlakuan a = 6 data, dan perlakuan b = 6 data)
    terima kasih pak."

    Karena bapak menggunakan uji dependent t test, maka pada uji normalitas, yang diuji adalah selisih dari pasangan nilai (differences between scores) harus berdistribusi normal (Ingat!!!! Selisihnya, dan bukan nilai-nilai aslinya).

    Jadi, bapak mesti hitung terlebih dahulu selisih dari tiap-tiap pasangan data . . . Nah, kemudian seluruh selisih dari tiap-tiap pasangan data diuji kenormalannya . . ya boleh menggunakan uji Kolmogorov-Sminrov, uji Saphiro-Wilk, uji Lilifors, dan banyak lagi . . . . .

    Sebagaimana kata para pakar statistika, yakni Andy Field :

    "Both the independent t-test and dependent t-test are parametric tests based on the normal distribution. Therefore, they assume :

    [1] The sampling distribution is normally distributed. In the dependent t-test this means that the sampling distribution of the differences between scores should be normal, not the scores themselves.

    [2] Data are measured at least the interval level.
    "

    yang secara ringkas artinya, pada dependent t test, yang diuji kenormalannya adalah seluruh selisih dari tiap-tiap pasangan data . . .

    tirms 😀

    Reply
  30. 31

    Anonymous

    "mas mw tanya.. peneltianku semuanya skala nominal menggunakan instrumen Pertanyaan Terbuka.. analisis yang cocok apa ya???"

    Mungkin bisa digunakan uji binomial, uji McNemar, uji chi-kuadrat, uji Cochran . . . mungkin di antara uji2 yang disebutkan di atas, ada yang cocok untuk permasalahan mas roni 🙂

    Reply
  31. 32

    Anwar Hidayat

    Shapiro Wilk dan Shapiro francia serta ryan joiner akan meningkat probabilitasnya secara dramatis jika sampel lebih dari 50 pada beberapa jenis distribusi, misal distribusi platykurtic atau leptokurtic. Tidak masalah menggunakan kolmogorov smirnov pada sampel kurang dari 50, tetapi dari berbagai uji coba, shapiro wilk dan shapiro francia menunjukkan performa yang terbaik kemudian diikuti anderson darling dan lilliefors. Uji Kolmogorov pada distribusi tertentu hilang reliabilitasnya pada sampel besar di atas 2000. Khusus shapiro wilk tidak reliabel pada berbagai distribusi pada sampel di atas 2000 dan shapiro francia pada sampel di atas 5000. Secara keseluruhan shapiro wilk memang lebih powerfull dari pada kolmogorov smirnov pada sampel 50 atau kurang, hal tersebut sering terbukti jika dibandingkan dengan normal pp atau normal qq plot. Untuk selengkapnya anda bisa baca artikel saya: Pilihan Uji Normalitas Univariate.

    Reply
  32. 33

    Anwar Hidayat

    Saya balik bertanya kepada saudara anonymous: bagaimana jika X1 memiliki hubungan kuadratik dengan Y sedangkan X2 memiliki hubungan linear dengan Y, padahal kita ingin membentuk model prediksi terhadap Y berdasarkan X1 dan X2?

    Reply
  33. 34

    Anonymous

    [1]Pakar statistika, W. J. Conover, dalam bukunya "Practical Nonparametric Statistic, 3rd Edition" pada halaman 429 menyatakan sebagai berikut.

    "The Kolmogorov test may be preferred over the chi-squared test for goodness of fit if the SAMPLE SIZE IS SMALL" . . .

    Jelas dari pernyataan di atas dapat disimpulkan bahwa, uji K-S baik digunakan untuk SAMPEL KECIL . . . .nah, definisi dari SAMPEL KECIL BERMACAM2, ada yang mengatakan 20, ada yang 30, ada yang 50 dll . . . .

    [2] sekilas uji K-S dan uji Saphiro-Wilk

    Pakar Statistika, yakni Andy Field dalam bukunya yang berjudul "Discovering Statistics Using SPSS, 3rd Edition" menyatakan sebagai berikut.

    "The Shapiro-Wilk test does much same thing, but it has MORE POWER to DETECT differences from normality (So, you might find this test is significant when the K-S test is not)".

    Dari pernyataan tersebut dapat diartikan bahwa uji Shapiro-Wilk LEBIH KUAT dalam hal menolak H0 dibandingkan pada uji K-S. . . .

    Reply
  34. 35

    prana ugianagio

    Oh ya mas, jadi ada banyak pertanyaan nih, kalau boleh sya tahu

    [1] Kenapa para pakar menganjurkan uji shapiro wilk dibandingkan uji kolmogorov-sminrov untuk sampel < 50?? Kenapa tidak 49 atau 48 atau 51 . . .

    [2] Emang apa akibatnya, jika sampel < 50, kita tetap menggunakan uji kolmogorov-smirnov???

    [3] sya ingin tahu, dari referensi atau sumber mana mas bisa mengatakan "bahwa untuk sampel kecil kurang dari 50, uji shapiro wilk adalah yang paling baik dan paling banyak dianjurkan oleh para pakar. Uji yang juga dianjurkan pada sampel < 50 adalah uji Shapiro francia, shapiro dengan koreksi royston, serta uji ryan joiner. Untuk sampel antara 51 sampai dengan 200 dianjurkan menggunakan uji Lilliefors. Untuk sampel > 200 kita bisa menggunakan uji 1 sampel Kolmogorov Smirnov, Anderson Darling, Skewness Kurtosis dan Jarque Bera."

    Mohon sumbernya dari mana sehingga mas mengatakan demikian 😀 😀 . . . sya hanya seseorang yang punya rasa ingin tahu yg tinggi 😀

    Reply
  35. 36

    Anonymous

    seseorang menggunakan regresi linear karena hubungan antara variabel bebas dan takbebasnya bersifat linear . . kita tahu bahwa TIDAK SELALU hubungan antara variabel bebas dan tak bebasnya bersifat LINEAR . . . .bagaimana jika hubungannya berupa kuadratik, kubik, pangkat4, sinus, cosinus, dll . . . . adakah metode statistika yang dapat digunakan utk menerangkan hubungan demikian??? . . .thanks

    Reply
  36. 37

    Anwar Hidayat

    Saudara anonymous, perlu anda pahami bahwa memang benar dalam linear regression, tiap variabel bebas harus linear dengan variabel terikat. Tetapi anda lupa bahwa jika sudah ditransformasi, misal yang ditransformasi adalah variabel bebasnya saja, maka yang menjadi variabel bebas di dalam model di mana harus linear dengan variabel terikat, adalah variabel bebas hasil transformasi. Jadi bukan lagi variabel aslinya. Apabila yang ditransformasi adalah variabel terikat, maka variabel bebas linear dengan variabel terikat hasil transformasi. Dan anda harus memperluas wawasan anda, bahwasanya transformasi dalam regresi linear bukan hanya untuk mengatasi masalah normalitas dan heteroskedastisitas, tetapi juga untuk mengatasi masalah lainnya seperti linearitas. Namun apabila dengan cara transformasi, linearitas tidak bisa meningkat sampai ke level signifikan, sebaiknya menggunakan regresi non linear. Teori ini bisa anda baca pada: Simon Sheather. A Modern Approach to Regression with R. Springer Texts in Statistics Vol. 58 of Springer Series in Language and Communication, Springer texts in statistics. Page 167 – 174. Springer Science & Business Media, 2009. Dan pada: Chandan Mukherjee, Howard White, Marc Wuyts. Econometrics and Data Analysis for Developing Countries. Priorities for Development Economics. Page 148 – 160. Routledge, 2013. Dalam buku tersebut juga dijelaskan, misalkan variabel terikat ditransformasi dengan logaritma, maka untuk mengembalikan nilai y prediksi (fitted value) yang sesungguhnya, adalah dengan melakukan operasi eksponensial pada fitted value, sebab kebalikan dari logaritma adalah eksponensial. Selain itu anda juga pahami, bahwasanya transformasi pada regresi linear bukan hanya transformasi yang bersifat linear (misal menambahkan variabel dengan konstanta, mengalikan dengan kontanta atau membagi dengan konstanta) sebab cara itu tidak akan mengubah linearitas. Tetapi jika anda melakukan transformasi dengan cara transformasi non linear (misal mengkuadratkan, inverse, square root) maka akan mengubah linearitas antara variabel bebas dan terikat.

    Reply
  37. 38

    Anwar Hidayat

    1. Performa terbaik yang dimaksud adalah sesuai dengan keadaan datanya apabila dibuktikan dengan grafik normalitas, misal normal pp, normal qq, detrend qq dan histogram. Bisa jadi kolmogorov menyatakan normal, padahal dalam kenyataannya ada 1, 2 atau beberapa plot yang melenceng jauh dari garis lurus pada normal pp atau normal qq.
    2. Bukan masalah enak atau tidak enak, tetapi pada masalah apakah hipotesa penelitian yang mensyaratkan asumsi normalitas itu dapat dijadikan acuan untuk menjawab hipotesa. Bisa jadi kolmogorov menyatakan normal sehingga uji regresi linear yang anda lakukan dinyatakan fit, padahal sesungguhnya tidak normal, sehingga sebenarnya regresi anda tidak BLUE.

    Reply
  38. 39

    Anonymous

    Apakah anda ingin memaksakan, yang SECARA TEORI, tidak terdapat hubungan LINEAR antara X1 dan Y, namun anda paksakan dengan menggunakan regresi linear??? :D,

    Reply
  39. 40

    Anonymous

    Mantab artikel jurnalnya . . . sekedar masukkan, segala jawaban, hendaknya cantumkan sumber dan halamannya, jadi tidak terkesan atas akal-akalan sendiri :D, karena sekali lagi, kita bukan pakar 🙂

    Reply
  40. 41

    Anonymous

    [1] Sore mas, ikut nimbrung juga nih, mas menyatakan "Tidak masalah menggunakan kolmogorov smirnov pada sampel kurang dari 50, tetapi dari berbagai uji coba, shapiro wilk dan shapiro francia menunjukkan performa yang terbaik kemudian diikuti anderson darling dan lilliefors." . . .Nah yang dimaksud dengan "PERFORMA TERBAIK APA MAS"??

    [2] "Secara keseluruhan shapiro wilk memang lebih powerfull dari pada kolmogorov smirnov pada sampel 50 atau kurang,", Nah, jadi lebih Enak donk menggunakan uji K-S, karena pada uji K-S lebih tinggi kemungkinannya untuk diterima H0, dibandingkan uji S-W 😀

    Reply
  41. 42

    Anwar Hidayat

    Idealnya memang lebih baik menggunakan uji shapiro wilk atau shapiro francia pada sampel kecil kurang dari 50.

    Reply
  42. 43

    Chandra Budi Hartono

    Maaf pak mau tanya, jika saya menggunakan KS pada sampel kurang dari 50, seperti yg bapak katakan td memang tidak apa, hanya saja kurang dalam hal power.
    pembimbing saya menyarakan SW. Apakah ada alasan yg bisa memperkiat saya menggunakan KS jika sampel kurang dari 50 pak?
    Terimakasih sebelumnya.

    Reply

Cobalah Menjadi Pandai! Berikan Komentarnya Ya......

2012 - 2017 statistikian allright reserved