Kamis, 29 Mei 2014

ANALISIS KORELASI DAN REGRESI



 ANALISIS KORELASI DAN REGRESI

Para mahasiswa tingkat awal yang mempelajari Statistika seringkali bingung dengan dua istilah ini, “analisis korelasi” dan “analisis reegresi”. Kebingungannya berkisar kepada fungsi kedua alat analisis, apakah fungsinya sama atau beda ? kalau beda, kapan kita menggunakan analisis korelasi dan kapan dan pada situasi bagaimana kita menggunakan analisis regresi. Berikut ini akan dijelaskan perbedaan kedua alat analisis tersebut.

Tujuan analsisi korelasi adalah ingin mengetahui APAKAH ADA HUBUNGAN antara dua variabel atau lebih ? Sedangkan tujuan analisis regresi adalah untuk MEMPREDIKSI SEBERAPA JAUH pengaruh yang ada tersebut (yang telah dianalisis melalui analisis korelasi).

Misalnya, dengan analisis korelasi ingin diketahui apakah ada hubungan antara terjadinya perang antarnegara dengan kegiatan perlombaan senjata (arm races) ?  Bila melalui analisis korelasi terbukti bahwa ada hubungan diantara kedua variabel tersebut, maka analisis regresi akan memperkirakan jika jumlah senjata dinaikan sekian ribu jumlahnya maka kondisi konflik antarnegara akan seperti apa terjadinya.

Mungkin ada juga yang bertanya dan kebetulan sudah pernah mengenal alat analisis statistika lainnya, yaitu uji-t dan uji-F (ANOVA). Apa bedanya antara uji-t dan ANOVA dengan analisis korelasi/regresi ? Perbedaannya adalah, bila uji-t dan ANOVA menguji ADA-TIDAKNYA PERBEDAAN DUA SAMPEL atau lebih, maka analisis regresi menguji ADA-TIDAKNYA HUBUNGAN DUA VARIABEL atau lebih.

  
ANALISIS KORELASI

Sekali lagi, bahwa tujuan dari analsisi korelasi adalah untuk mengetahui apakah diantara dua variabel terdapat hubungan atau tidak, dan jika ada hubungan bagaimanakah arah hubungan dan seberapa besar hubungan tersebut. Data pada analisis korelasi dapat berupa data kualitatif maupun kuantitatif, yang masing-masing mempunyai ukuran korelasi sendiri-sendiri.

Contoh Analisis Korelasi dengan SPSS:
Contoh1:
Menghitung korelasi antara pengetahuan tentang kewarganegaraan dengan  partisipasi politik seseorang. Sebelum kita memulai analisis kita perhatikan dahulu apakah data yang akan kita peroleh berskala nominal, ordinal, interval atau rasio ? Sebab perlakuan terhadap data-data tersebut akan berbeda ketika kita akan melakukan analisis korelasi.

Untuk data yang berskala interval dan atau rasio (bersifat kuantitatif/parametrik) tipe analisis korelasi yang digunakan adalah Pearson Correlation atau istilah lainnya adalah Product Moment Correlation. Sedangkan untuk yang berskala ordinal kita gunakan Spearman Correlation (Statistik Non-Parametrik).

Kembali ke contoh kasus kita, kedua variabel yang ada yaitu pengetahuan kewarganegaraan dan tingkat partisipasi politik umumnya belum memiliki standar yang baku dalam skala nilainya. Biasanya untuk mendapatkan nilai-nilai bagi variabel-variabel tersebut kita terlebih dahulu melakukan pengukuran kepada sejumlah responden mengenai tingkat pengetahuannya tentang kewarganegaraan dan tingkat partisipasi politiknya, biasanya kita akan menyebarkan angket yang berisi sejumlah daftar pertanyaan atau pernyataan yang akan mengukur sejauh mana level pengetahuan kewarganegaraannya dan tingkat partisipasi politiknya, baik level pengetahuan kewarganegaraan dan tingkat partisipasi politik keduanya merupakan konsep yang berkaitan dengan perilaku seorang manusia. Seperti telah diulas dalam modul sebelumnya, para peneliti ilmu sosial umumnya menggunakan Skala Likert guna mengukur persepsi atau perilaku sosial. Maka biasanya data yang akan kita dapatkan dari hasil survey/penyebaran angket yang mengukur tingkat pengetahuan kewarganegaraan seseorang dan tingkat partisipasi politiknya akan berskala ordinal. Misalkan untuk mengukur pengetahuan seseorang dibuatkan instrumen yang terdiri atas 6 butir pertanyaan guna mengukur pengetahuannya tentang kewarganegaraan yang diberikan kepada 5 orang responden (A,B,C,D dan E). Dari lima orang responden akan memiliki jawaban atas angket yang diberikan sebagai berikut.
Maka nilai-nilai jawaban tersebut terlebih dahulu harus di transformasikan ke dalam data interval. Misalkan hasilnya (Succesive Interval-nya) diperoleh sebagai berikut:

Lalu untuk mendapatkan skor tiap-tiap responden untuk menentukkan tingkat pengetahuan kewarganegaraan yang dimilikinya digunakan rumus tertentu (caranya dibahas pada topik berikutnya). Skor tingkat pengetahuan kewarganegaraan dari kelima responden tersebut akhirnya, misalnya diperoleh sebagai berikut.

Tabel Skor Reponden untuk
Tingkat Pengetahuan Kewarganegaraan
Selanjutnya hal yang sama dilakukan pula untuk mendapatkan skor mengenai tingkat partisipasi politiknya, sehingga misalnya akhirnya diperoleh data sebagai berikut.

Tabel Data Lengkap
Selanjutnya kita olah dengan SPSS, dengan langkah-langkah sebagai berikut:

1.      Buat file dengan nama korelasi1.sav dalam folder pribadi Anda, berkenaan dengan data lengkap di atas. Misalkan variabel Skor Tingkat Pengetahuan Kewarganegaraan kita namai Citizenship dan Skor Tingkat Partisipasi Politik kita namai Participation, hasilnya seperti berikut.
 
     
2.      Jika sudah nampak, dari menu utama SPSS, pilih menu Analyze. Kemudian pilih submenu Correlate, dan pilih bivariate. Maka akan tampak di layar tampilan seperti gambar berikut:

      

3.    Selanjutnya adalah mengisi  menu-menu yang ada sebagai berikut:
a. Variable yang akan dikorelasikan, pilih Citizenship dan Participation
b.   Correlation Coeffitients atau alat hitung koefisien korelasi. Pilih Pearson.
c.   Test of Significance yang akan digunakan, pilih Two-tailed untuk uji dua sisi.
d.  Flag significant correlations pilih untuk diaktifkan, dengan cara mengkliknya.
e.  Kemudian tekan tombol Options, hingga tampak di layar tampilan seperti ini.
 

             

            f.  Lalu pada pilihan statistics abaikan saja. 
            g.  Pada menu missing values, pilih  Exclude case pairwise untuk aktif. Selanjutnya tekan  
                Continue. 
            h.  Tekan OK untuk mengakhiri pengisisian prosedur analisis. Selanjutnya SPSS melakukan 
                pekerjaan analisis yang hasilnya dapat terlihat pada bagian output berikut ini.

Analisis Output
1.      Arti Angka Korelasi (Lihat Pearson Correlation)
Ada dua hal dalam penafsiran korelasi, yaitu tanda ‘+” atau ‘-“ yang berhubungan dengan arah korelasi, serta kuat tidaknya korelasi.
Korelasi antara Citizenship dengan Participation, didapat angka +0,969 (tanda “+” disertakan karena tidak ada tanda “-“ pada output, jadi otomatis positif). Hal ini berarti :
·   Arah korelasi positif, artinya semakin tinggi tingkat pengetahuan kewarganegaraan
   seseorang maka partisipasi politiknya cenderung semakin besar. Demikian pula sebaliknya. 
·  Besaran korelasi (0,969) yang > 0,5, berarti tingkat pengetahuan kewarganegaraan seseorang
   berkorelasi KUAT dengan partisipasi politiknya.

2.      Signifikansi Hasil Korelasi (lihat Sig. (2-tailed))
Bila kita hendak merumuskan hipotesis bahwa antara dua variabel, yaitu tingkat pengetahuan kewarganegaraan seseorang dengan partisipasi politiknya memiliki hubungan (korelasi), maka secara statistik dapat dinyatakan seperti berikut:

H0:Tidak ada hubungan (korelasi) antara dua variabel
Hi: Ada hubungan (korelasi) antara dua variabel

Maka bila kita ingin menguji hipotesis ini, kita misalnya dapat menguji dengan melakukan uji dua sisi. Dasar pengambilan keputusannya adalah dengan dasar probabilitas sebagai berikut:
  • Jika probabilitas > 0,05 (atau 0,01) maka Ho diterima
  • Jika probabilitas < 0,05 (atau 0,01) maka Ho ditolak
  • Catatan: 0,05 atau 0,01 adalah tergantung pilihan kita.

Keputusan pada contoh kasus yang kita miliki pada keterangan Sig. (2-tailed) diperoleh angka probailitasnya 0,007 maka kedua variabel tersebut memang SECARA NYATA berkorelasi. Hal ini bisa dilihat juga dari adanya tanda ** pada angka korelasi.

3.      Jumlah Data yang Berkorelasi
Dapat dilihat dari dari nilai N, karena tidak ada data yang hilang, maka data yang diproses adalah 5.





KORELASI PARSIAL

Kadang-kadang dalam suatu penelitian kita perlu menambahkan lagi satu variabel yang berfungsi sebagai pengontrol dari dua variabel yang telah berkorelasi terlebih dahulu. Misalnya seperti pada contoh di atas, bila kita ingin menghitung korelasi parsial antara tingkat pengetahuan kewarganegaraan seseorang dengan perilaku demokratisnya dimana partisipasi politik menjadi variabel kontrol. Karena ketiga variabel bersifat kuantitatif, maka tipe analisis korelasi yang digunakan adalah Pearson.
Langkah-langkah yang ditempuh:

1.   Buka lagi file korelasi1.sav, lalu kita tambahkan 1 lagi variabel dengan nama Democracy yang mewakili variabel tingkat perilalu demokrasi seseorang. Sehingga diperoleh tampilan sebagai berikut:


 

2.  Jika sudah nampak, dari menu utama SPSS, pilih menu Analyze. Kemudian pilih submenu Correlate, dan pilih Partial. Maka akan tampak di layar tampilan seperti gambar berikut:


 


3.      Pengisian:
a.       Variable yang akan dikorelasikan, pilih Citizenship dan Democracy
b.      Controlling for (variabel pengontrol), pilih participation
c.       Test of Significance yang akan digunakan, pilih Two-tailed untuk uji dua sisi.
d.      Display actual signifance level pilih untuk diaktifkan, dengan cara mengkliknya.








e.       Abaikan yang lainnya, kemudian tekan tombol OK untuk prosessing data. Outputnya sebagai berikut:

Correlations



 
Partial Corr


Analisis Hasil Pengolahan oleh SPSS:
Analisis Output
1.      Arti Angka Korelasi (Lihat Correlation)
Pada hasil output ada dua bagian, yang pertama adalah Analsis Korelasi Pearson (Bivariat) antara 3 variabel, yaitu Citizenship, Participation dan Democracy. Sedangkan bagian yang kedua analisis korelasi antara Citizenship dengan Democracy dimana Participation menjadi variabel pengontrolnya.

Bila dibandingkan terlihat bahwa angka korelasi antara Citizenship dengan Democracy dengan menggunakan variabel pengontrol nilainya menjadi turun, yaitu dari 0,968 menjadi 0,397. Sedangkan tandanya masih “positif’. Hal ini berarti bahwa dengan memperhitungkan besarnya tingkat partisipasi politik seseorang, masih ada korelasi positif antara tingkat pengetahuan kewarganegaraan dengan perilaku demokratisnya. Sehingga, semakin tinggi tingkat partisipasi politik seseorang, dan jika perilaku demokrasinya pun meningkat, maka ada kecenderungan partisipasi politik orang tersebut akan semakin meningkat. Demikian pula sebaliknya.



KORELASI UNTUK DATA ORDINAL

Bila kita memiliki data yang memiliki tipe ordinal, apakah analisis korelasinya harus sama ? Menggunakan Pearson ? Jawabannya tentu tidak. Untuk data yang bersifat ordinal, seperti hasil dari penyebaran kuesioner yang berisi variabel berjenjang seperti: Sangat baik, Baik, Tidak Baik dan seterusnya, maka harus menggunakan korelasi Spearman dan Kendall. Jadi datanya bisa kualitatif maupun kuantitatif.
Mari kita lihat contoh kasus analisis untuk data ordinal dengan membuka file nilai_karyawan.

Pada contoh tersebut berisi nilai kapasitas karyawan dari suatu perusahaan dilihat dari aspek prestasi kerja, IQ dan loyalitasnya. Dimana ada 75 orang karyawan.


 












Selanjutnya kita akan menghitung korelasi antara Prestasi Kerja, IQ yang dimiliki dan Loyalitas karyawan. Karena ketiga variabel tersebut kualitatif maka korelasi yang digunakan adalah korelasi Spearman dan Kendall.

Langkah-langkahnya sebagai berikut:
  1. Buka file nilai_karyawan
  2. Dari menu utama SPSS, pilih menu Analyze. Kemudian pilih submenu Correlate, dan pilih Bivariate. Maka akan tampak di layar tampilan seperti gambar berikut:




 






  1. Pengisian: Bila pada analsis data kuantitatif yang dicentang pada Correlation Coefficients adalah Pearson, maka sekarang yang harus dicentang adalah Kendall’s tau-b dan Spearman (jangan lupa nonaktifkan yang Pearson-nya).
4.      Untuk variabel, isikan prestasi, IQ dan Loyalitas dengan cara mengkliknya untuk menyorotnya, lalu klik tanda panah.
5.      Untuk yang lainnya sama dengan analisis sebelumnya. Hasilnya adalah sebagai berikut:

NonParametric Correlation




Analisis: Penafsirannya sama dengan penafsiran pada analisis Pearson.

1.      Arti Angka Korelasi (Lihat Pearson Correlation)
·         Korelasi antara Prestasi dan Loyalitas adalah positif, atau semakin loyal seorang karyawan, maka prestasinya cenderung semakin bagus. Demikian pula sebaliknya. Akan tetapi angka korelasi sebesar 0,299 < 0,5 menunjukkan lemahnya hubungan kedua variabel tersebut.
·         Korelasi antara IQ dengan Loyalitas positif dan nilainya 0,072  0,5 menunjukan hubungan keduanaya lemah.
·         Korelasi antara Prestasi dengan IQ adalah negatif, atau semakin tinggi IQ karyawan maka prestasinya cenderung makin jelek, demikian pula sebaliknya. Namun angka korelasi 0,015 < 0,5 menunjukkan lemahnya hubungan ekedua variabel tersebut. Catatan: angka korelasi yang dipakai adalah korelasi Kendall. Namun bila diukur dengan Spearman, hasilnya tidak jauh berbeda.

2.      Signifikansi Hasil Korelasi (lihat Sig. (2-tailed))
·         Korelasi antara Prestasi dengan Loyalitas adalah signifikan (Probabilitas 0,005 jauh lebih kecil daripada 0,05), yang berarti adanya hubungan yang benar-benar signifikan antara Prestasi dan Loyalitas seorang karyawan.
·         Korelasi anatara IQ dengan Loyalitas hampir signifikan (Probabilitas adalah 0,508 yang hampir mendekati 0,05). Untuk kasus ini bisa dilakukan dengan pengujian ulang dengan data yang diperbaharui, untuk memastikan apakah kedua variabel berkorelasi secara signifikan.
·         Korelasi antara Prestasi dengan IQ adalah tidak signifikan (Probabilitas 0,893 jauh lebih besar daripada 0,05), yang berarti antara Prestasi dan IQ seorang karyawan tidak ada hubungan.

3.      Jumlah Data yang Berkorelasi
Dapat dilihat dari dari nilai N, karena tidak ada data yang hilang, maka data yang diproses adalah 75. (Simpan hasil output dengan nama korelasi3).



ANALISIS REGRESI

Kita telah berlatih menggunakan analisis korelasi dengan SPSS, selanjutnya kita akan berlatih untuk menggunakan analisis regresi. Tujuan dari analisis regresi adalah untuk memprediksi besar Variabel Terikat (Dependent Variable) dengan menggunakan data Variabel Bebas (Independent Variable)  yang sudah diketahui besarnya.

Pada dasarnya tahapan penyusunan model analisis regresi adalah sebagai berikut:
  1. Menentukan yang mana variabel bebas dan variabel terikatnya
  2. Menentukan metode pembuatan model regresi, dalam SPSS ada beberapa pilihan, yaitu: Enter, Stepwise, Forward dan Backward (perbedaanya akan dibahas pada bagian lain). Default SPSS adalah metode Enter. Jika kita memilih metode Stepwise, maka uji signifikansi justru mendahului uji asumsi seperti normalitas dan sebagainya, oleh karena itu dalam latihan kita akan menggunakan default SPSS yaitu metode Enter.
  3. Melihat ada tidaknya data yang outlier (ekstrem)
  4. Menguji asumsi-asumsi pada regresi berganda, seperti normalitas, Linieritas, Heteroskedastisitas dan lain-lainnya.
  5. Menguji signifikansi model (uji-t, uji-F dan sebagainya)
  6. Intepretasi model Regresi Berganda

Persamaan model regresi dinyataakan dalam rumusan sebagai berikut:
Y = a + bX1 + cX2

Keterangan:
Y = Variabel dependen
X1 dan X2 = Variabel-variabel independen
a, b, c = konstanta-konstanta regresi

Latihan:
Kembali kita buka lagi file sebelumnya yang menggambarkan antara tingkat partisipasi politik seseorang dengan tingkat pengetahuan kewarganegaraannya dan tingkat perilaku demokrasinya. Dalam analisis regresi kita ingin meprediksi, bagaimana tingkat partisipasi politik seseorang bila tingkat pengetahuan kewarganegaraannya dan tingkat perilaku demokrasinya berubah-ubah nilainya. Untuk itu kita lihat lagi contoh data yang kita punya sebelumnya.
Tabel Data Analisis Regresi



Langkah-langkah:
1.      uat atau jika sudah ada buka lagi file SPSS yang memuat data ini.


 











2.      Dari menu SPSS, pilih menu utama Analyze, lalu submenu Regression, kemudian pilih Linear …  Maka akan tampak tampilan seperti ini


 



3.      Untuk pengisian, sebagai berikut:
a.       Untuk pilihan Dependent (variabel terikat). Pilih variabel Participation
b.      Untuk Independent(s) pilih Citizenship dan Democracy
c.       Method, pilih Enter
d.      Abaikan bagian lain
e.       Tekan OK untuk prosessing data maka outputnya diperoleh sebagai berikut.

Output dan Analisisnya



Bagian ini menggambarkan derajat keeratan hubungan antarvariabel.
·         Angka R sebesar 0.982(a) menunjukkan bahwa korelasi/hubungan antara Participation dengan kedua variabel independen-nya adalah kuat (karena besarnya > 0,5).
·         Angka R Square atau Koefisien Determinasi adalah 0.963 (berasal dari 0,982 x 0,982). Ini artinya bahwa 0,963 atau 96,3% variasi dari Participation dapat dijelaskan oleh variasi dari kedua variabel independen, yaitu Democracy dan Citizenship. Sedangkan sisanya (100-96,3 = 0,7) atau 7% dijelaskan oleh sebab-sebab yang lain. Untuk variabel independen lebih dari dua sebaiknya gunakan Adjusted R Square yang pada latihan kita nilainya 0,927.
·         Std. Error of the Estimate yang nilainya  0.85442 menggambarkan tingkat ketepatan prediksi regresi, dimana semakin kecil angkanya maka semakin baik prediksinya.

Bagian ini menggambarkan tingkat signifikansi. Dari uji ANOVA atau F-test, didapat F-hitung 26.396 dengan tingkat signifikansi sebesar 0,037. Karena probabilitas (tingkat signifikansi) ini lebih kecil daripada 0,05 maka model regresi ini bisa dipakai untuk memprediksi tingkat partisipasi politik seseorang. Dengan kata lain, tingkat pengetahuan kewarganegaraan seseorang dan tingkat perilaku demokratisnya secara bersama-sama berpengaruh terhadap tingkat partisipasi politiknya.
Sedangkan bagian ini menggambarkan seberapa besar koefisien regresinya.
·         Persamaan regresi yang diperoleh adalah sebagai berikut:
Participation = -2.300 + 0,411 Citizenship + 0,768 Democracy
·         Konstanta sebesar -2,30 menyatakan bahwa jika seseorang tidak memiliki pengetahuan kewarganegaraan dan perilaku demokratis maka partisipasi politiknya -2,30. Secara kualitatif tentu tidak ada perilaku “minus”, mungkin dapat diintepretasikan dalam konteks budaya politik gal itu adalah budaya “apatis”. Jangan lupa juga, bahwa secara nyata ketiga variabel itu berskala ordinal, tidak memiliki angka “nol” seperti dalam batasan skala interval.
·         Koefisien regresi 0,411 menunjukkan  bahwa setiap pengetahuan kewarganegaraan seseorang bertambah +1 poin, maka partisipasi politiknya akan bertambah 0,411 poin.
·         Koefisien regresi 0,768 menunjukkan  bahwa setiap tingkat perilaku demokratis seseorang bertambah +1 poin, maka partisipasi politiknya akan bertambah juga sebesar 0,768 poin
·         Sedangkan uji-t digunakan untuk menguji signifikansi konstanta dan setiap variabel independen
Hipotesis yang dibangun adalah sebagai berikut:
Ho = Koefisien Regresi Tidak Signifikan
Hi  = Koefisien Regresi Signifikan

Pengambilan keputusan (berdasarkan probabilitas, lihat kolom Sig.) adalah sebagai berikut:
Jika Sig. > 0,05 maka Ho diterima
Jika Sig. < 0,05 maka Ho ditolak , Hi diterima

Terlihat bahwa pada kolom Sig. untuk ketiga variabel tersebut, yaitu konstanta = 0,453, Citizenship = 0,57 dan Democracy = 0,361 mempunyai angka signifikansi > 0,05, dengan demikian Ho diterima atau dengan kata lain kedua variabel tersebut tidak cukup signifikan mempengaruhi tingkat partisipasi politik seseorang.

Kejadian di atas mungkin disebabkan karena data-data yang ada memang menunjukkan hal tersebut.