ANALISIS KORELASI DAN REGRESI
Para mahasiswa tingkat awal
yang mempelajari Statistika seringkali bingung dengan dua istilah ini, “analisis korelasi” dan “analisis reegresi”. Kebingungannya
berkisar kepada fungsi kedua alat analisis, apakah fungsinya sama atau beda ?
kalau beda, kapan kita menggunakan analisis korelasi dan kapan dan pada situasi
bagaimana kita menggunakan analisis regresi. Berikut ini akan dijelaskan
perbedaan kedua alat analisis tersebut.
Tujuan analsisi
korelasi adalah ingin mengetahui APAKAH
ADA HUBUNGAN antara dua variabel atau lebih ? Sedangkan tujuan analisis
regresi adalah untuk MEMPREDIKSI
SEBERAPA JAUH pengaruh yang ada tersebut (yang telah dianalisis melalui
analisis korelasi).
Misalnya, dengan
analisis korelasi ingin diketahui apakah ada hubungan antara terjadinya perang antarnegara dengan kegiatan
perlombaan senjata (arm races)
? Bila melalui analisis korelasi
terbukti bahwa ada hubungan diantara kedua variabel tersebut, maka analisis
regresi akan memperkirakan jika jumlah senjata dinaikan sekian ribu jumlahnya
maka kondisi konflik antarnegara akan seperti apa terjadinya.
Mungkin ada juga
yang bertanya dan kebetulan sudah pernah mengenal alat analisis statistika
lainnya, yaitu uji-t dan uji-F (ANOVA). Apa bedanya antara uji-t dan ANOVA dengan analisis
korelasi/regresi ? Perbedaannya adalah, bila uji-t dan ANOVA menguji
ADA-TIDAKNYA PERBEDAAN DUA SAMPEL atau lebih, maka analisis regresi menguji
ADA-TIDAKNYA HUBUNGAN DUA VARIABEL atau lebih.
ANALISIS KORELASI
Sekali lagi, bahwa
tujuan dari analsisi korelasi adalah untuk mengetahui apakah diantara dua
variabel terdapat hubungan atau tidak, dan jika ada hubungan bagaimanakah arah
hubungan dan seberapa besar hubungan tersebut. Data pada analisis korelasi
dapat berupa data kualitatif maupun kuantitatif, yang masing-masing mempunyai
ukuran korelasi sendiri-sendiri.
Contoh Analisis Korelasi dengan SPSS:
Contoh1:
Menghitung
korelasi antara pengetahuan tentang kewarganegaraan dengan partisipasi politik seseorang. Sebelum kita
memulai analisis kita perhatikan dahulu apakah data yang akan kita peroleh
berskala nominal, ordinal, interval atau rasio ? Sebab perlakuan terhadap
data-data tersebut akan berbeda ketika kita akan melakukan analisis korelasi.
Untuk data yang
berskala interval dan atau rasio (bersifat kuantitatif/parametrik) tipe
analisis korelasi yang digunakan adalah Pearson
Correlation atau istilah lainnya adalah
Product Moment Correlation. Sedangkan untuk yang berskala ordinal kita
gunakan Spearman Correlation (Statistik Non-Parametrik).
Kembali ke
contoh kasus kita, kedua variabel yang ada yaitu pengetahuan kewarganegaraan
dan tingkat partisipasi politik umumnya belum memiliki standar yang baku dalam skala nilainya.
Biasanya untuk mendapatkan nilai-nilai bagi variabel-variabel tersebut kita
terlebih dahulu melakukan pengukuran kepada sejumlah responden mengenai tingkat
pengetahuannya tentang kewarganegaraan dan tingkat partisipasi politiknya,
biasanya kita akan menyebarkan angket yang berisi sejumlah daftar pertanyaan atau
pernyataan yang akan mengukur sejauh mana level pengetahuan kewarganegaraannya
dan tingkat partisipasi politiknya, baik level pengetahuan kewarganegaraan dan
tingkat partisipasi politik keduanya merupakan konsep yang berkaitan dengan
perilaku seorang manusia. Seperti telah diulas dalam modul sebelumnya, para
peneliti ilmu sosial umumnya menggunakan Skala Likert guna mengukur persepsi
atau perilaku sosial. Maka biasanya data yang akan kita dapatkan dari hasil
survey/penyebaran angket yang mengukur tingkat pengetahuan kewarganegaraan
seseorang dan tingkat partisipasi politiknya akan berskala ordinal. Misalkan untuk
mengukur pengetahuan seseorang dibuatkan instrumen yang terdiri atas 6 butir
pertanyaan guna mengukur pengetahuannya tentang kewarganegaraan yang diberikan
kepada 5 orang responden (A,B,C,D dan E). Dari lima orang responden akan memiliki jawaban
atas angket yang diberikan sebagai berikut.
Maka nilai-nilai
jawaban tersebut terlebih dahulu harus di transformasikan ke dalam data
interval. Misalkan hasilnya (Succesive Interval-nya) diperoleh sebagai berikut:
Tabel
Skor Reponden untuk
Tingkat
Pengetahuan Kewarganegaraan
Selanjutnya hal
yang sama dilakukan pula untuk mendapatkan skor mengenai tingkat partisipasi
politiknya, sehingga misalnya akhirnya diperoleh data sebagai berikut.
Tabel Data Lengkap
Selanjutnya kita
olah dengan SPSS, dengan langkah-langkah sebagai berikut:
1.
Buat file dengan nama korelasi1.sav dalam folder pribadi
Anda, berkenaan dengan data lengkap di atas. Misalkan variabel Skor Tingkat
Pengetahuan Kewarganegaraan kita namai Citizenship dan Skor Tingkat Partisipasi
Politik kita namai Participation, hasilnya seperti berikut.
2.
Jika sudah nampak, dari menu
utama SPSS, pilih menu Analyze. Kemudian pilih submenu Correlate, dan pilih
bivariate. Maka akan tampak di layar tampilan seperti gambar berikut:
3. Selanjutnya adalah mengisi menu-menu yang ada sebagai berikut:
a.
Variable yang akan
dikorelasikan, pilih Citizenship dan Participation
b.
Correlation Coeffitients atau
alat hitung koefisien korelasi. Pilih Pearson.
c.
Test of Significance yang akan
digunakan, pilih Two-tailed untuk uji dua sisi.
d.
Flag significant correlations
pilih untuk diaktifkan, dengan cara mengkliknya.
e.
Kemudian tekan tombol Options,
hingga tampak di layar tampilan seperti ini.
f.
Lalu pada pilihan statistics
abaikan saja.
Continue.
h.
Tekan OK untuk mengakhiri
pengisisian prosedur analisis. Selanjutnya SPSS melakukan
pekerjaan analisis
yang hasilnya dapat terlihat pada bagian output berikut ini.
Analisis Output
1.
Arti Angka Korelasi (Lihat Pearson Correlation)
Ada dua hal dalam penafsiran korelasi, yaitu tanda ‘+” atau ‘-“ yang
berhubungan dengan arah korelasi, serta kuat tidaknya korelasi.
Korelasi antara Citizenship dengan Participation, didapat angka +0,969
(tanda “+” disertakan karena tidak ada tanda “-“ pada output, jadi otomatis
positif). Hal ini berarti :
· Arah korelasi positif, artinya
semakin tinggi tingkat pengetahuan kewarganegaraan
seseorang maka partisipasi
politiknya cenderung semakin besar. Demikian pula sebaliknya.
·
Besaran korelasi (0,969) yang
> 0,5, berarti tingkat pengetahuan kewarganegaraan seseorang
berkorelasi
KUAT dengan partisipasi politiknya.
2.
Signifikansi Hasil Korelasi (lihat Sig. (2-tailed))
Bila kita hendak merumuskan hipotesis bahwa antara dua variabel, yaitu
tingkat pengetahuan kewarganegaraan seseorang dengan partisipasi politiknya memiliki
hubungan (korelasi), maka secara statistik dapat dinyatakan seperti berikut:
H0:Tidak ada hubungan (korelasi) antara dua variabel
Hi: Ada
hubungan (korelasi) antara dua variabel
Maka bila kita ingin menguji hipotesis ini, kita misalnya dapat
menguji dengan melakukan uji dua sisi. Dasar pengambilan keputusannya adalah
dengan dasar probabilitas sebagai berikut:
- Jika probabilitas > 0,05 (atau 0,01) maka Ho diterima
- Jika probabilitas < 0,05 (atau 0,01) maka Ho ditolak
- Catatan: 0,05 atau 0,01 adalah tergantung pilihan kita.
Keputusan pada contoh kasus yang kita miliki pada keterangan Sig.
(2-tailed) diperoleh angka probailitasnya 0,007 maka kedua variabel tersebut
memang SECARA NYATA berkorelasi. Hal ini bisa dilihat juga dari adanya tanda **
pada angka korelasi.
3.
Jumlah Data yang Berkorelasi
Dapat dilihat dari dari nilai N, karena tidak ada data yang hilang,
maka data yang diproses adalah 5.
KORELASI PARSIAL
Kadang-kadang
dalam suatu penelitian kita perlu menambahkan lagi satu variabel yang berfungsi
sebagai pengontrol dari dua variabel yang telah berkorelasi terlebih dahulu.
Misalnya seperti pada contoh di atas, bila kita ingin menghitung korelasi
parsial antara tingkat pengetahuan kewarganegaraan seseorang dengan perilaku
demokratisnya dimana partisipasi politik menjadi variabel kontrol. Karena
ketiga variabel bersifat kuantitatif, maka tipe analisis korelasi yang
digunakan adalah Pearson.
Langkah-langkah
yang ditempuh:
1. Buka lagi file korelasi1.sav, lalu kita tambahkan 1
lagi variabel dengan nama Democracy
yang mewakili variabel tingkat perilalu demokrasi seseorang. Sehingga diperoleh
tampilan sebagai berikut:
2. Jika sudah nampak, dari menu
utama SPSS, pilih menu Analyze.
Kemudian pilih submenu Correlate,
dan pilih Partial. Maka akan tampak
di layar tampilan seperti gambar berikut:
3.
Pengisian:
a.
Variable yang akan dikorelasikan, pilih Citizenship
dan Democracy
b.
Controlling for (variabel pengontrol),
pilih participation
c.
Test of Significance yang akan
digunakan, pilih Two-tailed untuk uji dua sisi.
d.
Display actual signifance level pilih
untuk diaktifkan, dengan cara
mengkliknya.
e.
Abaikan yang lainnya, kemudian
tekan tombol OK untuk prosessing
data. Outputnya sebagai berikut:
Correlations
Partial Corr
Analisis Hasil Pengolahan oleh SPSS:
Analisis Output
1.
Arti Angka Korelasi (Lihat Correlation)
Pada hasil output ada dua bagian, yang pertama adalah Analsis
Korelasi Pearson (Bivariat) antara 3 variabel, yaitu Citizenship, Participation
dan Democracy. Sedangkan bagian yang kedua analisis korelasi antara Citizenship
dengan Democracy dimana Participation menjadi variabel pengontrolnya.
Bila dibandingkan terlihat bahwa angka korelasi antara Citizenship dengan
Democracy dengan menggunakan variabel pengontrol nilainya menjadi turun, yaitu
dari 0,968 menjadi 0,397. Sedangkan tandanya masih “positif’. Hal ini berarti
bahwa dengan memperhitungkan besarnya tingkat partisipasi politik seseorang,
masih ada korelasi positif antara tingkat pengetahuan kewarganegaraan dengan perilaku
demokratisnya. Sehingga, semakin tinggi tingkat partisipasi politik seseorang, dan
jika perilaku demokrasinya pun meningkat, maka ada kecenderungan partisipasi
politik orang tersebut akan semakin meningkat. Demikian pula sebaliknya.
KORELASI UNTUK DATA ORDINAL
Bila kita
memiliki data yang memiliki tipe ordinal, apakah analisis korelasinya harus
sama ? Menggunakan Pearson ? Jawabannya tentu tidak. Untuk data yang bersifat
ordinal, seperti hasil dari penyebaran kuesioner yang berisi variabel
berjenjang seperti: Sangat baik, Baik, Tidak Baik dan seterusnya, maka harus
menggunakan korelasi Spearman dan Kendall.
Jadi datanya bisa kualitatif maupun kuantitatif.
Mari kita lihat
contoh kasus analisis untuk data ordinal dengan membuka file nilai_karyawan.
Pada contoh
tersebut berisi nilai kapasitas karyawan dari suatu perusahaan dilihat dari
aspek prestasi kerja, IQ dan loyalitasnya. Dimana ada 75 orang karyawan.
Selanjutnya kita akan menghitung korelasi antara Prestasi Kerja, IQ
yang dimiliki dan Loyalitas karyawan. Karena ketiga variabel tersebut
kualitatif maka korelasi yang digunakan adalah korelasi Spearman dan Kendall.
Langkah-langkahnya sebagai berikut:
- Buka file nilai_karyawan
- Dari menu utama SPSS, pilih menu Analyze. Kemudian pilih submenu Correlate, dan pilih Bivariate. Maka akan tampak di layar tampilan seperti gambar berikut:
|
- Pengisian: Bila pada analsis data kuantitatif yang dicentang pada Correlation Coefficients adalah Pearson, maka sekarang yang harus dicentang adalah Kendall’s tau-b dan Spearman (jangan lupa nonaktifkan yang Pearson-nya).
4.
Untuk variabel, isikan
prestasi, IQ dan Loyalitas dengan cara mengkliknya untuk menyorotnya, lalu klik
tanda panah.
5.
Untuk yang lainnya sama dengan
analisis sebelumnya. Hasilnya adalah sebagai berikut:
NonParametric Correlation
Analisis:
Penafsirannya sama dengan penafsiran pada analisis Pearson.
1.
Arti Angka Korelasi (Lihat Pearson Correlation)
·
Korelasi antara Prestasi dan
Loyalitas adalah positif, atau semakin loyal seorang karyawan, maka prestasinya
cenderung semakin bagus. Demikian pula sebaliknya. Akan tetapi angka korelasi
sebesar 0,299 < 0,5 menunjukkan lemahnya hubungan kedua variabel tersebut.
·
Korelasi antara IQ dengan
Loyalitas positif dan nilainya 0,072 0,5
menunjukan hubungan keduanaya lemah.
·
Korelasi antara Prestasi dengan
IQ adalah negatif, atau semakin tinggi IQ karyawan maka prestasinya cenderung
makin jelek, demikian pula sebaliknya. Namun angka korelasi 0,015 < 0,5
menunjukkan lemahnya hubungan ekedua variabel tersebut. Catatan: angka korelasi
yang dipakai adalah korelasi Kendall. Namun
bila diukur dengan Spearman, hasilnya tidak jauh berbeda.
2.
Signifikansi Hasil Korelasi (lihat Sig. (2-tailed))
·
Korelasi antara Prestasi dengan
Loyalitas adalah signifikan (Probabilitas 0,005 jauh lebih kecil daripada
0,05), yang berarti adanya hubungan yang benar-benar signifikan antara Prestasi
dan Loyalitas seorang karyawan.
·
Korelasi anatara IQ dengan
Loyalitas hampir signifikan (Probabilitas adalah 0,508 yang hampir mendekati
0,05). Untuk kasus ini bisa dilakukan dengan pengujian ulang dengan data yang
diperbaharui, untuk memastikan apakah kedua variabel berkorelasi secara
signifikan.
·
Korelasi antara Prestasi dengan
IQ adalah tidak signifikan (Probabilitas 0,893 jauh lebih besar daripada 0,05),
yang berarti antara Prestasi dan IQ seorang karyawan tidak ada hubungan.
3.
Jumlah Data yang Berkorelasi
Dapat dilihat dari dari nilai N, karena tidak ada data yang hilang,
maka data yang diproses adalah 75. (Simpan hasil output dengan nama korelasi3).
ANALISIS REGRESI
Kita telah
berlatih menggunakan analisis korelasi dengan SPSS, selanjutnya kita akan
berlatih untuk menggunakan analisis regresi. Tujuan dari analisis regresi adalah
untuk memprediksi besar Variabel Terikat (Dependent
Variable) dengan menggunakan data Variabel Bebas (Independent Variable) yang
sudah diketahui besarnya.
Pada dasarnya
tahapan penyusunan model analisis regresi adalah sebagai berikut:
- Menentukan yang mana variabel bebas dan variabel terikatnya
- Menentukan metode pembuatan model regresi, dalam SPSS ada beberapa pilihan, yaitu: Enter, Stepwise, Forward dan Backward (perbedaanya akan dibahas pada bagian lain). Default SPSS adalah metode Enter. Jika kita memilih metode Stepwise, maka uji signifikansi justru mendahului uji asumsi seperti normalitas dan sebagainya, oleh karena itu dalam latihan kita akan menggunakan default SPSS yaitu metode Enter.
- Melihat ada tidaknya data yang outlier (ekstrem)
- Menguji asumsi-asumsi pada regresi berganda, seperti normalitas, Linieritas, Heteroskedastisitas dan lain-lainnya.
- Menguji signifikansi model (uji-t, uji-F dan sebagainya)
- Intepretasi model Regresi Berganda
Persamaan model
regresi dinyataakan dalam rumusan sebagai berikut:
Y =
a + bX1 + cX2
Keterangan:
Y = Variabel
dependen
X1 dan X2 =
Variabel-variabel independen
a, b, c =
konstanta-konstanta regresi
Latihan:
Kembali kita
buka lagi file sebelumnya yang menggambarkan antara tingkat partisipasi politik
seseorang dengan tingkat pengetahuan kewarganegaraannya dan tingkat perilaku
demokrasinya. Dalam analisis regresi kita ingin meprediksi, bagaimana tingkat
partisipasi politik seseorang bila tingkat pengetahuan kewarganegaraannya dan
tingkat perilaku demokrasinya berubah-ubah nilainya. Untuk itu kita lihat lagi
contoh data yang kita punya sebelumnya.
Tabel
Data Analisis Regresi
Langkah-langkah:
1. uat atau jika sudah
ada buka lagi file SPSS yang memuat data ini.
2.
Dari menu SPSS, pilih menu
utama Analyze, lalu submenu Regression, kemudian pilih Linear … Maka akan tampak tampilan seperti ini
3.
Untuk pengisian, sebagai
berikut:
a.
Untuk pilihan Dependent (variabel
terikat). Pilih variabel Participation
b.
Untuk Independent(s) pilih
Citizenship dan Democracy
c.
Method, pilih Enter
d.
Abaikan bagian lain
e.
Tekan OK untuk prosessing data
maka outputnya diperoleh sebagai berikut.
Output dan Analisisnya
Bagian ini menggambarkan
derajat keeratan hubungan antarvariabel.
·
Angka R Square atau Koefisien
Determinasi adalah 0.963 (berasal dari 0,982 x 0,982). Ini artinya bahwa 0,963
atau 96,3% variasi dari Participation dapat dijelaskan oleh variasi dari kedua
variabel independen, yaitu Democracy dan Citizenship. Sedangkan sisanya
(100-96,3 = 0,7) atau 7% dijelaskan oleh sebab-sebab yang lain. Untuk variabel
independen lebih dari dua sebaiknya gunakan Adjusted R Square yang pada latihan kita
nilainya 0,927.
·
Std. Error of the Estimate yang nilainya 0.85442 menggambarkan tingkat ketepatan
prediksi regresi, dimana semakin kecil angkanya maka semakin baik prediksinya.
Bagian ini
menggambarkan tingkat signifikansi. Dari uji ANOVA atau F-test, didapat
F-hitung 26.396
dengan tingkat signifikansi sebesar 0,037. Karena probabilitas (tingkat
signifikansi) ini lebih kecil daripada 0,05 maka model regresi ini bisa dipakai
untuk memprediksi tingkat partisipasi politik seseorang. Dengan kata lain,
tingkat pengetahuan kewarganegaraan seseorang dan tingkat perilaku
demokratisnya secara bersama-sama berpengaruh terhadap tingkat partisipasi
politiknya.
Sedangkan bagian
ini menggambarkan seberapa besar koefisien regresinya.
·
Persamaan regresi yang
diperoleh adalah sebagai berikut:
Participation = -2.300 + 0,411 Citizenship + 0,768 Democracy
·
Koefisien regresi 0,411
menunjukkan bahwa setiap pengetahuan
kewarganegaraan seseorang bertambah +1 poin, maka partisipasi politiknya akan
bertambah 0,411 poin.
·
Koefisien regresi 0,768
menunjukkan bahwa setiap tingkat
perilaku demokratis seseorang bertambah +1 poin, maka partisipasi politiknya
akan bertambah juga sebesar 0,768 poin
·
Sedangkan uji-t digunakan untuk menguji signifikansi
konstanta dan setiap variabel independen
Hipotesis yang
dibangun adalah sebagai berikut:
Ho = Koefisien
Regresi Tidak Signifikan
Hi = Koefisien Regresi Signifikan
Pengambilan keputusan
(berdasarkan probabilitas, lihat kolom Sig.) adalah sebagai berikut:
Jika Sig. > 0,05
maka Ho diterima
Jika Sig. < 0,05
maka Ho ditolak , Hi diterima
Terlihat bahwa pada
kolom Sig. untuk ketiga variabel tersebut, yaitu konstanta = 0,453, Citizenship
= 0,57 dan Democracy = 0,361 mempunyai angka signifikansi > 0,05, dengan
demikian Ho diterima atau dengan kata lain kedua variabel tersebut tidak cukup
signifikan mempengaruhi tingkat partisipasi politik seseorang.