KORELASI
adalah istilah statistik yang menyatakan derajat hubungan linier antara dua variabel
atau lebih, yang ditemukan oleh Karl Pearson pada wal 1900, oleh sebab itu
terkenal dengan sebutan korelasi Pearson Product Moment (PPM). korelasi adalah
salah satu teknik analisis statistik yang paling banyak digunakan oleh para
peneliti. karena para peneliti umumnya tertarik terhadap peristiwa-peristiwa
yang terjadi dan mencoba untuk menghubungkannya.
Misalnya kita ingin menghubngkan
antara tinggi badan dengan berat badan, antara umur dengan tekanan darahnya,
antara motivasi dengan prestasi belajar atau bekerja dan seterusnya. Hubungan
antara dua variabel didalam teknik korelasi bukanlah dalam arti hubungan sebab
akibat (timbal-balik), melainkan hanya merupakan hubungan searah saja. hubungan
sebab akibat, misalnya : kemiskinan dengan kejahatan, kebersihan dengan
kesehatan, kemiskinan dengan kebodohan.. dalam korelasi hanya mengenal hubungan
searah saja (Bukan timbal balik) , misalnya tinggi badan menyebabkan berat
badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan
tinggi badannya bertambah. akibatnya dalam korelasi dikenal penyebab dan
akibatnya. dan data akibat atau yang dipengaruhi disebut variabel terikat.
istilah bebas disebut juga dengan independen yang biasaya dilambangkan dengan
huruf X atau X1. sedangkan istialh terikat disebut dependen yang biasanya
dilambangkan dengan huruf Y. bagaimanakah menentukan bahwa variabel itu bebas
atau terikat? jawaban ialah tergantung dari landasan teori yang kita pakai.
Korelasi merupakan teknik analisis
yang termasuk dalam salah satu teknik pengukuran asosiasi / hubungan (measures
of association). Pengukuran asosiasi merupakan istilah umum
yang mengacu pada sekelompok teknik dalam statistik bivariat yang digunakan
untuk mengukur kekuatan hubungan antara dua variabel. Diantara sekian banyak
teknik-teknik pengukuran asosiasi, terdapat dua teknik korelasi yang sangat
populer sampai sekarang, yaitu Korelasi Pearson Product Moment dan Korelasi
Rank Spearman. Selain kedua teknik tersebut, terdapat pula teknik-teknik
korelasi lain, seperti Kendal, Chi-Square, Phi Coefficient, Goodman-Kruskal,
Somer, dan Wilson.
Pengukuran asosiasi mengenakan nilai
numerik untuk mengetahui tingkatan asosiasi atau kekuatan hubungan antara
variabel. Dua variabel dikatakan berasosiasi jika perilaku variabel yang satu
mempengaruhi variabel yang lain. Jika tidak terjadi pengaruh, maka kedua
variabel tersebut disebut independen.
Korelasi bermanfaat untuk mengukur
kekuatan hubungan antara dua variabel (kadang lebih dari dua variabel) dengan
skala-skala tertentu, misalnya Pearson data harus berskala interval atau rasio;
Spearman dan Kendal menggunakan skala ordinal; Chi Square menggunakan data nominal.
Kuat lemah hubungan diukur diantara jarak (range) 0 sampai dengan 1. Korelasi
mempunyai kemungkinan pengujian hipotesis dua arah (two tailed).
Korelasi searah jika nilai koefesien korelasi diketemukan positif; sebaliknya
jika nilai koefesien korelasi negatif, korelasi disebut tidak searah.
Yang dimaksud dengan koefesien korelasi ialah suatu pengukuran statistik
kovariasi atau asosiasi antara dua variabel. Jika koefesien korelasi
diketemukan tidak sama dengan nol (0), maka terdapat ketergantungan antara dua
variabel tersebut. Jika koefesien korelasi diketemukan +1. maka hubungan
tersebut disebut sebagai korelasi sempurna atau hubungan linear sempurna dengan
kemiringan (slope) positif.
Jika koefesien korelasi
diketemukan -1. maka hubungan tersebut disebut sebagai korelasi sempurna atau
hubungan linear sempurna dengan kemiringan (slope) negatif.
Dalam korelasi sempurna tidak
diperlukan lagi pengujian hipotesis, karena kedua variabel mempunyai hubungan
linear yang sempurna. Artinya variabel X mempengaruhi variabel Y secara
sempurna. Jika korelasi sama dengan nol (0), maka tidak terdapat hubungan
antara kedua variabel tersebut.
Dalam korelasi sebenarnya tidak
dikenal istilah variabel bebas dan variabel tergantung. Biasanya dalam
penghitungan digunakan simbol X untuk variabel pertama dan Y untuk variabel
kedua. Dalam contoh hubungan antara variabel remunerasi dengan kepuasan kerja,
maka variabel remunerasi merupakan variabel X dan kepuasan kerja merupakan variabel
Y.
Variabel yang akan kita
hubngkan terdiri atas berbagai tingkatan data. tingkatan data meliputi data
nominal, interval, dan rasio. tingkatan data tersebutt menentukan alaisis
korelasi mana yang paling tepat digunakan. oleh sebab itu, sebelum mempelajari
analisis korelasi, maka macam-macam tingkatan data tersebut hasrus sudah
dipahami sepenuhnya.
Kegunaan
Pengukuran asosiasi berguna untuk
mengukur kekuatan (strength) hubungan antar dua variabel atau lebih.
Contoh: mengukur hubungan antara variabel:
- Motivasi kerja dengan produktivitas
- Kualitas layanan dengan kepuasan pelanggan
- Tingkat inflasi dengan IHSG
Pengukuran ini hubungan antara dua
variabel untuk masing-masing kasus akan menghasilkan keputusan, diantaranya:
- Hubungan kedua variabel tidak ada
- Hubungan kedua variabel lemah
- Hubungan kedua variabel cukup kuat
- Hubungan kedua variabel kuat
- Hubungan kedua variabel sangat kuat
Penentuan tersebut didasarkan pada
kriteria yang menyebutkan jika hubungan mendekati 1, maka hubungan semakin
kuat; sebaliknya jika hubungan mendekati 0, maka hubungan semakin lemah.
Teori Korelasi
Korelasi dan Kausalitas
Ada perbedaan mendasar antara
korelasi dan kausalitas. Jika kedua variabel dikatakan berkorelasi, maka kita
tergoda untuk mengatakan bahwa variabel yang satu mempengaruhi variabel yang
lain atau dengan kata lain terdapat hubungan kausalitas. Kenyataannya belum
tentu. Hubungan kausalitas terjadi jika variabel X mempengaruhi Y. Jika kedua
variabel diperlakukan secara simetris (nilai pengukuran tetap sama seandainya
peranan variabel-variabel tersebut ditukar) maka meski kedua variabel
berkorelasi tidak dapat dikatakan mempunyai hubungan kausalitas. Dengan
demikian, jika terdapat dua variabel yang berkorelasi, tidak harus terdapat
hubungan kausalitas.
Terdapat dictum yang
mengatakan “correlation
does not imply causation”. Artinya
korelasi tidak dapat digunakan secara valid untuk melihat adanya hubungan
kausalitas dalam variabel-variabel. Dalam korelasi aspek-aspek yang melandasi
terdapatnya hubungan antar variabel mungkin tidak diketahui atau tidak
langsung. Oleh karena itu dengan menetapkan korelasi dalam hubungannya dengan
variabel-variabel yang diteliti tidak akan memberikan persyaratan yang memadai
untuk menetapkan hubungan kausalitas kedalam variabel-variabel tersebut.
Sekalipun demikian bukan berarti bahwa korelasi tidak dapat digunakan sebagai indikasi
adanya hubungan kausalitas antar variabel. Korelasi dapat digunakan sebagai
salah satu bukti adanya kemungkinan terdapatnya hubungan kausalitas tetapi
tidak dapat memberikan indikasi hubungan kausalitas seperti apa jika memang itu
terjadi dalam variabel-variabel yang diteliti, misalnya model recursive,
dimana X mempengaruhi Y atau non-recursive, misalnya X mempengaruhi Y
dan Y mempengaruhi X.
Dengan untuk mengidentifikasi
hubungan kausalitas tidak dapat begitu saja dilihat dengan kaca mata korelasi
tetapi sebaiknya menggunakan model-model yang lebih tepat, misalnya regresi,
analisis jalur atau structural equation model.
Korelasi dan Linieritas
Terdapat hubungan erat antara
pengertian korelasi dan linieritas. Korelasi Pearson, misalnya, menunjukkan
adanya kekuatan hubungan linier dalam dua variabel. Sekalipun demikian jika
asumsi normalitas salah maka nilai korelasi tidak akan memadai untuk
membuktikan adanya hubungan linieritas. Linieritas artinya asumsi adanya
hubungan dalam bentuk garis lurus antara variabel. Linearitas antara dua
variabel dapat dinilai melalui observasi scatterplots bivariat. Jika
kedua variabel berdistribusi normal dan behubungan secara linier, maka
scatterplot berbentuk oval; jika tidak berdistribusi normal scatterplot tidak
berbentuk oval.
Asumsi
Asumsi dasar korelasi diantaranya seperti tertera di bawah ini:
- Kedua variabel bersifat independen satu dengan lainnya, artinya masing-masing variabel berdiri sendiri dan tidak tergantung satu dengan lainnya. Tidak ada istilah variabel bebas dan variabel tergantung.
- Data untuk kedua variabel berdistribusi normal. Data yang mempunyai distribusi normal artinya data yang distribusinya simetris sempurna. Jika digunakan bahasa umum disebut berbentuk kurva bel. Menurut Johnston (2004) ciri-ciri data yang mempunyai distribusi normal ialah sebagai berikut:
- Kurva frekuensi normal menunjukkan frekuensi tertinggi berada di tengah-tengah, yaitu berada pada rata-rata (mean) nilai distribusi dengan kurva sejajar dan tepat sama pada bagian sisi kiri dan kanannya. Kesimpulannya, nilai yang paling sering muncul dalam distribusi normal ialah rata-rata (average), dengan setengahnya berada dibawah rata-rata dan setengahnya yang lain berada di atas rata-rata.
- Kurva normal, sering juga disebut sebagai kurva bel, berbentuk simetris sempurna.
- Karena dua bagian sisi dari tengah-tengah benar-benar simetris, maka frekuensi nilai-nilai diatas rata-rata (mean) akan benar-benar cocok dengan frekuensi nilai-nilai di bawah rata-rata.
- Frekuensi total semua nilai dalam populasi akan berada dalam area dibawah kurva. Perlu diketahui bahwa area total dibawah kurva mewakili kemungkinan munculnya karakteristik tersebut.
- Kurva normal dapat mempunyai bentuk yang berbeda-beda. Yang menentukan bentuk-bentuk tersebut adalah nilai rata-rata dan simpangan baku (standard deviation) populasi.Koefesien Korelasi
Koefesien korelasi ialah pengukuran
statistik kovarian atau asosiasi antara dua variabel. Besarnya koefesien
korelasi berkisar antara +1 s/d -1. Koefesien korelasi menunjukkan kekuatan (strength)
hubungan linear dan arah hubungan dua variabel acak. Jika koefesien korelasi
positif, maka kedua variabel mempunyai hubungan searah. Artinya jika nilai
variabel X tinggi, maka nilai variabel Y akan tinggi pula. Sebaliknya, jika
koefesien korelasi negatif, maka kedua variabel mempunyai hubungan terbalik.
Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan menjadi rendah
(dan sebaliknya). Untuk memudahkan melakukan interpretasi mengenai kekuatan
hubungan antara dua variabel penulis memberikan kriteria sebagai berikut
(Sarwono:2006):
- 0 : Tidak ada korelasi antara dua variabel
- >0 – 0,25: Korelasi sangat lemah
- >0,25 – 0,5: Korelasi cukup
- >0,5 – 0,75: Korelasi kuat
- >0,75 – 0,99: Korelasi sangat kuat
- 1: Korelasi sempurna
Signifikansi
Apa sebenarnya signifikansi itu?
Dalam bahasa Inggris umum, kata, "significant" mempunyai makna
penting; sedang dalam pengertian statistik kata tersebut mempunyai makna
“benar” tidak didasarkan secara kebetulan. Hasil riset dapat benar tapi tidak
penting. Signifikansi / probabilitas / α memberikan gambaran mengenai bagaimana
hasil riset itu mempunyai kesempatan untuk benar. Jika kita memilih signifikansi
sebesar 0,01, maka artinya kita menentukan hasil riset nanti mempunyai
kesempatan untuk benar sebesar 99% dan untuk salah sebesar 1%.
Secara umum kita menggunakan angka
signifikansi sebesar 0,01; 0,05 dan 0,1. Pertimbangan penggunaan angka tersebut
didasarkan pada tingkat kepercayaan (confidence interval) yang
diinginkan oleh peneliti. Angka signifikansi sebesar 0,01 mempunyai pengertian
bahwa tingkat kepercayaan atau bahasa umumnya keinginan kita untuk memperoleh
kebenaran dalam riset kita adalah sebesar 99%. Jika angka signifikansi sebesar
0,05, maka tingkat kepercayaan adalah sebesar 95%. Jika angka signifikansi
sebesar 0,1, maka tingkat kepercayaan adalah sebesar 90%.
Pertimbangan lain ialah menyangkut
jumlah data (sample) yang akan digunakan dalam riset. Semakin kecil angka
signifikansi, maka ukuran sample akan semakin besar. Sebaliknya semakin besar
angka signifikansi, maka ukuran sample akan semakin kecil. Unutuk memperoleh
angka signifikansi yang baik, biasanya diperlukan ukuran sample yang besar.
Sebaliknya jika ukuran sample semakin kecil, maka kemungkinan munculnya
kesalahan semakin ada.
Untuk pengujian dalam SPSS digunakan
kriteria sebagai berikut:
- Jika angka signifikansi hasil riset < 0,05, maka hubungan kedua variabel signifikan.
- Jika angka signifikansi hasil riset > 0,05, maka hubungan kedua variabel tidak signifikan
Interpretasi Korelasi
Ada tiga penafsiran hasil analisis
korelasi, meliputi: pertama, melihat kekuatan hubungan dua variabel; kedua,
melihat signifikansi hubungan; dan ketiga, melihat arah hubungan.
Untuk
melakukan interpretasi kekuatan hubungan antara dua variabel dilakukan dengan
melihat angka koefesien korelasi hasil perhitungan dengan menggunakan kriteria
sbb:
- Jika angka koefesien korelasi menunjukkan 0, maka kedua variabel tidak mempunyai hubungan
- Jika angka koefesien korelasi mendekati 1, maka kedua variabel mempunyai hubungan semakin kuat
- Jika angka koefesien korelasi mendekati 0, maka kedua variabel mempunyai hubungan semakin lemah
- Jika angka koefesien korelasi sama dengan 1, maka kedua variabel mempunyai hubungan linier sempurna positif.
- Jika angka koefesien korelasi sama dengan -1, maka kedua variabel mempunyai hubungan linier sempurna negatif.
Interpretasi berikutnya melihat
signifikansi hubungan dua variabel dengan didasarkan pada angka signifikansi
yang dihasilkan dari penghitungan dengan ketentuan sebagaimana sudah dibahas di
bagian 2.7. di atas. Interpretasi ini akan membuktikan apakah hubungan kedua
variabel tersebut signifikan atau tidak.
Interpretasi
ketiga melihat arah korelasi. Dalam korelasi ada dua arah korelasi, yaitu
searah dan tidak searah. Pada SPSS hal ini ditandai dengan pesan two tailed.
Arah korelasi dilihat dari angka koefesien korelasi. Jika koefesien korelasi
positif, maka hubungan kedua variabel searah. Searah artinya jika variabel X
nilainya tinggi, maka variabel Y juga tinggi. Jika koefesien korelasi negatif,
maka hubungan kedua variabel tidak searah. Tidak searah artinya jika variabel X
nilainya tinggi, maka variabel Y akan rendah.
Dalam
kasus, misalnya hubungan antara kepuasan kerja dan komitmen terhadap organisasi
sebesar 0,86 dengan angka signifikansi sebesar 0 akan mempunyai makna bahwa
hubungan antara variabel kepuasan kerja dan komitmen terhadap organisasi
sangat kuat, signifikan dan searah. Sebaliknya dalam kasus hubungan antara
variabel mangkir kerja dengan produktivitas sebesar -0,86, dengan angka
signifikansi sebesar 0; maka hubungan kedua variabel sangat kuat,
signifikan dan tidak searah.
Contoh: Hubungan antara kepuasan
kerja dengan loyalitas pegawai
Hipotesis berbunyi sbb:
- H0: Tidak ada hubungan antara kepuasan kerja dengan loyalitas pegawai
- H1: Ada hubungan antara kepuasan kerja dengan loyalitas pegawai
Hasil t hitung sebesar 3,6
T table dengan ketentuan α= 0,05 Degree
of freedom: n-2, dan n = 30 diketemukan sebesar: 2,048. Didasarkan ketentuan di
atas, maka t hitung 3,6 > t table 2,048. Dengan demikian H0 ditolak dan H1
diterima. Artinya ada hubungan antara kepuasan kerja dengan loyalitas
pegawai
Disamping menggunakan cara diatas,
cara kedua ialah menggunakan angka signifikansi. Caranya sebagai berikut:
Hipotesis berbunyi sbb:
- H0: Tidak ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai
- H1: Ada hubungan signifikan antara kepuasan kerja dengan loyalitas pegawai
Angka signifikansi hasil perhitungan
sebesar 0,03. Bandingkan dengan angka signifikansi sebesar 0,05. Keputusan
menggunakan kriteria sbb:
- Jika angka signifikansi hasil riset < 0,05, maka H0 ditolak.
- Jika angka signifikansi hasil riset > 0,05, maka H0 diterima
Didasarkan ketentuan diatas maka
signifikansi hitung sebesar 0,03 < 0,05, maka H0 ditolak dan H1 diterima.
Artinya Ada hubungan signifikan antara kepuasan kerja dengan loyalitas
pegawai.
Dalam SPSS pengujian dilakukan
dengan menggunakan angka signifikansi. Oleh karena itu dalam contoh analisis
pada bab berikutnya akan hanya menggunakan angka signifikansi.
Koefesien Determinasi
Koefesien diterminasi dengan simbol
r2 merupakan proporsi variabilitas dalam suatu data yang dihitung
didasarkan pada model statistik. Definisi berikutnya menyebutkan bahwa r2 merupakan
rasio variabilitas nilai-nilai yang dibuat model dengan variabilitas nilai data
asli. Secara umum r2 digunakan sebagai informasi mengenai
kecocokan suatu model. Dalam regresi r2 ini dijadikan
sebagai pengukuran seberapa baik garis regresi mendekati nilai data asli yang
dibuat model. Jika r2 sama dengan 1, maka angka tersebut menunjukkan
garis regresi cocok dengan data secara sempurna.
Interpretasi lain ialah bahwa r2
diartikan sebagai proporsi variasi tanggapan yang diterangkan oleh
regresor (variabel bebas / X) dalam model. Dengan demikian, jika r2 =
1 akan mempunyai arti bahwa model yang sesuai menerangkan semua variabilitas
dalam variabel Y. jika r2 = 0 akan mempunyai arti bahwa tidak ada
hubungan antara regresor (X) dengan variabel Y. Dalam kasus misalnya jika r2
= 0,8 mempunyai arti bahwa sebesar 80% variasi dari variabel Y (variabel
tergantung / response) dapat diterangkan dengan variabel X (variabel bebas /
explanatory); sedang sisanya 0,2 dipengaruhi oleh variabel-variabel yang tidak
diketahui atau variabilitas yang inheren. (Rumus untuk menghitung koefesien
determinasi (KD) adalah KD = r2 x 100%) Variabilitas mempunyai makna
penyebaran / distribusi seperangkat nilai-nilai tertentu. Dengan
menggunakan bahasa umum, pengaruh variabel X terhadap Y adalah sebesar 80%;
sedang sisanya 20% dipengaruhi oleh faktor lain.
Dalam hubungannya dengan korelasi,
maka r2 merupakan kuadrat dari koefesien korelasi yang
berkaitan dengan variabel bebas (X) dan variabel Y (tergantung). Secara umum
dikatakan bahwa r2 merupakan kuadrat korelasi antara variabel
yang digunakan sebagai predictor (X) dan variabel yang memberikan response (Y).
Dengan menggunakan bahasa sederhana r2 merupakan koefesien
korelasi yang dikuadratkan. Oleh karena itu, penggunaan koefesien determinasi
dalam korelasi tidak harus diinterpretasikan sebagai besarnya pengaruh variabel
X terhadap Y mengingat bahwa korelasi tidak sama dengan kausalitas. Secara
bebas dikatakan dua variabel mempunyai hubungan belum tentu variabel satu
mempengaruhi variabel lainnya. Lebih lanjut dalam konteks korelasi antara dua
variabel maka pengaruh variabel X terhadap Y tidak nampak. Kemungkinannya hanya
korelasi merupakan penanda awal bahwa variabel X mungkin berpengaruh terhadap
Y. Sedang bagaimana pengaruh itu terjadi dan ada atau tidak kita akan mengalami
kesulitan untuk membuktikannya. Hanya menggunakan angka r2 kita
tidak akan dapat membuktikan bahwa variabel X mempengaruhi Y.
Dengan demikian jika kita
menggunakan korelasi sebaiknya jangan menggunakan koefesien determinasi untuk
melihat pengaruh X terhadap Y karena korelasi hanya menunjukkan adanya hubungan
antara variabel X dan Y. Jika tujuan riset hanya untuk mengukur hubungan maka
sebaiknya berhenti saja di angka koefisien korelasi. Sedang jika kita ingin
mengukur besarnya pengaruh variabel X terhadap Y sebaiknya menggunakan rumus
lain, seperti regresi atau analisis jalur.
Bentuk korelasi
Salah satu jenis korelasi yang paling populer adalah koefisien korelasi momen-produk Pearson, yang diperoleh dengan membagi kovarians kedua variabel dengan perkalian simpangan bakunya. Meski memiliki nama Pearson, metode ini pertama kali diperkenalkan oleh Francis Galton.
Bentuk korelasi
Salah satu jenis korelasi yang paling populer adalah koefisien korelasi momen-produk Pearson, yang diperoleh dengan membagi kovarians kedua variabel dengan perkalian simpangan bakunya. Meski memiliki nama Pearson, metode ini pertama kali diperkenalkan oleh Francis Galton.
Koefisien korelasi momen-produk
Pearson
Sifat-sifat matematis
Korelasi linier antara 1000 pasang
pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya
ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi
maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh
korelasi = +1).
Korelasi ρX, Y antara dua peubah acak X dan Y dengan nilai yang diharapkan μX dan μY dan simpangan baku σX dan σY didefinisikan sebagai:
Korelasi ρX, Y antara dua peubah acak X dan Y dengan nilai yang diharapkan μX dan μY dan simpangan baku σX dan σY didefinisikan sebagai:
Karena μX = E(X),
σX2 = E(X2) − E2(X)
dan demikian pula untuk Y, maka dapat pula ditulis
Korelasi dapat dihitung bila
simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian ketidaksamaan Cauchy-Schwarz, koefisien korelasi
tak akan melebihi dari 1 dalam nilai
absolut. Korelasi bernilai 1 jika terdapat hubungan linier yang
positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1
dan +1 yang menunjukkan tingkat dependensi
linier antara dua variabel. Semakin dekat dengan -1 atau +1, semakin
kuat korelasi antara kedua variabel tersebut.
Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, dan Y = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X, sehingga
Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, dan Y = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X, sehingga
Koefisien korelasi non-parametrik
Koefisien korelasi Pearson merupakan statistik parametrik, dan ia kurang begitu
menggambarkan korelasi bila asumsi dasar normalitas suatu data
dilanggar. Metode korelasi non-parametrik seperti ρ Spearman and τ Kendall berguna ketika distribusi tidak normal.
Koefisien korelasi non-parametrik masih kurang kuat bila dibandingkan
dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung
memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.
Metode pengukuran yang lain untuk
mengetahui dependensi antara dua peubah acak
Untuk mendapatkan suatu pengukuran mengenai dependensi data
(juga nonlinier), dapat digunakan rasio korelasi, yang mampu
mendeteksi hampir segala dependensi fungsional
Kopula dan korelasi
Banyak orang yang keliru menganggap bahwa informasi yang
diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur
ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya
ketergantungan antara peubah acak harus dipertimbangkan pula kopula antara keduanya. Koefisien korelasi dapat
didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus,
misalnya dalam fungsi distribusi kumulatif
pada distribusi normal multivariat.
Matriks korelasi
Matriks korelasi n peubah
acak X1, ..., Xn adalah n ×
n matrik dimana i,j adalah corr(Xi, Xj).
Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks
korelasi akan sama dengan matriks
kovarians peubah acak yang telah distandarkan Xi
/SD(Xi) untuk i = 1, ..., n.
Sehingga, matriks korelasi merupakan matriks definit tak-negatif.
Matriks korelasi selalu simetris, yakni korelasi antara Xi dan Xj adalah sama dengan korelasi antara Xj and Xi).
Matriks korelasi selalu simetris, yakni korelasi antara Xi dan Xj adalah sama dengan korelasi antara Xj and Xi).
"Korelasi tak selalu berarti
sebab-akibat"
Diktum konvensi bahwa "korelasi
tak selalu berarti sebab-akibat" dibahas dalam artikel hubungan
artifisial (spurious relationship). Lihat pula korelasi mengarah ke hubungan sebab-akibat (kekeliruan
logis). Bagaimanapun, korelasi tak diasumsukan selalu akausal,
meski penyebab tersebut bisa pula tidak diketahui.
Menghitung korelasi secara akurat
dengan metode numerik
Berikut adalah algoritma (dalam
pseudocode) yang akan mengestimasi korelasi dengan menggunakan metode mumerik
sum_sq_x
= 0
sum_sq_y
= 0
sum_coproduct
= 0
mean_x
= x[1]
mean_y
= y[1]
last_x
= x[1]
last_y
= y[1]
for
i in 2 to N:
sweep = (i - 1.0) / i
delta_x = x[i] - mean_x
delta_y = y[i] - mean_y
sum_sq_x += delta_x * delta_x * sweep
sum_sq_y += delta_y * delta_y * sweep
sum_coproduct += delta_x * delta_y * sweep
mean_x += delta_x / i
mean_y += delta_y / i
pop_sd_x
= sqrt( sum_sq_x / N )
pop_sd_y
= sqrt( sum_sq_y / N )
cov_x_y
= sum_coproduct / N
correlation
= cov_x_y / (pop_sd_x * pop_sd_y)