ANALISIS KOLERASI
ANALISIS
KORELASI
MAKALAH
Disusun Guna Memenuhi Tugas
Mata Kuliah : Statistika
Dosen Pengampu: bapak chozairin
Disusun Oleh:
Imamatul Qudsiyah (1501026075)
Khoyainul Huda (1501026059)
Reza Muhammad Azhari (1401016084)
FAKULTAS DAKWAH DAN KOMUNIKASI
UNIVERSITAS ISLAM NEGERI WALISONGO
SEMARANG
2016
I.
PENDAHULUAN
Banyak analisis statistik yang bertujuan untuk mengatahui apakah
ada hubunganya antara dua atau lebih perubahan . bila hubungan demikian ini
dapat dinyatakan dalam rumus matmatika, maka kita dapat menggunakanya untuk
keperluan peramalan . masalah peramalan dapat dilakukan dengan persamaaan
regresi, mendekati nilai tengah populasi. Dalam permasalah ini kelompok kita
akan merpertaskan difinisi analisis kolerasi yang mencangkup beberpa hal yang
perlu kita ketahiu karena ni sangat penting untuk peramalan dalam menentukan
hasil penelitian yang akan kita hadapi di S1 ini. Oleh maka dari itu mari kita
memasuki pembahasan
II.
RUMUSAN MASALAH
A.
Bagaimanakah
definisi analisis korelasi?
B.
Bagaimanakah
koefisiensi korelasi?
C.
Bagaimakaha
analisis korelasi sederhana linear?
D.
Bagaimakaha
analisis korelasi sederhana nonlinear dan data terkelompok?
E.
Apa
sajakah hal-hal penting dalam analisis korelasi?
III.
PEMBAHASAN
A.
Definisi analisis korelasi
Istilah
“korelasi” berasal dari bahasa Inggris “correlation” yang diartikan: hubungan,
saling hubungan, hubungan timbal balik. Dengan demikian, terdapat tiga macam
bentuk hubungan antar variable, yaitu:
hubungan simetris, hubungan kausal atau sebab akibat, dan
hubungan interaktif atau saling mempengaruhi.
Istilah “korelasi” dalam statistika diberi pengertian sebagai
“hubungan antara dua variabel atau lebih”. Hubungan antara dua variabel disebut
dengan “bivariate correlation”, sedangkan antara lebih dari dua variabel
disebut dengan “ multivariate correlation”.[1]
Analisis korelasi menunjukkan teknik-teknik yang dipergunakan di
dalam mengukur kerapatan hubungan anatar variabel-variabel. Perhitungan yang
mengenai derajat kerapatan (degree of closeness) didasarkan pada persamaan
regresi. Tetapi, adalah dimungkinkan untuk melakukan analisis korelasi tanpa
benar-benar memakai persamaan regresi.
Perlu dicatat bahwa suatu derajat korelasi yang tinggi tidaklah
menunjukkan sebuah hubungan sebab akibat (a cause and effect relationship)
antara variabel-variabel. Kita dapat memperoleh sebuah hubungan yang tinggi
antara dua buah variabel bila hubungan itu tidak memiliki arti yang nyata.
Tingkatan hubungan yang tinggi semata-mata menunjukkan hasil
matematika. Kita harus mencapai suatu kesimpulan yang didasarkan pada alasan
yang masuk akal (logical reasoning) dan penyelidikan yang cerdas (intelligent
investigation) atas peristwa-peristiwa yang secara signifikan berkaitan. Analisis
ini ingin mengukur korelasi dua buah variabel, yaitu variabel bebas (X) dengan
variabel tidak bebas (Y). [2]
B.
Koefiseien Korelasi
Untuk mencari dan menentukan hubungan atau korelasi antara dua
variabel atau lebih dilakukan dengan menghitung dan menemukan indeks korelasi
atau koefisien kotelasi antara varabel yang sedang dicari hubungan atau
korelasinya. Koefisien korelasi untuk populasi diberi simbol rho (ρ). Koefisien
korelasi untuk sampel diberi simbol r, dan untuk korelasi ganda diberi simbol
R. Koefisien korelasi merupakan angka
yang menunjukkan arah dan kuat-lemahnya hubungan antara dua variabel atau
lebih. Arah hubungan dinyatakan dalam bentuk positif atau negatif., sedangkan
kuat –lemahnya hubungan dinyatakan dalam besarnya nilai koefisien korelasi.
Korelasi atau hubungan dinyatakan positif apabila kenaikan nilai
suatu variabel (X) diikuti dengan kenaikan variabel lain (Y), atau apabila
penurunan nilai suatu variabel (X) diikuti dengan penurunan variabel lain (Y).
Sebagai contoh: Terdapat hubungan atau korelasi positif antara nilai UMPTN
dengan nilai IPK. Hal ini berarti bahwa semakin baik atau tinggi nilai UMPTN
maka akan semakin baik atau tinggi nilai IPK, begitupun sebalinya, semakin
jelek atau rendah nilai UMPTN, maka akan semakin jelek atau rendah nilai IPK.
Perhatikan ilustrasi di bawah ini:
X Y atau X Y
Korelasi atau hubungan dinyatakan
negatif apabila kenaikan nilai suatu variabel (X) diikuti dengan penurunan
nilai variabel lain (Y), atau sebaliknya penurunan suatu variabel (X) diikuti
dengan kenaikan variabel lain (Y). Sebagai contoh: Terdapat hubungan atua
korelasi negatif antara prestasi belajar Matematika dengan prestasi belajar
Bahasa. Hal ini berarti bahwa semakin baik atau tinggi prestasi belajar
Matematika maka akan semakin jelek atau rendah prestasi belajar Bahasa,
begitupun sebaliknya, semakin jelek atau rendah prestasi belajar Matematika,
maka akan semakin baik atau tinggi prestasi belajar Bahasa. Perhatikan
ilustrasi di bawah ini:
X Y atau X Y
Selanjutnya, kuat lemahnya hubungan
atau korelasi antarvariabel dinyatakan pada besarnya nilai koefisien korelasi.
Koefisien korelasi terbesar = 1, koefisiensi korelasi negatif terbesar = -1,
dan koefisien korelasi terkecil adalah 0. Jika hubungan atau korelasi antardua
variabel atau lebih mempunyai nilai koefisien korelasi 1 atau -1, maka hubungan
tersebut dinyatakan sempurna positif atau sempurna negatif. Sebaiknya, suatu
hubungan itu dikatakan tidak sempurna apabila koefisien korelasi r < +1 atau
r < -1, artinya hubungan itu tidak sempurna positif atau tidak sempurna
negatif. Secara aljabar dinyatakan -1 ≤ r ≤ + 1. [3]
Hal ini berarti bahwa
kejadian-kejadian pada variabel yang satu dapat dijelaskan atau diprediksikan
oleh variabel yang lain tanpa terjadi kesalahan (error).
Untuk dapat memberikan penafsiran
terhadap nilai koefisien korelasi dapat berpedoman pada ketentuan seperti pada
tabel di bawah ini:
Tabel 1.1
Pedoman
Interpretasi Nilai Koefisien Korelasi
Interval nilai Koefisien
|
Tingkat Korelasi
|
0,000-0,199
0,200-0,399
0,400-0,699
0,700-0,899
0,900-1,000
|
Sangan lemah
Lemah
Sedang
Kuat
Sangan Kuat
|
Besarnya
koefisien korelasi dan atau kuat lemahnya hubungan juga dapat diketahui dari
penyebaran titik-titik pertemuan antara dua variabel yang membentuk diagram
pancar (scatterplot). Apabila titik-titik pertemuan tersebut berada dalam atau
membentuk satu garis lurus, maka koefisien korelasinya = 1 atau -1. Jika
titik-titik pertamuan tersebut membentuk lingkaran, maka koefisien korelasinya
= 0. [4]
C.
Analisis Korelasi Sederhana Linier
(1)
Perhitungan r2 dan r dengan metode kuadrat terkecil.
Untuk keperluan analisis koefisien korelasi yang diperlukan adalah
persamaan berikut ini:
∑ (Y - Ῡ)2 =
∑ ( Y - Yc )2 +
∑ ( Yc - Ῡ)2
Di mana:
∑ (Y - Ῡ)2 =
variasi total (total variation), total sum of squares, total error.
∑ ( Y - Yc )2
=
variasi yang tidak dijelaskan, (unexplained variation), unexplained sum of
squares, unexplained error.
∑ ( Yc - Ῡ)2 = variasi yang dijelaskan, explained sum of
squares, explained error.
Dengan menggunakan perumusan di atas, koefisien determinasi dapat
dicari dengan perumusan sebagai berikut:
r2 = ∑ ( Yc - Ῡ)2 = variasi yang dijelaskan
∑ (Y –
ӯ)2 variasi
total
Atau dapat juga cara:
r2 = 1- ∑ ( Y - Yc )2
∑ (Y - Ῡ)2
= 1- variasi yang tidak dijelaskan
Variasi total
Perlu dijelaskan bahwa ∑ ( Y
- Yc )2 disebut
koefisien
∑ (Y - Ῡ)2
nondeterminasi, dan ini biasanya dinyatakan dengan simbol k2.
Jadi k2 = 1 – r2, r2 = 1- k2, r2
+ k2 = 1. Akar daripada koefisien nondeteminasi (√ k2)
menghasilkan apa yang disebut : koefisien alienasi (k).
Untuk mendapatkan koefisien korelasi, dapat dilakaukan dengan salah
satu dari dua cara berikut:
Dengan
mengakarkan koefisien determinasi, r = √ r2
Contoh:
Tabel 1.2
D. P
|
Y
|
Yc
|
( Y - Yc )2
|
( Yc - Y)2
|
(Y - Y)2
|
1
2
3
4
5
6
7
8
9
10
|
54
30
28
48
36
30
38
46
16
42
|
46,8
36,3
21,6
51,0
34,2
27,9
40,5
40,5
23,7
44,7
|
51,84
39,69
40,96
9,00
3,24
4,41
6,25
30,25
59,29
7,29
|
100,00
0,25
231,04
201,64
6,76
79,21
13,69
13,69
171,61
62,41
|
295, 84
46,24
77,44
125,44
0,64
46,24
1,44
84,64
432,64
27,04
|
|
368
|
|
252,22
|
880,30
|
1.137,60
|
Ῡ = 368 ÷ 10 = 36,8
Koefisien determinasi dapat diperoleh dengan perhitungan sebagai
berikut:
r2 = ∑ ( Yc - Ῡ)2 =
880,30 = 0,7738 atau 77,38 %
∑ (Y – ӯ)2
1.137,60
Sedangkan koefisien korelasi dapat diperoleh dengan:
r = √ 0,7738 = 0,8797
atau dapat pula dicari dengan cara demikian:
r2 = 1- ∑ (y – yc)2 = 1- 252,22 =
1- 0,2217 = 0,7783 atau 77,83 %
∑ (y –
y)2 1.137,60
r = √ 0,7783 = 0,8822.
(2)
Perhitungan dengan metode product moment dari karl pearson
Mendel Hall dan Mc Clave menyatakan bahwa koefisian korelasi
product moment pearson (r) memeberikan suatu ukuran kuantitatif dari pada
kekuatan hubungan linier antara X dan Y, ssebagai mana yang terjadi dengan
kemiringan kuadrat terkecil b. Tetapi tidak seperti kemiringan tersebut,
koefisien korelasi r adalah tanpa skala. Koefisien korelasi product moment
pearson didefinisikan sebagai suatu ukuran mengenai hubungan linier antara dua
buah variabel X dan Y.
Dalam
metode ini terlebih dahulu di cari koefisien korelasi, baru kemudian menyusul
perhitungan koefisien determinasi. Untuk mencari koefisien korelasi
dipergunakan rumusan sebagai berikut:
r = n ∑ XY - (∑X)
( ∑Y)
√ [n∑ X2 – (∑ X)2 ]
[n∑Y2 – (∑Y)2]
Koefisien
determinasi dicari dengan mengkuadratkan koefisein korelasi. Jadi, (r)2
= r2
Di
mana:
n = Banyaknya Pasangan data X dan Y
Σx =
Total Jumlah dari Variabel X
Σy =
Total Jumlah dari Variabel Y
Σx2=
Kuadrat dari Total Jumlah Variabel X
Σy2=
Kuadrat dari Total Jumlah Variabel Y
Σxy=
Hasil Perkalian dari Total Jumlah Variabel X dan Variabel Y
Contoh:
Dari
sebuah data diperoleh ∑ X = 264, ∑ Y = 368, ∑ XY = 10.556, ∑X2 =
7,768, dan ∑ Y2 = 14.680.
Koefisien
korelasi dihitung demikian .
r = 10 (10.556) –
(264) (368)
√ [10 (7.768) – (264)2]
[10(14.680) - (368)2]
r = 8.408 =
0,8822.
9.530,266733
r2
= (0,8822)2 = 0,7784
atau 77,84 %.
Hasil
perhitungan dengan metode ini ternyata mendekati hasil yang diperoleh dengan
cara tidak langsung pada metode pertama.
D.
Analisis Korelasi Sederhana : Nonlinear dan Data Terkelompok
Perhitungan
r2 dan r di dalam analisis korelasi nonlinear mempergunakan rumusan
yang sama dengan yang dipakai di dalam analisis korelasi linear. Tidak terdapat
perbedaan di dalam kedua pemakaian itu.
Contoh:
Misalkan
dari hasil suatu perhitungan kita memiliki persamaan garis regresi non-linear
seperti berikut:
Yc
= 2,588 + 2,065X – 0,211X2
Dengan
persamaan tersebut dihitunglah nilai variasi total, variasi yang dijelaskan,
dan variasi yang tidak dijelaskan.
Ῡ = 5,8 ;
r2 = ( Yc - Ῡ)2
/ ∑ (Y - Ῡ)2 = 21,02 ÷ 21,40 = 0,9822 atau
98,22 %
r = √ (r2) = √ 0,9822 = 0,9911
Tabel 1.3
Y
|
Yc
|
(Y - Ῡ)2
|
( Yc - Ῡ)2
|
( Y - Yc
)2
|
4,5
5,9
7,0
7,8
7,2
6,8
4,5
2,7
|
4,765
5,621
6,962
7,640
7,503
6,613
4, 741
2,561
|
1,69
0,01
1,44
4,00
1,97
1,00
1,69
1,61
|
1,077
0,032
1,350
3,386
2,900
0,661
1,121
10,491
|
0,069
0,078
0,001
0,026
0,092
0,035
0,058
0,019
|
|
21,40
|
21,020
|
0,378
|
Perbedaan yang terdapat pada perhitungan kesalahan taksiran baku
cuplikan (atau simpang baku regresi), se. Perbedaan terjadi pada
besarnya nilai derajat bebas (db).
Karena adanya 3 buah nilai konstan yang tidak diketahui, maka sekarang
db = n – 3.
Jadi, untuk menghitung, nilai se dengan data dalam
contoh di atas adalah sebagai berikut:
Cara I:
Se = √ ∑( Y - Yc )2 = √
0,378 = √ 0,0756 = 0,2750
n- 3 8 – 3
Cara II:
Se = √ ∑ Y2 - a∑ Y - c∑ XY- c∑ X2
Y
n – 3
= √ 290,52 – 2,588 (46,4)
– 2,065 (230,42) – (-0,211) (1449)
8
– 3
= √ 290,52 – 120,0832 –
475,8173 + 305,739
5
= √
(0,3585 ÷ 5) = √ 0,0717 = 0,2678.
Perbedaan
hasil dari kedua cera di atas terjadi sebagai akibat adanya proses pembulatan
dalam perhitungan.
E.
Hal-hal Penting dalam Analisi Korelasi
1.
Hubungan
regresi dan korelasi
Bila garis regresi itu horizontal, maka kemiringannya adalah b=0
dan koefisien korelasinya adalah 0. Jadi, b=0 dan r = 0. Keduanya berarti bahwa
variabel-variabel itu tidak berhubungan, dan kasus ini tentu saja r2
(koefisien determinasi) juga 0.
Di lain pihak, jika seluruh titik pengamalatan berada pada garis
regresi, kesalahan taksiran baku yang dihitung dalam analisis regresi = 0 dan
korelasinya sempurna. Karena itu, se = 0 berarti bahwa r =1 atau r =
-1, dan tentu saja r2 = 1.
2.
Hati-hati
terhadap pengamatan di dalam analisi regresi dan korelasi
a.
Asumsi-asumsi
Tidak erdapat asumsi-asumsi yang terkandung di dalam perhitungan
sebuah persamaan regresi. Hal itu dikarenakan kriteria least squares umumnya
diterima sebagai suatu kriteria yang baik. Tetapi, asumsi-asumsi tentang model
regresi normal terkandung di dalamnya bila kita menarik inferensi-inferensi
statistika, yaitu ketika kita menyusun taksiran-taksiran selang kepercayaan
atau menguji hipotesis-hipotesis tentang kemiringan garis regresi.
b.
Ekstrapolasi
Ekstrapolasi berarti penerapan suatu persamaan regresi yang
dihitung di luar interval data pengamatan. Sebagai contoh, misalkan kita
mengumpulkan data mengenai ukuran mesin mobil X dan jarak mil minyak Y, dan
misalkan ukuran mesin terkecil dan terbesar yang diamati adalah 150 dan 350
inchi kubik. Kemudian kita hitung persamaan regresinya. Jika sekarang kita
terapkan persamaan itu untuk menaksir jarak mil gas seluruh mobil dengan mesin
berukuran 500 inchi kubik, taksiran itu merupakan sebuah ekstrapolasi.
c.
Relevansi
dari data historis
Data yang kita analisis adalah data masa lalu . mereka adalah
sejarah, yang baru saja terjadi atau yang sudah lebih jauh lagi. Hubungan
–hubungan mungkin (atau banyak yang dilakukan) berubah sepanjang perjalanan
waktu. Karena itu, adalah bijaksana untuk mempertayakan apakah dapat
dipertanggungjawabkan dalam keadaan sekarang untuk menerapkan suatu hubungan
yang ditentukan dari data yang berhubungan dengan keadaan masa lalu.
d.
Interpretasi-interpretasi
yang menyesatkan dari koefisien korelasi
Menginterpretasikan nilai-nilai r kecil dan besar, seperti r=0,20
dan r=0,70 sebagai hubungan yang lemah dan kuat dapat menyesatkan. Hal ini
disebabkan meski sebuah nilai r itu kecil dapat menjadi signifikan pada tingkat
1 % , tetapi sebuah nilai r besar tidak dapat signifikan meski pada tingkat
5%,.
e.
Korelasi,
Sebab,dan Omong Kosong
Adanya suatu korelasi yang secara signifikan tinggi anatara dua
buah variabel tidak mengatakan kepada kita mengenai mengapa ada krelasi itu.
Terutama korelasi itu tidak mengatakan kepada kita bahwa variabel yang satu
merupakan sebab dan yang lain merupakan akibat. Juga, korelasi-korelasi itu
sering ada karena variabel-variabel yang di pilih untuk analisis hanya
merupakan dua dari sejumlah variabel yang berhubungan. Sebagai contoh, kita
mengharapkan untuk menemukan suatu korelasi positif anatara sejumlah guru
sekolah di berbagai kota dan konsumsi minuman keras berkaitan dengan besaran
populasi.
IV.
KESIMPULAN
Analisis Korelasi : metode statistik yang digunakan untuk
menentukan kuat tidaknya (derajat) hubungan linier antara 2
variable atau lebih.
Analisa korelasi sederhana,meneliti hubungan dan bagaimana eratnya
itu,tanpa melihat bentuk hubungan. Jika kenaikan didalam suatu variable diikuti
dengan kenaikan variable yang lain,maka dapat dikatakan bahwa kedua variable
tersebut mempunyai “korelasi”yang positif.Tetapi jika kenaikan didalam suatu
variable diikuti penurunan variable yang lain maka kedua variable tersebut
mempunyai korelasi negatif.Jika tidak ada perubahan pada suatu variable
,meskipun variable yang lain mengalami perubahan ,maka kedua variable
tersebut,tidak mempunyai hubungan (uncorrelated).
NB :
Variable adalah besaran yang bisa berubah-ubah.
Variable terikat adalah variable yang
dipengaruhi oleh variable lain
Variable bebas adalah variable yang
tidak dipengaruhi oleh variable lain.
Koefisien
korelasi adalah bilangan yang digunakan untuk mengukur keeratan hubungan antar
variable (kuat / lemah / tidak adaa) simbol (KK) -1<= kk <= 1
Koefisien
korelasi rank spearman adalah indeks / angka yang digunakan untuk mengukur
keeratan hubungan antar 2 variable yang datanya berbentuk data ordinal (data
bertingkat / rangking).
[1]
Shodiq, Aplikasi Statistika Dalam Penelitian Kependidikan, (Semarang:
CV. Karya Abadi Jaya, 2015), hlm. 101.
[2]
Soegyarto Mangkuatmodjo, Statistik Lanjutan, (Jakarta: RINEKA CIPTA,
2004), hlm. 234-235.
[3]
Soegyarto Mangkuatmodjo, hlm. 238.
[4]
Shodiq, hlm. 102-104.
DAFTAR PUSTAKA
Mangkuatmodjo, Soegyarto. 2004. Statistik Lanjutan. Jakarta: RINEKA
CIPTA
Shodiq. 2015. Aplikasi Statistika dalam Penelitian Kependidikan. Semarang:
CV. Karya Abadi Jaya
Komentar
Posting Komentar