Bab 9. Analisis Regresi dan Analisis Korelasi
ANALISIS REGRESI & KORELASI
Analisis regresi mempelajari bentuk hubungan antara satu atau lebih
peubah/variabel bebas (X) dengan satu peubah tak bebas (Y). dalam penelitian peubah
bebas ( X) biasanya peubah yang ditentukan oleh peneliti secara bebas misalnya
dosis obat, lama penyimpanan, kadar zat pengawet, umur ternak dan sebagainya.
Disamping itu peubah bebas bisa juga berupa peubah tak bebasnya, misalnya dalam
pengukuran panjang badan dan berat badan sapi, karena panjang badan lebih mudah
diukur maka panjang badan dimasukkan kedalam peubah bebas (X), sedangkan berat
badan dimasukkan peubah tak bebas (Y). Sedangkan peubah tak bebas (Y) dalam
penelitian berupa respon yang diukur akibat perlakuan/peubah bebas (X).
misalnya jumlah sel darah merah akibat pengobatan dengan dosis tertentu, jumlah
mikroba daging setelah disimpan beberapa hari, berat ayam pada umur tertentu dan sebagainya.
Bentuk hubungan antara
peubah bebas (X) dengan peubah tak bebas (Y) bisa dalam bentuk polinom derajat
satu (linear) polinom derajat dua (kuadratik). Polinom derajat tiga (Kubik) dan
seterusnya. Disamping itu bisa juga dalam bentuk lain misalnya
eksponensial, logaritma, sigmoid dan sebagainya. Bentuk-bentuk ini dalam analisis
regresi-korelasi biasanya dilakukan transformasi supaya menjadi bentuk polinom.
Dalam bentuk yang paling
sederhana yaitu satu peubah bebas (X) dengan satu peubah tak bebas (Y) mempunyai
persamaan:
Y =a +bx
Disini a disebut intersep dan b adalah koefisien arah atau koefisien beta.
Dalam pengertian fungsi
persamaan garis Y + a + bx hanya ada satu yang dapat dibentuk dari dua buah
titik dengan koordinat yang berbeda yaitu ( X1, Y1) dan X2,Y2).
Hal ini berarti kita bisa membuat banyak sekali persamaan garis dalam bentuk
lain melalui dua buat titik yang berbeda koordinatnya/tidak berimpit.
Persamaan
garis melalui dua buah titik dirumuskan sebagai berikut:
Persamaan Garis Regresi |
Sebagai contoh misalnya titik A (1,3) dan titik B ($,9) maka
persamaan garis linear yang dapat dibuat adalah:
Persamaan Garis Linear |
Dalam bentuk matrik bisa kita buat persaman sebagai berikut:
Matrix Regresi Linear |
Jadi a=1 dan b=2 sehingga persamaannya Y=1 +2X
Jika jumlah data sebanyak n maka persamaannya sebagai berikut:
Disini βo adalah penduga a, β1 adlah penduga b dan εi merupakan besarnya simpangan persamaan garis penduga. Semakin kecil nilai εi persamaan regresi yang diperoleh akan semakin baik.
Jadi kita dapat menuliskan pengamatan kita menjadi:
Dengan notasi matriks dapat ditulis sebagai berikut:
Jadi kita peroleh matrik Y,X,β dan ε dengan dimensi sebagai berikut :
Jika diasumsikan E(ε) = 0 maka E(Y) = Xβ
Bila modelnya benar β
merupakan penduga terbaik yaitu dengan jalan melakukan penggandaan awal dengan
X’ sehingga diperoleh persamaan normal sebagai berikut:
Jadi β=(X’X)-1X’Y
Disini(X’X)-1 adalah kebalikan (inverse) dari matrik X’X
Contoh :
Seorang peneliti ingin
mengetahui bentuk hubungan antara jumlah cacing jenis tertentu dengan jumlah
telurnya pada usus ayam buras. Untuk tujuan tersebut diperiksa 20 ekor ayam dan
ditemukan sebagai berikut:
Bila kita duga bentuk hubungan antara jumlah cacing (X) dan jumlah
telurnya (Y) adalah:
Jadi Ŷ=-2,442 + 4,103 Xi,
Persamaan garis regresi Yi =-2,442 + 4,103 Xi bukanlah satu-satunya
garis penduga untuk menyatakan hubungan antara jumlah cacing dengan jumlah
telurnya. Sudah barang tentu masih banyak lagi bentuk persamaan penduga yang
dapat dibuat misalnya dalam bentuk persamaan Yi=βo+β1Xi+β2Xi2,Yi=βoXiβ1
(dalam bentuk linear LnYi=Ln βo+βiLnXi) dan masih banyak
lagi bentuk yang lainnya.
Untuk menyatakan apakah garis yang diperoleh
cukup baik untuk menggambarkan hubungan antara peubah bebas (X) dengan peubah
tak bebas (Y) dapat dilakukan pengujian bentuk model yang digunakan dan keeratan
hubungannya (korelasi) untuk menyatakan ketepatan dan ketelitian persamaan
garis regresi yang diperoleh.
Analisis Korelasi merupakan suatu
analisis untuk mengetahui tingkat keeratan hubungan antara dua variabel.
Tingkat hubungan tersebut dapat dibagi menjadi tiga kriteria, yaitu
mempunyai hubungan positif, mempunyai hubungan negatif dan tidak
mempunyai hubungan.
Analisis Regresi Sederhana : digunakan untuk mengetahui pengaruh dari variabel bebas terhadap variabel terikat atau dengan kata lain untuk mengetahui seberapa jauh perubahan variabel bebas dalam mempengaruhi variabel terikat. Dalam analisis regresi sederhana, pengaruh satu variabel bebas terhadap variabel terikat dapat dibuat persamaan sebagai berikut : Y = a + b X. Keterangan : Y : Variabel terikat (Dependent Variable); X : Variabel bebas (Independent Variable); a : Konstanta; dan b : Koefisien Regresi. Untuk mencari persamaan garis regresi dapat digunakan berbagai pendekatan (rumus), sehingga nilai konstanta (a) dan nilai koefisien regresi (b) dapat dicari dengan metode sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2] atau a = (ΣY/N) – b (ΣX/N)
b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]
Contoh :
Berdasarkan hasil pengambilan sampel secara acak tentang pengaruh lamanya belajar (X) terhadap nilai ujian (Y) adalah sebagai berikut :
r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}
r = [(5 . 166) – (25 . 28) / √{[(5 . 151) – (25)2] . [(5 . 186) – (28)2]} = 0,94
Nilai koefisien korelasi sebesar 0,94 atau 94 % menggambarkan bahwa antara nilai statistik dan matematika mempunyai hubungan positif dan hubungannya erat, yaitu jika mahasiswa mempunyai nilai statistiknya baik maka nilai matematikanya juga akan baik dan sebaliknya jika nilai statistik jelek maka nilai matematikanya juga jelek.
Analisis Regresi Sederhana : digunakan untuk mengetahui pengaruh dari variabel bebas terhadap variabel terikat atau dengan kata lain untuk mengetahui seberapa jauh perubahan variabel bebas dalam mempengaruhi variabel terikat. Dalam analisis regresi sederhana, pengaruh satu variabel bebas terhadap variabel terikat dapat dibuat persamaan sebagai berikut : Y = a + b X. Keterangan : Y : Variabel terikat (Dependent Variable); X : Variabel bebas (Independent Variable); a : Konstanta; dan b : Koefisien Regresi. Untuk mencari persamaan garis regresi dapat digunakan berbagai pendekatan (rumus), sehingga nilai konstanta (a) dan nilai koefisien regresi (b) dapat dicari dengan metode sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2] atau a = (ΣY/N) – b (ΣX/N)
b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]
Contoh :
Berdasarkan hasil pengambilan sampel secara acak tentang pengaruh lamanya belajar (X) terhadap nilai ujian (Y) adalah sebagai berikut :
(nilai ujian)
|
X (lama belajar)
|
X 2
|
XY
|
40
|
4
|
16
|
160
|
60
|
6
|
36
|
360
|
50
|
7
|
49
|
350
|
70
|
10
|
100
|
700
|
90
|
13
|
169
|
1.170
|
ΣY = 310
|
ΣX = 40
|
ΣX2 = 370
|
ΣXY = 2.740
|
Dengan menggunakan rumus di atas, nilai a dan b akan diperoleh sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2]
a = [(310 . 370) – (40 . 2.740)] / [(5 . 370) – 402] = 20,4
b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]
b = [(5 . 2.740) – (40 . 310] / [(5 . 370) – 402] = 5,4
Sehingga persamaan regresi sederhana adalah Y = 20,4 + 5,2 X
Berdasarkan hasil penghitungan dan persamaan regresi sederhana tersebut di atas, maka dapat diketahui bahwa : 1) Lamanya belajar mempunyai pengaruh positif (koefisien regresi (b) = 5,2) terhadap nilai ujian, artinya jika semakin lama dalam belajar maka akan semakin baik atau tinggi nilai ujiannya; 2) Nilai konstanta adalah sebesar 20,4, artinya jika tidak belajar atau lama belajar sama dengan nol, maka nilai ujian adalah sebesar 20,4 dengan asumsi variabel-variabel lain yang dapat mempengaruhi dianggap tetap.
Analisis Korelasi (r) : digunakan untuk mengukur tinggi redahnya derajat hubungan antar variabel yang diteliti. Tinggi rendahnya derajat keeratan tersebut dapat dilihat dari koefisien korelasinya. Koefisien korelasi yang mendekati angka + 1 berarti terjadi hubungan positif yang erat, bila mendekati angka – 1 berarti terjadi hubungan negatif yang erat. Sedangkan koefisien korelasi mendekati angka 0 (nol) berarti hubungan kedua variabel adalah lemah atau tidak erat. Dengan demikian nilai koefisien korelasi adalah – 1 ≤ r ≤ + 1. Untuk koefisien korelasi sama dengan – 1 atau + 1 berarti hubungan kedua variabel adalah sangat erat atau sangat sempurna dan hal ini sangat jarang terjadi dalam data riil. Untuk mencari nilai koefisen korelasi (r) dapat digunakan rumus sebagai berikut : r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}
Contoh :
Sampel yang diambil secara acak dari 5 mahasiswa, didapat data nilai Statistik dan Matematika sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2]
a = [(310 . 370) – (40 . 2.740)] / [(5 . 370) – 402] = 20,4
b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]
b = [(5 . 2.740) – (40 . 310] / [(5 . 370) – 402] = 5,4
Sehingga persamaan regresi sederhana adalah Y = 20,4 + 5,2 X
Berdasarkan hasil penghitungan dan persamaan regresi sederhana tersebut di atas, maka dapat diketahui bahwa : 1) Lamanya belajar mempunyai pengaruh positif (koefisien regresi (b) = 5,2) terhadap nilai ujian, artinya jika semakin lama dalam belajar maka akan semakin baik atau tinggi nilai ujiannya; 2) Nilai konstanta adalah sebesar 20,4, artinya jika tidak belajar atau lama belajar sama dengan nol, maka nilai ujian adalah sebesar 20,4 dengan asumsi variabel-variabel lain yang dapat mempengaruhi dianggap tetap.
Analisis Korelasi (r) : digunakan untuk mengukur tinggi redahnya derajat hubungan antar variabel yang diteliti. Tinggi rendahnya derajat keeratan tersebut dapat dilihat dari koefisien korelasinya. Koefisien korelasi yang mendekati angka + 1 berarti terjadi hubungan positif yang erat, bila mendekati angka – 1 berarti terjadi hubungan negatif yang erat. Sedangkan koefisien korelasi mendekati angka 0 (nol) berarti hubungan kedua variabel adalah lemah atau tidak erat. Dengan demikian nilai koefisien korelasi adalah – 1 ≤ r ≤ + 1. Untuk koefisien korelasi sama dengan – 1 atau + 1 berarti hubungan kedua variabel adalah sangat erat atau sangat sempurna dan hal ini sangat jarang terjadi dalam data riil. Untuk mencari nilai koefisen korelasi (r) dapat digunakan rumus sebagai berikut : r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}
Contoh :
Sampel yang diambil secara acak dari 5 mahasiswa, didapat data nilai Statistik dan Matematika sebagai berikut :
Sampel
|
X (statistik)
|
Y (matematika)
|
XY
|
X2
|
Y2
|
1
|
2
|
3
|
6
|
4
|
9
|
2
|
5
|
4
|
20
|
25
|
16
|
3
|
3
|
4
|
12
|
9
|
16
|
4
|
7
|
8
|
56
|
49
|
64
|
5
|
8
|
9
|
72
|
64
|
81
|
Jumlah
|
25
|
28
|
166
|
151
|
186
|
r = [(5 . 166) – (25 . 28) / √{[(5 . 151) – (25)2] . [(5 . 186) – (28)2]} = 0,94
Nilai koefisien korelasi sebesar 0,94 atau 94 % menggambarkan bahwa antara nilai statistik dan matematika mempunyai hubungan positif dan hubungannya erat, yaitu jika mahasiswa mempunyai nilai statistiknya baik maka nilai matematikanya juga akan baik dan sebaliknya jika nilai statistik jelek maka nilai matematikanya juga jelek.
Sumber : http://statistikian.blogspot.com/2012/08/analisis-regresi-korelasi.html
http://ssantoso.blogspot.com/2008/08/analisis-regresi-dan-korelasi-materi.html