just fun

just fun

Jumat, 03 Juni 2011

metode forward


Untuk mendapatkan model terbaik dalam sebuah analisis regresi maka diperlukan pengujian terhadap variabel prediktor yang dimasukkan ke dalam model. Hal ini untuk menghindari terdapatnya beberapa variabel prediktor yang tidak berpengaruh secara signifikan terhadap variabel respon yang berada dalam model walaupun sesungguhnya variabel tersebut berhubungan sangat erat dengan variabel respon Y.  Selain itu juga, untuk melihat apakah antar variabel prediktor saling berkorelasi satu sama lain atau terjadi kasus multikolinearitas. Untuk mendapatkan model yang diinginkan terdapat dua pertimbangan dalam pembentukan model, diantaranya:
1.      Agar persamaan regresi bermanfaat untuk tujuan prediksi, seringkali diinginkan model yang memuat sebanyak-banyaknya variabel X (prediktor) yang mempengaruhi variabel Y (respon)
2.      Karena pertimbangan biaya untuk mendapatkan informasi, maka digunakan  sesedikit mungkin variabel X (prediktor) yang mempengaruhi variabel Y (respon)
Untuk itu dibutuhkan metode untuk dapat mengakomodasikan dua kepentingan di atas dengan cara Selecting the best regression equation. Berikut ini adalah cara-cara yang sering digunakan dalam memilih model terbaik.         
Metode FORWARD
Metode forward adalah memasukkan prediktor secara bertahap berdasarkan korelasi parsial terbesar. Dalam metode forward variabel prediktor yang dimasukkan dalam model tidak dapat dikeluarkan lagi. Proses tersebut dihentikan ketika prediktor-prediktor baru tidak bisa meningkatkan berpengaruh secara signifikan (sig di bawah 0.05) terhadap variable respon.
Prosedur eliminasi forward adalah salah satu prosedur pemilihan model terbaik dalam regresi dengan eliminasi variabel bebas yang membangun model secara bertahap. Terdapat beberapa cara pengujian dengan metode forward, yang akan dibahas kali ini adalah dengan menggunakan uji F dan uji t-student dengan software SPSS.
Langkah-langkah pengujian dengan uji F adalah sebagai berikut:
  1. Membuat model regresi sederhana untuk setiap variabel bebas. Kemudian, setiap model dilakukan uji slope dengan uji F. Kita bandingkan nilai-nilai F tertinggi, misalnya FL, dengan nilai F bertaraf nyata tertentu dari tabel , misalnya F0.
a.                   Jika FL < F0, berarti tidak ada variabel bebas yang terpilih.
b.                   Jika FL > F0, masukkan variabel bebas L ke dalam model.
  1. Jika pada tahap 1 ada variabel bebas yang dimasukkan (misal L), maka kita membuat model regresi dengan dua variabel bebas di mana salah satunya adalah variabel L, misalkan variabel bebas L dan K. Kemudian kita lakukan uji F parsial:
FK = 
kemudian kita bandingkan nilai-nilai F tertinggi, misalnya FK dengan nilai F bertaraf nyata tertentu dari tabel, misalnya F0.
a.                   Jika FK < F0, berarti hanya variabel bebas yang lolos pada tahap 1 yang digunakan dalam model.
b.                   Jika FK > F0, masukkan variabel bebas K dimasukkan ke dalam model.
  1. Jika pada tahap 2 ada variabel bebas yang dimasukkan (misal K), maka stepwise memeriksa apakah ada variabel bebas yang sudah ada dalam model dikeluarkan. Kita lakukan uji F parsial: FL= .
a.                   Jika FL < F0, berarti variabel bebas L dikeluarkan dari model.
b.                  Jika FK > F0, berarti variabel bebas L dan K dimasukkan dalam model.
  1. Misalkan variabel bebas L dipertahankan. Jadi, sekarang variabel bebas L dan K digunakan dalam model. Selanjutnya, tahapan berulang sampai tidak ada lagi variabel bebas yang ditambahkan atau dibuang. Artinya, pekerjaan telah selesai.
Langkah-langkah forward dengan uji t menggunakan software, yaitu :
1.      Mulai dari awalnya tidak ada model yang ada dalam model.
2.      Memasukkan variabel prediktor secara bertahap berdasarkan korelasi parsial terbesar ke dalam model. Variabel prediktor yang dimasukkan adalah variabel prediktor yang nilai p-valuenya kurang dari nilai α yang telah ditentukan (α=0.05 %)
3.      Lanjutkan sampai tidak terdapat lagi variabel predictor yang tidak dapat dimasukkan ke dalam model.
Untuk lebih jelas, contohnya terdapat dibawah ini:
Sebuah peneliti  ingin meneliti tentang hubungan antara gaji seorang ilmuwan matematikawan pada tingkat menengah dan senior (Y, dalam jutaan rupiah) dengan indeks kualitas publikasi (X1), jumlah tahun bekerja(X2), dan indeks keberhasilan dalam berkarya(X3).
No.
Y
X1
X2
X3
1
33.2
3.5
9
6.1
2
40.3
5.3
20
6.4
3
38.7
5.1
18
7.4
4
46.8
5.8
33
6.7
5
41.4
4.2
31
7.5
6
37.5
6
13
5.9
7
39
6.8
25
6
8
40.7
5.5
30
4
9
30.1
3.1
5
5.8
10
52.9
7.2
47
8.3
11
38.2
4.5
25
5
12
31.8
4.9
11
6.4
13
43.3
8
23
7.6
14
44.1
6.5
35
7
15
42.8
6.6
39
5
16
33.6
3.7
21
4.4
17
34.2
6.2
7
5.5
18
48
7
40
7
19
38
4
35
6
20
35.9
4.5
23
3.5
21
40.4
5.9
33
4.9
22
36.8
5.6
27
4.3
23
45.2
4.8
34
8
24
35.1
3.9
15
5
















Misalkan terdapat 3 variabel respon, yaitu , , dan   maka model yang dapat dibentuk:
Y =  +   + +  +

Pengujian dengan metode Forward:
1.      Hitung koefisien korelasi setiap variabel independen dengan variabel dependen.
                                                                






















2.      Koefisien korelasi  x2  dengan Y paling mendekati |1|, sehingga variabel x2 adalah variabel pertama yang masuk ke dalam model.

3.      Estimasi model regresi dengan variabel independen x2
                                                                   Coefficients(a)

  
 
Model

Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
B
Std. Error
1
(Constant)
29.048
1.454

19.978
.000
X2
.419
.053
.859
7.854
.000
a  Dependent Variable:
  1. Karena |thit| > t1-α/2;db.error atau p-value < α (= 5 %), maka variabel x2 signifikan masuk ke dalam model. Hitung korelasi parsial variabel independen tersisa, x1 dan x3 dengan Y. Sebagai variabel kontrol adalah variabel yang sudah masuk ke dalam model, x2.





5.      Berdasarkan output SPSS di atas, x1 mempunyai koefisien korelasi parsial paling mendekati |1|, sehingga x1 masuk ke dalam model setelah x2.
6.      Estimasi kembali model regresi, dengan memasukkan variabel x1 setelah x2.
                                                                   Coefficients(a)

  
 
Model

Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
B
Std. Error
1
(Constant)
24.348
3.707

6.569
.000
X1
2.828
.673
.667
4.200
.000







a  Dependent Variable: Y


7.      Karena |thit| > t1-a/2;db.error atau p-value < α , maka variabel x2 dan x1 signifikan masuk ke dalam model. Estimasi variabel x3 dengan Y, sebagai variabel kontrol adalah x2 dan x1 dan bandingkan dengan nilai t1-a/2;db.error  jika signifikan maka x3  juga masuk dalam model.
                                                                          Coefficients(a)

  
 
Model

Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
B
Std. Error
1
(Constant)
25.465
4.548

5.600
.000
X3
2.344
.743
.558
3.156
.005
a  Dependent Variable: Y

8.       Karena |thit| > t1-a/2;db.error atau p-value < α, maka variabel x3 juga dapat dimasukkan dalam model. Sehingga model yang dibentuk yaitu:

Y = 17.847 + 1.103  + 0.322  + 1.289

Jika kita uji secara langsung dengan SPSS maka didapatkan:

                                                                Variables Entered/Removed(a)

Model
Variables Entered
Variables Removed
Method
1
X2
.
Forward (Criterion: Probability-of-F-to-enter <= .050)
2
X3
.
Forward (Criterion: Probability-of-F-to-enter <= .050)
3
X1
.
Forward (Criterion: Probability-of-F-to-enter <= .050)
     a  Dependent Variable: Y

dari hasil diatas maka terlihat bahwa ketiga variabel predictor diatas memang dapat dimasukkan ke dalam model.

3 komentar:

  1. terima kasih :)mohon perbaikannya ya,sebagian picturenya tidak terdefinisi di dalam web sehingga tidak dapat dilihat

    BalasHapus
  2. Assalamualaikum, nama saya Aldy asal saya dari bengkulu!
    saya mau bartanya berapa isi yang tertera di blog mbak ini? dan tolong Lampirkan No wa nya???

    Misalkan terdapat 3 variabel respon, yaitu , , dan maka model yang dapat dibentuk:
    Y = + + + +

    Pengujian dengan metode Forward:

    BalasHapus