PENGANTAR ANALISIS REGRESI SEDERHANA

Halo Gaes….. maaf sebelumnya bila postingan ini agak panjang, siapkan camilan dan kopi dulu gaes….

Regresi merupakan dasar dari banyak analisis kuantitatif yang sering digunakan dalam penelitian-penelitian sosial disamping penelitian eksak tentunya. Analisis jalur (path analysis) dan Structural Equation Modelling (SEM) berdasar pada analisis regresi ini. Dalam tulisan ini kita akan fokus membahas apa itu regresi khususnya regresi sederhana.

Yang sederhana dulu aja ya gaes…. karena bahagia juga dimulai dari hal-hal sederhana kok, hehehe….

Singkatnya, analisis regresi digunakan untuk mengestimasi variabilitas/perubahan suatu variabel melalui variabel lain. Variabel yang diestimasi biasanya disebut dengan variabel terikat (dependent/regressan/prediktan). Disebut terikat karena variabilitas atau perubahannya ditentukan oleh variabel lain. Variabel lain yang digunakan untuk memprediksi disebut variabel bebas (independent/regressor/prediktor). Bisa ditebak ya, disebut bebas ya karena variasi atau perubahannya tidak ditentukan oleh variabel lain.

Baiklah, kita pakai contoh saja ya. Misalnya saya adalah seorang manajer toko sepeda motor dengan data penjualan dan jumlah sales sebagai berikut:

Singkat cerita, saya berencana menambah seorang tenaga sales menjadi 6 orang sales, kira-kira berapa penjualan tiap harinya?. Tentunya ini adalah angka estimasi saja, sebelum benar-benar tahu jumlah penjualan sebenarnya setelah ada tambahan jumlah sales.

Metode estimasi sangat banyak, misalnya metode rata-rata, rata-rata bergerak, garis tren dll. Kita akan mencoba tiga metode estimasi dasar yaitu metode rata-rata, tren dengan free hand, dan tren dengan regresi OLS (ordinary least square).

Estimasi Dengan Rata-Rata

Agar lebih ringkas, jumlah sales dan penjualan rata-rata per hari kita sebut dengan X dan Y. X untuk sales dan Y untuk penjualan. Simbol variabel ini sangat lazim digunakan, dimana dalam regresi X sering dilambangkan untuk variabel bebas dan Y untuk variabel terikat.

Estimasi rata-rata adalah estimasi yang sangat sederhana, dimana kita hanya cukup merata-rata setiap nilai Y tanpa memperhatikan nilai X. Dengan demikian rata-rata dari Y adalah 13 dibagi 5 sebagai jumlah data sehingga hasilnya adalah 2,6. Selengkapnya lihat tabel di bawah ini.

Y’ merupakan estimasi dari nilai Y dengan metode rata-rata. Sedangkan e adalah error term yaitu selisih antar nilai estimasi (Y’) dengan nilai sebenarnya (Y). bila digambarkan dalam grafik adalah sebagai berikut:

Estimasi Dengan Grafik Freehand

Estimasi sederhana selanjutnya adalah dengan menggunakan freehand atau dengan menggambarkan garis tren sesuai intuisi kita pada tren data. Lebih jelasnya silahkan lihat pada grafik berikut:

Garis Y’ merupakan garis estimasi yang kita gambar secara sembarang untuk melakukan estimasi dari nilai Y. Tentunya dengan menggunakan garis tren/lurus yang menurut kita secara subyektif garis tersebut memiliki nilai selisih estimasi (error term) paling kecil. Kita bisa menggambar lebih horizontal atau lebih vertikal tergantung intuisi kita.

Hasil estimasi dari metode freehand di atas bila diringkas seperti pada tabel berikut ini.

Bila kita bandingkan dengan hasil estimasi metode freehand ini dengan metode rata-rata, manakah yang lebih baik?. Hasil estimasi yang paling baik bisa dilihat dari nilai error term-nya. Ya, error term atau selisih antara estimasi dan kenyataannya. Tentunya nilai error term (e) yang paling kecil yang lebih baik. Nilai e pada tabel 2. dan tabel 3. akan kita bandingkan mana yang lebih kecil?.

Bila kita lihat sekilas e pada Tabel 2 sebesar 0, sedangkan pada Tabel 3 sebesar -0,30, apakah nilai e ini yang paling baik? karena bisa dikatakan tidak ada selisih antara estimasi dan kenyataan?. Eits…. tunggu dulu, nilai total e sebesar 0 pada tabel 2 merupakan nilai riil sedangkan selisih estimasi antara yang positif dan negatif dijumlah sehingga ini tidak bisa dibuat ukuran karena tidak mencerminkan jarak selisih sebenarnya. Pada kolom paling kanan di kedua tabel di atas merupakan nilai e yang sudah dikuadratkan (e2) untuk mendapatkan nilai positif. Nilai total dari e2 inilah yang bisa kita bandingkan. Walaupun masih banyak karakteristik error term yang perlu kita lihat untuk mendapatkan hasil estimasi terbaik, namun intinya tetap error term terkecil lah yang paling sering digunakan. Nah…. Sekarang bisa kita bandingkan metode estimasi mana yang lebih baik pada satu set data di atas?. Ya….. metode freehand lah yang lebih baik karena mempunyai total e2 sebesar 0,15 yang lebih kecil dari 0,70 bila menggunakan metode rata-rata.

Metode Regresi

Bila dengan metode freehand kita menggambar garis trend sesuai dengan intuisi kita, maka hasilnya pun bisa beragam. Nilai e tentunya juga bisa beragam pula, bisa lebih kecil dan tentu pula bisa lebih besar. Maka dengan menggunakan persamaan regresi, garis tren tidak agi kita gambar sendiri melainkan dengan melakukan beberapa penghitungan. Persamaan regresi pada set data di atas bila kita tuliskan sebagai berikut:

Y = a + bX + e   

atau

Loading...

Y’  = a + bX

Dimana “a” adalah konstanta dan “b” adalah koefisien regresi atau slope (kemiringan garis tren). Nilai a dan b ini dapat kita peroleh melalui rumus Ordinary Least Square (OLS) sebagai berikut.

Baiklah, langsung saja kita hitung ya gaes…..

Penghitungan konstanta/intersep (a) adalah sebagai berikut:

Penghitungan koefisien regresi (b) adalah sebagai berikut:

Berdasar pada hasil perhitungan tersebut maka persamaan regresi pada set data di atas adalah:

Y = 1,85 + 0,25X + e   

atau

Y’  = 1,85 + 0,25X

Sehingga hasil estimasinya adalah sebagai berikut:

Bila digambarkan menjadi seperti berikut:

Nah, bagaimana penilaian Anda tentang ketiga metode estimasi di atas, mana yang terbaik?. Ya, metode regresi OLS lah yang mempunyai error term yang paling kecil bukan?. Selain kecil, besaran error term setiap nilai X hampir konstan. Nah inilah salah satu kriteria estimasi yang baik selain error term yang kecil.

Loading...

Inilah dasar dari analisis regresi. Ingat, bahwa X adalah prediktor dan Y adalah prediktan. Besaran Y baik secara teoritis maupun logis ditentukan oleh X. Tidak setiap variabel bisa dimasukkan dalam model regresi ini, alias harus ada dasar yang kuat. Karena statistika atau matematika tidak melihat variabel Anda setiap X dan Y bisa dimasukkan, namun tidak berarti apa-apa bila tidak ada dasar teori, empiris, logis atau dasar lainnya yang relevan. Untuk hal ini anda bisa membaca artikel saya di SINI dan di SINI.

Bila saya menambahkan seorang sales lagi untuk menambah kekuatan penjualan maka estimasi penjualan akan menjadi:

Y’  = 1,85 + 0,25X

Y’  = 1,85 + 0,25(6)

Y’  = 3,35

atau

Y = 3,35 + e   

Bagaimana Gaes…. mudah bukan….. jika Anda merasa tulisan ini cukup panjang atau lebih menyukai belajar melalui media audio visual, Anda bisa mempelajarinya melalui video berikut.

Gaes…. cukup sekian dulu ya tulisan kali ini. Poin terpentingnya adalah bagaimana kita memahami mengapa analisis regresi sering digunakan untuk menguji hubungan kausal antara satu atau lebih variabel bebas terhadap variabel terikat. Selamat belajar ya gaes…. jangan lupa seruput kopinya……. Sampai jumpa lagi….

2 comments

Tinggalkan Balasan