Advertisements
METODOLOGI PENELITIAN
1.1.
Regresi
Kuantitatif: Prediksi Harga Mobil
Model regresi linier umumnya memprediksi
rata-rata kolom target, mengingat satu set fitur input. Namun, dalam beberapa
aplikasi, seperti prediksi harga, kami tertarik untuk memprediksi kisaran atau
keseluruhan distribusi kolom target, bukan perkiraan tunggal.
Dalam percobaan ini, kami mencoba
meramalkan harga sebuah mobil yang diberi beberapa atribut.
1.1.1
Data
Data terdiri dari 283 contoh, masing-masing dengan 7 atribut. Langkah
pertama adalah preprocessing data, dengan menggunakan modul berikut:
·
Modul data yangtidak ada ketika ditarik diganti dengan 0 untuk
numerical atau integer.
·
Data
yang tidak integer / string diubah kedalam bentuk numerical.
·
Data dibagi menjadi pelatihan 70% dan
set pengujian 30% menggunakan modul Split.
1.1.2
Parameter
Ada dua cara untuk mengatur parameter modul Regresi Linear ini, dengan
menggunakan opsi properti modul:
1. Parameter Utama
Disini kita memilih 5 atribut yang berkaitan langsung pada
umumnya dengan harga jual sebuah mobil yaitu tahun, harga, kilometer, transmisi
dan CC.
2. Parameter pendukung
Karena transmisi merupakan polynominal datanya atau string ,
maka transmisi diubah dulu ke numerical yang selanjutnya diantara tranmisi
manual atau transmisi otomatis dijadikan pembanding dengan atribut lainnya.
Disini kita memakai transmisi otomatis yang dijadikan pembanding sehingga
hilang.
Prediksi dari model regresi kuantitatif
dapat diperoleh dengan menggunakan modul Model Skor generik. Outputnya
memberikan kolom tambahan dengan prediksi untuk harga – harga mobil bekas dengan atribut yang ada..
LANGKAH
KERJA
Dalam penelitian ini, data didapatkan
dari hasil crawling website jual beli mobil yaituwww.carmudi.co.id. Data yang diambil yaitu harga dan
spesifikasi mobil avanza yang dijual di website tersebut dengan kategori yang
diambil yaitu, tahun, harga, klomenter, tranmisi, bahan bakar dan cc. Data yang
diambil yaitu harga dan spesifikasi mobil avanza yang dijual di website
tersebut dengan kategori yang diambil yaitu, tahun, harga, klomenter, tranmisi,
bahan bakar dan cc. Data diambil menggunakan software fminer professional yang
biasa digunakan untuk menarik data-data di web search engine atau yellow pages.
Dengan skema dibawah , data yang diingikan dapat didapatkan.
Gambar 2.1 Skema Crawling fminer
Setelah
data ditarik data masih mentah dan harus mengalami proses preprosesing. Proses
preprosessing dilakukan di excel misalnya mengisi kolom yang kosong dengan
angka 0 dan memisahkan tahun dan nama mobil agar bisa diolah nantinya. Data
perlu melewati tahap ini karena data yang ditarik merupakan big data yang
berdasarkan listing acak sesuai dengan format html web. Sehingga data masih
tidak beraturan dan perlu diterjemahkan.
Gambar 2.2. Data
Mentah
Kemudian
data siap diolah setelah rapi sesuai dengan kriteria data rapidminer.
Gambar 2.3 Data yang telah dirapikan
Import
data excel tersebut ke dalam rapidminer dengan klik add data. Format tidak diubah tetap xls sesuai dengan format data
hasil Fminer. Berikut dibawah ini adalah skema untuk menjalankan regresi linear
untuk penelitian ini.
Gambar 2.4 Skema
Regresi Linear
Selanjutnya pilih atribut yang ingin dijadikan parameter untuk memprediksi harga. Disini peneliti menggunakan lima parameter yang erat dengan harga mobil. Tentunya harga yang dijadikan role parameter agar muncul prediksi.
Gambar 2.5.
Memilih Atribut
Lalu
pilih harga sebagai role dan target role. Jadi harga merupakan variable
dependen yang dipengaruhi oleh atribut lainnya yang tadi telah dipilih. Sesuai
dengan yang kita inginkan yaitu memprediksi harga.
Gambar 2.6. Memilih
Variabel Dependen
Mengingat
atribut yang tadi dipilih ada yang merupakan polynominal yang fungsi regresi
tidak dapat membacanya. Kita perlu mengkonversi atribut transmisi ke numerical.
Nantinya transmisi akan dibagi menjadi dua kolom yaitu kolom transmisi manual
dan tranmisi otomatis. Isinya hanya 1 dan 0 seperti biner. Pilih attribute
filter type ke single dan pilih transmisi.
Gambar 2.7. Mengubah attribut polinomial
Drag
select attributes dan pilih atribut transmisi yang ingin dihapus disini
peneliti mengorbankan transmisi otomatis karena jumlahnya paling sedikit
sebenarnya bisa saja tapi lebih baik pilih yang jumlahnya sedikit dari data
yang ada.
Pilih Split Data untuk membagi data yang ada menjadi data tes dan data
uji. Data set jadi kami telah menciptakan dua partisi salah satu yang terdiri
dari 70% dari data dan dan partisi kedua yang terdiri dari 30% dari baris
dan ada 3 jenis pengambilan sampel
linear sampel jika kita memilih linear pengambilan sampel apa yang secara cepat
apakah akan memilih 70% untuk partisi pertama dan 30% dari baris partisi kedua
untuk sampling random.
Gambar 2.8 Membagi Data
Masukkan
fungsi Linear Regression, tanpa mengubah parameter. Lalu tambahkan juga untuk apply
model untuk mengeksekusi model yang telah dibuat. Masukkan juga Performance
Regression untuk memunculkan result dan data melihat tingkat kesalahan.
Gambar 2.9. Skema Akhir Rapidminer
HASIL DAN PEMBAHASAN
Regresi Linear digunakan untuk meramalkan suatu hal
dari data numerik yang ada. Hasil dari regresi bisa dijadikan patokan untuk
menentukan suatu keputusan. Dari data dan model regresi linear yang tadi
dibuat. Telah dihasilkan data prediksi
Gambar 2.10. Hasil Prediksi Harga
Hasil
yang tidak jauh dari harga aslinya. Tentunya ini sampling acak dari data yang
telah diambil dari www.carmudi.co.id . Harga Avanza umumnya sekitar
100.000.000 lebih tergantung keadaan yang dicantumkan.
Untuk
korelasi kuadrat dikatakan standar yang artinya data tersebar acak dan jarang
terjadi galat. Dengan tersebarnya data secara merata menyebabkan variable
dicocokan dengan variable lainnya untuk mendapatkan prediksi yang akurat. Hasil
0.288 artinya setiap data saling terkait sebanyak 0.288 kali dengan variable
yang dipilih.
Untuk
tingkat kesalahan akar kuadrat sekitar 27.000.000. Yang artinya prediksi
rata-rata hanya berselisih 27.000.000 dengan harga aslinya berdasarkan atribut
yang saling terkait.
Harga
asli yang dibandingkan dengan atribut yang telah ditentukan diatas menunjukkan
grafik seperti diatas. Harga terbanyak yang sesuai dengan atribut terkait yaitu
Avanza diharga 150.000.000. Ini harga yang beredar dipasaran saat ini. Kemudian
dibandingkan dengan prediksi harga yang muncul.
Grafik
diatas menunjukan grafik harga prediksi yang muncul dari hasil regresi linear
dengan atribut-atribut yang sudah ditentukan diproses sebelumnya. Sesuai dengan
atribut yang dipasangkan harga yang ditunjukan yaitu sekitar 160.000.000 untuk
sebuah mobil Avanza. Hasil ini bisa ditarik kesimpulan untuk menjual mobil
Avanza sekitar harga 160.000.000. Dan bagi yang ingin membeli Avanza bekas bisa
menawarnya disekitar harga 130.000.000 sampai 160.000.000.
Regresi
linear terjadi diantara atribut tranmisi manual dan tahun mobil , yang
dikalikan dengan koefisien rata-rata dari atribut lainnya. Yang menghasilkan
regresi linear koefisien intercept 14342853821.367 hasil ini akan mempengaruhi
70% data pengujian dari seluruh data yang ada. Output dari hasil regresi linear
dan data pengujian akan menghasilkan data prediksi harga berserta atribut
terkaitnya.
Hasil Regresi Linear diatas yaitu antara transmisi
manual dan tahun kedua atribut ini yang paling mempengaruhi harga sebagai
variable utama. Koefisien dan error masing – masing atribut berbeda keduanya
saling mempengaruhi variable harga. Tranmisi manual memiliki koefisien
5696437,235 koefisien ini akan dikalikan dengan harga asli dan atribut lainnya
untuk menghasilkan harga prediksi. Sama halnya dengan atribut tahun yang
memiliki koefisien 7191878,754. Intersep,
definisi secara metematis adalah suatu titik perpotongan antara suatu garis
dengan sumbu Y pada diagram/sumbu kartesius saat nilai X = 0. Sedangkan
definisi secara statistika adalah nilai rata-rata pada variabel Y apabila nilai
pada variabel X bernilai 0. Dengan kata lain, apabila transmisi_manual tidak
memberikan kontribusi, maka secara rata-rata, variabel tahun akan bernilai
sebesar intersep.
KESIMPULAN
Prediksi harga mobil dapat dilakukan
dengan algoritma regresi linear dengan memanfaatkan random sampling dari web
jual beli mobil www.carmudi.co.id. Kita dapat menarik kesimpulan untuk
menjual dengan harga berapa atau membeli dengan harga yang pantas.
Jika dilihat dari data hasil
penelitian, harga yang dihasilkan pun tidak terlalu jauh dengan harga asli yang
beredar. Sehingga ketika ingin menjual mobil bisa cepat laku dengan melihat
pesaing dari harganya. Dan dengan harga yang pantas pun kita dapat membeli
mobil dengan kualitas yang bagus dengan melihat prediksi dan atributnya.
REFERENSI
Chuancan Chen, Lulu Hao dan Cong Xu (2017). Comparative analysis of used car price
evaluation models. American Institue of Physics.
Georg v Graevenitz, Christian Helmes dkk (2016).
Does Online Seacrg Predict Sales?
Evidence from Big Data for Car
Artikel Terkait
Advertisements
Title : Contoh Metodologi Penelitian
Description : METODOLOGI PENELITIAN 1. 1.1. Regresi Kuantitatif: Prediksi H arga M obil Model regresi linier umumnya memprediksi rata-r...
Description : METODOLOGI PENELITIAN 1. 1.1. Regresi Kuantitatif: Prediksi H arga M obil Model regresi linier umumnya memprediksi rata-r...
0 Response to "Contoh Metodologi Penelitian"
Post a Comment