Iklan

Social Icons

Powered by Blogger.

Contoh Metodologi Penelitian



Advertisements




METODOLOGI PENELITIAN
1.1.   Regresi Kuantitatif: Prediksi Harga Mobil
Model regresi linier umumnya memprediksi rata-rata kolom target, mengingat satu set fitur input. Namun, dalam beberapa aplikasi, seperti prediksi harga, kami tertarik untuk memprediksi kisaran atau keseluruhan distribusi kolom target, bukan perkiraan tunggal.
Dalam percobaan ini, kami mencoba meramalkan harga sebuah mobil yang diberi beberapa atribut.
1.1.1   Data
Data terdiri dari 283 contoh, masing-masing dengan 7 atribut. Langkah pertama adalah preprocessing data, dengan menggunakan modul berikut:
·         Modul data yangtidak ada ketika ditarik diganti dengan 0 untuk numerical atau integer.
·         Data yang tidak integer / string diubah kedalam bentuk numerical.
·         Data dibagi menjadi pelatihan 70% dan set pengujian 30% menggunakan modul Split.

1.1.2  Parameter
Ada dua cara untuk mengatur parameter modul Regresi Linear ini, dengan menggunakan opsi properti modul:
1.      Parameter Utama
Disini kita memilih 5 atribut yang berkaitan langsung pada umumnya dengan harga jual sebuah mobil yaitu tahun, harga, kilometer, transmisi dan CC.
2.      Parameter pendukung
Karena transmisi merupakan polynominal datanya atau string , maka transmisi diubah dulu ke numerical yang selanjutnya diantara tranmisi manual atau transmisi otomatis dijadikan pembanding dengan atribut lainnya. Disini kita memakai transmisi otomatis yang dijadikan pembanding sehingga hilang.
Prediksi dari model regresi kuantitatif dapat diperoleh dengan menggunakan modul Model Skor generik. Outputnya memberikan kolom tambahan dengan prediksi untuk harga – harga mobil bekas dengan atribut yang ada..

LANGKAH KERJA
WhatsApp Image 2017-07-02 at 21.54.25.jpegDalam penelitian ini, data didapatkan dari hasil crawling website jual beli mobil yaituwww.carmudi.co.id. Data yang diambil yaitu harga dan spesifikasi mobil avanza yang dijual di website tersebut dengan kategori yang diambil yaitu, tahun, harga, klomenter, tranmisi, bahan bakar dan cc. Data yang diambil yaitu harga dan spesifikasi mobil avanza yang dijual di website tersebut dengan kategori yang diambil yaitu, tahun, harga, klomenter, tranmisi, bahan bakar dan cc. Data diambil menggunakan software fminer professional yang biasa digunakan untuk menarik data-data di web search engine atau yellow pages. Dengan skema dibawah , data yang diingikan dapat didapatkan.

Gambar 2.1 Skema Crawling fminer
Setelah data ditarik data masih mentah dan harus mengalami proses preprosesing. Proses preprosessing dilakukan di excel misalnya mengisi kolom yang kosong dengan angka 0 dan memisahkan tahun dan nama mobil agar bisa diolah nantinya. Data perlu melewati tahap ini karena data yang ditarik merupakan big data yang berdasarkan listing acak sesuai dengan format html web. Sehingga data masih tidak beraturan dan perlu diterjemahkan.
Gambar 2.2. Data Mentah

Kemudian data siap diolah setelah rapi sesuai dengan kriteria data rapidminer.








Gambar 2.3 Data yang telah dirapikan

Import data excel tersebut ke dalam rapidminer dengan klik add data. Format tidak  diubah tetap xls sesuai dengan format data hasil Fminer. Berikut dibawah ini adalah skema untuk menjalankan regresi linear untuk penelitian ini.

Gambar 2.4 Skema Regresi Linear


Selanjutnya pilih atribut yang ingin dijadikan parameter untuk memprediksi harga. Disini peneliti menggunakan lima parameter yang erat dengan harga mobil. Tentunya harga yang dijadikan role parameter agar muncul prediksi.

Gambar 2.5. Memilih Atribut

Lalu pilih harga sebagai role dan target role. Jadi harga merupakan variable dependen yang dipengaruhi oleh atribut lainnya yang tadi telah dipilih. Sesuai dengan yang kita inginkan yaitu memprediksi harga.
Gambar 2.6. Memilih Variabel Dependen

Mengingat atribut yang tadi dipilih ada yang merupakan polynominal yang fungsi regresi tidak dapat membacanya. Kita perlu mengkonversi atribut transmisi ke numerical. Nantinya transmisi akan dibagi menjadi dua kolom yaitu kolom transmisi manual dan tranmisi otomatis. Isinya hanya 1 dan 0 seperti biner. Pilih attribute filter type ke single dan pilih transmisi.
Gambar 2.7. Mengubah attribut polinomial

Drag select attributes dan pilih atribut transmisi yang ingin dihapus disini peneliti mengorbankan transmisi otomatis karena jumlahnya paling sedikit sebenarnya bisa saja tapi lebih baik pilih yang jumlahnya sedikit dari data yang ada.
Pilih Split Data untuk membagi data yang ada menjadi data tes dan data uji. Data set jadi kami telah menciptakan dua partisi salah satu yang terdiri dari 70% dari data dan dan partisi kedua yang terdiri dari 30% dari baris dan  ada 3 jenis pengambilan sampel linear sampel jika kita memilih linear pengambilan sampel apa yang secara cepat apakah akan memilih 70% untuk partisi pertama dan 30% dari baris partisi kedua untuk sampling random.

Gambar 2.8 Membagi Data

Masukkan fungsi Linear Regression, tanpa mengubah parameter. Lalu tambahkan juga untuk apply model untuk mengeksekusi model yang telah dibuat. Masukkan juga Performance Regression untuk memunculkan result dan data melihat tingkat kesalahan.

Gambar 2.9. Skema Akhir Rapidminer

HASIL DAN PEMBAHASAN
Regresi Linear digunakan untuk meramalkan suatu hal dari data numerik yang ada. Hasil dari regresi bisa dijadikan patokan untuk menentukan suatu keputusan. Dari data dan model regresi linear yang tadi dibuat. Telah dihasilkan data prediksi
Gambar 2.10. Hasil Prediksi Harga

Hasil yang tidak jauh dari harga aslinya. Tentunya ini sampling acak dari data yang telah diambil dari www.carmudi.co.id . Harga Avanza umumnya sekitar 100.000.000 lebih tergantung keadaan yang dicantumkan.
Untuk korelasi kuadrat dikatakan standar yang artinya data tersebar acak dan jarang terjadi galat. Dengan tersebarnya data secara merata menyebabkan variable dicocokan dengan variable lainnya untuk mendapatkan prediksi yang akurat. Hasil 0.288 artinya setiap data saling terkait sebanyak 0.288 kali dengan variable yang dipilih.

Untuk tingkat kesalahan akar kuadrat sekitar 27.000.000. Yang artinya prediksi rata-rata hanya berselisih 27.000.000 dengan harga aslinya berdasarkan atribut yang saling terkait.

Harga asli yang dibandingkan dengan atribut yang telah ditentukan diatas menunjukkan grafik seperti diatas. Harga terbanyak yang sesuai dengan atribut terkait yaitu Avanza diharga 150.000.000. Ini harga yang beredar dipasaran saat ini. Kemudian dibandingkan dengan prediksi harga yang muncul.
Grafik diatas menunjukan grafik harga prediksi yang muncul dari hasil regresi linear dengan atribut-atribut yang sudah ditentukan diproses sebelumnya. Sesuai dengan atribut yang dipasangkan harga yang ditunjukan yaitu sekitar 160.000.000 untuk sebuah mobil Avanza. Hasil ini bisa ditarik kesimpulan untuk menjual mobil Avanza sekitar harga 160.000.000. Dan bagi yang ingin membeli Avanza bekas bisa menawarnya disekitar harga 130.000.000 sampai 160.000.000.
Regresi linear terjadi diantara atribut tranmisi manual dan tahun mobil , yang dikalikan dengan koefisien rata-rata dari atribut lainnya. Yang menghasilkan regresi linear koefisien intercept 14342853821.367 hasil ini akan mempengaruhi 70% data pengujian dari seluruh data yang ada. Output dari hasil regresi linear dan data pengujian akan menghasilkan data prediksi harga berserta atribut terkaitnya.

Hasil Regresi Linear diatas yaitu antara transmisi manual dan tahun kedua atribut ini yang paling mempengaruhi harga sebagai variable utama. Koefisien dan error masing – masing atribut berbeda keduanya saling mempengaruhi variable harga. Tranmisi manual memiliki koefisien 5696437,235 koefisien ini akan dikalikan dengan harga asli dan atribut lainnya untuk menghasilkan harga prediksi. Sama halnya dengan atribut tahun yang memiliki koefisien 7191878,754.  Intersep, definisi secara metematis adalah suatu titik perpotongan antara suatu garis dengan sumbu Y pada diagram/sumbu kartesius saat nilai X = 0. Sedangkan definisi secara statistika adalah nilai rata-rata pada variabel Y apabila nilai pada variabel X bernilai 0. Dengan kata lain, apabila transmisi_manual tidak memberikan kontribusi, maka secara rata-rata, variabel tahun akan bernilai sebesar intersep.
KESIMPULAN
Prediksi harga mobil dapat dilakukan dengan algoritma regresi linear dengan memanfaatkan random sampling dari web jual beli mobil www.carmudi.co.id. Kita dapat menarik kesimpulan untuk menjual dengan harga berapa atau membeli dengan harga yang pantas.

Jika dilihat dari data hasil penelitian, harga yang dihasilkan pun tidak terlalu jauh dengan harga asli yang beredar. Sehingga ketika ingin menjual mobil bisa cepat laku dengan melihat pesaing dari harganya. Dan dengan harga yang pantas pun kita dapat membeli mobil dengan kualitas yang bagus dengan melihat prediksi dan atributnya.

REFERENSI
Elkan, Charles (2013). Predictive analytics and data mining. elkan@cs.ucsd.edu.
Chuancan Chen, Lulu Hao dan Cong Xu (2017). Comparative analysis of used car price evaluation models. American Institue of Physics.
Georg v Graevenitz, Christian Helmes dkk (2016). Does Online Seacrg Predict Sales? Evidence from Big Data for Car 
Artikel Terkait



Advertisements


Title : Contoh Metodologi Penelitian
Description : METODOLOGI PENELITIAN 1.      1.1.    Regresi Kuantitatif: Prediksi H arga M obil Model regresi linier umumnya memprediksi rata-r...

0 Response to "Contoh Metodologi Penelitian"

Post a Comment