Klasifikasi Data Menggunakan Metode Naïve Bayes - Weka Java GUI Chooser Version 3.8.0

in #programming8 years ago

Teori keputusan Bayes ialah merupakan sebuah pendekatan statistik fundamental di dalam pengenalan pola (Pattern Recognition). Pendekatan Bayes ini telah di dasarkan pada kuantifikasi trade-off antara berbagai keputusan klasifikasi bermetode probabilitas. Dalam keputusan ini terdapat dua proses penting yang dilakukan ketika melakukan proses klasifikasi yakni Learning (Training) : Proses pembelajaran yang menggunakan traning set. Sedangkan proses kedua yakni Testing : Menguji model dengan menggunakan data testing.

So, dalam tulisan ini saya akan membahas mengenai "Klasifikasi Data Menggunakan Metode Naïve Bayes". Dimana manfaat dari algortima Naïve Bayes ini adalah untuk memprediksi terhadap data-data tertentu. Untuk itu program yang akan saya gunakan ialah Weka berbasi Java GUI Chooser Version 3.8.0. Dikarenakan Weka merupakan sebuah paket tools Machine Learning praktis yang cocok di gunakan untuk menyelesaikan berbagai masalah-masalah data mining yang ada di dunia nyata. Khususnya pengklasifikasian data yang di dasari pendekatan dari machine learning.

PROSES KLASIFIKASI DATA


Sebelum memulai langkah proses klasifikasi ini, diperlukannya inputan data yang akan digunakan untuk pengklasifikasian. Data yang digunakan bebas pilihan, akan tetapi dalam percobaan ini saya menggunakan data yang simple seperti yang telah saya gunakan pada postingan pertama mengenai "Proses Menganalisis Data Dalam Data Mining" agar lebih mudah untuk dipelajari. Baik, langsung saja pada tahap proses langkah sebagai berikut ini :

  1. Mempersiapkan file cuaca.arff yang telah dibuat pada percobaan pertama sebagai data training untuk percobaan kedua.
  2. Membuat file dengan format (.arff) untuk digunakan sebagai data testing. Lihat gambar 1.1.
    Gambar 1.1 Isi file CuacaTesting.arff
  3. Buka aplikasi Weka kemudian pilih menu Explorer. Lihat gambar 1.2.
    Gambar 1.2 Memilih menu explorer
  4. Setelah menu explore terbuka maka langkah selanjutnya yaitu memilih file data training cuaca.arff yang telah dibuat pada percobaan sebelumnya dengan klik tab menu open file => pilih data yang akan diinputkan kemudian klik open. Lihat gambar 1.3.
    Gambar 1.3 Mengambil data yang akan diinputkan
  5. Setelah data training di inputkan selanjutnya klik tab Classify => klik Choose => pilih metode Naive Bayes pada folder Bayes. Lihat gambar 1.4.
    Gambar 1.4 Pilih Metode Naive Bayes
  6. Setelah memilih metode yang digunakan selanjutnya menginputkan data testingnya yaitu dengan langkah : pada tab Classify yang tadi conteng ceklist Supplied test set => klik tombol set => klik open file => pilih file CuacaTesting.arff => klik close => klik Start. Lihat gambar 1.5.
    Gambar 1.5 Input Data Testing
  7. Setelah proses klasifikasi selesai maka langkah selanjutnya yaitu menyimpan data hasil klasifikasi dengan format .arff agar hasil klasifikasi dapat dilihat yaitu dengan cara: klik kanan pada kotak area Result list => klik Visualize Classifier Errors = klik save dan simpan file dengan nama CuacaPrediksi.arff. Lihat gambar 1.6.
    Gambar 1.6 Save Data Hasil Klasifikasi

OUTPUT KLASIFIKASI DATA


Setelah proses pengklasifikasian selesai, tentunya kita ingin mengetahui output yang akan di hasilkan dai percobaan tersebut. Maka dari itu berikut langkah untuk melihat output dari hasil proses pengklasifikasian.

  1. Untuk melihat hasil klasifikasi dari data testing maka kita menggunakan tool Arffviewer pada Weka yaitu dengan cara: pada menu utama Weka klik tab Tools => klik menu Arffviewer. Lihat gambar 1.7.
    Gambar 1.7 Membuka Tool Arffviewer
  2. Setelah Arffviewer terbuka maka akan muncul jendela baru maka langkah selanjutnya yaitu : klik tab File => klik Open = > pilih file hasil klasifikasi CuacaPredik.arff yang telah disave pada langkah percobaan kemudian klik Open. Lihat gambar 1.8.
    Gambar 1.8 Memasukkan File Hasil Prediksi
  3. Data hasil klasisifikasi menggunakan metode Naive Bayes. Lihat gambar 1.9.
    Gambar 1.9 Data Hasil Klasifikasi

MENGANALISA PENGKLASIFIKASIAN DATA


Dari data hasil prediksi atau hasil klasifikasi dapat kita lihat bahwa :

  1. Jika nilai margin prediksinya mendekati angka 1 atau di atas 0,5 maka hasil prediksi adalah "ya" (dapat bermain tenis).
  2. Jika nilai margin prediksinya di bawah 0,5 atau minus maka hasil prediksinya adalah "tidak" (tidak dapat bermain tenis).
  3. Berdasarkan output hasil yang di dapat pada saat cuaca berangin tidak dapat bermain tenis. Berdasarkan output hasil yang di dapat pada saat cuaca hujan tidak dapat bermain tenis.

KESIMPULAN


Menyimpulkan bahwa hasil klasifikasi yang didapat dari data training kemudian dilakukan pengujian dengan data testing yang telah dibuat dan mengklasifikasikannya menggunakan metode naive bayes setelah di analisa dapat diambil kesimpulan bahwa hasil dari klasifikasi dapat dikatakan akurat karena beberapa hasil klasifikasi berbanding lurus dengan situasi nyata, yaitu sebagai berikut :

  1. Pada saat hujan kemungkinan besar kita tidak dapat bermain tenis, hasil klasifikasi juga menghasilkan jawaban tidak dengan margin nilai prediksinya adalah minus.
  2. Pada saat cuaca berangin kemungkinan kita juga tidak dapat bermain tenis, dan hasil klasifikasi juga menghasilkan jawaban tidak dengan margin nilai prediksinya adalah minus.


Follow me at :

Thanks For Reading This Post, If You Like, Upvote and Keep Resteem


-Komunitas Steemit Indonesia-

Sort:  

Postingan yang bagus bang @alfarisi, jika berkenan jangan lupa follow kembali saya @jekisatria .

Terima kasih banyak bang. Siap, Insha Allah akan saa follow kembali :) @jekisatria

Best cloud mining solution ever !!
you dont need to have your own computer to mine bitcoin or any other crypto currencies
cloud mining is much easier and affordable as you can just begin with 30$
I have invested only 100$ and got back 40$ in bitcoins after 2 months only.
use my code "R4Tlzf" and have 3% or more discount on your initial and later investment
Make sure to use the code each time you deposit
https://www.genesis-mining.com