GithubHelp home page GithubHelp logo

ammarsufyan / emailspamdetection-weka Goto Github PK

View Code? Open in Web Editor NEW
1.0 1.0 0.0 74.88 MB

Proyek ini bertujuan untuk memeriksa bahwa email yang diterima adalah spam atau ham melalui klasifikasi teks di WEKA menggunakan algoritma J48 Decision Tree dan Naive Bayes Multinomial Text.

License: MIT License

classification email-spam-classifier j48 naive-bayes prediction weka

emailspamdetection-weka's Introduction

Spam Detection Using Weka

Rumusan Masalah

Setiap hari pengguna email menerima ratusan spam dari alamat baru yang secara otomatis dihasilkan oleh robot pengirim email. Untuk menyaring spam dengan metode tradisional, seperti whitelist hampir tidak mungkin. Penerapan metode text mining pada email dapat meningkatkan efisiensi penyaringan spam.

Tujuan Penelitian

Untuk memeriksa bahwa email yang diterima adalah spam atau ham melalui klasifikasi teks di WEKA menggunakan algoritma J48 Decision Tree dan Naive Bayes Multinomial Text. Setelah itu, dilakukan perbandingan algoritma dengan parameter tertentu untuk menentukan algoritma yang terbaik dalam melakukan klasifikasi dan prediksi email spam.

Dataset

Source: Spam/Ham Email Dataset

Implementasi

Algoritma J48

Algoritma J48 adalah sebuah algoritma turunan dari C4.5. Algoritma ini menghasilkan pohon biner dimana dalam proses klasifikasi pohon akan dibangun dan setiap tupel dari pohon tersebut akan diterapkan pada basis data dan hasil klasifikasi dari tupel tersebut. Algoritma J48 akan mengabaikan nilai yang tidak lengkap dalam proses pembuatan pohon. Dasar dari algoritma ini adalah untuk membagi data ke dalam beberapa bagian berdasarkan nilai atribut dari item yang ada pada training dataset. Algoritma J48 dapat melakukan klasifikasi baik melalui decision tree ataupun rules yang diperoleh dari pohon tersebut.

Algoritma Naive Bayes

Naive Bayes adalah algoritma machine learning yang sering digunakan dalam masalah klasifikasi teks. Naive Bayes didasarkan pada teorema Bayes. Algoritma Naive Bayes disebut "naif" karena membuat asumsi bahwa kemunculan fitur tertentu tidak tergantung pada kemunculan fitur lainnya. Salah satu model dari Naïve Bayes yang sering digunakan dalam klasifikasi teks adalah multinomial Naive Bayes. Multinomial Naive Bayes merupakan metode supervised learning sehingga setiap data perlu diberikan label sebelum dilakukan training. Pada penelitian kali ini, kami menggunakan Naive Bayes Multinomial Text.

Kesimpulan

Algoritma Naive Bayes lebih baik daripada J48 dalam kasus klasifikasi dan prediksi email spam. Naive bayes memiliki waktu yang lebih cepat dalam melakukan pemodelan dibandingkan J48. Terlihat pada gambar di atas hasil prediksi Naive Bayes lebih akurat daripada J48 dengan 20 email yang berhasil diklasifikasi dengan benar, sedangkan J48 hanya mengklasifikasi 17 email dengan benar.

image

image

emailspamdetection-weka's People

Contributors

ammarsufyan avatar dadangdut33 avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.