Salah satu yang akan kami bahas algoritma naive bayes adalah jenis algoritma supervised learning, dimana algoritma tidak bisa belajar sendiri tetapi harus diberi contoh terlebih dahulu dengan cara memberi label pada dataset yang kita punya. Memberi label disini artinya adalah dataset kita telah diberikan nilai kebenarannya yang akan dijadikan sebagai nilai target atau nilai acuan. Untuk lebih lanjut tentang algoritma naive bayes mari simak artikel dibawah ini sampai selesai.
Daftar Isi Artikel
ToggleAlgoritma Naive Bayes Adalah
Naive Bayes adalah metode yang cocok untuk klasifikasi biner dan multiclass. Metode yang juga dikenal sebagai Naive Bayes Classifier ini menerapkan teknik supervised klasifikasi objek di masa depan dengan menetapkan label kelas ke instance/catatan menggunakan probabilitas bersyarat. Probabilitas bersyarat adalah ukuran peluang suatu peristiwa yang terjadi berdasarkan peristiwa lain yang telah (dengan asumsi, praduga, pernyataan, atau terbukti) terjadi.
Istilah supervised merujuk pada klasifikasi training data yang sudah diberi label dengan kelas. Misalnya, sebuah transaksi penipuan telah ditandai sebagai data transaksional. Kemudian, jika Anda ingin mengklasifikasikan transaksi di masa depan menjadi fraudulent/non-fraudulent (penipuan/non-penipuan), maka jenis klasifikasi itu akan disebut sebagai supervised.
Manfaat Algoritma Naive Bayes
Naive Bayes termasuk dalam keluarga algoritma penambangan data, yang mengubah kumpulan data yang sangat besar menjadi informasi yang berguna. Berikut ini beberapa kegunaan algoritma Naive Bayes:
- Mengidentifikasi wajah dan fitur-fitur wajah, seperti mata, hidung, mulut, dan alis.
- Memprediksi cuaca.
- Membantu dokter mendiagnosis risiko penyakit pasien, seperti kanker atau penyakit jantung.
- Digunakan pada Google News untuk mengelompokkan suatu berita, misalnya berita tentang politik, hiburan, gaming, atau edukasi.
- Pada e-mail, algoritma Naive Bayes digunakan untuk mengklasifikasikan apakah pesan yang masuk adalah spam atau tidak.
- Menggunakan data fMRI, algoritma Naive Bayes dapat memprediksi berbagai kondisi kognitif manusia dan menemukan cedera otak.Â
Tipe Algoritma Naive Bayes
Dirangkum dari IBM, ada berbagai macam algoritma Naive Bayes yang dibedakan berdasarkan distribusi nilai. Tiga tipe algoritma Naive Bayes yang populer yaitu:
- Gaussian Naive Bayes (GaussianNB)
Varian algoritma Naive Bayes yang menggunakan distribusi Gaussian (distribusi normal) dan variabel kontinu. Model ini digunakan untuk mencari rata-rata dan standar deviasi dari masing-masing kelas.
- Multinomial Naive Bayes (MultinomialNB)
Jenis algoritma ini mengasumsikan bahwa fitur berasal dari distribusi multinomial.
Varian ini berguna saat menggunakan data diskrit, seperti jumlah frekuensi, dan biasanya diterapkan dalam kasus penggunaan pemrosesan bahasa alami (natural language processing/NLP), seperti klasifikasi spam pada e-mail.
- Bernoulli Naive Bayes (BernoulliNB)
Varian ini menggunakan variabel Boolean, yaitu variabel dengan dua nilai, seperti Benar dan Salah atau 1 dan 0.
Contoh Konsep Probabilitas Bersyarat
Salah satu contoh konsep probabilitas bersyarat sederhana adalah pelemparan dua buah koin. Setiap koin memiliki dua sisi, yaitu angka dan gambar. Jadi ketika dua koin dilempar bersamaan, ada kemungkinan keduanya menunjukkan sisi yang sama atau berbeda.
Diketahui ruang sampelnya adalah sebagai berikut:
- Koin 1 = angka; Koin 2 = gambar
- Koin 1 = angka; Koin 2 = angka
- Koin 1 = gambar; Koin 2 = angka
- Koin 1 = gambar; Koin 2 = gambar
Jika menghitung probabilitasnya, maka probabilitas (P) kedua koin yaitu:
- Peluang kedua koin menunjukkan dua gambar = 1/4
- Peluang salah satu koin menunjukkan angka = 3/4
- Peluang koin kedua menunjukkan angka, dan koin pertama adalah gambar= ½
- Peluang koin kedua menunjukkan gambar, dan koin pertama adalah angka = ½
Kemudian untuk mengetahui berapa peluang koin pertama menunjukkan angka (kejadian A), dan koin kedua menunjukkan gambar (kejadian B), maka bisa menggunakan rumus probabilitas bersyarat berikut ini:
Rumus Probabilitas Bersyarat : P(A|B) = P(B|A)*P(A) / P(B)
- P (A|B) = Probabilitas bersyarat A yang di berikan oleh B
- P (B|A) = Probabilitas bersyarat B yang diberikan oleh A
- P(A) = Probabilitas kejadian A
- P(B) = Probabilitas kejadian B
P(A|B) = [ P(Koin pertama angka dan koin kedua adalah gambar) * P(Koin kedua gambar) ] / P(Koin pertama angka)
P(A|B)Â = [ (1/2) * (1/2) ] / (1/2)
Hasilnya = 1/2 = 0,5
Berdasarkan penghitungan, maka probabilitas bersyaratnya adalah ½ atau jika didesimalkan menjadi 0,5.
JIka kamu ingin mendalami apa itu algoritma naive bayes, kunjungi Kursus Data Science ITBOX. Kamu akan mempelajari algoritma selain naive bayes, seperti decision tree, linear regression dan lainnya.


