Analisis Sentimen Opini Publik tentang Kerusakan Jalan di Sumatera Utara Menggunakan Metode Naive Bayes Berbasis Pengawasan Lemah (Berbasis Leksikon)
DOI:
https://doi.org/10.65371/metrokom.v2i2.131Kata Kunci:
Analisis Sentimen, Naïve Bayes, Lexicon-Based, Weak Supervision, Infrastruktur JalanAbstrak
Infrastruktur jalan merupakan aspek vital pembangunan daerah yang sering mendapat perhatian publik di media online, terutama di Sumatera Utara. Pemantauan opini publik secara manual terhadap isu ini kurang efisien karena volume data yang besar dan ketidakseimbangan sentimen yang didominasi oleh keluhan. Studi ini bertujuan untuk mengembangkan model analisis sentimen otomatis menggunakan pendekatan Weak Supervision yang menggabungkan metode berbasis leksikon untuk pelabelan otomatis dan algoritma Multinomial Naive Bayes untuk mengklasifikasikan opini publik ke dalam tiga kategori berbeda: positif, negatif, dan netral. Data dikumpulkan melalui teknik web scraping dari berbagai portal berita online. Untuk mengatasi ketidakseimbangan kelas data, studi ini menerapkan Synthetic Minority Over-sampling Technique (SMOTE) pada data pelatihan. Hasil pengujian pada data uji menunjukkan bahwa model mampu mencapai akurasi sebesar 70,93%. Model berkinerja sangat baik dalam mendeteksi sentimen negatif dengan nilai Presisi 0,86, dan mampu mengenali sentimen positif dengan Recall 0,70 berkat penerapan SMOTE. Berdasarkan hasil ini, model Naïve Bayes dapat digunakan secara efektif untuk mengklasifikasikan sentimen publik terhadap kerusakan jalan. Selain itu, temuan ini berfungsi sebagai referensi strategis dan rekomendasi bagi para pemangku kepentingan, seperti Inspektorat, untuk merumuskan kebijakan yang relevan dan berbasis data dalam upaya peningkatan infrastruktur dan pembangunan daerah.
Referensi
Afuan, L., Khanza, M., & Zahira Hasyati, A. (2025). Enhancing Sentiment Analysis of the 2024 Indonesian Presidential Inauguration on X Using Smote-Optimized Naive Bayes Classifier. Jurnal Teknik Informatika (JUTIF), 6(1), 325–333. https://doi.org/10.52436/1.jutif.2025.6.1.4290
Albab, M. U., P., Y. K., & Fawaiq, M. N. (2023). Optimization of the Stemming Technique on Text Preprocessing President 3 Periods Topic. Jurnal Transformatika, 20(2), 1–12. https://doi.org/10.26623/transformatika.v20i2.5374
Amal, I., & Jayanta. (2023). Perbandingan Pelabelan Otomatis Dan Manual Untuk Analisis Sentimen Terhadap Kenaikan Harga BBM Pertamina Pada Twitter Menggunakan Algoritma Support Vector Machine. Seminar Nasional Mahasiswa Ilmu Komputer Dan Aplikasinya (SENAMIKA), 4(2), 473–487. https://conference.upnvj.ac.id/index.php/senamika/article/view/2562
Badriyah, Chamidy, T., & Suhartono. (2025). Application of SMOTE in Sentiment Analysis of MyXL User Reviews on Google Play Store. JISKA (Jurnal Informatika Sunan Kalijaga), 10(1), 74–86. https://doi.org/10.14421/jiska.2025.10.1.74-86
Budaya, I. G. B. A., & Suniantara, I. K. P. (2024). Comparison of Sentiment Analysis Algorithms with SMOTE Oversampling and TF-IDF Implementation on Google Reviews for Public Health Centers. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 4(3), 1077–1086. https://doi.org/10.57152/malcom.v4i3.1459
Fatharani, D., & Syahrul, E. (2025). HYBRID SENTIMENT ANALYSIS OF MAXIM APP USERS USING SUPPORT VECTOR MACHINE AND LEXICON- BASED APPROACH. JITET (Jurnal Informatika Dan Teknik Elektro Terapan), 13(3), 1930–1937. https://doi.org/http://dx.doi.org/10.23960/jitet.v13i3S1.8148 HYBRID
Fikri, M. R., Handayanto, R. T., & Irwan, D. (2022). Web Scraping Situs Berita Menggunakan Bahasa Pemograman Python. Journal of Students ‘Research in Computer Science, 3(1), 123–136.
Firda, H., Putra, P., Oktadini, N. R., & Sevtiyuni, P. E. (2025). Perbandingan Pelabelan Rating-based dan Inset Lexicon-based dalam Analisis Sentimen Menggunakan SVM (Studi Kasus: Ulasan Aplikasi GoBiz di Google Play Store). Sistemasi: Jurnal Sistem Informasi, 14(2), 516–528. http://sistemasi.ftik.unisi.ac.id
Gibran, M. K., Rifki, M. I., Hasugian, A. H., Siahaan, A. T. A. A., Sahputra, A., & Ong, R. (2024). Sentiment Analysis of Platform X Users on Starlink Using Naive Bayes. Instal : Jurnal Komputer, 16(3), 210–220. https://doi.org/https://doi.org/10.54209/jurnalinstall.v16i03.240
Hafiz, Y. A., & Sudarmilah, E. (2023). IMPLEMENTASI WEB SCRAPING PADA PORTAL BERITA ONLINE. Inisiasi, 12(1), 55–60. https://doi.org/10.59344/inisiasi.v12i1.120
Haikal, B. F., Hasibuan, M. S., & Rifki, M. I. (2025). Perbandingan Algoritma Naïve Bayes Dan Dempster Shafer Untuk Diagnosis Penyakit ISPA. JOURNAL OF COMPUTER SCIENCE AND INFORMATICS ENGINEERING, 04(3), 147–157. https://doi.org/Doi: https://doi.org/10.55537/cosie.v4i3.1161
Hardiyanti, M., & Fajarlestari, M. K. (2025). Optimasi Analisis Sentimen Komentar Penonton Wayang Digital dengan SMOTE dan Algoritma Naïve Bayes. SISTEMASI, 14(3), 1–11. https://doi.org/https://doi.org/10.32520/stmsi.v14i3.5002
Hermawan, M. A., Faqih, A., & Dwilestari, G. (2025). Implementasi Akurasi Model Naive Bayes Menggunakan Smote Dalam Analisis Sentimen Pengguna Aplikasi Brimo. Jurnal Informatika Dan Teknik Elektro Terapan, 13(1), 855–862. https://doi.org/10.23960/jitet.v13i1.5748
Jelita, H. P., Saad, M. I., & Wahyuni. (2025). Penerapan Algoritma Naïve Bayes Dalam Analisis Sentimen Masyarakat Terhadap STMIK Widya Cipta Dharma. Bulletin of Information Technology (BIT), 6(2), 148–160. https://doi.org/10.47065/bit.v5i2.2029
Kurnia, Purnamasari, I., & Saputra, D. D. (2023). Analisis Sentimen Dengan Metode Naïve Bayes, SMOTE Dan Adaboost Pada Twitter Bank BTN. Jurnal JTIK (Jurnal Teknologi Informasi Dan Komunikasi), 7(2), 235–242. https://doi.org/10.35870/jtik.v7i3.707
Kurniawan, Y. I., Sidiq, R. H., Widadi, A. D., Yubiharto, A. R. A., Gibran, A. K., Aditama, M. R., & Laksono, F. A. T. (2025). Sentiment Analysis of Netflix App Reviews on Google Play Store using the Naive Bayes. JITAR: Journal of Information Technology and Applications Research, 1(2), 01–17. https://doi.org/10.63956/jitar.v1i2.31
Manoppo, M. R., Kolang, I. C., Nur Fiat, D. N., Mawara, R. M. C., Sumarno, A. D. P., Yusupa, A., & Tarigan, V. (2025). ANALISIS SENTIMEN PUBLIK DI MEDIA SOSIAL TERHADAP KENAIKAN PPN 12% DI INDONESIA MENGGUNAKAN INDOBERT. Jurnal Kecerdasan Buatan Dan Teknologi Informasi, 4(2), 152–163. https://doi.org/10.69916/jkbti.v4i2.322
Oktavia, A., Apriani, W., Putri, N., Rina, I., Purnata, H., Martono, S. M., Hanam, E. S., & Qomarotun Nurlaila, S. T. M. T. (2025). Matematika Teknik. PT Penerbit Qriset Indonesia.
Putra, A. H., & Salam, A. (2025). A Comparative Performance of SMOTE, ADASYN and Random Oversampling in Machine Learning Models on Prostate Cancer Dataset. Journal of Applied Informatics and Computing (JAIC), 9(3), 603–610. https://doi.org/10.30871/jaic.v9i3.9308
Rahmatullah, M. R. F., Andono, P. N., & Soeleman, M. A. (2025). Improving Random Forest Performance for Sentiment Analysis on Unbalanced Data Using SMOTE and BoW Integration: PLN Mobile Application Case Study. Scientific Journal of Informatics, 12(1), 1–10.
Rambe, M. R. A., Zufria, I., & Rifki, M. I. (2025). Analisis Sentimen Masyarakat pada Platform Media Sosial X ( Twitter ) terhadap Pelantikan Kabinet Merah Putih Menggunakan Bernoulli Naïve Bayes. Journal Of Information System, Computer Science And Information Technology |, 6(1), 83–102. file:///D:/KULIAH SEMSTER 5/ref/ref/Analisis Sentimen Masyarakat pada Platform Media Sosial X (Twitter) terhadap Pelantikan Kabinet Merah Putih Menggunakan Bernoulli Naïve Bayes.pdf
Ratnaswari, S., Wibowo, N. C., & Kartika, Y. S. D. (2025). ANALISIS SENTIMEN MENGGUNAKAN METODE LEXICON-BASED DAN SUPPORT VECTOR MACHINE PADA PRESIDEN DAN WAKIL PRESIDEN INDONESIA PERIODE 2024–2029. Jurnal Informatika Dan Teknik Elektro Terapan, 13(1), 362–368. https://doi.org/http://dx.doi.org/10.23960/jitet.v13i1.5604 ANALISIS
Rohmatun, L., & Baita, A. (2025). Machine Learning-Based Sentiment Analysis on Twitter (X): A Case Study of the “Kabur Aja Dulu” Issue Using SVM. Journal of Applied Informatics and Computing (JAIC), 9(4), 1972–1983. https://doi.org/10.30871/jaic.v9i4.9991
Sabrina, D., Sabilla, A. D., & Azizah, N. (2025). Kombinasi Vader Lexicon Dan Support Vector Machine Untuk Klasifikasi Sentimen Komentar Aplikasi Blu Bca. INSERT: Information System and Emerging Technology Journal, 6(1), 22–33. https://ejournal.undiksha.ac.id/index.php/insert/article/view/86240
Safira, A., & Hasan, F. N. (2023). ANALISIS SENTIMEN MASYARAKAT TERHADAP PAYLATTER MENGGUNAKAN METEODE NAIVE BAYES CLASSIFIER. Jurnal Sistem Informasi, 5(January), 59–70. https://doi.org/10.31849/zn.v5i1.12856
Saputra, C., Irsyad, H., & Rahman, A. (2025). Applied Information Technology and Computer Science Pemrosesan Query dan Pemeringkatan Judul Berita Terkait Gu- bernur Jawa Barat Menggunakan TF-IDF dan Cosine Similarity. Applied Information Technology and Computer Science, 4(1), 25–32. https://doi.org/https://doi.org/10.58466/aicoms.v3i2
Syah, I. R., Hoiriyah, & Walid, M. (2023). ANALISIS SENTIMEN PENGGUNAMEDIA SOSIAL TERHADAP APLIKASI M-HEALTH PEDULI LINDUNGI DENGAn METODE LEXICONBASED DAN NAÏVE BAYES. Indonesian Journal of Business Intelligence Volume, 6(1), 43–54. https://doi.org/http://dx.doi.org/10.21927/ijubi.v6i1.3275
Ulgasesa, R., Negara, A. B. P., & Tursina, T. (2022). Pengaruh Stemming Terhadap Performa Klasifikasi Sentimen Masyarakat Tentang Kebijakan New Normal. Jurnal Sistem Dan Teknologi Informasi (JustIN), 10(3), 286. https://doi.org/10.26418/justin.v10i3.53880
Ulhaq, A. L. D., & Suprayogi. (2025). Comparing Machine Learning Models for Sentiment Analysis of Textual Reviews. Journal of Applied Informatics and Computing (JAIC), 9(6), 3642–3647. https://doi.org/https://doi.org/10.30871/jaic.v9i6.11239
