Komparasi Tingkat Akurasi Random Forest dan C4.5 Pada Klasifikasi Performa Mahasiswa

Authors

  • Sudarto Universitas Mikroskil Author
  • Erlanie Sufarnap Universitas Mikroskil Author
  • Mirza Ilhami Universitas Mikroskil Author

Keywords:

C4.5, Machine Learning, Performa Mahasiswa, Random forest, Information Gain

Abstract

Mahasiswa merupakan salah satu faktor keberhasilan bagi Perguruan Tinggi Negeri (PTN) dan Perguruan Tinggi Swasta (PTS). Sehingga pengukuran performa mahasiswa tentunya sangat penting dilakukan sebagai bagian dalam melakukan pengawasan dan memahami peningkatan performa mahasiswa. Peningkatan performa mahasiswa dipengaruhi oleh beberapa faktor seperti ekonomi keluarga, pendidikan orang tua, media sosial, lingkungan, prestasi akademik. Penelitian ini bertujuan untuk membandingkan metode random forest dan metode C4.5 dalam melakukan prediksi dan klasifikasi dataset performa mahasiswa. Penelitian ini dilakukan mulai dari tahap pengumpulan data menggunakan data sekunder dari  sumber repository UCI machine learning yang terdiri dari 145 data mahasiswa dan 33 atribut. Berikutnya dilakukan tahap prepocessing dengan melakukan seleksi fitur menggunakan information gain sehingga diperoleh 9 atribut yang berpengaruh dalam pengujian. Tahap pengujian dilakukan dengan split data terhadap data training dan data testing serta dengan menggunakan k-fold cross validation. Hasil dari pengujian menunjukkan bahwa nilai akurasi tertinggi yang diperoleh metode random forest sebesar 92,86 % melalui pengujian dengan split data 90:10. Untuk metode C4.5 diperoleh nilai akurasi tertinggi sebesar 75,34 % melalui pengujian dengan slit data 90:10. Dari hasil pengujian kedua metode tersebut diperoleh nilai akurasi metode random forest lebih unggul  17,52 % dibandingkan metode C4.5 sehingga layak direkomendasikan dalam melakukan prediksi dan klasifikasi pada dataset performa mahasiswa

Downloads

Published

2025-07-14