Failure Prediction Using Ensemble Learning: A Comparative Study with Synthetic and Real-World Datasets

dc.contributor.authorÇiftpınar, Aslı Beyza
dc.contributor.authorKanar, Pelin
dc.contributor.authorCıcek, Zeynep Idil Erzurum
dc.date.accessioned2026-02-08T15:02:52Z
dc.date.available2026-02-08T15:02:52Z
dc.date.issued2025
dc.departmentBursa Teknik Üniversitesi
dc.description22LÖP171
dc.description.abstractThe ability to predict and prevent machine failures is a crucial task for businesses on a global scale at a time of increasing dependence on automation and technology. This paper primarily addressed a novel failure prediction model approach based on ensemble learning. Commonly used machine learning models including Decision Trees, K-Nearest Neighborhood, Support Vector Machines, and Logistic Regression and two different ensemble learning strategies were used: bagging and majority voting. The SZVAV real-life failure dataset provided by Lawrence Berkeley National Laboratory and the AI4I2020 Predictive Maintenance synthetic dataset were utilized to evaluate the performance of the proposed ensemble models. The preprocessing stage included the application of oversampling since there is an imbalance problem in both datasets. In this context, a comparison of three oversampling techniques was also presented for the datasets considered in the study. As a result of the tests, it was seen that the proposed models are superior to individual machine learning methods and Random Forest, which is an ensemble model itself, for the considered datasets. In addition, the proposed ensemble models were compared with the original failure prediction models previously presented in the literature on the AI4I2020 dataset, and it was reported that more successful results are obtained with the proposed approach.
dc.description.abstractMakine arızalarını tahmin etme ve önleme yeteneği, otomasyon ve teknolojiye olan bağımlılığın arttığı bir zamanda küresel ölçekte işletmeler için kritik bir görevdir. Bu çalışma öncelikle topluluk öğrenmeye dayalı özgün bir arıza tahmin modeli yaklaşımını ele almaktadır. Karar Ağaçları, K-En Yakın Komşuluk, Destek Vektör Makineleri ve Lojistik Regresyon dahil olmak üzere yaygın olarak kullanılan makine öğrenmesi modelleri ve iki farklı topluluk öğrenme stratejisi kullanılmıştır: torbalama ve çoğunluk oylaması. Lawrence Berkeley Ulusal Laboratuvarı tarafından sağlanan SZVAV gerçek yaşam arıza veri seti ve AI4I2020 Tahmini Bakım sentetik veri seti, önerilen topluluk modellerinin performansını değerlendirmek için kullanılmıştır. Her iki veri setinde de bir dengesizlik sorunu olduğu için ön işleme aşaması aşırı örnekleme uygulamasını içermektedir. Bu bağlamda, çalışmada ele alınan veri setleri için üç aşırı örnekleme tekniğinin bir karşılaştırması da sunulmuştur. Testler sonucunda, ele alınan verisetleri için önerilen modellerin bireysel makine öğrenmesi yöntemlerinden ve kendisi bir topluluk modeli olan Rastgele Orman'dan üstün olduğu görülmüştür. Ayrıca önerilen topluluk modelleri, AI4I2020 veri seti üzerinden literatürde daha önce sunulan orijinal hasar tahmin modelleri ile karşılaştırılmış ve önerilen yaklaşımla daha başarılı sonuçlar elde edildiği raporlanmıştır.
dc.description.sponsorshipEskisehir Technical University, Turkey Scientific Research Projects Committee [TR] Eskişehir Teknik Üniversitesi
dc.identifier.doi10.35414/akufemubid.1571811
dc.identifier.endpage797
dc.identifier.issn2149-3367
dc.identifier.issue4
dc.identifier.startpage785
dc.identifier.urihttps://doi.org/10.35414/akufemubid.1571811
dc.identifier.urihttps://hdl.handle.net/20.500.12885/3680
dc.identifier.volume25
dc.language.isoen
dc.publisherAfyon Kocatepe Üniversitesi
dc.relation.ispartofAfyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi
dc.relation.ispartofAfyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_DergiPark_20260207
dc.subjectStatistical Data Science
dc.subjectİstatistiksel Veri Bilimi
dc.titleFailure Prediction Using Ensemble Learning: A Comparative Study with Synthetic and Real-World Datasets
dc.title.alternativeTopluluk Öğrenmesi Kullanılarak Arıza Tahmini: Sentetik ve Gerçek Dünya Veri Setleriyle Karşılaştırmalı Bir Çalışma
dc.typeArticle

Dosyalar