Rastgele Orman ve Karar Ağacı yöntemlerinin karşılaştırılması: Bisikletli kaza analizi örnek çalışması

dc.contributor.advisorAkgün, Nurten
dc.contributor.authorSadık, Ebru
dc.date.accessioned2026-02-08T15:48:47Z
dc.date.available2026-02-08T15:48:47Z
dc.date.issued2025
dc.departmentBTÜ, Lisansüstü Eğitim Enstitüsü, İnşaat Mühendisliği Ana Bilim Dalı
dc.description.abstractKaza analizlerinde geleneksel regresyon yerine makine öğrenimi algoritmaları tercih edilmeye başlanmıştır. Makine öğrenimi algoritmaları bir öğrenme sürecine sahiptir bunun yanında sınıflandırma ve tahmin modelleri kurabilir, büyük ve küçük veri setleriyle çalışabilirler. Bu çalışmada dönel kavşaklarda meydana gelmiş bisikletli kazaları analiz edilmiştir. Veri setindeki bisikletli yaralanma derecesini bağımsız değişkenlere göre sınıflandırmak için makine öğrenmesi yöntemlerinden ikisi olan Karar Ağacı ve Rastgele Orman algoritmaları kullanılmıştır. Literatürde yapılan çalışmalar sınıflandırma açısından Karar Ağacı ve Rastgele Orman algoritmalarının yüksek doğruluk oranı verdiğini göstermektedir. Çalışmada Karar Ağacı ve Rastgele Orman algoritmalarının güçlü bir sınıflandırıcı olmasından yararlanarak hangi bağımsız değişkenin yaralanma derecesi üzerinde ne kadar etkisi olduğunu göstermek amaçlanmıştır. Ayrıca ortaya çıkan sonuçlarda iki makine öğrenmesi yönteminin karşılaştırması da yapılmıştır. Motorlu araçlar açısından kaza yaralanma derecesini büyük ölçüde azaltan dönel kavşaklar aynı etkiyi bisikletliler için göstermemektedir. Bisiklet sürücülerinin dönel kavşaklarda dezavantajlı durumda bulunmasından dolayı bisikletli kazaları analiz edilmiştir. Analizi gerçekleştirmek için 439 adet örnek kullanılmıştır. Veri seti İngiltere'nin Newcastle kentinde farklı dönel kavşaklarda meydana gelen bisikletli-motorlu kaza bilgilerini içermektedir. Veride yaralanma derecesi hafif ve ağır olmak üzere 2 kategoriye ayrılmıştır. Analizde yaralanma derecesi bağımlı değişkendir; Bağımsız değişkenler ise dönel kavşak geometrik elemanları, sürücülere ait sosyodemografik bilgiler, sürücü davranışı, hız limiti, hava koşullarıdır. Veri setinde bağımlı değişken olan yaralanma derecesi kategoriktir ve sınıflandırma işlemi yapılmıştır. Analizlerin gerçekleştirilmesi için R Programı tercih edilmiştir. Karar Ağacı ve Rastgele Orman birer denetimli öğrenme algoritmasıdır. Karar Ağacı ve Rastgele Orman algoritmalarında eğitim ve test için veriler %70-%30 şeklinde ayrılmıştır. Sınıflandırma doğruluğunu ölçmek için karışıklık matrisi kullanılmıştır. Karışıklık matrisinde, kullanılan yöntemin doğru ve yanlış tahmin ettiği değerler sayısal olarak ortaya konulur. Kullanılan algoritmanın doğruluk oranının yüksek olması iyi bir sınıflandırma algoritması seçimi için önemlidir. Analiz sonucunda Karar Ağacı %86,15 ve Rastgele Orman %83,33 sınıflandırma doğruluğu ortaya koymuştur. Literatürde genellikle Rastgele Ormanın Karar Ağacına göre daha yüksek doğruluk oranı verdiği görülmüştür. Bu çalışmada Rastgele Ormanın daha düşük sonuç vermesinin sebebinin veri seti kaynaklı olabileceği düşünülmektedir ve her seferinde seçilen %70'lik eğitim verisindeki değişim doğruluk oranını etkileyebilir. Kaza analizlerinde net bir makine öğrenimi algoritması önerilmesi doğru değildir. İleride yapılacak kaza analizi çalışmalarında farklı veri setleri üzerinde farklı makine öğrenimi algoritmaları da denenmelidir.
dc.description.abstractMachine learning algorithms have become increasingly popular in accident analysis, replacing traditional regression. Machine learning algorithms have a learning process and can build classification and prediction models, and can work with both large and small datasets. This study analyzed cyclist accidents that occurred at roundabouts. Two machine learning methods, Decision Tree and Random Forest algorithms, were used to classify cyclist injury severity in the dataset based on independent variables. Literature studies indicate that Decision Tree and Random Forest algorithms provide high accuracy in classification. This study aimed to demonstrate the impact of each independent variable on the injury severity by leveraging the robustness of Decision Tree and Random Forest algorithms. The results also compared the two machine learning methods. Roundabouts, which significantly reduce the injury severity for motor vehicles, do not have the same effect on cyclists. Because cyclists are disadvantaged at roundabouts, cyclist accidents were analyzed. 439 samples were used to perform the analysis. The dataset contains information on cyclist-motorist accidents occurring at various roundabouts in Newcastle, England. The data is divided into two categories: mild and severe. In the analysis, the degree of injury is the dependent variable; the independent variables are the roundabout geometric elements, sociodemographic information of the drivers, driver behavior, speed limit, and weather conditions. The dependent variable in the dataset, degree of injury, is categorical, and classification is performed. R software was used to perform the analyses. Decision Tree and Random Forest are both supervised learning algorithms. Data are split into 70% and 30% for training and testing in Decision Tree and Random Forest algorithms. A confusion matrix is used to measure classification accuracy. The confusion matrix numerically displays the values correctly and incorrectly predicted by the method used. A high algorithmic accuracy is crucial for selecting a good classification algorithm. The analysis revealed a classification accuracy of 86.15% for Decision Tree and 83.33% for Random Forest. In the literature, it is generally observed that Random Forest yields higher accuracy than Decision Tree. The lower results obtained with Random Forest in this study are thought to be due to the dataset, and the variation in the selected 70% training data each time may affect the accuracy rate. It is not appropriate to recommend a single machine learning algorithm for accident analysis. Future accident analysis studies should also test different machine learning algorithms on different datasets.
dc.identifier.endpage72
dc.identifier.startpage1
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=V-oEQd0LkkqRGCXNzJWCTSC9_V_i5gbN9xCdwRgtC6d_ihhsj-yjxgIyIcEtzcnZ
dc.identifier.urihttps://hdl.handle.net/20.500.12885/6343
dc.identifier.yoktezid978872
dc.language.isotr
dc.publisherBursa Teknik Üniversitesi
dc.relation.publicationcategoryTez
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_TEZ_20260207
dc.subjectİnşaat Mühendisliği
dc.subjectCivil Engineering
dc.titleRastgele Orman ve Karar Ağacı yöntemlerinin karşılaştırılması: Bisikletli kaza analizi örnek çalışması
dc.title.alternativeComparison of Random Forest and Decision Tree methods: Study of cyclist accident analysis
dc.typeMaster Thesis

Dosyalar