Kamu kurumlarına gelen iş taleplerinin yapay zeka yöntemleri ile sınıflandırılması
Yükleniyor...
Dosyalar
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Bursa Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
COVID-19 küresel salgını bilişim teknolojilerinin kullanımını dünya genelinde hızlı bir şekilde arttırmıştır. Günümüzde artık kamu kurumları ve özel işletmeler, kullanıcılardan (müşteri, çalışan vb.) gelecek talepleri çeşitli "İş Talep Sistemi" yazılımları ile internet üzerinden almaktadır. Bilişim teknolojilerinin yoğun kullanılmasıyla kamu kurumlarının veya özel işletmelerin departmanlarına çok sayıda başvurular yapılmakta bu da büyük çaplı verilerin işlenip bilgiye dönüştürülmesi anlamına gelmektedir. Yapay zekâ yöntemleri, büyük verilerden doğru çıkarımlar yapılmasında oldukça avantaj sağlamaktadır. Bu tezde yapay zekâ teknolojisi kullanılarak iş talep yazışmalarının hangi birime ait olacağının belirlenmesi otomatik hale getirilmeye çalışılmıştır. Böylece iş talep sistemlerinde ilgili birimin manuel olarak belirlenme süreçlerinde yaşanabilecek hataların azaltılması, zaman ve enerji kayıplarının önüne geçilmesi amaçlanmıştır. Bu tezde literatürde iş talep yazılımları ile ilgili paylaşılan herhangi bir veri setine rastlanmadığından ilk etapta veri seti elde edilmiştir. Bu tezde kullanılan veri seti, bir kamu kurumunda personeller tarafından gönderilen 20.602 iş talebini içermektedir. Daha sonra iş taleplerinin hangi birime ait olacağının tahmin edilmesi için LSTM mimarisi ve BERTurk, Word2Vec, Doc2Vec ve FastText kelime gömme yöntemleri kullanılarak dört farklı derin öğrenme tabanlı hibrit yöntem oluşturulmuştur. Hibrit yöntemlerin başarı seviyesinin arttırılması için veri setlerine temizleme ve/veya kök ayırma ön işlemleri uygulanmıştır. Son olarak hibrit yöntemler birbirleri ile karşılaştırılmıştır. Deneysel sonuçlarda, LSTM ve Word2Vec, LSTM ve Doc2Vec, LSTM ve FastText hibrit yöntemleri ile iş talepleri ortalama %92 başarı oranında sınıflandırabilmiştir. LSTM ve BERTurk hibrit yöntemi ise bu yöntemlere göre daha düşük başarı (%88) göstermiştir. Ön işlem adımlarından yalnızca temizle işlemi, LSTM ve BERTurk hibrit yönteminin başarısını %2 arttırabilmiştir. Temizleme ve kök ayırma veya yalnızca kök ayırma işleminin uygulanmasının, bu hibrit yöntemin başarısını arttırmadığı görülmüştür. Diğer yöntemlerde ise yalnızca her iki ön işlem aşamasının birlikte uygulanması başarı oranını %1 arttırmıştır. Sonuç olarak bu tezde iş talep sistemi yazılımı aracılığıyla iletilen başvurular, bir kamu kurumunda ilgili olabilecekleri birimlere göre yüksek doğruluk oranında sınıflandırılmıştır.
The global COVID-19 pandemic has rapidly increased the use of information technologies worldwide. Nowadays, public institutions and private businesses receive requests from users (customers, employees, etc.) through various "Job Demand System" software applications over the Internet. The extensive use of information technologies results in numerous demands for departments of public institutions or private businesses, which means processing and transforming large-scale data into information. Artificial intelligence methods provide significant advantages in making accurate inferences from big data. This thesis aims to automate the determination of which department the job request correspondence belongs to using artificial intelligence technology. Thus, it aims to reduce errors that may occur in the manual determination process of the relevant unit in job request systems and to prevent time and energy losses. A dataset was initially obtained since no dataset related to job demand software was found in the literature. The dataset used in this thesis includes 20.602 job requests sent by personnel in a public institution. Then, four different deep learning-based hybrid methods were created using the LSTM architecture and the word embedding methods BERTurk, Word2Vec, Doc2Vec, and FastText to estimate the job requests belonging to which department. Pre-processing steps such as cleaning and/or stemming were applied to the datasets to improve the success levels of the hybrid methods. Finally, the hybrid methods were compared to each other. In the experimental results, LSTM and Word2Vec, LSTM and Doc2Vec, and LSTM and FastText methods classified job demand with an average success rate of 92%. The LSTM and BERTurk method showed lower success (88%) than others. Only the cleaning step among the pre-processing steps improved the success of the LSTM and BERTurk hybrid method by 2%. It was observed that applying cleaning and stemming or only stemming did not improve the success of this hybrid method. In other methods, applying both pre-processing steps together increased the success rate by 1%. As a result, in this thesis, the job demand system software was classified accurately according to the units they may be relevant to in a public institution.
The global COVID-19 pandemic has rapidly increased the use of information technologies worldwide. Nowadays, public institutions and private businesses receive requests from users (customers, employees, etc.) through various "Job Demand System" software applications over the Internet. The extensive use of information technologies results in numerous demands for departments of public institutions or private businesses, which means processing and transforming large-scale data into information. Artificial intelligence methods provide significant advantages in making accurate inferences from big data. This thesis aims to automate the determination of which department the job request correspondence belongs to using artificial intelligence technology. Thus, it aims to reduce errors that may occur in the manual determination process of the relevant unit in job request systems and to prevent time and energy losses. A dataset was initially obtained since no dataset related to job demand software was found in the literature. The dataset used in this thesis includes 20.602 job requests sent by personnel in a public institution. Then, four different deep learning-based hybrid methods were created using the LSTM architecture and the word embedding methods BERTurk, Word2Vec, Doc2Vec, and FastText to estimate the job requests belonging to which department. Pre-processing steps such as cleaning and/or stemming were applied to the datasets to improve the success levels of the hybrid methods. Finally, the hybrid methods were compared to each other. In the experimental results, LSTM and Word2Vec, LSTM and Doc2Vec, and LSTM and FastText methods classified job demand with an average success rate of 92%. The LSTM and BERTurk method showed lower success (88%) than others. Only the cleaning step among the pre-processing steps improved the success of the LSTM and BERTurk hybrid method by 2%. It was observed that applying cleaning and stemming or only stemming did not improve the success of this hybrid method. In other methods, applying both pre-processing steps together increased the success rate by 1%. As a result, in this thesis, the job demand system software was classified accurately according to the units they may be relevant to in a public institution.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri, Bilgisayar ve Kontrol, Computer Engineering, Computer Science, Control