Bir otomotiv firmasında konu modelleme yaklaşımı kullanılarak çalışan önerilerinin değerlendirilmesi

Yükleniyor...
Küçük Resim

Tarih

2022

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Veri madenciliğinin bir alt kolu olan metin madenciliği, birçok dilde birçok farklı alanda yazılmış metinlerde özellik çıkarımı için kullanılmaktadır. Son yıllarda önem kazanan konu modelleme yöntemleri metin madenciliği uygulamalarında sıklıkla tercih edilmeye başlanmıştır. Konu modelleme, veri madenciliği, gizli veri keşfi ve veri ile metin belgeleri arasındaki ilişkileri bulmak için metin madenciliğinde en güçlü tekniklerden biridir. Büyük boyutlu dokümanlardaki gizli yapıyı denetimsiz şekilde ortaya çıkaran konu modelleme, başarılı bir yöntem olarak kabul görmüştür. Bir doküman kümesi içerisindeki belgelerin konu olarak adlandırılan sözcük grupları dokümanlar içerisinde gizli ve yapılandırılmamış bir biçimde bulunur. Bu konuların özelliği metin içerisinde çoğunlukla birlikte görülmeleri ve genellikle ortak veya birbirine benzeyen temayı paylaşan sözcüklerden oluşmalarıdır. Konu modellemede metinde sıkça birlikte görülen kelimeler kümelenerek soyut konular(abstract topic) üretilir ve ilgili metinler içerdikleri kelimelere göre kendisine en yakın olan bir veya daha fazla kümede konuçlandırılır. Birbirine yakın olabilecek ifadeler anlamsal uzayda soyut konu oluşturulacak şekilde gruplanırlar. Daha sonra bu dokümanlar oluşturulan gruplara ve içerdikleri kelimelere göre kümelenir. Günümüzün en büyük endüstrilerinden biri olan otomotiv endüstrisinde rekabetin fazla olması işletmelerin iyileştirme çalışmalarına önem vermeleri gerekliliğini doğurmuştur. Bu iyileştirmelerin arasında çalışanların önerileri oldukça önemli yer kaplamaktadır.Öneri sistemlerinin içeriğinin metinlerden oluşması, onları ileri metin madenciliği çalışmaları için uygun veri setleri haline getirmiştir. Çalışan önerilerinin konu modelleme ile analiz edilmesi, en çok hangi konularda öneriler geldiğini, hangi konulara yoğunlaşılması gerektiğini ve gelecekteki öneri ve iyileştirmelerle ilgili tahminler yapabilmeyi olanaklı hale getirebilecektir. Bu çalışmada bir otomotiv firmasının öneri sistemlerini analiz etmek için metin madenciliğine ait yöntemlerden Gizli Dirichlet Tahsisi (GDT) kullanılmıştır. Projemizde analiz için Azure Machine Learning aracı kullanılmıştır. En çok verilen öneri çeşiti "getirisi olmayan olumlu öneri"lerdir. Bu öneriler genellikle iş sağlığı ve güvenliği ile ilgili olmaktadır. 2. Sıradaki en çok verilen öneriler ise "öneri" yani getirisi olan, firmaya kazanç sağlayan önerilerdir. 3. Sırada "öneriden hızlı kaizene" yani çok kısa sürede sonuç alınabilen, getirisi yüksek öneriler bulunmaktadır. 4. Sırada "değerlendirilmek üzere havale" edilen öneriler bulunurken, en az verilen öneri türünün ise "devreye alınmayacak öneriler" olduğu görünmektedir.
Text mining, a sub-branch of data mining, is used for feature extraction in texts written in many languages and in many different fields. Subject modeling methods, which have gained importance in recent years, have started to be preferred frequently in text mining applications. Topic modeling is one of the most powerful techniques in text mining for data mining, discovery of hidden data, and finding relationships between data and text documents. Topic modeling, which reveals the hidden structure of large documents in an unsupervised manner, has been accepted as a successful method. Phrases called subjects of documents in a set of documents are found in documents in a hidden and unstructured form. The peculiarity of these topics is that they are often seen together in the text and usually consist of words that share a common or similar theme. In topic modeling, abstract topics are produced by clustering the words that are frequently seen together in the text, and the related texts are positioned in one or more clusters closest to the words they contain. Expressions that may be close to each other are grouped in the semantic space to form an abstract subject. These documents are then clustered according to the groups created and the words they contain. The high competition in the automotive industry, which is one of the largest industries of today, necessitated the businesses to attach importance to improvement studies. Among these improvements, the suggestions of the employees occupy a very important place. The fact that the content of the recommendation systems consists of texts has made them suitable data sets for advanced text mining studies. Analyzing employee suggestions with subject modeling will make it possible to make suggestions about which subjects are the most, which subjects should be focused on, and to make predictions about future suggestions and improvements. In this study, Latent Dirichlet Allocation (LDA), one of the text mining methods, was used to analyze the recommendation systems of an automotive company. Azure Machine Learning tool was used for analysis in our project. The most common type of suggestion is "positive suggestions with no return". These recommendations are generally related to occupational health and safety. 2. The most frequently given suggestions are "suggestions", that is, those that have returns and provide profit to the company. In the 3rd rank, there are "fast kaizene suggestions", that is, high-yielding suggestions that can be achieved in a very short time. 4. Suggestions that are "referred to be evaluated" are in the rank, while "recommendations that will not be put into action" seem to be the least given type of suggestion.

Açıklama

Anahtar Kelimeler

Konu modelleme, Gizli dirichlet tahsisi, LDA, Öneri sistemleri, Topic modeling, Latent Dirichlet Allocation, LDA, Recommendation systems

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Koleksiyon