Yazar "Marangoz, Kadriye" seçeneğine göre listele
Listeleniyor 1 - 1 / 1
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe Türkçe metinlerde farklı temsil modelleri ve öğrenme yöntemleri ile duygu analizi karşılaştırması(Bursa Teknik Üniversitesi, 2023) Marangoz, Kadriye; Cingiz, Mustafa ÖzgürDuygu analizi çalışmaları sosyal medyanın gücünün artması ile birlikte toplum üzerinde hâkim olan duygunun belirlenmesi için oldukça önemlidir. Kişi ya da kurumlar kendileri hakkındaki düşünceleri değerlendirmek ve itibar derecelerini analiz edebilmek için sıklıkla bu tekniğe başvurmaktadırlar. Duygu analiz çalışmalarının kapsamı oldukça geniş olmakla birlikte birçok konuşma dili için çok sayıda araştırma alanı bulunmaktadır. Sürekli gelişen teknoloji ile birlikte duygu analizi için kullanılabilecek yöntem ve metotların sayısındaki artış, yöntem ve metotların kıyaslandığı çalışmaların önemini artırmaktadır. Türkçe dili için yapılan duygu analiz çalışmaları mevcut olup birden fazla veri kümesi üzerinde, ön işlem çalışmalarının yapılarak veya yapılmadan sunulduğu, farklı yöntem ve sınıflandırıcıların kıyaslandığı çalışmaların sayısının yeterli olmadığı görülmektedir. Bu tez çalışmasında, her biri yaklaşık 17 bin Türkçe kullanıcı yorumları içeren KEMİK veri kümesi ve içerisinde alt veri kümeleri bulunan HUMIR veri kümesi kullanılmıştır. Bu veri kümeleri üzerinde hem ön işlem çalışmalarının yapıldığı hem de yapılmadığı versiyonları çalışma kapsamında değerlendirilmiştir. Metinsel verilerin sınıflandırılabilmesi için kullanılan vektörleştirme yöntemleri olarak istatistiksel hesaplamalı yöntem olan TF-IDF, yapay sinir ağlarına dayalı dil modeller olan Word2Vec ve FastText, yapay sinir ağları ile eğitilmiş olasılıksal model olan GloVe ve transformer tabanlı model olan BERT modelleri tercih edilmiştir. Sınıflandırma için klasik makine öğrenmesi yöntemleri ile derin öğrenme tabanlı yöntemler ayrı ayrı kullanılmıştır. Klasik makine öğrenmesi yöntemleri olarak SVM, LR ve NB kullanılırken derin öğrenme tabanlı yöntemler olarak RNN, CNN, LSTM ve CNN+LSTM kullanılmıştır. Veri kümelerinin sahip olduğu sınıf sayısına göre ikili ve çoklu sınıflandırma gerçekleştirmiş olup farklı algoritma kombinasyonları denenmiştir. Elde edilen sonuçlar ile veri ön işlem adımlarının uygulandığı ve uygulanmadığı durumlarda elde edilen başarı değerleri kıyaslandığında veri ön işlem adımlarının başarı değerini büyük oranda etkilemediği görülmüştür. TF-IDF yönteminin klasik makine öğrenmesi yöntemlerinde daha iyi sonuçlar verdiği, yapay sinir ağı temelli metin vektörleştirme yöntemlerinin ise derin öğrenme tabanlı yöntemlerde daha iyi sonuç verdiği görülmüştür. Diğer bir yandan kullanılan hibrit model kombinasyonları ile kullanılan diğer model kombinasyonları kıyaslandığında elde edilen başarı değerleri arasındaki farkın çok yüksek olmadığı anlaşılmıştır.