Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma

Yükleniyor...
Küçük Resim

Tarih

2017

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Sekans etiketleme bir giriş dizisine karşılık bir çıkış dizisinin üretimidir. Giriş ve çıkış dizisinin içeriklerinegöre doğal dil işlemenin birçok konusu (varlık isim tanıma, makine çevirisi, morfolojik analiz, cümleleri öğelerine ayırma vb.) sekans etiketleme olarak tanımlanabilir. Bağlılık ayrıştırması, bir cümle içerisindekisözcükler arasındaki ilişkilerin ve ilişki türlerinin belirlenmesidir ve bir cümlenin anlamsal analizininyapılabilmesi için şarttır. Bağlılık ayrıştırması sekans etiketleme problemi olarak tanımlandığında iki çıkışdizisinin (ilişki türü, ilişkili kelime) birden üretilmesi gerekmektedir. Bizim önerimiz, özellikle Sekansetiketleme problemlerinin çözümünde sıklıkla kullanılan Şartlı Rastgele Alanların bağlılık ayrıştırmasıproblemi içinde kullanılabilir olduğudur. Ancak Şartlı Rastgele Alanlar tek çıkış üreten bir yöntemdir. Buzorluğu aşabilmek için iki çıkışlı (Bağlılık Türü ve Bağlanılan Kelime) bir problem olan Bağlılık Ayrıştırması iki parçaya bölünerek çözülmüştür. Ardından elde edilen sonuçlar birleştirilerek sistemin çıktısıolarak verilmiştir. Gerçekleştirilen bu çalışma ile Türkçe için en yüksek bağlılık ayrıştırması sonuçlarınaulaşılmıştır.
In the most general form Sequence Labelling is the production of an output sequence in response to an inputsequence. Many of natural language processing problems such as (entity name recognition, machinetranslation, morphological analysis, separation of the elements of sentence etc.) can be defined as a sequencelabelling. Dependency parsing is to determine the relationship and the type of the relationship between wordswithin a sentence and it is essential to perform semantic analysis of a sentence. When dependency parsing is defined as a sequence labelling problem, production of two outputs (relationship type, related words) isrequired. Our recommendation is to use the Conditional Random Fields (CRF) which is commonly used insequence labelling problems. However CRF is a method that produces a single output. To overcome thisdifficulty we propose to divide Dependency Parsing which is a problem with two outputs into two parts. Theoverall solution is provided by combining the results of these parts. With the performed operation we reached the best dependency parsing results for Turkish language.

Açıklama

Anahtar Kelimeler

[No Keywords]

Kaynak

Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi

WoS Q Değeri

N/A

Scopus Q Değeri

Q2

Cilt

32

Sayı

2

Künye