LSTM mimarisiyle bilgilendirici göğüs röntgeni altyazıları oluşturma

dc.contributor.authorGüzel, Ömer Faruk
dc.contributor.authorTanrıverdi, Harun
dc.contributor.authorBakal, Mehmet Gökhan
dc.date.accessioned2026-02-08T15:05:28Z
dc.date.available2026-02-08T15:05:28Z
dc.date.issued2025
dc.departmentBursa Teknik Üniversitesi
dc.description.abstractBiyomedikal görüntüleme, tıp uzmanları için en etkili tıbbi tarama prosedürüdür. Özellikle röntgen görüntüleri, tıbbi teşhis amacıyla yoğun bir şekilde referans noktası olarak kullanılmaktadır. Ancak, röntgen görüntülerinden altta yatan hususları anlamak önemli radyolojik bilgi gerektirir. Bu çalışmada, bir kodlayıcı modülü olarak DenseNet121 sinir ağı mimarisini ve kelime gömme katmanları olarak metinsel veri (altyazılar) öğelerini kullanan bir derin öğrenme modeli, verilen X-ışını görüntülerinin ilgili başlık / altyazı bilgilerini tahmin etmek için eğitilmiştir. Oluşturulan model, özellikle nöral makine çevirisi görevleri için kullanılan tipik bir diziden diziye modeldir. Deneylerde, eğitim ve test aşamaları için Indiana Üniversitesi tarafından hazırlanan Open-i veri tabanı kullanılmıştır. Veri kümesi, bir alan uzmanı tarafından oluşturulan XML formatında saklanan 7.470 X-ray görüntüsü ve 3.955 hasta raporundan oluşmaktadır. Metinsel raporlar izlenimler, bulgular, karşılaştırmalar ve endikasyonlar dahil olmak üzere dört özel başlık içermektedir. Model geliştirme sırasında, izlenim başlıkları altındaki metinsel verilerden eğitim ve test adımlarında yararlanılmıştır. Modelin performansını ölçmek için İki Dilli Değerlendirme Alt Çalışma Puanı (BLUE) hesaplanmış ve birincil performans değerlendirme metriği olarak kullanılmıştır. BLUE puanlarına göre en iyi performans puanı, diğer n-gram setlerine kıyasla (burada n: 1, 2 ve 3) 0,38368 BLUE puanı ile dört kelime (dört gram) tahmin edildiğinde elde edilmiştir. Bu araştırma çalışması, otomatik teşhis amaçlı tıbbi görüntü veri kümelerinde metin oluşturma görevinde diziden diziye modellerin gücünü göstermektedir.
dc.description.abstractBiomedical imaging is the most effective medical screening procedure for medical specialists. Specifically, X-ray images are intensively used as a reference point for medical diagnostic purposes. However, understanding the underlying matters from the X-ray images requires significant radiological knowledge. In this study, a deep learning model, which employs the DenseNet121 neural network architecture as an encoder module and textual data (captions) items as word embedding layers, is trained to predict the corresponding title/caption information of the given X-ray images. The generated model is a typical sequence-to-sequence model used particularly for neural machine translation tasks. In the experiments, the Open-i database curated by Indiana University is used for the training and testing phases. The dataset consists of 7,470 X-ray images and 3,955 patient reports stored in XML format, composed by a domain expert. The textual reports contain four specific captions, including impressions, findings, comparisons, and indications. During the model development, the textual data under the impression captions was exploited in the training and testing steps. To measure the model’s performance, the Bilingual Evaluation Understudy Score (BLUE) was calculated and utilized as the primary performance evaluation metric. Based on the BLUE scores, the best performance score was achieved when four words (four grams) were predicted with the BLUE score of 0.38368 compared to other n-gram sets (where n: 1, 2, and 3). This research effort demonstrates the power of sequence-to-sequence models on the text generation task in medical image datasets for automatic diagnosing purposes.
dc.identifier.doi10.61112/jiens.1529215
dc.identifier.endpage489
dc.identifier.issn2791-7630
dc.identifier.issue2
dc.identifier.startpage477
dc.identifier.urihttps://doi.org/10.61112/jiens.1529215
dc.identifier.urihttps://hdl.handle.net/20.500.12885/4673
dc.identifier.volume5
dc.language.isoen
dc.publisherİdris Karagöz
dc.relation.ispartofYenilikçi Mühendislik ve Doğa Bilimleri
dc.relation.ispartofJournal of Innovative Engineering and Natural Science
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_DergiPark_20260207
dc.subjectImage Processing
dc.subjectGörüntü İşleme [EN] Human-Computer Interaction
dc.subjectİnsan Bilgisayar Etkileşimi [EN] Deep Learning
dc.subjectDerin Öğrenme [EN] Bioinformatics
dc.subjectBiyoenformatik [EN] Natural Language Processing
dc.subjectDoğal Dil İşleme
dc.titleLSTM mimarisiyle bilgilendirici göğüs röntgeni altyazıları oluşturma
dc.title.alternativeGenerating informative chest X-ray captions with LSTM architecture
dc.typeArticle

Dosyalar