Fiziksel tabanlı işleme materyalleri için kabartı dokularının yapay sinir ağları ile sentezi

Yükleniyor...
Küçük Resim

Tarih

2022

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Prosedürel İçerik Üretimi (PİÜ), on yıllardır üzerinde çalışılan bir alandır. PİÜ, dijital ürünlerin maliyetlerini düşürmeyi mümkün kılabilir. Birçok dijital içerik, yaygın olarak kullanılan veya çok benzer olan varlıkları içerir. Bir varlık üretimi için uygun bir PİÜ fonksiyonu bulmak, üretim için gereken zamanı ve maliyeti azaltacaktır. Öte yandan, dijital varlıklar oluşturmak için işe yarar fonksiyonlar hazırlamak zordur. Bu tür fonksiyonlar, makine öğrenimi yöntemleri kullanılarak tahminlenebilir. Yeterli miktarda veri verildiğinde, belirli bir varlık türü üretmek için üretken bir yapay zeka modeli eğitilebilmektedir. Grafik İşlem Birimlerinde (GPU) yapılan iyileştirmeler sayesinde günümüzde yapay zeka modelleri oluşturmak daha kolay hale gelmiştir. Özellikle Yapay Sinir Ağları (YSA) popüler hale gelmiş ve yıllardır aktif olarak üzerinde çalışılmaktadır. Sınıflandırabilen veya örnek üretebilen modellerin eğitebilmesi, YSA'nın özelliklerindendir. Otokodlayıcılar ve Çekişmeli Üretici Ağlar (ÇÜA), üretken modellere örnektir. Üretken modelleri kullanarak, stilleri transfer etmek veya diğer karmaşık işlevleri tahminlemek de mümkündür. Fiziksel Tabanlı İşleme (FTİ) yöntemi, gerçekçi 3B modelleri ve sahneleri gerçek zamanlı olarak oluşturmanın bir yoludur. İyi sonuçlar elde edebilmek için çeşitli doku türlerinin kullanılması gerekmektedir. Kabartı dokuları, 3B model materyallerinde kullanılan doku türlerinden biridir. Yüzey normallerini ve yüksekliklerini simüle etmek için kullanılmaktadır. Normal dokuları, yüzey normal vektörlerini barındıran kabartı dokularıdır. Normal dokuları, otometrik stereo teknikleri kullanılarak veya yüksek detaylı modelin düşük detaylı versiyonuna yansıtılarak üretilebilmektedir. Söz konusu yöntemler zaman ve maliyet açısından pahalıdır. YSA ve PİÜ'yü birleştirmeye odaklanan birçok çalışma bulunmaktadır. Her ikisini de kullanarak, maliyetleri düşürürken makul kalitede malzeme dokuları üretmek mümkün olabilmektedir. Bu tezde, birkaç üretici yapay sinir ağı modeli eğitilmiştir. Sonuçları, ağ karmaşıklığı ile birbirleriyle karşılaştırılmıştır. Artan katman ve filtre sayılarının her zaman çıktı kalitesini yükseltmediği tespit edilmiştir. Karmaşık modellerde, kaybolan gradyan sorunu gözlemlenmiştir. Kaybolan gradyan problemi bir noktadan sonra modelin daha fazla gelişememesine ve eğitime devam etmenin faydasız olmasına sebep olmaktadır. Kalıntılı Sinir Ağları (ResNet) mimarisine sahip modellerin bu sorunu çözebileceği görülmüştür. Nihai sonuçlar ayrıca, veri artırmanın eğitim aşamasında büyük bir rol oynadığını göstermiştir.
Procedural Content Generation (PCG) is a field that has been studied on for decades. PCG may make it possible to lower costs of digital products. Many digital contents include commonly-used or very similar assets. Finding a proper function for PCG would decrease time and money required for the production. On the other hand, preparing useful functions to generate digital assets is difficult. This kind of functions can be approximated using machine learning methods. Given a sufficient amount of data, a generative artificial intelligence model can be trained to produce a specific type of asset. Thank to the improvements on Graphics Processing Units (GPU), it is easier nowadays to build artificial intelligence models. Especially, Artificial Neural Networks (ANN) have became popular and been worked on actively for years. Training models that can classify or produce samples is of the capabilities of ANN's. Autoencoders and Generative Adverserial Networks (GAN) are examples of generative models. Using generative models, it is also possible to transfer styles or approximate other complex functions. Physically Based Rendering (PBR) method is a way to render realistic 3D models and scenes in realtime. For good results, various type of textures are needed. Bump maps are a type of texure for 3D materials. They are used to simulate surface normals and heights. Normal maps are bump maps that store normal vectors of surface. They can be produced using photometric stereo techniques or projecting a high-poly model onto its low-poly version. These methods are time consuming and expensive. There are many studies that focus on combining ANN and PCG. Using both, it would be possible to produce material textures in reasonable quality while reducing the costs. In this thesis, several generative artificial neural network models were trained. Their results were compared to eachother by the network complexity. It was determined that increasing layer and filter numbers doesn't always higher the output quality. The complex models caused vanishing gradient problem. Vanishing gradient problem, at some point, stops the model from getting more improved and makes it ineffective to continue the training phase. It was understood that the models with the architecture of Residual Neural Networks (ResNet) can handle this problem. Final results also showed that data augmentation plays a big role on the training phase.

Açıklama

Anahtar Kelimeler

Derin Öğrenme, Evrişimsel Sinir Ağları, Prosedürel İçerik Üretimi, Fiziksel Tabanlı İşleme, Doku Sentezi, Deep Learning, Convolutional Neural Networks, Procedural Content Generation, Physically Based Shading, Texture Synthesis

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Koleksiyon