Yazar "Büker, Aykut" seçeneğine göre listele
Listeleniyor 1 - 5 / 5
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe Angular Margin Softmax Loss and Its Variants for Double Compressed AMR Audio Detection(Association for Computing Machinery, Inc, 2021) Büker, Aykut; Hanilçi, CemalDouble compressed (DC) adaptive multi-rate (AMR) audio detection is an important but challenging audio forensic task which has received great attention over the last decade. Although the majority of the existing studies extract hand-crafted features and classify these features using traditional pattern matching algorithms such as support vector machines (SVM), recently convolutional neural network (CNN) based DC AMR audio detection system was proposed which yields very promising detection performance. Similar to any traditional CNN based classification system, CNN based DC AMR recognition system uses standard softmax loss as the training criterion. In this paper, we propose to use angular margin softmax loss and its variants for DC AMR detection problem. Although using angular margin softmax was originally proposed for face recognition, we adapt it to the CNN based end-to-end DC audio detection system. The angular margin softmax basically introduces a margin between two classes so that the system can learn more discriminative embeddings for the problem. Experimental results show that adding angular margin penalty to the traditional softmax loss increases the average DC AMR audio detection from 95.83% to 100%. It is also found that the angular margin softmax loss functions boost the DC AMR audio detection performance when there is a mismatch between training and test datasets.Öğe Deep convolutional neural networks for double compressed AMR audio detection(John Wiley and Sons Inc, 2021) Büker, Aykut; Hanilçi, CemalDetection of double compressed (DC) adaptive multi-rate (AMR) audio recordings is a challenging audio forensic problem and has received great attention in recent years. Here, the authors propose to use convolutional neural networks (CNN) for DC AMR audio detection. The CNN is used as (i) an end-to-end DC AMR audio detection system and (ii) a feature extractor. The end-to-end system receives the audio spectrogram as the input and returns the decision whether the input audio is single compressed (SC) or DC. As a feature extractor in turn, it is used to extract discriminative features and then these features are modelled using support vector machines (SVM) classifier. Our extensive analysis conducted on four different datasets shows the success of the proposed system and provides new findings related to the problem. Firstly, double compression has a considerable impact on the high frequency components of the signal. Secondly, the proposed system yields great performance independent of the recording device or environment. Thirdly, when previously altered files are used in the experiments, 97.41% detection rate is obtained with the CNN system. Finally, the cross-dataset evaluation experiments show that the proposed system is very effective in case of a mismatch between training and test datasets.Öğe Double Compressed AMR Audio Detection Using Long-Term Features and Deep Neural Networks(Ieee, 2019) Büker, Aykut; Hanilçi, CemalDetecting double compressed audio files is an important problem for audio forensics applications such as audio forgery detection and determining the authenticity of an audio file appearing as an evidence. In this paper, we focus on detecting double compressed adaptive multi-rate (AMR) audio using deep neural network (DNN) classifier and long-term average spectrum (LTAS) and long-term average cepstrum (LTAC) features. Experiments conducted on TIMIT database show that compression rate has a significant impact on the performance. LTAS and LTAC features yield similar performance with slight differences. Removing unvoiced audio frames is found to reduce the detection accuracy and multi-condition training does not bring any performance improvement.Öğe Double Compressed AMR Audio Detection Using Spectral Features With Temporal Segmentation(Institute of Electrical and Electronics Engineers Inc., 2021) Büker, Aykut; Hanilçi, CemalDouble compressed (DC) AMR audio detection is an important audio forensic problem which is used to authenticate the originality of an auido recording. Majority of the existing studies use audio features extracted from the AMR encoder parameters such as linear prediction (LP) coefficients. Recently, we proposed to use the long-term average spectrum (LTAS) features for DC AMR audio detection and promising results were achieved. In this paper, we propose a novel feature extraction techniques which does not require any prior knowledge about the details of the encoding and decoding processes of the AMR codec. The proposed features are extracted from the temporal segmentation of the short-term Fourier transform (STFT) representation of the audio signal. The proposed features are then classified using deep neural network (DNN) classifier. Experimental results conducted on two different databases show that the proposed features considerably outperform the long-term average spectrum (LTAS) features. The average detection rate is improved from 92.44% to 96.48% on MDSVC dataset and from 80.95% to 83.67% on TIMIT database with the proposed features.Öğe İki kez sıkıştırılmış ses sinyallerinin analizi ve otomatik olarak tespit edilmesi(Bursa Teknik Üniversitesi, 2023) Büker, Aykut; Hanilçi, CemalBu tez çalışmasında iki kez sıkıştırılmış ses sinyallerinin tespit edilmesi problemi ele alınacaktır. Ses kayıtları mahkemelerde delil olarak yaygın bir şekilde kullanılmaktadır. Bununla birlikte ses kaydının içeriğinin değiştirilip değiştirilmediğini doğrulamak önemli bir problemdir. Ses kaydında manipülasyon yapmak isteyen biri ses sinyalini öncelikle dalga formuna dönüştürmelidir. Dalga formu üzerinde değişiklikler yapıldıktan sonra bu değişiklikleri gizlemek için sıkıştırma işlemi ile aynı formata dönüştürebilir. Bu sebeple iki kez sıkıştırılmış ses sinyallerini tespit etmek oldukça önemlidir. Literatürde yapılan çalışmalarda iki kez sıkıştırılmış ses tespitinde genellikle sıkıştırma için kullanılan ses kodlayıcısı hakkında bilgiler kullanılarak öznitelikler elde edilmiştir. Bu tez çalışmasında kodlayıcı hakkında herhangi bir ön bilgi olmadan genel öznitelikler elde edilmeye çalışılarak daha başarılı iki kez sıkıştırılmış ses sinyalinin tespit edilmesi hedeflenmektedir. Ayrıca literatürde derin sinir ağlarının kullanıldığı çalışma sayısının çok sınırlı olması sebebi ile derin sinir ağlarının hem öznitelik çıkarma hem de sınıflandırma aşamalarındaki güçlerinden faydalanarak başarılı bir sistem geliştirmek hedeflenmektedir. Öznitelikleri derin öğrenme yapılarının eğitim aşamasında otomatik olarak öğrenen ve gürültü, kanal ve kayıt ortamı gibi performansı olumsuz etkileyebilecek değişimlere karşı başarılı, iki kez sıkıştırılmış ses tespit sistemi geliştirilecektir. Farklı derin öğrenme yapıları ve farklı veri kümeleri kullanarak detaylı analiz yapılacaktır. Tek bir veri kümesi ile eğitilen sistemin diğer veri kümelerindeki ses sinyalleri ile test edildiğinde de iki kez sıkıştırılmış sesleri tespit etmede başarılı olması hedeflenmektedir. Kullanılacak veri kümelerinden biri daha önceden farklı kodlayıcılar ile sıkıştırılmış ses sinyalleri içermekte olup bu ses sinyalleri kullanılarak iki kez sıkıştırılmış ses tespitindeki performans incelenecektir. Tez çalışmasının ilk kısmında, dar bant AMR kodlayıcı kullanılarak farklı bit-oranları ile sıkıştırma işlemi yapılarak bir kez ve iki kez sıkıştırılmış ses sinyalleri üretilecektir. Ses sinyallerinin spektrogramları kullanılarak derin öğrenme modelleri ile eğitilecektir. Farklı modeller ve farklı kayıp fonksiyonları kullanılarak sistemin daha yüksek başarı oranı vermesi için çalışmalar yapılmıştır. Literatürde geniş bant AMR kodlayıcı ile iki kez sıkıştırılmış ses tespiti problemi daha önce çalışmadığından, tezin ikinci kısmında geniş bant AMR kodlayıcı ile iki kez sıkıştırılmış ses sinyalleri üretildikten sonra bu veriler ile iki kez sıkıştırılmış ses tespit sistemi incelenecektir.












