Spatial Audio Reproduction Using Analysis-based Synthesis Methods

Proje tanımı

Üç boyutlu ve holografik gösterim teknolojilerinin gelişimi ile birlikte bu teknolojileri kullanan üç boyutlu televizyon (3DTV), bilgisayar oyunları ve sanal gerçeklik sistemleri gibi uygulamalar araştırma laboratuvarlarının dışına çıkarak son kullanıcıya ulaşma imkanı bulmuştur. Bu sistemlerin daha gerçekçi ve sürükleyici olmaları için en temel gereksinim olan üç boyutlu görüntüler yanında, sesin de son kullanıcıya üç boyutlu olarak sunulabilmesi elzemdir. Ses alanlarının üç boyutlu kaydı, kodlaması ve üretimi ülkemizde araştırılmayan bir konu olmakla birlikte Avrupa, Amerika ve Japonya’daki üniversiteler, araştırma laboratuvarları ve şirketler tarafından özellikle 1970’li yılların başından itibaren yoğun olarak incelenmektedir. Günümüzde kullanılan üç boyutlu ve uzamsal ses sistemleri, çalışma prensipleri açısından ikiye ayrılırlar. Birinci türdeki sistemler, son kullanıcının dinlemesi için çok kanallı bir hoparlör sistemiyle sentezlenecek olan akustik alanın, gerçek bir akustik alanla, belli bir zamansal ve uzamsal frekans bandı aralığında fiziksel olarak birebir aynı olmasını hedefler. İkinci tür sistemler ise insan algısına dayalı sistemler olup, hoparlörler ya da kulaklıklarla üretilen sesin fiziksel kesinliğini değil algısal yeterliliğini amaçlar. Birinci türden sistemlere dalga cephesi sentezi (wave field synthesis, WFS) ve Ambisonik sistemler örnek olarak verilebilir. İkinci türden sistemlere örnek olarak ise ses üretiminin kulaklıklar üzerinden yapıldığı binaural ve hoparlörler üzerinden yapıldığı çok kanallı (multichannel) sistemler verilebilir. Birinci tür sistemler ekipman ve donanım gereksinimlerinin yüksek olması nedeniyle daha çok sanal gerçeklik uygulamalarında ve simülatörlerde, ikinci tür sistemler ise ekipman kısıtlarının izin verdiği ölçüde bilgisayar oyunları, telekonferans sistemleri, DVD ve Blu-ray gibi kayıt ortamlarında dağıtılan sinema filmlerinde kullanılır.

Halihazırda kullanılmakta olan uzamsal ses sistemleriyle ilgili en önemli sorunlardan biri terminal uyumluluğu sorunudur. Örneğin bir çokluortam ağının iki tarafında bulunan kullanıcılarca paylaşılan bir sanal ortamın birinci kullanıcısı 5.1 çok kanallı ses sistemi ve ikinci kullanıcısı binaural ses sistemi kullanıyor olsun. Birinci kullanıcı için üretilen çok kanallı ses sinyallerinin ikinci kullanıcı tarafından binaural ses sistemi üzerinden çalınabilmesi için çok kanallı ses için kodlanmış sinyallerin binaural ses sinyallerine dönüştürülmesi; tersi durumda da binaural ses için kodlanmış sinyallerin çok kanallı sistemde kullanılabilecek sinyallere dönüştürülmesi gereklidir. Bu işlemler için hesaplama karmaşıklığı ve maliyeti yüksek çapraz kodlama algoritmaları kullanılması gerekecektir. Aynı sanal ortamı paylaşan üçüncü bir kullanıcı Ambisonik ses sistemine sahipse, binaural- Ambisonik, çok kanallı-Ambisonik, Ambisonik-çok kanallı, binaural-çok kanallı, Ambisonik-binaural, ve çok kanallı-binaural dönüşümlerini sağlayabilecek altı değişik çapraz kodlama algoritması koşturulması gerekecektir. Bir diğer deyişle böyle bir senaryoda N değişik uzamsal ses sistemi için N(N-1) transkodlama algoritmasının eş zamanlı olarak koşturulması gerekecektir. Bazı kullanıcıların tablet bilgisayarlar gibi hesaplama gücü düşük sistemler kullanabiliyor olacakları düşünüldüğünde bu şekilde yapılacak iki yönlü transkodlama işlemlerinin uygulanabilir olmadığı görülecektir.

Uzamsal ses kayıtlarıyla ilgili bir diğer önemli sorun, kullanılması öngörülen uzamsal ses sistemini hedefleyerek yapılmış ses kayıtlarının uzamsal özelliklerinin (ses kaynaklarının yönü ve uzaklığı, kayıt yapılan ortamın yankışım özellikleri gibi) kayıt sonrasında etkileşimli olarak değiştirilmesinin mümkün olmamasıdır. Örneğin 5.1 çok kanallı uzamsal ses üretimi için yapılmış bir konser kaydından elde edilecek ses sahnesinde şarkıcının sesini seçici olarak arttırmak, müzik aletlerinden birinin sesini ise seçici olarak azaltmak mümkün değildir. Bu türden, ses sistemine özel kayıtlarda uzamsal ses üretiminin doğru şekilde yapılabilmesi için, kaydedilen kanallar arasındaki genlik ve faz farklarının korunuyor olması gerektiğinden, her bir kanaldaki ses sinyallerinin kayıt sonrasında düzenlemek ve kaydedilen ses sahnesini yeniden bağdamak amacıyla işlenmesi imkansız değilse de çok zordur.

Önerilen projenin amacı özel mikrofon dizilerinden elde edilen ses sinyallerinin işlenmesi yoluyla, kaydedilen ses sahnesinin ses nesneleri ve akustik öznitelik bileşenlerine ayrılması ve bu şekilde uzamsal ses sistemi türünden bağımsız bir ses kayıt ve kodlama biçemi geliştirilmesidir. Proje TÜBİTAK 1001 Bilimsel ve Teknolojik Araştırma Projelerini Destekleme Programı (kontrat numarası 113E531) desteği ile ODTÜ Enformatik Enstitüsü bünyesinde yürütülmektedir. Proje hakkında daha detaylı bilgi edinmek için sağdaki gezinti çubuğunu kullanabilirsiniz.

Proje tanımı

Pages

Search | Ara

News | Haberler

Archives | Arşiv

Categories | Kategoriler