Tez No |
İndirme |
Tez Künye |
Durumu |
409252
|
|
Tensor fusion: Learning in heterogeneous and distributed data / Tensör tümleştirme: Ayrı cinsten ve dağıtık verilerde öğrenme
Yazar:UMUT ŞİMŞEKLİ
Danışman: DOÇ. DR. ALİ TAYLAN CEMGİL
Yer Bilgisi: Boğaziçi Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
İngilizce
2015
178 s.
|
|
Bu tezde, büyük çaplı ve/ya farklı kaynaklardan toplanan ayrık veriler için iyi bir modelleme doğruluğu ve uygulanabilirlik ödünleşimi sağlayan bağlaşımlı matris ve tensör ayrışımı modelleri üzerinde yoğunlaşıyoruz. Bu tezdeki asıl amacımız bağlaşımlı tensör ayrışım modelleri için çıkarım yöntemi geliştirmek olacaktır. İlk olarak, olabilecek bütün model topolojilerini kapsamayı hedefleyen titiz bir tensör ayrışım simgelemi geliştireceğiz. Simgelemimiz, tensör ayrışım modellerinde paralel ve dağıtık çıkarım yapmaya olanak sağlayan kısmen ayrışabilir yapıyı vurgulamaktadır. İkinci olarak, bağlaşımlı ayrışım modellerinde çıkarım yöntemleri geliştireceğiz. Önerdiğimiz yöntemler üç ana grupta toplanabilir. İlk gruptaki yöntemlerde, enbüyük olabilirlik ve enbüyük sonsal kestirim için eniyileme tabanlı yöntemler üzerinde duracağız. İkinci grup yöntemler bağlaşımlı ayrışım modellerinde önemli bir rol oynayan ilgili ağırlık ve ıraksayları da beraber olarak kestirmektedir. Son olarak üçüncü grupta tam Bayesçi çıkarım yöntemleri üzerinde yoğunlaşacağız ve saklı değişkenlerin sonsal dağılımlarından örnek çekme amacıyla birçok Markov Zinciri Monte Carlo yöntemi geliştireceğiz. Önerdiğimiz yöntemleri birçok zorlu uygulamada sınayacağız. Bilhassa, ses işleme alanında görülen birçok zorlu uygulama için yeni ayrışım modelleri geliştireceğiz. Ayrıca, dağıtık çıkarım yöntemlerimizi büyük çaplı bağlantı kestirimi problemlerinde sınayacağız ve bu uygulamaların hepsi için başarılı sonuçlar göstereceğiz.
|
|
In this thesis, we focus on coupled matrix and tensor factorization models; that provide a good modeling accuracy -- practicality trade off for modeling large-scale and/or heterogeneous data that are collected from diverse sources. Our main concern in this thesis will be to develop inference methods for coupled tensor factorization models. We will first develop a rigorous tensor factorization notation, that aims to cover all possible model topologies and coupled factorization models. Our notation highlights the partially separable structure of tensor factorization models, which paves the way for developing parallel and distributed inference algorithms. Secondly, we will develop novel methods for making inference in coupled tensor factorization models. The proposed methods can be separated into three groups. In the first set of methods, we will focus on optimization-based approaches for making maximum likelihood and a-posteriori estimation of the latent variables. The second group of methods builds up on the first group and jointly estimates the relative weights and divergence functions, which play important role in coupled factorization models. Finally, in the third group, we will focus on full Bayesian inference, where we will develop several Markov Chain Monte Carlo methods for sampling from the posterior distributions of the latent variables. We will evaluate our methods on several challenging applications. We will develop novel factorization models for addressing challenging audio processing applications. We will also evaluate our distributed inference methods on large-scale link prediction applications, where we will report successful results in all of these applications. |