Tez No İndirme Tez Künye Durumu
177330
Coupling speech recognition and rule-based machine translation / Ses tanıma ve kural-tabanlı otomatik çeviri sistemlerinin entegre edilmesi
Yazar:SELÇUK KÖPRÜ
Danışman: PROF. DR. ADNAN YAZICI
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Doğal dil işleme = Natural language processing ; Ses işleme = Speech processing
Onaylandı
Doktora
İngilizce
2008
147 s.
Bu tezin amacı, Otomatik Ses Tanıma (OST) sistemleri ile kural tabanlı Otomatik Çeviri (OÇ) sistemlerinin bağdaştırılmasını incelemektir. Bu tezde, Ses Çevirisi (SÇ) amacıyla OST ve OÇleri entegre eden özgün bir yaklaşım sunuyoruz. Sunulan yöntem, kelime-grafiği formatındaki ses verilerini işleyebilen ilk kural tabanlı OÇ sistemini içermesi açısından özgündür. Diğer kural tabanlı OÇ sistemleri ile kıyaslamak gerekirse, bizim sistemimiz kelime dizisine ek olarak kelime grafikleri de işleyebilmektedir. Dolayısıyla, OST ve kural tabanlı OÇ arasında önerilen entegrasyon yöntemi basit bir yazılım mühendisliği uygulamasından ötedir. Bağdaştırma yöntemimizin ilk-en iyi ve N-en iyi tekniklerinden daha iyi performans gösterdiklerini de ortaya koyuyoruz. İlk-en iyi ve N-en iyi teknikleri, OST ve kural tabanlı OÇ sistemlerini bağdaştırmak için kullanılan, bizim sunduğumuz yaklaşım haricindeki tek yöntemlerdir. Argümanlarımızın doğruluğunu deneylerle de kanıtlıyoruz.Kural tabanlı OÇ sistemlerinin SÇ işinde kullanılmasının önemli olduğunu düşünüyoruz ve bu konuda cevaplanması gereken sorular hala mevcuttur. Bağdaştırma ile ilgili literatürün çok önemli kısmı OST ile istatistiksel OÇ sistemlerinin entegrasyonu üzerinedir. Bunun sebebi, istatistiksel OÇ sistemlerinin kelime-grafiklerini girdi olarak işleyebiliyor olmasıdır. Bu şekilde, belirsizliklerin çözümlendiği yer OÇ bileşenine ötelenmektedir. Bu tezde sunduğumuz yeni yaklaşımla birlikte, aynı avantaj kural tabanlı OÇ sistemleri için de geçerli olacaktır. Bu kazanım, kural tabanlı OÇ sistemlerinin SÇ işinde etkin olarak kullanılmasını sağlayacaktır.
The objective of this thesis was to study the coupling of automatic speech recognition (ASR) systems with rule-based machine translation (MT) systems. In this thesis, a unique approach to integrating ASR with MT for speech translation (ST) tasks was proposed. The proposed approach is unique, essentially because it includes the first rule-based MT system that can process speech data in a word graph format. Compared to other rule-based MT systems, our system processes both a word graph and a stream of words. Thus, the suggested integration method of the ASR and the rule-based MT system is more detailed than a simple software engineering practice. The second reason why it is unique is because this coupling approach performed better than the first-best and N-best list techniques, which are the only other methods used to integrate an ASR with a rule-based MT system. The enhanced performance of the coupling approach was verified with experiments.The utilization of rule-based MT systems for ST tasks is important; however, there are some unresolved issues. Most of the literature concerning coupling systems has focused on how to integrate ASR with statistical MT rather than rule-based MT. This is because statistical MT systems can process word graphs as input, and therefore, the resolution of ambiguities can be moved to the MT component. With the new approach proposed in this thesis, this same advantage exists in rule-based MT systems. The success of such an approach could facilitate the efficient usage of rule-based systems for ST tasks.