Tez No İndirme Tez Künye Durumu
682636
Towards deeply intelligent interfaces in relational databases / İlişkisel veri tabanlarında derin akıllı arayüzler üzerine
Yazar:ARİF USTA
Danışman: PROF. DR. ÖZGÜR ULUSOY
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2021
116 s.
İlişkisel veri tabanları, yapısal bir şekilde veri depolamayı sağlayan, en popüler ve yaygın olarak kullanılan alt yapılardan biridir. Veriye erişmek için, kullanıcılar ulaşmak istedikleri bilgileri Yapılandırılmış Sorgu Dili (SQL) kullanarak uygun sorgularla ifade etmek zorundadır. SQL oldukça anlatımcı ve esnek bir dildir; ancak kullanıcının, sorgunun yazıldığı veri tabanının temelinde yatan şemayı bilmesi ve SQL sözdizimine aşina olması gerekir, ki sıradan kullanıcılar için bu durum kolay değildir. Bu amaçla, derin öğrenme tekniklerinden yararlanarak ilişkisel veri tabanlarında kullanılmak üzere daha akıllı kullanıcı arayüzleri yapmak için iki farklı strateji önerilmektedir. İlk çalışmamızda, doğal dil sorgularını SQL'e tercüme etmeyi amaçlayan İlişkisel Veri Tabanına Yönelik Doğal Dil Arayüzleri'nde kullanılan anahtar sözcük eşleme problemi için çözüm sunulmaktadır. Anahtar sözcük eşleme, dizi etiketleme problemi olarak ele alınmaktadır. Doğal dil sorgularının sözcük türlerini de kullanan bu özgün yaklaşım, gözetimli derin öğrenme kullanmaktadır. DBTagger (Database Tagger) adı verilen bu yaklaşım, uçtan uca ve şemadan bağımsız bir çözümdür. Web arama motorlarında yaygın olarak kullanılan ve oldukça bilinen bir strateji olan sorgu tavsiyesi paradigması, uzman kullanıcıların sorgularını sıradan kullanıcılara tavsiye ederek bilgiye erişim sürecinde yardım eder. İkinci çalışmamızda, derin öğrenmeden yararlanarak ilişkisel veri tabanlarında kullanılmak üzere bağlamsal sorgu tavsiye algoritması, Conquer, sunulmaktadır. İlk olarak, veri tabanı satırlarının gizli uzaydaki temsillerini oluşturmak amacıyla Çizge Sinir Ağları kullanılmaktadır. SQL sorguları, sorgunun sonucunda dönen satırların temsillerinin ortalaması alınarak semantik vektör ile temsil edilmektedir. Tanık-Temelli bir yaklaşım olarak, tavsiyeler üretmek için sorguların nihai temsillerinin üzerine kosinüs benzerliği kullanılmaktadır.
Relational databases is one of the most popular and broadly utilized infrastructures to store data in a structured fashion. In order to retrieve data, users have to phrase their information need in Structured Query Language (SQL). SQL is a powerfully expressive and flexible language, yet one has to know the schema underlying the database on which the query is issued and to be familiar with SQL syntax, which is not trivial for casual users. To this end, we propose two different strategies to provide more intelligent user interfaces to relational databases by utilizing deep learning techniques. As the fi rst study, we propose a solution for keyword mapping in Natural Language Interfaces to Databases (NLIDB), which aims to translate Natural Language Queries (NLQs) to SQL. We defi ne the keyword mapping problem as a sequence tagging problem, and propose a novel deep learning based supervised approach that utilizes part-of-speech (POS) tags of NLQs. Our proposed approach, called DBTagger (DataBase Tagger), is an end-to-end and schema independent solution. Query recommendation paradigm, a well-known strategy broadly utilized in Web search engines, is helpful to suggest queries of expert users to the casual users to help them with their information need. As the second study, we propose Conquer, a CONtextual QUEry Recommendation algorithm on relational databases exploiting deep learning. First, we train local embeddings of a database using Graph Convolutional Networks to extract distributed representations of the tuples in latent space. We represent SQL queries with a semantic vector by averaging the embeddings of the tuples returned as a result of the query. We employ cosine similarity over the final representations of the queries to generate recommendations, as a Witness-Based approach. Our results show that in classi cation accuracy of database rows as an indicator for embedding quality, Conquer outperforms state-of-the-art techniques.