Ulusal Tez Merkezi

Tez No	İndirme	Tez Künye	Durumu
439597		A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine / Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı Yazar:AHU Danışman: PROF. DR. GÜLEN ÇAĞDAŞ ; PROF. DR. İKBAL SEVİL SARIYILDIZ Yer Bilgisi: İSTANBUL TEKNİK ÜNİVERSİTESİ / FEN BİLİMLERİ ENSTİTÜSÜ / MİMARLIK ANABİLİM DALI / Mimari Tasarım Bilim Dalı Konu:Mimarlık = Architecture ; Şehircilik ve Bölge Planlama = Urban and Regional Planning Anahtar Kelime:	Onaylandı Doktora İngilizce 2016 441 s.

Kentlerin karmaşık yapısına ilişkin mevcut bilgimizi arttırarak kentsel müdahele süreçlerinde daha bilinçli ve bilgiye dayanan kararlar üretebilmek kent araştırmaları için önemli bir çalışma alanı ve mücadele konusu olagelmiştir. Geniş ölçekli hesaplama sistemleri (large-scale computing) ve yeni nesil veri toplama ve analiz etme teknikleri bu alanda çalışan araştırmacılara yeni fırsatlar sunmaktadır.. Bu tez hesaplamalı bilim ve mühendislik alanındaki bu önemli gelişmelerin kentsel veri analizi alanına ne tür katkılar sağlayabileceği konusuna odaklanmaktadır. Tezin hedefi 'veri madenciliği aracılığı ile bilgi keşfi' jenerik sürecini kullanarak kentsel verileri analiz etmek ve böylelikle kente dair bilgimizi arttırabilecek bulgulara erişmektir. 'Veri madenciliği aracılığı ile bilgi keşfi' süreci hesaplamalı araç ve teknikleri kullanarak çok geniş, çoğunlukla karmaşık ve çok boyutlu veri tabanlarında gizli "önceden bilinmeyen ve faydalı/kullanışlı" (Witten & Frank, 2005) enformasyon örüntülerinin (değişkenler arasındaki korelasyonlar, veri gruplamaları (sınıflandırma ve kümeleme) ya da daha kompleks hipotezler) otomatik ya da yarı-otomatik olarak araştırılması sürecidir . Bu doğrultuda bu tezin ana hedefi 'kent analizinde veri madenciliği aracılığı ile bir bilgi keşfi yaklaşımı' geliştirmektir. Kent analistlerinin bu yaklaşımı, kentsel müdahele süreçlerinde kanıta dayalı ve kentsel bağlama duyarlı kararlar verebilmeyi sağlayabilecek, 'ilişkisel kent bilgisi'ni keşfetmek amacı ile kullanılabileceği düşünülmektedir. İlişkisel kent bilgisi bu tez kapsamında önerilmiş bir kavramdır ve kentsel veri tabanlarını veri madenciliği algoritmaları kullanarak analiz ederek bulabileceğimiz 'kullanışlı' ve 'değerli' enformasyon örüntüleri ve ilişkilerini ifade etmektedir. Kent analizinde veri madenciliği aracılığı ile bilgi keşfi' yaklaşımı kentsel alanların yerel ve özgün karakteristiklerinin daha derinden ve kullanışlı bir şekilde anlaşılmasını sağlayabilir. Tezin ikincil hedefi ise, 2008 tarihli Beyoğlu Koruma Amaçlı Nazım İmar Planına ilişkin tematik analiz paftalarında gizli olduğu düşünülen 'bilgilerin' keşfedilmesidir. Bir grup temel kentsel bileşenin yani binalar, sokaklar, mahalleler ve bunlara ilişkin çeşitli özelliklerin resmedildiği geleneksel tematik kent analizi paftaları söz konusu Nazım İmar Planı'nın temelini oluşturmaktadır. Bu analiz paftalarının oldukça zengin birer veri kaynağı oldukları ancak mevcut durumu görsel olarak ifade etmekten öteye bir fayda getirmedikleri ve planlama kararlarına doğrudan etki etmedikleri gözlemlenmiştir. Veri madenciliği aracılığı ile bilgi keşfi yaklaşımı kullanılarak tematik analiz paftalarında gizli olduğu düşünülen 'bilgiler'in keşfedilmesi mümkün olabilir ve bu 'bilgiler' kentsel bağlama duyarlı dönüşüm yaklaşımları geliştirmek üzere kullanılabilir. Bu amaçlar doğrultusunda, tez kapsamında birbiri ile bağlantılı üç araştırma sorusu belirlenmiştir: (1) 'Veri tabanlarında bilgi keşfi' jenerik sürecinin kentsel veri analizi alanına uyarlanmasını sağlayacak genel bir kent analizi süreç modelinin geliştirilmesi, (2) bu modelin geliştirilerek Beyoğlu Koruma Amaçlı Nazım İmar Planı tematik kent analizi paftalarının analizi için kullanılması, (3) Tematik analiz paftalarından elde edilecek 'ilişkisel kent bilgisi'nin kentsel dönüşüm süreçlerinde müdahele önerilerinin geliştirilmesi amacı ile kullanılması. İlk araştırma sorusuna cevap olarak Fayyad, Piatetsky-Shapiro, and Smyth (1996b) tarafından geliştirilen ve yaygın olarak kabul gören 'veri tabanlarında bilgi keşfi' jenerik süreci kentsel veri analizi alanına uyarlanarak bir 'Kent Analizinde Bilgi Keşfi Süreç Modeli' geliştirilmiştir . Bu süreç modeli ham veriler içerisinde gizli enformasyon örüntüleri ve ilişkilerini ortaya çıkartmak için coğrafi bilgi sistemleri ve veri madenciliği araçlarını bir arada kullanarak 'kentsel veritabanı oluşturulma, analiz etme ve analiz sonuçlarını değerlendirme' alt süreçlerini tarif etmektedir. Modelde, veri tabanı oluşturma süreci için coğrafi bilgi sistemleri kullanılırken, veri tabanı analiz etme ve sonuçları değerlendime süreçleri için coğrafi bilgi sistemleri işlevleri ve veri madenciliği teknikleri birbirini tamamlayacak şekilde kullanılmaktadır. Model, coğrafi bilgi sistemleri ve veri madenciliği platformlarının karşılıklı olarak birbirlerine girdi sağlayabileceğini ve iki farklı işlev platformunun bu şekilde bağlantılanması ile daha incelikli/nitelikli bir veri analizi yapmanın mümkün olabileceğini göstermektedir. İkinci ve üçüncü araştırma sorularının araştırılması amacı ile öncellikle 'Kent Analizinde Bilgi Keşfi Süreç Modeli' bir miktar daha geliştirilerek tematik kentsel analiz paftalarının çeşitli hesaplamalı platformlarda işlenmesi ile paftaların içerdiği verilerden coğrafi bilgi sistemleri tabanlı bir veri tabanı (Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri Tabanı) oluşturulmuştur. Beyoğlu Kentsel Koruma alanı içerisinde yer alan binalar ve binalara ilişkin birçok farklı mekansal ve mekansal olmayan özellikten oluşan bu dijital veri tabanı kullanılarak üç farklı uygulama yapılmıştır. İlk uygulama Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri Tabanının veri madenciliği teknik ve yöntemleri kullanılarak analiz edilmesi ile elde edilebilecek enformasyon ilişkileri ve örüntülerininin nasıl çeşitlenebileceğini araştırmak amacı ile yapılmıştır. İkinci ve üçüncü uygulamalarda, tez kapsamında önerilen veri madenciliği aracılığı ile bilgi keşfi yaklaşımının Beyoğlu Koruma alanı içerisinde yer alan Tarlabaşı semtinin dönüşümü sürecine nasıl bir katkı sağlayabileceği sınanmak istenmiştir. İkinci uygulama kapsamında 'Kent Analizinde Bilgi Keşfi Süreç Modeli', evrimsel bir yaklaşımla bir arada kullanılarak, araştırmacı tarafından önerilen alternatif bir kentsel dönüşüm yaklaşımı çerçevesinde ortaya konulan bir dizi kentsel müdahelenin alana nasıl uygulanabileceği gösterilmiştir. Üçüncü uygulama kapsamında ise 'Kent Analizinde Bilgi Keşfi Süreç Modeli' öğrenciler tarafından uluslararası bir çalıştay sürecinde yine Tarlabaşı dönüşümü sorunsalı bağlamında kullanılarak test edilmiştir. Öğrenciler bu modeli kullanarak Tarlabaşı semtinin yerel özelliklerini keşfederek bu analizleri temel alan bir takım kentsel dönüşüm müdahele önerileri ortaya koymuşlardır. Tezin bilimsel çıktıları arasında özellikle üç tanesinin doğrudan kullanılabilir olduğu ve bu çalışmayı benzerlerinden ayırdığı düşünülmektedir: (1) Kent Analizinde Bilgi Keşfi Süreç Modeli. Coğrafi Bilgi Sistemleri ve veri madenciliği tekniklerinin bir arada kullanıldığı başka araştırmalar mevcuttur ancak mevcut literatürde böyle bir süreci tarif eden bir kent analizi süreç modelinine rastlanmamış ve özellikle de böyle bir sürecin geleneksel tematik kent analizi paftalarını analiz ederek bunlar içerisinde gizli enformasyon örüntüleri ve ilişkilerini keşfetmek amacı ile kullanıldığı bir örneğe rastlanmamıştır. (2) Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri Tabanı. Beyoğlu Kentsel Koruma alanı içerisinde yer alan 11,984 adet bina ve bu binaların mekansal ve mekansal olmayan 45 farklı özelliğini içeren oldukça geniş ve detaylı bir dijital veri tabanı oluşturulmuştur. Mevcut literatürde veri madenciliği tekniklerinin, bina ölçeğinde bu kadar kapsamlı mikro ölçekli veri içeren bir mekansal veri tabanı üzerinde uygulandığı başka bir araştırmaya rastlanmamıştır. Bu veri tabanının Beyoğlu Kentsel Koruma Alanı üzerine çalışmak isteyen araştırmacılar ve pratisyenler tarafından kullanılabileceği için tezin önemli kullanılabilir çıktılarından biri olduğu düşünülmektedir. (3) Coğrafi Bilgi Sistemleri, veri madenciliği işlevleri ve evrimsel hesaplama yaklaşımlarını bir arada kullanarak bina zemin katlarına işlev, kullanıcı tipi ve mülkiyet tipi atfeden bir hesaplamalı süreç. Tezin bu çıktısı üçüncü araştırma sorusuna yanıt aranan ikinci uygulama kapsamında üretilmiştir. Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri Tabanı içerisinden Tarlabaşı semtine ait veriler ayrılarak sırası ile Naïve Bayes Sınıflandırma analizi ve Birliktelik Kuralları analizi uygulanmıştır. Bu analiz sonuçlarında elde edilen veri madenciliği bulguları binaların zemin katlarına işlev atayan bir dizi kuralın tanımlanması için kullanılmıştır. Bu kurallar, yazar tarafından geliştirilen bir kentsel dönüşüm yaklaşımı çerçevesinde önerilen kullanıcı ve mülkiyet tipi yerleşimi kurallarıyla birlikte evrimsel bir algoritmanın uygunluk (fitness) ölçütü olarak kullanılmıştır. Sonuç olarak evrimsel algoritma binaların zemin katlarının mevcut işlevlerini dönüştürmüş ve binalara birer kullanıcı tipi ve mülkiyet tipi bilgisi atfetmiştir. Bu uygulama, veri madenciliği analizi sonuçlarının kentsel dönüşüm amaçlı müdahele önerileri geliştirirken nasıl kullanılabileceğine dair bir yol örneklemektedir. Bu hesaplamalı sürecin benzerleri araştırmacılar ve pratisyenler tarafından başka kentsel bağlamlar için dönüştürücü müdahele önerileri geliştirmek üzere yeniden kullanılabilir. Mevcut literatürde, veri madenciliği analizi sonuçlarını evrimsel bir algoritmanın uygunluk (fitness) ölçütü olarak kullanarak işlev, kullanıcı tipi ve mülkiyet tipi yerleşim planları üreten başka bir örneğe rastlanmamıştır. Bu nedenle tez kapsamında geliştirilen bu hesaplamalı sürecin tezin en özgün bilimsel çıktısı olduğu düşünülmektedir. Sonuç olarak yapılan araştırma, Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri Tabanı içerisinde yer alan verilerle sınırlı olsa da, kent analizinde veri madenciliği aracılığı ile bilgi keşfi yaklaşımının, temel kentsel bileşenler ve onların farklı özellikleri arasındaki enformasyon ilişkileri ve örüntülerini ortaya çıkartma potansiyelini ortaya koymaktadır. Bunun yanı sıra, bu araştırma, sözü edilen enformasyon ilişkileri ve örüntülerinin, kentsel mekanların özgün özelliklerini ortaya koyabileceği ve bu özelliklerin, araştırmacılar ve pratisyenler tarafından değerli bulunurlarsa, daha bilinçli ve bilgiye dayalı kentsel müdahele önerileri geliştirmek üzere kullanılabileceğini de göstermiştir. Böylelikle tez kapsamında geliştirilen kent analizinde veri madenciliği aracılığı ile bilgi keşfi yaklaşımının kentsel dönüşüm süreçlerinde yapılan müdahelelerin kalitesini arttırabileceği ve dolayısı ile genel anlamda kentsel alanların kalitesinin arttırılabileceği düşünülmektedir. Bununla birlikte, tez kapsamında yapılan uygulamalar, böyle bir yaklaşımın ortaya çıkarabileceği sonuçların kalitesinin toplanabilen ve erişilebilen veri kalitesi ve miktarı ile sınırlı olduğu da ortaya koymaktadır.

Enhancing our knowledge of the complexities of cities in order to empower ourselves to make more informed decisions has always been a challenge for urban research. Recent developments in large-scale computing, together with the new techniques and automated tools for data collection and analysis are opening up promising opportunities for addressing this problem. The main motivation that served as the driving force behind this research is how these developments may contribute to urban data analysis. On this basis, the thesis focuses on urban data analysis in order to search for findings that can enhance our knowledge of urban environments, using the generic process of knowledge discovery using data mining. A knowledge discovery process based on data mining is a fully automated or semiautomated process which involves the application of computational tools and techniques to explore the "previously unknown, and potentially useful information" (Witten & Frank, 2005) hidden in large and often complex and multi-dimensional databases. This information can be obtained in the form of correlations amongst variables, data groupings (classes and clusters) or more complex hypotheses (probabilistic rules of co-occurrence, performance vectors of prediction models etc.). This research targets researchers and practitioners working in the field of urban studies who are interested in quantitative/computational approaches to urban data analysis and specifically aims to engage the interest of architects, urban designers and planners who do not have a background in statistics or in using data mining methods in their work. Accordingly, the overall aim of the thesis is the development of a knowledge discovery approach to urban analysis; a domain-specific adaptation of the generic process of knowledge discovery using data mining enabling the analyst to discover 'relational urban knowledge'. 'Relational urban knowledge' is a term employed in this thesis to refer to the potentially 'useful' and/or 'valuable' information patterns and relationships that can be discovered in urban databases by applying data mining algorithms. A knowledge discovery approach to urban analysis through data mining can help us to understand site-specific characteristics of urban environments in a more profound and useful way. On a more specific level, the thesis aims towards 'knowledge discovery' in traditional thematic maps published in 2008 by the Istanbul Metropolitan Municipality as a basis of the Master Plan for the Beyoglu Preservation Area. These thematic maps, which represent urban components, namely buildings, streets, neighbourhoods and their various attributes such as floorspace use, land price, population density or historical importance, do not really extend our knowledge of Beyoglu Preservation Area beyond documenting its current state and do not contribute to the interventions presented in the master plan. However it is likely that 'useful' and 'valuable' information patterns discoverable using data mining algorithms are hidden in them. In accordance with the stated aims, three research questions of the thesis concerns (1) the development of a general process model to adapt the generic process of knowledge discovery using data mining for urban data analysis, (2) the investigation of information patterns and relationships that can be extracted from the traditional thematic maps of the Beyoglu Preservation Area by further developing and implementing this model and (3) the investigation of how this 'relational urban knowledge' could support architects, urban designers, planners or geographers whilst developing urban intervention proposals for urban regeneration. A Knowledge Discovery Process Model (KDPM) for urban analysis was developed, as an answer to the the first research question. The KDPM for urban analysis is a domain-specific adaptation of the widely accepted process of knowledge discovery in databases defined by Fayyad, Piatetsky-Shapiro, and Smyth (1996b). The model describes a semi-automated process of database formulation, analysis and evaluation for extracting information patterns and relationships from raw data by combining both GIS and data mining functionalities in a complementary way. The KDPM for urban analysis suggests that GIS functionalities can be used to formulate a database, and GIS and data mining can complement each other in analyzing the database and evaluating the outcomes. The model illustrates that the output of a GIS platform can become the input for a data mining platform and vice versa, resulting in an interlinked analytical process which allows for a more sophisticated analysis of urban data. To investigate the second and third research questions, firstly the KDPM for urban analysis was further developed to construct a GIS database of the Beyoglu Preservation Area from the thematic maps. Then, three implementations were performed using this GIS database; the Beyoglu Preservation Area Building Features Database consisting of multiple features attributed to the buildings. In Implementation (1), the KDPM for urban analysis was used to investigate a variety of patterns and relationships that can be extracted from the database using three different data mining methods. In Implementations (2) and (3), the KDPM for urban analysis was implemented to test how the knowledge discovery approach through data mining proposed in this thesis can assist in developing draft plans for the regeneration of a run-down neighbourhood in the Beyoglu Preservation Area (Tarlabasi). In Implementation (2), the KDPM for urban analysis is implemented in combination with an evolutionary process to apply a regeneration approach developed by the author; a computational process which generates draft plans for ground floor use, user-profile and tenure-type allocation was developed. In Implementation (3), students applied the KDPM for urban analysis during the course of an international workshop. The model enabled them to explore site-specific particularities of Tarlabasi that would support their urban intervention proposals. Among the outputs of the thesis three of them are considered as utilizable outputs that distinguish this thesis from previous studies: (1) The KDPM for urban analysis. Although there have been other studies which make use of data mining methods and techniques combined with GIS technology, to the best of our knowledge no previous research has implemented a process model to depict this process and used the model to extract 'knowledge' from traditional thematic maps. Researchers and practitioners can re-use this process model to xx v analyze other urban environments. The KDPM for urban analysis is, therefore, one of the main utilizable outputs of the thesis and an important scientific contribution of this study. (2) The Beyoglu Preservation Area Building Features Database. A large and quite comprehensive GIS database which consists of 45 spatial and non-spatial features attributed to the 11,984 buildings located in the Beyoglu Preservation Area was constructed. This database is one of the original features of this study. To the best of our knowledge, there are no other examples of applications of data mining using such a comprehensive GIS database, constructed from a range of actual microscale data representing such a variety of features attributed to the buildings. This database can be re-used by analysts interested in studying the Beyoglu Preservation Area. The Beyoglu Preservation Area Building Features Database is therefore one of the main utilizable outputs of the thesis and represents a scientific contribution to the research material on the Beyoglu Preservation Area. (3) A computational process which generates draft plans for ground floor use, user-profile and tenure-type allocation, using GIS and data mining functionalities with evolutionary computation. This output of the thesis was generated by Implementation (2), which aimed to investigate Research Question (3). The overall process involved the successive application of Naïve Bayes Classification, Association Rule Analysis and an Evolutionary Algorithm to a subset of the Beyoglu Preservation Area Building Features Database representing the Tarlabasi neighbourhood. Briefly, the findings of the data mining analysis were used to formulate a set of rules for assigning ground floor use information to the buildings. These rules were then used for fitness measurements of an Evolutionary Algorithm, together with other fitness measurements for assigning user-profile and tenure-type information (defined by the author according to the regeneration approach developed by the author). As a result, the algorithm transformed the existing allocation of the ground floor use in the buildings located in Tarlabasi in accordance with the given rules and assigned user-profile and tenure-type information for each building. This computational process demonstrated one way to use the data mining analysis findings in generating urban intervention proposals for urban regeneration. A similar computational process can be implemented in other urban contexts by researchers and practitioners. To the best of our knowledge, no prior research has used data mining analysis findings for fitness measurements of an Evolutionary Algorithm in order to produce draft plans for ground floor use, user-profile and tenure-type allocation. This is, therefore, the most original scientific contribution and utilizable output of the thesis. As a result of the research, on the basis of the data that is available in the thematic maps of the Beyoglu Preservation Area, the potential of a knowledge discovery approach to urban analysis in revealing the relationships between various components of urban environments and their various attributes is demonstrated. It is also demonstrated that these relationships can reveal site-specific characteristics of urban environments and if found 'valuable' by the the targeted researchers and practitioners, these can lead to the development of more informed intervention proposals. Thereby the knowledge discovery approach to urban analysis developed in this thesis may help to improve the quality of urban intervention proposals and consequently the quality of built environments. On the other hand, these implementations also exposed the major limitation of the knowledge discovery approach to urban analysis through data mining, which is the fact that the findings discoverable by this approach are limited by the relevant data that is collectable and accessible.