Kentlerin karmaşık yapısına ilişkin mevcut bilgimizi arttırarak kentsel müdahele
süreçlerinde daha bilinçli ve bilgiye dayanan kararlar üretebilmek kent araştırmaları
için önemli bir çalışma alanı ve mücadele konusu olagelmiştir. Geniş ölçekli
hesaplama sistemleri (large-scale computing) ve yeni nesil veri toplama ve analiz
etme teknikleri bu alanda çalışan araştırmacılara yeni fırsatlar sunmaktadır.. Bu tez
hesaplamalı bilim ve mühendislik alanındaki bu önemli gelişmelerin kentsel veri
analizi alanına ne tür katkılar sağlayabileceği konusuna odaklanmaktadır. Tezin
hedefi 'veri madenciliği aracılığı ile bilgi keşfi' jenerik sürecini kullanarak kentsel
verileri analiz etmek ve böylelikle kente dair bilgimizi arttırabilecek bulgulara
erişmektir. 'Veri madenciliği aracılığı ile bilgi keşfi' süreci hesaplamalı araç ve
teknikleri kullanarak çok geniş, çoğunlukla karmaşık ve çok boyutlu veri
tabanlarında gizli "önceden bilinmeyen ve faydalı/kullanışlı" (Witten & Frank,
2005) enformasyon örüntülerinin (değişkenler arasındaki korelasyonlar, veri
gruplamaları (sınıflandırma ve kümeleme) ya da daha kompleks hipotezler) otomatik
ya da yarı-otomatik olarak araştırılması sürecidir .
Bu doğrultuda bu tezin ana hedefi 'kent analizinde veri madenciliği aracılığı ile bir
bilgi keşfi yaklaşımı' geliştirmektir. Kent analistlerinin bu yaklaşımı, kentsel
müdahele süreçlerinde kanıta dayalı ve kentsel bağlama duyarlı kararlar verebilmeyi
sağlayabilecek, 'ilişkisel kent bilgisi'ni keşfetmek amacı ile kullanılabileceği
düşünülmektedir. İlişkisel kent bilgisi bu tez kapsamında önerilmiş bir kavramdır ve
kentsel veri tabanlarını veri madenciliği algoritmaları kullanarak analiz ederek
bulabileceğimiz 'kullanışlı' ve 'değerli' enformasyon örüntüleri ve ilişkilerini ifade
etmektedir. Kent analizinde veri madenciliği aracılığı ile bilgi keşfi' yaklaşımı
kentsel alanların yerel ve özgün karakteristiklerinin daha derinden ve kullanışlı bir
şekilde anlaşılmasını sağlayabilir.
Tezin ikincil hedefi ise, 2008 tarihli Beyoğlu Koruma Amaçlı Nazım İmar Planına
ilişkin tematik analiz paftalarında gizli olduğu düşünülen 'bilgilerin' keşfedilmesidir.
Bir grup temel kentsel bileşenin yani binalar, sokaklar, mahalleler ve bunlara ilişkin
çeşitli özelliklerin resmedildiği geleneksel tematik kent analizi paftaları söz konusu
Nazım İmar Planı'nın temelini oluşturmaktadır. Bu analiz paftalarının oldukça
zengin birer veri kaynağı oldukları ancak mevcut durumu görsel olarak ifade
etmekten öteye bir fayda getirmedikleri ve planlama kararlarına doğrudan etki
etmedikleri gözlemlenmiştir. Veri madenciliği aracılığı ile bilgi keşfi yaklaşımı
kullanılarak tematik analiz paftalarında gizli olduğu düşünülen 'bilgiler'in
keşfedilmesi mümkün olabilir ve bu 'bilgiler' kentsel bağlama duyarlı dönüşüm
yaklaşımları geliştirmek üzere kullanılabilir.
Bu amaçlar doğrultusunda, tez kapsamında birbiri ile bağlantılı üç araştırma sorusu
belirlenmiştir: (1) 'Veri tabanlarında bilgi keşfi' jenerik sürecinin kentsel veri analizi alanına uyarlanmasını sağlayacak genel bir kent analizi süreç modelinin
geliştirilmesi, (2) bu modelin geliştirilerek Beyoğlu Koruma Amaçlı Nazım İmar
Planı tematik kent analizi paftalarının analizi için kullanılması, (3) Tematik analiz
paftalarından elde edilecek 'ilişkisel kent bilgisi'nin kentsel dönüşüm süreçlerinde
müdahele önerilerinin geliştirilmesi amacı ile kullanılması.
İlk araştırma sorusuna cevap olarak Fayyad, Piatetsky-Shapiro, and Smyth (1996b)
tarafından geliştirilen ve yaygın olarak kabul gören 'veri tabanlarında bilgi keşfi'
jenerik süreci kentsel veri analizi alanına uyarlanarak bir 'Kent Analizinde Bilgi
Keşfi Süreç Modeli' geliştirilmiştir . Bu süreç modeli ham veriler içerisinde gizli
enformasyon örüntüleri ve ilişkilerini ortaya çıkartmak için coğrafi bilgi sistemleri
ve veri madenciliği araçlarını bir arada kullanarak 'kentsel veritabanı oluşturulma,
analiz etme ve analiz sonuçlarını değerlendirme' alt süreçlerini tarif etmektedir.
Modelde, veri tabanı oluşturma süreci için coğrafi bilgi sistemleri kullanılırken, veri
tabanı analiz etme ve sonuçları değerlendime süreçleri için coğrafi bilgi sistemleri
işlevleri ve veri madenciliği teknikleri birbirini tamamlayacak şekilde
kullanılmaktadır. Model, coğrafi bilgi sistemleri ve veri madenciliği platformlarının
karşılıklı olarak birbirlerine girdi sağlayabileceğini ve iki farklı işlev platformunun
bu şekilde bağlantılanması ile daha incelikli/nitelikli bir veri analizi yapmanın
mümkün olabileceğini göstermektedir.
İkinci ve üçüncü araştırma sorularının araştırılması amacı ile öncellikle 'Kent
Analizinde Bilgi Keşfi Süreç Modeli' bir miktar daha geliştirilerek tematik kentsel
analiz paftalarının çeşitli hesaplamalı platformlarda işlenmesi ile paftaların içerdiği
verilerden coğrafi bilgi sistemleri tabanlı bir veri tabanı (Beyoğlu Kentsel Koruma
Alanı Bina Özellikleri Veri Tabanı) oluşturulmuştur. Beyoğlu Kentsel Koruma alanı
içerisinde yer alan binalar ve binalara ilişkin birçok farklı mekansal ve mekansal
olmayan özellikten oluşan bu dijital veri tabanı kullanılarak üç farklı uygulama
yapılmıştır. İlk uygulama Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri
Tabanının veri madenciliği teknik ve yöntemleri kullanılarak analiz edilmesi ile elde
edilebilecek enformasyon ilişkileri ve örüntülerininin nasıl çeşitlenebileceğini
araştırmak amacı ile yapılmıştır. İkinci ve üçüncü uygulamalarda, tez kapsamında
önerilen veri madenciliği aracılığı ile bilgi keşfi yaklaşımının Beyoğlu Koruma alanı
içerisinde yer alan Tarlabaşı semtinin dönüşümü sürecine nasıl bir katkı
sağlayabileceği sınanmak istenmiştir. İkinci uygulama kapsamında 'Kent Analizinde
Bilgi Keşfi Süreç Modeli', evrimsel bir yaklaşımla bir arada kullanılarak, araştırmacı
tarafından önerilen alternatif bir kentsel dönüşüm yaklaşımı çerçevesinde ortaya
konulan bir dizi kentsel müdahelenin alana nasıl uygulanabileceği gösterilmiştir.
Üçüncü uygulama kapsamında ise 'Kent Analizinde Bilgi Keşfi Süreç Modeli'
öğrenciler tarafından uluslararası bir çalıştay sürecinde yine Tarlabaşı dönüşümü
sorunsalı bağlamında kullanılarak test edilmiştir. Öğrenciler bu modeli kullanarak
Tarlabaşı semtinin yerel özelliklerini keşfederek bu analizleri temel alan bir takım
kentsel dönüşüm müdahele önerileri ortaya koymuşlardır.
Tezin bilimsel çıktıları arasında özellikle üç tanesinin doğrudan kullanılabilir olduğu
ve bu çalışmayı benzerlerinden ayırdığı düşünülmektedir:
(1) Kent Analizinde Bilgi Keşfi Süreç Modeli. Coğrafi Bilgi Sistemleri ve veri
madenciliği tekniklerinin bir arada kullanıldığı başka araştırmalar mevcuttur ancak
mevcut literatürde böyle bir süreci tarif eden bir kent analizi süreç modelinine
rastlanmamış ve özellikle de böyle bir sürecin geleneksel tematik kent analizi
paftalarını analiz ederek bunlar içerisinde gizli enformasyon örüntüleri ve ilişkilerini
keşfetmek amacı ile kullanıldığı bir örneğe rastlanmamıştır.
(2) Beyoğlu Kentsel Koruma Alanı Bina Özellikleri Veri Tabanı. Beyoğlu
Kentsel Koruma alanı içerisinde yer alan 11,984 adet bina ve bu binaların mekansal
ve mekansal olmayan 45 farklı özelliğini içeren oldukça geniş ve detaylı bir dijital
veri tabanı oluşturulmuştur. Mevcut literatürde veri madenciliği tekniklerinin, bina
ölçeğinde bu kadar kapsamlı mikro ölçekli veri içeren bir mekansal veri tabanı
üzerinde uygulandığı başka bir araştırmaya rastlanmamıştır. Bu veri tabanının
Beyoğlu Kentsel Koruma Alanı üzerine çalışmak isteyen araştırmacılar ve
pratisyenler tarafından kullanılabileceği için tezin önemli kullanılabilir çıktılarından
biri olduğu düşünülmektedir.
(3) Coğrafi Bilgi Sistemleri, veri madenciliği işlevleri ve evrimsel hesaplama
yaklaşımlarını bir arada kullanarak bina zemin katlarına işlev, kullanıcı tipi ve
mülkiyet tipi atfeden bir hesaplamalı süreç. Tezin bu çıktısı üçüncü araştırma
sorusuna yanıt aranan ikinci uygulama kapsamında üretilmiştir. Beyoğlu Kentsel
Koruma Alanı Bina Özellikleri Veri Tabanı içerisinden Tarlabaşı semtine ait veriler
ayrılarak sırası ile Naïve Bayes Sınıflandırma analizi ve Birliktelik Kuralları analizi
uygulanmıştır. Bu analiz sonuçlarında elde edilen veri madenciliği bulguları
binaların zemin katlarına işlev atayan bir dizi kuralın tanımlanması için
kullanılmıştır. Bu kurallar, yazar tarafından geliştirilen bir kentsel dönüşüm
yaklaşımı çerçevesinde önerilen kullanıcı ve mülkiyet tipi yerleşimi kurallarıyla
birlikte evrimsel bir algoritmanın uygunluk (fitness) ölçütü olarak kullanılmıştır.
Sonuç olarak evrimsel algoritma binaların zemin katlarının mevcut işlevlerini
dönüştürmüş ve binalara birer kullanıcı tipi ve mülkiyet tipi bilgisi atfetmiştir. Bu
uygulama, veri madenciliği analizi sonuçlarının kentsel dönüşüm amaçlı müdahele
önerileri geliştirirken nasıl kullanılabileceğine dair bir yol örneklemektedir. Bu
hesaplamalı sürecin benzerleri araştırmacılar ve pratisyenler tarafından başka kentsel
bağlamlar için dönüştürücü müdahele önerileri geliştirmek üzere yeniden
kullanılabilir. Mevcut literatürde, veri madenciliği analizi sonuçlarını evrimsel bir
algoritmanın uygunluk (fitness) ölçütü olarak kullanarak işlev, kullanıcı tipi ve
mülkiyet tipi yerleşim planları üreten başka bir örneğe rastlanmamıştır. Bu nedenle
tez kapsamında geliştirilen bu hesaplamalı sürecin tezin en özgün bilimsel çıktısı
olduğu düşünülmektedir.
Sonuç olarak yapılan araştırma, Beyoğlu Kentsel Koruma Alanı Bina Özellikleri
Veri Tabanı içerisinde yer alan verilerle sınırlı olsa da, kent analizinde veri
madenciliği aracılığı ile bilgi keşfi yaklaşımının, temel kentsel bileşenler ve onların
farklı özellikleri arasındaki enformasyon ilişkileri ve örüntülerini ortaya çıkartma
potansiyelini ortaya koymaktadır. Bunun yanı sıra, bu araştırma, sözü edilen
enformasyon ilişkileri ve örüntülerinin, kentsel mekanların özgün özelliklerini ortaya
koyabileceği ve bu özelliklerin, araştırmacılar ve pratisyenler tarafından değerli
bulunurlarsa, daha bilinçli ve bilgiye dayalı kentsel müdahele önerileri geliştirmek
üzere kullanılabileceğini de göstermiştir. Böylelikle tez kapsamında geliştirilen kent
analizinde veri madenciliği aracılığı ile bilgi keşfi yaklaşımının kentsel dönüşüm
süreçlerinde yapılan müdahelelerin kalitesini arttırabileceği ve dolayısı ile genel
anlamda kentsel alanların kalitesinin arttırılabileceği düşünülmektedir. Bununla
birlikte, tez kapsamında yapılan uygulamalar, böyle bir yaklaşımın ortaya
çıkarabileceği sonuçların kalitesinin toplanabilen ve erişilebilen veri kalitesi ve
miktarı ile sınırlı olduğu da ortaya koymaktadır.
|
Enhancing our knowledge of the complexities of cities in order to empower
ourselves to make more informed decisions has always been a challenge for urban
research. Recent developments in large-scale computing, together with the new
techniques and automated tools for data collection and analysis are opening up
promising opportunities for addressing this problem. The main motivation that
served as the driving force behind this research is how these developments may
contribute to urban data analysis. On this basis, the thesis focuses on urban data
analysis in order to search for findings that can enhance our knowledge of urban
environments, using the generic process of knowledge discovery using data mining.
A knowledge discovery process based on data mining is a fully automated or semiautomated
process which involves the application of computational tools and
techniques to explore the "previously unknown, and potentially useful information"
(Witten & Frank, 2005) hidden in large and often complex and multi-dimensional
databases. This information can be obtained in the form of correlations amongst
variables, data groupings (classes and clusters) or more complex hypotheses
(probabilistic rules of co-occurrence, performance vectors of prediction models etc.).
This research targets researchers and practitioners working in the field of urban
studies who are interested in quantitative/computational approaches to urban data
analysis and specifically aims to engage the interest of architects, urban designers
and planners who do not have a background in statistics or in using data mining
methods in their work.
Accordingly, the overall aim of the thesis is the development of a knowledge
discovery approach to urban analysis; a domain-specific adaptation of the generic
process of knowledge discovery using data mining enabling the analyst to discover
'relational urban knowledge'. 'Relational urban knowledge' is a term employed in
this thesis to refer to the potentially 'useful' and/or 'valuable' information patterns
and relationships that can be discovered in urban databases by applying data mining
algorithms. A knowledge discovery approach to urban analysis through data mining
can help us to understand site-specific characteristics of urban environments in a
more profound and useful way.
On a more specific level, the thesis aims towards 'knowledge discovery' in
traditional thematic maps published in 2008 by the Istanbul Metropolitan
Municipality as a basis of the Master Plan for the Beyoglu Preservation Area. These
thematic maps, which represent urban components, namely buildings, streets,
neighbourhoods and their various attributes such as floorspace use, land price,
population density or historical importance, do not really extend our knowledge of
Beyoglu Preservation Area beyond documenting its current state and do not
contribute to the interventions presented in the master plan. However it is likely that 'useful' and 'valuable' information patterns discoverable using data mining
algorithms are hidden in them.
In accordance with the stated aims, three research questions of the thesis concerns
(1) the development of a general process model to adapt the generic process of
knowledge discovery using data mining for urban data analysis, (2) the investigation
of information patterns and relationships that can be extracted from the traditional
thematic maps of the Beyoglu Preservation Area by further developing and
implementing this model and (3) the investigation of how this 'relational urban
knowledge' could support architects, urban designers, planners or geographers whilst
developing urban intervention proposals for urban regeneration.
A Knowledge Discovery Process Model (KDPM) for urban analysis was developed,
as an answer to the the first research question. The KDPM for urban analysis is a
domain-specific adaptation of the widely accepted process of knowledge discovery
in databases defined by Fayyad, Piatetsky-Shapiro, and Smyth (1996b). The model
describes a semi-automated process of database formulation, analysis and evaluation
for extracting information patterns and relationships from raw data by combining
both GIS and data mining functionalities in a complementary way. The KDPM for
urban analysis suggests that GIS functionalities can be used to formulate a database,
and GIS and data mining can complement each other in analyzing the database and
evaluating the outcomes. The model illustrates that the output of a GIS platform can
become the input for a data mining platform and vice versa, resulting in an
interlinked analytical process which allows for a more sophisticated analysis of
urban data.
To investigate the second and third research questions, firstly the KDPM for urban
analysis was further developed to construct a GIS database of the Beyoglu
Preservation Area from the thematic maps. Then, three implementations were
performed using this GIS database; the Beyoglu Preservation Area Building Features
Database consisting of multiple features attributed to the buildings. In
Implementation (1), the KDPM for urban analysis was used to investigate a variety
of patterns and relationships that can be extracted from the database using three
different data mining methods. In Implementations (2) and (3), the KDPM for urban
analysis was implemented to test how the knowledge discovery approach through
data mining proposed in this thesis can assist in developing draft plans for the
regeneration of a run-down neighbourhood in the Beyoglu Preservation Area
(Tarlabasi). In Implementation (2), the KDPM for urban analysis is implemented in
combination with an evolutionary process to apply a regeneration approach
developed by the author; a computational process which generates draft plans for
ground floor use, user-profile and tenure-type allocation was developed. In
Implementation (3), students applied the KDPM for urban analysis during the course
of an international workshop. The model enabled them to explore site-specific
particularities of Tarlabasi that would support their urban intervention proposals.
Among the outputs of the thesis three of them are considered as utilizable outputs
that distinguish this thesis from previous studies:
(1) The KDPM for urban analysis. Although there have been other studies which
make use of data mining methods and techniques combined with GIS technology, to
the best of our knowledge no previous research has implemented a process model to
depict this process and used the model to extract 'knowledge' from traditional
thematic maps. Researchers and practitioners can re-use this process model to
xx v
analyze other urban environments. The KDPM for urban analysis is, therefore, one
of the main utilizable outputs of the thesis and an important scientific contribution of
this study.
(2) The Beyoglu Preservation Area Building Features Database. A large and
quite comprehensive GIS database which consists of 45 spatial and non-spatial
features attributed to the 11,984 buildings located in the Beyoglu Preservation Area
was constructed. This database is one of the original features of this study. To the
best of our knowledge, there are no other examples of applications of data mining
using such a comprehensive GIS database, constructed from a range of actual microscale
data representing such a variety of features attributed to the buildings. This
database can be re-used by analysts interested in studying the Beyoglu Preservation
Area. The Beyoglu Preservation Area Building Features Database is therefore one of
the main utilizable outputs of the thesis and represents a scientific contribution to the
research material on the Beyoglu Preservation Area.
(3) A computational process which generates draft plans for ground floor use,
user-profile and tenure-type allocation, using GIS and data mining functionalities
with evolutionary computation. This output of the thesis was generated by
Implementation (2), which aimed to investigate Research Question (3). The overall
process involved the successive application of Naïve Bayes Classification,
Association Rule Analysis and an Evolutionary Algorithm to a subset of the Beyoglu
Preservation Area Building Features Database representing the Tarlabasi
neighbourhood. Briefly, the findings of the data mining analysis were used to
formulate a set of rules for assigning ground floor use information to the buildings.
These rules were then used for fitness measurements of an Evolutionary Algorithm,
together with other fitness measurements for assigning user-profile and tenure-type
information (defined by the author according to the regeneration approach developed
by the author). As a result, the algorithm transformed the existing allocation of the
ground floor use in the buildings located in Tarlabasi in accordance with the given
rules and assigned user-profile and tenure-type information for each building. This
computational process demonstrated one way to use the data mining analysis
findings in generating urban intervention proposals for urban regeneration. A similar
computational process can be implemented in other urban contexts by researchers
and practitioners. To the best of our knowledge, no prior research has used data
mining analysis findings for fitness measurements of an Evolutionary Algorithm in
order to produce draft plans for ground floor use, user-profile and tenure-type
allocation. This is, therefore, the most original scientific contribution and utilizable
output of the thesis.
As a result of the research, on the basis of the data that is available in the thematic
maps of the Beyoglu Preservation Area, the potential of a knowledge discovery
approach to urban analysis in revealing the relationships between various
components of urban environments and their various attributes is demonstrated. It is
also demonstrated that these relationships can reveal site-specific characteristics of
urban environments and if found 'valuable' by the the targeted researchers and
practitioners, these can lead to the development of more informed intervention
proposals. Thereby the knowledge discovery approach to urban analysis developed
in this thesis may help to improve the quality of urban intervention proposals and
consequently the quality of built environments. On the other hand, these
implementations also exposed the major limitation of the knowledge discovery
approach to urban analysis through data mining, which is the fact that the findings discoverable by this approach are limited by the relevant data that is collectable and
accessible. |