Tez No İndirme Tez Künye Durumu
768813
Coğrafi bilgi sistemleri entegreli makine öğrenmesine dayalı toplu taşınmaz değerleme modelinin geliştirilmesi / Development of mass property valuation model based on geographic information systems integrated machine learning methods
Yazar:MUHAMMED OĞUZHAN METE
Danışman: PROF. DR. TAHSİN YOMRALIOĞLU
Yer Bilgisi: İstanbul Teknik Üniversitesi / Lisansüstü Eğitim Enstitüsü / Geomatik Mühendisliği Ana Bilim Dalı / Geomatik Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Jeodezi ve Fotogrametri = Geodesy and Photogrammetry
Dizin:Coğrafi bilgi sistemleri = Geographical information systems ; Gayrimenkul değerleme = Real estate valuation ; Makine öğrenmesi = Machine learning
Onaylandı
Doktora
Türkçe
2022
198 s.
Küresel arazi idaresi sisteminin temel fonksiyonlarından biri olan arazi değeri ile planlama, vergilendirme, imar uygulamaları gibi mülkiyete dayalı birçok işlemde karşılaşılmaktadır. Bu bağlamda taşınmaz değerinin uluslararası standartlara uygun, nesnel yaklaşımlar ile değerlendirilmesi oldukça önemlidir. Teknolojinin ilerlemesiyle birlikte Coğrafi Bilgi Sistemleri (CBS), Yapay Zeka ve Makine Öğrenmesi, Bulut Bilişim, Yapı Bilgi Modelleme gibi akıllı sistemlerin değerleme uygulamalarında kullanımı artmakta, taşınmazların değeri yüksek doğrulukla, hızlı bir şekilde belirlenebilmektedir. Taşınmazların tekil değerlemesinde kullanılan Emsal Karşılaştırma, Gelir, Maliyet gibi klasik yöntemlerden farklı olarak toplu değerleme yöntemi bilişim sistemlerinden faydalanarak geniş alanlarda çok sayıda taşınmazın topyekün değerlendirilmesini mümkün kılmaktadır. Öte yandan arazi idaresi sistemlerinin kavramsal model tasarımında ISO standardı olan Arazi İdaresi Alan Modeli (LADM)'yi benimseyen ülkeler, taşınmaz değerleme amaçlı ülke profillerini oluşturarak süreçleri daha etkin bir şekilde yürütmeyi hedeflemektedirler. Değerleme çalışmalarında CBS ve Makine Öğrenmesine dayalı yöntemlerin ön plana çıktığı görülse de bu iki yaklaşımın bütünleşik kullanımının yer aldığı çalışmalar oldukça sınırlıdır. Ayrıca toplu değerleme çalışmalarında taşınmazların yüzölçümü, oda sayısı gibi fiziksel özelliklerine yoğunlaşılmakta, değeri oldukça etkileyen konumsal ve çevresel faktörler yeterince analiz edilmemektedir. Tez çalışması kapsamında CBS ve Makine Öğrenmesi yöntemleri bütünleştirilerek hibrit bir değerleme yöntemi geliştirilmiş, konumsal analizlerle değerleme verilerinin zenginleştirilmesi amaçlanmıştır. Öncelikle Birleşik Krallık çalışma bölgesinde LADM'ye dayalı bir kavramsal model tasarımı yapılmış, fiziksel modele geçiş aşamasında açık kaynaklı PostgreSQL/PostGIS veritabanı oluşturulmuştur. Daha sonra CBS destekli Nominal Değerleme Yöntemi ile yakınlık, yüzey, görünürlük gibi konumsal analizler gerçekleştirilmiş, nominal arsa değer haritası oluşturulmuştur. Birleşik Krallık Kraliyet Arazi Kayıt Kurumu tarafından açık lisans ile paylaşılan gerçek konut satış verileri kullanılarak Lineer Regresyon, Rastgele Orman, XGBoost, CatBoost gibi çeşitli Makine Öğrenmesi regresyon yöntemleri ile toplu değerleme çalışması gerçekleştirilmiştir. Konumsal kriterler eklenmeden önce gerçekleştirilen regresyon analizi sonucunda Makine Öğrenmesi modellerinin yeterli doğruluğa ulaşamadıkları görülmüştür. CBS analizleri sonrası elde edilen konumsal kriterlerin nominal puanları öznitelik zenginleştirme yoluyla değerleme verisindeki taşınmazlara aktarılmıştır. Konumsal kriterlerin eklenmesi sonrası gerçekleştirilen regresyon analizinde R2 değerinin yaklaşık %39, MAPE değerinin ise %27 civarında iyileştirildiği, yapılan oran analizleri sonucunda da çalışmanın toplu değerleme standartlarına uygun şekilde yeterli doğruluğa ulaştığı gözlemlenmiştir. Öte yandan global regresyon modellerinde kriterlerin mekansal otokorelasyonu ve bölgesel önem düzeyleri dikkate alınmazken tüm çalışma bölgesi için sabit bir kriter ağırlığı alınmaktadır. Oysa değeri etkileyen faktörler konuma, çevresel ve sosyo-ekonomik etkilere bağlı olarak değişkenlik gösterebilmektedir. Mekansal otokorelasyonun hesaplanması ve tüm kriterlerin özelliklerine bağlı olarak değer bölgelerinin oluşturulması için Nominal Ağırlıklı Çok Değişkenli Mekansal Kümeleme Yöntemi geliştirilmiştir. Bu yöntem ile beş farklı değer bölgesi tespit edilmiş, her bir kümede lokal regresyon modelleri oluşturularak değerleme doğruluğu artırılmış, bölgelere özgü kriter önemleri ve ağırlık katsayıları elde edilmiştir. Kriter önem skorlarının için hem permütasyon tabanlı öznitelik önemi hem de oyun teorisine dayanan SHAPley değerleri hesaplanmıştır. Böylece değişkenlerin bölgesel olarak değeri hangi yönde, ne derecede etkilediğine dair sonuçlar elde edilmiştir. Yapay zeka yöntemlerinde önyargı ve varyans dengesi, modelin öğrenme karakterini ortaya koyan önemli bir göstergedir. CBS ve Makine Öğrenmesi yöntemleri ile geliştirilen yöntem, genelleştirilebilirliğin incelenmesi amacıyla Birleşik Krallık'tan sonra Türkiye'de İstanbul ve İzmir illeri için de gerçekleştirilmiştir. Sonuçlara bakıldığında konumsal değişkenlerin katkısıyla konut amaçlı taşınmazların değeri İstanbul ve İzmir şehirleri için de yüksek doğrulukla belirlenmiştir. Tez kapsamında ayrıca yapılı taşınmazların arsa ve bina değerlerinin ayrıştırılması için Nominal Yönteme Dayalı Parametrik Maliyet Modellemesi yaklaşımı geliştirilmiştir. Bu kapsamda yapıya ait temel bileşenlerin yeniden inşa maliyeti modellenerek toplam değerden çıkarılmış, arsa değeri Makine Öğrenmesi ile geliştirilen arsa değerleme modeli sonuçları ile kıyaslanmıştır. Böylelikle yapılı bir taşınmazı meydana getiren zemindeki arsanın ve üzerinde bulunan binanın değerini ayrı ayrı ifade edebilen bir değerleme yaklaşımı geliştirilmiştir. Çalışmanın son aşamasında taşınmazlara ait tüm verileri ve değer haritalarını web ortamında kullanıcılarla paylaşmak için Bulut CBS tabanlı Taşınmaz Değer Bilgi Portalı geliştirilmiştir. Hem geleneksel sunucu-istemci mimarisi ile, hem de sunucusuz bulut yaklaşımı ile verilerin depolanması ve web servisleriyle paylaşılması sağlanmış, iki yöntem kıyaslanarak performans ve maliyet analizleri gerçekleştirilmiştir. Tez çalışmasında taşınmaz değerleme ve taşınmaz yönetimi anlamında uçtan uca tüm süreçlerin CBS ve Makine Öğrenmesine dayalı geliştirilmesi sağlanmış, sürdürülebilir arazi yönetimi paradigması çerçevesinde birlikte çalışabilir, bütüncül bir taşınmaz değerleme sistemi ortaya konmuştur.
Establishing an effective land management system has a vital role in building sustainable smart cities. Land value, which is one of the fundamental functions of the global land administration system, is encountered in many property-based transactions such as planning, taxation, zoning applications. In this sense, it is crucial to evaluate the value of properties objectively and in accordance with international standards. Advancements in technology have increased the use of intelligent systems such as Geographic Information Systems (GIS), Artificial Intelligence and Machine Learning, Cloud Computing, Building Information Modeling in mass valuation practices and improved the prediction accuracy dramatically. Unlike single-property valuation methods such as Sales Comparison, Income, and Cost approaches, which are known as classical methods, mass valuation provides evaluating a large number of properties in large areas by making use of information systems. Many countries have established a mass valuation system, especially for use in taxation studies. Moreover, other countries including Türkiye, continue to develop a national property valuation framework. On the other hand, countries that adopt a conceptual model design like ISO 19152 Land Administration Domain Model (LADM) standard, aim to carry out processes more effectively by creating country profiles for real estate valuation purposes. Multiple Regression Analysis, Hedonic Valuation, Nominal Valuation Method, Support Vector Machines, Random Forest, Artificial Neural Networks are some of the most prominent approaches for mass valuation studies. There is also a remarkable increase in the use of ensemble Machine Learning methods in housing price prediction applications. Ensemble Machine Learning methods provides better predictive models by aggregating several methods. Yet, ensembling is less interpretable, can be computationally expensive, and lacks taking into account spatial effects. There is a need for integrating the spatial variables into the predictive model using GIS. Although it is seen that GIS and Machine Learning based methods are used in valuation practices, integrated use of these two approaches are quite limited. In the thesis, first of all, a conceptual model based on LADM is designed in the UK study area, and an open source PostgreSQL/PostGIS database is created for transitioning to the physical model. Then, proximity, terrain, and visibility spatial analyzes are carried out in the Great Britain region covering England, Wales and Scotland. Then a nominal land value map is created with the GIS-based Nominal Valuation Method. Mass valuation process is carried out with various Machine Learning regression methods such as Linear Regression, Random Forest, XGBoost, CatBoost using HM Land Registry - Price Paid Data which records residential property sales in England and Wales. Although there are many physical variables of buildings in the valuation data, it was seen that the spatial and environmental criteria are insufficient. Therefore, the preliminary results of the regression analysis with only pyhsical determinants could not performed well. In order to improve the prediction accuracy, GIS and Machine Learning based hybrid method is developed. In this sense, spatial criteria scores obtained from GIS analyses are included in the price prediction data for feature enrichment purpose. After adding locational factors to the property price data, prediction accuracy of the global regression analysis increased significantly. It is observed that the R2 is improved by about 39% and the Mean Absolute Percentage Error value is improved by around 27%. Applying International Association of Assessors Office ratio analyzes, performance metrics such as Coefficient of Dispersion and Price-Related Differential complied with the mass appraisal standards. Most of the house price prediction studies generate a global regression model which omits spatial variability and geographic influence of the valuation factors. Global models are based on the approach that the estimation process is location-independent or the variables have the same characteristics for the entire study area. Spatial autocorrelation of the criteria and regional feature importances could not taken into account in the global regression models, while fixed criteria weights are applied for the entire study region. However, the factors affecting property value may vary depending on the location, environmental and socio-economic effects. Thus, Nominal Weighted Multivariate Spatial Clustering Method has been developed to calculate spatial autocorrelation and to generate value regions depending on the characteristics of the entire criteria. Hence, five different value regions have been determined with the clustering method and local regression models have been created in each cluster. Results showed that applying this novel weighted clustering approach increased the valuation accuracy and enabled obtaining region-specific feature importances and weight coefficients. To reveal local importance of the criteria that affect the property value, both permutation based feature importance and game theory based SHAPley values are calculated. SHAP summary table results shed light on how much and in which direction the variables affect the property value. The bias-variance tradeoff in artificial intelligence algorithms is an important indicator that reveals the learning characteristics of the model. The GIS and Machine Learning hybrid valuation method is also carried out in Istanbul and Izmir provinces to examine the generalization capability of the model. According to the results, with the contribution of spatial variables, the value of residential properties is also determined with high accuracy for the cities of Istanbul and Izmir after United Kingdom case study. In addition, within the scope of the thesis, Nominal Valuation Based Parametric Cost Modeling approach has been developed for decomposing the land and building values of the built real estates. In this context, the reconstruction cost of the basic components of the building is modeled and subtracted from the total property value, and the land value is compared with the results of the land valuation model developed with Machine Learning. Thus, a valuation approach has been developed that can separately express the value of the land on the ground and the building constructed on it. In the last stage of the thesis, the Cloud GIS-based Real Estate Value Information Portal is developed to share all the data and value maps of the properties with the users on the web. Using both the traditional server-client architecture and the serverless cloud approach, data is stored and shared via web services, performance and cost analysis are carried out by comparing these two methods. Results showed that serverless database responded to the query faster and scaled up during high workload to decrease latency. Hence, parcel vector data, which conveys ownership information and land values attributes, is shared directly from the PostGIS database as vector tiles. Besides S3 and AWS Lambda services are used for storing and disseminating raster-based land value map tiles. Leaflet and Mapbox GL JavaScript based web mapping libraries are used to develop the portal for providing dynamic and effective access to all information about real estates. In this study, all end-to-end processes in terms of real estate valuation and real estate management have been developed based on smart systems, and a holistic, interoperable approach has been revealed within the framework of the sustainable land management paradigm.