Geçmiş planlarımız hareketlerimizi yönlendirirler ve yeni planlar oluşturmamıza yardımcı olurlar. Bu yeni planlar, eski planlarımızın yeni duruma uyarlanmış versiyonlarıdırlar. Bu süreç "planlama yaparak öğrenme" olarak adlandırılabir. Bu süreçte çevre hakkında daha çok bilgi edinilir ve çevredeki objeler ve hareketler anlamlandırılır. Geçmiş planlarımızın bizi yönlendirmek konusunda yetersiz kaldığı durumlarda, kullanışlı planlar oluşturmak kolay değildir. Bizim dünyamızdan oldukça farklı, yanlış sağlayıcılar (false affordance) taşıyan objelerle dolu bir dünyada, rastgele olayların gerçekleşmesi çevreyi anlamlandırmayı ve onun bu sistemde hareketin planlanmasın engeller. Eğer bu dünya ile o dünya arasındaki farklar azsa, bir takım tekrar eden kalıplar bularak o dünyaya uyum sağlayabiliriz. Ancak aradaki farkların çok fazla olduğu durumlarda bazı durumlarda takılı kalabiliriz. Bu gibi koşullarda sistemi nasıl anlamlandıracağımızı bilemediğimiz için doğuştan gelen planlama mekanizmamızı kullanarak bu durumda nasıl mantıklı planlar oluşturabileceğimizi de bilemeyebiliriz, yani bu yeni sisteme göre plan yapmayı öğrenemeyebiliriz. Bu tezde, "öğrenmek için planlama" ve "plan yapmayı öğrenme" süreçleri karşılaştırılmaktadır. Bu amaç için objeler ile etkileşimin olduğu bir oyun geliştirdik ve bu oyunun oynanmasını içeren iki deney düzenlendi. Bu deneylerin sonucunda elde edilen bilgilerin ışığında geçmiş planlarını ve sağlayıcı bilgilerini kullanarak çevresi hakkında bilgiler toplayan ve planlamada kullanacağı bilgileri güncelleyen bir bilgisayar modeli geliştirildi.
|
Our prior plans supervise our actions and help us form new plans, which turn out to be the
modified versions of our related previous plans. This is the process that we call "plan to
learn", a procedure involving self-supervision to learn more about the environment and extract
meaning out of it. In cases where our prior plans fall short, it is not easy for us to produce
efficient or complete plans. For instance, in a world very different from our own, with objects
whose affordances appear to be false, encountering seemingly random situations prevent us
from understanding our environment and how to act in it. If the differences are small enough,
then we might be able to find patterns and adapt to that environment. However, if the distinctions
are too large to make a meaning out of them, we can be stuck on such occasions, as
we would not know how to make a reasonable plan in such a setting without supervision and
without using our innate planning mechanism, thus we cannot "learn to plan". In this thesis,
these two processes, "plan to learn" and "learn to plan" in structured problem domains are
compared. To this end, we conducted two experiments using a video game involving object
interaction and in the light of the outcomes, we developed a computer model that uses prior
plans containing affordances to learn about the environment and to update its knowledge of
the world. |