Tez No |
İndirme |
Tez Künye |
Durumu |
401349
|
|
Utilization of 3D data in face recognition /
Yazar:NESLİ ERDOĞMUŞ
Danışman: PROF. DR. JEAN-LUC DUGELAY
Yer Bilgisi: Institut Mines-Télécom / Yurtdışı Enstitü
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
İngilizce
2012
188 s.
|
|
Güvenlik uygulamalarına olan ihtiyaç ve yatırımlar büyük ölçüde artarken, özellikle bir
konu diger bir çok örüntü tanıma alanlarından çok daha fazla dikkat çekmektedir:
Biyometri - insanları fiziksel ve/veya davranıssal özelliklerine dayanarak tanıma. Bu
fiziksel özelliklerden biri olan yüz, erisilirlik ve güvenilirlik arasında sagladıgı uzlasma ile
ön plana çıkmaktadır. Bu doktora tezinde temel olarak, yüz tanımada digerlerine görece
daha yeni bir modalite olan 3B sekil bilgisi incelenmistir. Dogası geregi aydınlatma ve
durus degisikliklerinden etkilenmemesi dolayısıyla 2B karsılıgından daha avantajlı olsa da,
3B yüz bilgisi halen veri elde etme aksaklıkları veya yüz ifadeleri ve perdelemeden
kaynaklanan yüzey bozulmaları gibi önemli sorunlar ile karsı karsıyadır. Bu noktalar göz
önünde bulundurularak, 3B yüz verisinin ön-islemesi, nirengi noktalarının otomatik olarak
bulunması, yüz ifadelerinin ve tahriflerinin 3B benzetimleri, 3B öznitelik çıkarma ve 3B
bölgesel yüzey incelemesi konularının dahil oldugu kapsamlı bir çalısma sürdürülmüstür.
Plk olarak yüzün 3B gösterimleri ve buna baglı ön-isleme teknikleri gözden geçirilmistir.
Ön-isleme genel olarak yüz bölgesinin çıkarılması, ani çıkıntıların ve boslukların yok
edilmesi ve yüzeyin yumusatılması süreçlerinden olusmaktadır. Bunlara ek olarak, farklı
yüz bölgelerinin yapısal özelliklerine göre her iki modaliteyi (sekil ve doku) de kullanan bir
otomatik nirengi noktası bulma yöntemi sunulmustur.
Ardından, 3B yüz bilgisinin avantajları sistem kaydının hem 2B hem de 3B veriyle
yapıldıgı ancak tanıma için kullanılan test imgelerinin 2B imgeler oldugu asimetrik bir
senaryo dahilinde arastırılmıstır. Onyıllardır süregelen arastırma çalısmalarına ragmen, 2B
yüz tanıma sistemleri halen, özellikle mümkün olan tüm degisimleri temsil edemeyen az
sayıda örnegin oldugu durumlarda, sınıf-içi degisimlerde zorluklarla karsılasmaktadır. Bu
probleme yönelik, galeri kümesini genisletme amacıyla her birey için çesitli yüz ifadelerini
sentetize eden bir yüz tanıma sistemi önerilmistir. Pnce metal plaka egrileri (TPS) tabanlı
bir yöntem benimsenerek, yüz ifadeleri benzetimleri yapmak için soysal bir model,
istemciye özgü MPEG-4 uyumlu canlandırılabilir yüz modellerine bükülmüstür. Önerilen
galeri büyütmenin yüz tanıma basarımına olan yararlı etkileri deneylerle gösterilmistir.
Daha sonra, yukarıda bahsedilen uygulama çerçevesinin bir yan ürünü olarak, soysal
modeli bükme esnasında elde edilen TPS parametrelerinin biyometrik imzalar olarak
kullanılması önerilmis ve ayırdedici özellikleri analiz edilmistir. Çakıstırma uygulamalarında
çogu zaman gereksiz bir artık ürün olarak görülen bu parametreler aslında alısılagelmis
olandan (soysal model) sapmaları temsil etmektedirler. Bu noktadan hareketle yüz sekli
hakkında yogun bilgi içerdikleri ispatlanmıstır, ancak sonuçlar aynı zamanda yüz
ifadelerine olan dayanıksızlıklarını da ortaya koymusur.
Bu sonuçları müteakip, yüz modelleri için yerel asli sekil dagılımlarına dayanan, bölgesel
güvenilirlik seviyesi kestirimi algoritması gelistirilmistir. Yüz çakısmayacak sekilde 7
bölgeye ayrılmıs ve her bölge yüzey bozulumlarının miktarına göre degerlendirilmistir. Her
bir parça için, yapay bir sinir agı (ANN) kullanılarak güvenilirlik kestirilmistir. ANNler
yinelemeli en yakın nokta (ICP) tabanlı bir yöntem kullanılarak otomatik ölçülen bölgesel
kalite skorları esas alınarak egitilmislerdir. Burada "kalite" çözünürlük, gürültülülük, vs.
gibi özellikleri degil, yüz ifadesi ve perdelemeden kaynaklı yüzey bozulmalarının miktarını
esas almaktadır. Sonrasında, güvenilirlik dereceleri kestirimleri bölgesel eslestirme
skorlarının dogrulama ve kimlik belirleme amaçlı birlestirilmesinde kullanılmıstır. Bu amaç
için üç farklı tümlestirme yöntemi denenmistir: Toplam kuralı, Borda sayımı ve bölgesel
eslestirme skorlarını olasılıklara dönüstüren olasılıksal bir yöntem.
Son olarak, 3B yüz tanımada yeni yeni agırlık kazanan bir arastırma alanı ele alınmıstır:
yüzde kısmi tahrifat yaparak bir tanıma sisteminden kaçınmaya olan duygunluk. Plastik
cerrahi, prostetik makyaj, takma burun gibi bir çok araç kullanılarak gerçeklestirilebilen bu
tahrifatlar sayısız sekilde ve büyüklükte olabilir. Ne var ki, bu degisikliklerin olası etkileri
üzerine yapılan arastırmalar oldukça sınırlıdır. Bu doktora çalısmasında, burun bölgesine
uygulanacak benzer degisikliklerin çesitli önemli yüz tanıma teknigi basarımlarına olan
etkileri incelenmistir. Bu amaç için, her örnek yüz modelindeki burun bölgesinin rasgele
seçilmis bir baska burun bölgesi ile degistirildigi sentetik bir veri tabanı hazırlanmıs, burun
degisikliklerinin tanıma basarımlarındaki etkileri tayin edilmistir.
|
|
As the need and investment for security applications grow vastly, one particular topic
has certainly been attracting higher attention than many other pattern recognition fields:
biometrics – recognition of humans based on their physical and/or behavioral traits.
Among those traits, face stands out with its favorable reconcilement between accessibility
and reliability. In this doctoral dissertation, we principally investigate 3D shape which is a
relatively more recent modality in face recognition. Being advantageous to its 2D
counterpart for being intrinsically invariant to illumination and pose changes, 3D face
recognition still encounters major challenges such as acquisition inadequacy or facial
surface deformations due to expressions or occlusion. Bearing those in mind, a thorough
study is carried out on this topic, including pre-processing of 3D facial data, automatic
landmarking, facial expression and alteration simulations in 3D, 3D feature extraction and
3D regional surface analysis.
We firstly study pre-processing techniques for 3D face. The pre-processing includes
extraction of the facial region, elimination of spikes and holes in the facial mesh and
finally smoothing. Additionally, we present an automatic landmarking method that utilizes
both modalities (i.e. shape and texture) according to inherent characteristics of different
regions on face.
Then, we investigate the advantages of 3D face information in an asymmetrical
scenario in which a combined enrollment is realized by both 2D and 3D information
whereas the target images are still 2D images. Despite the decades of research, 2D face
recognition systems still encounter difficulties with intra-subject variations, especially in
case of few sample images which cannot capture all those possible deviations. For this
problem, we propose a face recognition system that synthesizes various facial expressions
for each subject to augment a given gallery set. By adopting a Thin Plate Spline (TPS) –
based method, we warp a generic model to generate client-specific MPEG-4 compliant
animatable face models for facial expression simulations and we demonstrate the
beneficial effects of the proposed gallery augmentation in recognition performances.
Next, as a useful by-product of the previous framework, we propose to employ the
TPS parameters that are obtained by warping the generic model as biometric signatures
and analyze their discriminative properties. Those parameters which have mostly been
overlooked as superfluous sediment in registration applications represent the deviations
from the conventional and they are proven to possess concentrated information about the facial shape. However, the results also revealed a frailty in the presence of facial
expressions.
Subsequently, we present a regional confidence level estimation algorithm for facial
surfaces based on local primitive shape distributions. Face is divided into 7 nonoverlapping
regions that are to be evaluated according to the presence of mesh
distortions. For each segment, an Artificial Neural Network (ANN) is utilized to estimate a
confidence level. The ANNs are trained using regional quality scores automatically
measured by an Iterative Closest Point (ICP)-based method. Here, "quality" implies the
absence of occlusions or expressions, rather than mesh resolution, noisiness, etc. In the
end, we exploit the reliability score estimations to combine the regional match scores for
verification and identification purposes via three different fusion methods at score level:
Sum rule, Borda Count and a probabilistic approach which converts match scores into
probabilities.
Finally, an emerging field of research in 3D face recognition is explored: susceptibility
to evasion in a recognition setting by partially modifying the facial surface. Those
modifications can be achieved via plastic surgery, prosthetic make-up, latex appliances,
etc. and they can be in countless different ways and amounts. However studies on their
possible impacts are still very limited. In this dissertation, we analyze how such changes
on nose region can affect the face recognition performances based on experiments
conducted by using several benchmark algorithms. For this purpose, a simulated face
database is prepared in which nose of each probe sample is replaced with another
randomly chosen one and the impact of the nose alterations on the recognition
performances is assessed. |