Yüz Örüntülerinden Cinsiyet Tespitinde Hibrit
Transkript
EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, 11-13 Mayıs 2016, Tokat TÜRKİYE Yüz Örüntülerinden Cinsiyet Tespitinde Hibrit Özniteliklerle Performans Geliştirme Uğur TURHAL1 1 Ahmet AKBAŞ2 Uğur TURHAL, 1Yalova Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü 2 Ahmet AKBAŞ, 2Yalova Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü 1 2 [email protected] [email protected] birlikte hali hazırda var olan yaya tanıma teknolojisine sahip araçlarda, sürücünün görüş açısını inceleyen bir kamera yardımıyla yol izlenir ve uygulanan örüntü tanıma yöntemi ile güzergâh üzerindeki nesnelerin yaya olma ihtimali değerlendirilerek, sürücü temelli olası kazaların önüne geçilmeye çalışılır. Özet Bir örüntüden yüz bölgesinin tespit edilmesi ve bu bölgede bulunan bireyin cinsiyetinin tahmini, özellikle yaş tahmini ile birleştirildiğinde, güvenlik sistemlerinde oldukça önemli bir yer tutmaktadır. Bununla birlikte, firmaların müşterilerini takip ederek, hangi yaş grubunun hangi tür ürünler ile ilgilendiğini tespit etmede ve buna bağlı olarak marka reklam maliyetlerini azaltmada etkili bir yöntem olacağı düşünülmektedir. Bu çalışmada FERET veri setine ait yüz örüntüleri Viola-Jones algoritması kullanılarak tespit edilmiş ve örüntüdeki bireyin cinsiyeti, çeşitli makine öğrenmesi yöntemleri ile tahmin edilmiştir. Cinsiyet tahmini için örüntü tanımada güçlü bir yöntem olan yerel ikili örüntü (Local Binary Pattern - LBP) histogramları ile yönlü gradyanların histogramı (Histogram of Oriented Gradients - HOG) yöntemleri bir arada kullanılarak hibrit bir veri kümesi oluşturulmuştur. Sınıflandırıcı sonuçları çeşitli performans analiz yöntemleri kullanılarak değerlendirilmiş ve sonuç kısmında problemin çözümüne yönelik en iyi yöntem önerilmiştir. Örüntü tanıma sistemlerinde, giriş örüntüsünden elde edilen öznitelikler yardımıyla tanımlanan veriler sınıflandırma işlemine tabi tutulur ve ait oldukları grupların tahmini sağlanır. Böyle bir sistem geliştirilirken kullanılacak öznitelik çıkartma algoritmalarının iyi tayini, sınıflandırma sonucunu doğrudan etkileyen parametrelerden biridir. Yüz örüntülerinden öznitelik elde etme işlemlerinde genellikle iki tür öznitelikten faydalanılır. Bunlar geometrik öznitelikler ve dokusal özniteliklerdir [4]. Geometrik öznitelikler, yüz üzerinde önceden tanımlanmış noktalar arasındaki Öklid uzaklık değerlerinin kullanılmasıyla elde edilir. Daha önceki çalışmalarda bu özniteliklere ait 10 temel oran belirlenmiştir [5]. Bu oranlar yardımıyla bir yüz örüntüsünün sınıflandırılması ve ait olduğu cinsiyet grubunun belirlenmesi mümkündür. Aydınlanmadan meydana gelebilecek değişimlere karşı dayanıklı olan bu öznitelikler, kamera, duruş açısı ve kafa pozisyonu gibi parametrelerden etkilenirler ve tespit edilmeleri güçtür. 1. Giriş Örüntü tanıma, veriler içerisindeki dokuları tanımlamak için kullanılan makine öğrenmesi sistemlerinin bir dalıdır [1]. Bir örüntüden elde edilen öznitelikler, makine öğrenmesi yöntemleri tarafından kullanılır ve örüntü hakkında sınıflandırıcı modelinin bilgi sahibi olması sağlanır. Bununla birlikte, örüntülerden elde edilen yüksek boyutlu veri kümeleri, sınıflandırıcıların performanslarını etkileyen en önemli unsurlardan biridir [2]. Kullanılacak bir takım yeniden tanımlayıcılar yardımıyla veri kümeleri daha düşük boyutlu alt uzaylara dönüştürülebilir. Burada temel amaç, minimum sınıflandırma maliyeti ve maksimum doğruluk elde etmektir [3]. Dokusal öznitelikler ise örüntünün tamamı ele alınarak elde edilir. Diğer yöntemlere nazaran aydınlanma, poz ve kamera açısı gibi örneğe özgü problemlerden daha az etkilenmeleri, bu özniteliklerin yüz tanıma sistemlerinde verimliliği arttırmasındaki en önemli nedenlerdendir [4]. 2. Materyal ve Metod Bu çalışmada FERET veri setinde bulunan 14,051 yüz örüntüsünden algoritma tarafından seçilen 304’ ü erkek bireylere, 196’ sı kadın bireylere ait toplamda 500 örüntü kullanılmıştır [6-8]. Kullanılan örüntülerde yüz bölgelerinin tespiti Viola-Jones algoritması tarafından sağlanmıştır. Elde edilen örüntüden Yerel İkili Örüntü (LBP) algoritması ve Yönlü Gradyanların Histogramı algoritmaları ile histogramları çıkartılmıştır. Ardından veri kümesinin boyutu Kamera sistemlerin gittikçe yaygınlaştığı günümüzde bilgisayarlı görme ve örüntü tanıma konuları oldukça önem kazanmıştır. Dünyaca ünlü otomobil üreticilerinin geliştirmeye çalıştığı sürücüsüz otomobil teknolojisi, bu alanlara verilebilecek en güncel örneklerden biridir. Bununla 361 EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, 11-13 Mayıs 2016, Tokat TÜRKİYE İlişki Temelli Öznitelik Seçme (CFS) algoritması kullanılarak küçültülmüştür. Elde edilen yeni veri kümesi k-En Yakın Komşu (kNN) ve Naive Bayes sınıflandırıcıları kullanılarak sınıflandırılmış ve sonuçlar tablolar yardımıyla kıyaslanmıştır. 2.1. Viola-Jones Algoritması Viola-Jones algoritması; örüntülerden yüz, göz, burun ve ağız bölgelerini tespit etmek amacıyla 2001 yılında Viola. P ve Jones. M. tarafından ortaya çıkarılmış bir yöntemdir [9]. Kullandığı Haar öznitelikleri ile yüz bölgesi içeren ve içermeyen veriler kullanılarak, önceden eğitilen bir sınıflandırıcı yardımıyla bu bölgelerin tespitini yapar. 1 saniyenin altındaki cevap süresiyle oldukça kullanışlı bir algoritmadır. Bununla birlikte, örüntü üzerinde tespit edilen hatalı alanlar algoritmanın bir dezavantajı olarak görülebilir. Şekil 1: Yüz tespit algoritması çalışma diyagramı Resim 1: Viola-Jones algoritması ile hatalı tespit edilen göz bölgeleri. 2.2. Öznitelik Çıkartma Öznitelik; makine öğrenmesi ve örüntü tanımada bir olgu için tespit edilen bireysel ölçülebilir özelliktir [1]. Örüntü tanımada birçok öznitelik çıkartma algoritması kullanılmaktadır. Bu çalışmada, örüntülerden dokusal öznitelikleri çıkartan Yerel İkili Örüntü (LBP) ve Yönlü Gradyanların Histogramı (HOG) algoritmaları kullanılmıştır. Ayrıca algoritma, düşey ile 15 dereceden fazla açı yapan bir yüz örüntüsünü tanımada yine başarılı olamamaktadır. 2.2.1. Yerel İkili Örüntü (LBP) LBP dokusal öznitelik çıkartma algoritması; resmin yerel yapısını özetleyen, gri seviyeden bağımsız bir doku ölçü yöntemidir [10]. Orijinal LBP algoritması merkez ve komşu pikseller arasında sıralı ikilik kod sistemi karşılaştırmalarına dayalı ayrımsama gücü yüksek bir analiz tekniğidir [11]. Her bir resim pikseli, kendisini çevreleyen 3x3 lük komşu bölgeleriyle arasındaki farkın u(x) basamak fonksiyonu kullanılarak ikilileştirilmesiyle etiketlenir [12]. Bir örüntüye ait LBP histogramı aşağıdaki eşitlikle elde edilir; Resim 2: Düşeyle sırasıyla 0, 15 ve 30 derece rotasyon açısına sahip yüz örüntülerinde Viola-Jones algoritmasının başarımı. Bu problemlerin önüne geçebilmek için tasarlanan algoritmanın çalışma diyagramı Şekil 1’ de verilmiştir. P 1 LBPP , R ( xc , y c ) s( g p g c )2 p (1) 1, t 0 s(t ) 0, t 0 (2) p 0 ise, ise. Eşitlikte (xc,yc) merkez pikselin LBP algoritmasına göre değerini, gp merkez pikselin komşularını, gc merkez pikselin gri değerini, R komşuların merkez piksele olan uzaklığını, P ise işleme sokulan komşu sayısını ifade etmektedir [13]. 362 EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, 11-13 Mayıs 2016, Tokat TÜRKİYE Bu çalışmada öznitelik seçme işlemi için İlişki Tabanlı Öznitelik Seçme (Correlation-based Feature Selection – CFS) algoritması kullanılmıştır. 2.3.1. Resim 3: üretilmesi. Giriş örüntüsünden LBP CFS ilişki bazlı bir filtreleme algoritmasıdır. Özniteliklere ait alt kümeler oluşturup bunların sınıflandırma ile olan ilişkisini inceler. Alt kümeleri oluştururken şu hipoteze göre çalışır: İyi öznitelik alt kümeleri, sınıflandırma ile ilişkisi olmayanlardan ziyade yakından ilişkili olan öznitelikleri barındırır [15]. Bir veri kümesinde CFS algoritması aşağıdaki eşitlik ile uygulanır; histogramının Bu çalışmada kullanılan 100x100 piksel boyutlarındaki yüz örüntüleri LBP algoritması tarafından 24x24 piksellik alanlara bölünmüştür. 2.2.2. I x I * Dx ve G I x2 I y2 q tan 1 Ix Iy Dy DxT I y I * Dy (7) k k (k 1)rii Eşitlikte rzc; Bir araya getirilen bileşenler ile diğer değişkenlerin ilişkisini, k; Bileşen sayısını, rzi; Bir araya getirilen bileşenler ile diğer değişkenlerin ortalama ilişkisini, rii; Bir araya getirilen bileşenler arası ortalama iç ilişkisini temsil etmektedir. HOG yöntemindeki temel amaç imgeyi bir grup lokal histogramlar olarak tanımlamaktır. Bu gruplar, imgenin yerel bir bölgesindeki gradyanların yönelimlerinde, gradyanların büyüklüklerinin toplandığı histogramlardır. Bir imgenin HOG değerlerinin çıkartılması için gerekli olan hesaplamalar aşağıda verilen eşitlikler ile sağlanır [14]: ve k rzi rzc Yönlü Gradyanların Histogramı (HOG) Dx 1 0 1 İlişki Tabanlı Öznitelik Seçme (CFS) 2.4. Sınıflandırma Sonuçları ve Performans Analizi Giriş örüntüleri için LBP algoritması tarafından üretilen 944 öznitelik ile HOG algoritması tarafından üretilen 4356 öznitelik Naïve Bayes ve k-En Yakın Komşu (kNN) sınıflandırıcıları kullanılarak, 10-Kat Çapraz Doğrulama (Ten Fold Cross Validation) – Birini Dışarıda Bırak (Leave One Out, LOO) yöntemleri ile sınıflandırılmıştır. Ardından aynı veri setleri, öznitelik seçme algoritmasından geçirilmiş ve boyutları küçültülmüştür. Yeni veri setleri kullanılarak sınıflandırma işlemleri tekrar edilmiştir. Son olarak öznitelik seçme algoritması ile boyutları küçültülen bu iki veri setinin birleştirilmesiyle elde edilen yeni veri kümesi ile sınıflandırma işlemleri tekrar edilmiştir. Elde edilen sonuçlar Tablo 1’de gösterilmiştir. (3) (4) (5) (6) Eşitlik 3’ te yatay ve dikey Sobel filtreleri tanımlanmıştır. Bu filtreler giriş örüntüsüne uygulanarak, örüntünün yatay ve dikey kenarları Ix ve Iy olmak üzere tespit edilir (Eşitlik 4). Sobel filtresi uygulanan Ix ve Iy örüntüleri kullanılarak, Eşitlik 5’ e göre bu örüntülerin gradyanları, ardından Eşitlik 7’ ye göre bu gradyanların yönelim açıları ( G ve θ ) hesaplanır. Bu çalışmada kullanılan 100x100 piksel boyutlarındaki yüz örüntüleri HOG algoritması tarafından bir bütün olarak ele alınmış ve örüntü üzerinde herhangi bir bölümlendirme işlemi yapılmamıştır. Tablo 8: Sınıflandırma sonuçları SINIFLANDIRICILAR YÖNTEM ÖZNİTELİK SAYISI - Naïve Bayes k-NN (k=1) Doğr. (%) ROC Süre (sn) Doğr. (%) ROC Süre (sn) LBP - 944 88.80 0.923 2.5 96.60 0.961 ~4 HOG - 4356 88.20 0.914 ~8 94.40 0.938 ~15 LBP - 98 91.00 0.950 ~1 96.40 0.957 ~1 HOG - 182 92.20 0.971 ~2 95.60 0.952 1.5 (LBP + HOG) - 280 93.20 0.968 ~1 97.60 0.970 ~2 2.3. Öznitelik Seçme Öznitelik seçme yöntemleri; temel ya da bağımsız bileşenlere en az katkı yapan özniteliklerin düşük ayırt edici özelliğe sahip olduğu fikrini esas alarak, daha anlamlı olan özniteliklerin yeni bir sınıflandırma uzayı altında toplanmaları esasına dayanır [5]. Yüksek öznitelik vektörlerine sahip veri setlerinde sınıflandırma süresi ve maliyetlerinin azaltılması, sınıflandırıcı performansının arttırılması ve çok boyutluluk problemininin (curse of dimensionality) önüne geçilmesi adına bu algoritmalar geliştirilmiştir [15]. Tablo 1’ de bulunan ilk iki satır; ham veri setlerine ait sonuçları, üçüncü ve dördüncü satır; öznitelik seçme algoritması uygulanan veri setlerine ait sonuçları, son satır 363 EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, 11-13 Mayıs 2016, Tokat TÜRKİYE ise; önerilen yönteme ait sonuçları göstermektedir. Tabloda verilen doğruluk değeri, doğru sınıflandırılmış verilerin tüm doğru verilere ait oranını, ROC değeri ise sınıflandırma sonucunun şans ile olan ilişkisini belirtir. Performans analizi yapılırken bu iki kriter birlikte değerlendirilir. Doğruluk değerinin 100’e, ROC değerinin ise 1’e yakınlığı, sınıflandırmanın kalitesini gösterir. Verilen hesaplama süreleri, sınıflandırıcıların; model oluşturma ve 10 kat çapraz doğrulama işlemlerinin tümünü tamamlayıncaya kadar geçen zamandır. arttırılması sağlanabilir. Bununla birlikte, en iyi sonuçları üretecek maksimum örnek sayısının belirlenmesi gibi bir optimizasyon problemi konusu üzerinde de durulabilir. 4. Kaynaklar [1] Bishop, C. M. “Pattern Recognition and Machine Learning”. Springer. pp. vii., 2006. [2] Babur S., et al., “DVM Tabanlı Kalın Bağırsak Kanseri Tanısı İçin Performans Geliştirme”, ELECO, 2012. [3] Biricik, G., Diri, B. ve Sönmez, A. C. “Abstract feature extraction for text classification.” Turkish Journal of Electrical Engineering and Computer Sciences, 11371159, 2012. [4] Kılınç, M., “Yüz Resimlerinden Yaş Tahmini”, Yüksek Lisans Tezi, 2012. [5] Chellappa R. ve Ramanathan N., “Face Recognition across Age Progression”. Proc. Face Recognition Grand Challenge and ICE Workshop, 2006. [6] Phillips, P. J., Wechsler, H., Huang J. ve Rauss, P. “The FERET database and evaluation procedure for facerecognition algorithms.”, Image and Vision Computing 16, 295-306, 1998. [7] Phillips, P. J., Moon, H., Rizvi, S.A. ve Rauss, P. J. “The FERET evaluation methodology for facerecognition algorithms”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 22, 1090-1104, 2000. [8] FERET Color Veri Seti (Versiyon: 1), http://www.nist.gov/itl/iad/ig/colorferet.cfm, E.T: 2016. [9] Viola P. ve Jones M., “Robust real time object detection”. In IEEE ICCV Workshop on Statistical and Computational Theories of Vision, 2001. [10] Ojala, T., Pietikäinen M. ve Harwood, D., "A Comparative Study of Texture Measures with Classification Based on Feature Distributions," Pattern Recognition, vol. 29, 51-59, 1996. [11] Marcel S., Rodriguez Y. ve Heusch G., “On the recent use of local binary patterns for face authentication”. International Journal on Image and Video Processing Special Issue on Facial Image Processing. IDIAP-RR, 06-34, 2007. [12] Ojala, T., Pietikainen M. ve Maenpaa T., "Multiresolution Gray-Scale and Rotation Invariant Texture Classification with Local Binary Patterns," IEEE Trans. Pattern Analysis and Machine Intelligence, 24, 971-987, 2002. [13] Kimmel, R., Klette, R. ve Sugimoto A., Computer Vision - ACCV 2010, Springer, New Zealand, 2012. [14] Kobayashi, T., Hidaka, Akinori. ve Kurita, T., "Selection of Histograms of Oriented Gradients Features for Pedestrian Detection.", ICONIP, 4985, 598-607, 2008. [15] Bellman, R.E., Dynamic programming. Princeton University Press. ISBN 978-0-691-07951-6, 1957. [16] Hall, M. A. Correlation-based Feature Subset Selection for Machine Learning. Hamilton, New Zealand., 1998. [17] Guo, J.M., Lin, C.C., Nguyen, H.S., “Face gender classification using improved appearance-based average face difference and support vector machine.” International Conference on System Science and Engineering, 637–640, 2010. Tablo 2’de aynı veri seti kullanılarak farklı yöntemlerle elde edilmiş sonuçlar bulunmaktadır. Tablo 9: Geçmiş çalışmalarda elde edilen sonuçlar Sonuç Çalışma Ref % 88,89 Doğruluk Guo, J.M. et al., [17] % 92,50 Doğruluk Mayo, M. ve Zhang, E. [18] % 93,00 Doğruluk O. Ozbudak et al. [19] % 95,05 Doğruluk Jabid, T.H.K. ve Oksam Chae, .M. [20] 3. Sonuçlar Sonuçlar incelendiğinde en yüksek doğruluk ve ROC değerlerinin kNN sınıflandırıcısında, önerilen yöntem ile oluşturulan veri setinden elde edildiği gözlemlenmektedir. Bununla birlikte önerilen yöntemin hesaplama süresindeki başarısı, özellikle gerçek zamanlı bir sistem tasarlanırken, gerek işlem süresi, gerekse sağladığı yüksek doğruluk ve ROC değerleri göz önünde bulundurulduğunda, kullanılabilirliğinin artmasında etkili bir parametredir. Ayrıca kNN sınıflandırıcısının Naive Bayes sınıflandırıcısına oranla daha yüksek sonuçlar vermesi, tasarlanan yüz tanıma modelinde, mesafe fonksiyonunun olasılık fonksiyonuna nazaran daha performanslı çalıştığını ortaya koymaktadır. Çalışmada elde edilen değerler Tablo 2’ deki veriler ile karşılaştırıldığında, hem doğruluk hem de hesaplama süresi alanlarında algoritmaların oldukça etkin çalıştığı gözlemlenmektedir. Yüz örüntülerinin hazırlanmasında kullanılan normalizasyon tekniği ile öznitelik çıkartma işleminde kullanılan LBP ve HOG algoritmalarının uyumlu çalışması, sonuç değerlerini yükseltmede etkili olmuştur. Bununla birlikte, kullanılan öznitelik seçme algoritmasının veri seti ile uyumu, daha düşük veri uzayında sınıflandırıcıların daha yüksek sonuçlara ulaşmasını sağlamıştır. Bundan sonraki çalışmalarda hibrit sınıflandırıcı yöntemlerinin bir arada kullanılmasıyla oluşturulacak yeni modeller belirlenerek sınıflandırma sonuçlarında kalitenin 364 EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, 11-13 Mayıs 2016, Tokat TÜRKİYE [18] Mayo, M. ve Zhang, E., “Improving face gender classification by adding deliberately misaligned faces to the training data”. IVCNZ08, 1–5, 2008. [19] Ozbudak, O., Tukel, M., Seker, S.: “Fast gender classification.”, Computational intelligence and computing research (ICCIC). IEEE International Conference, 1–5, 2010 [20] Jabid, T.H.K. ve Oksam Chae, M.: “Gender classification using local directional pattern (LDP).”, 20th International Conference on Pattern Classification (ICPR), 2162–2165, 2010. 365
Benzer belgeler
sınıf bilgisini kullanan boyut indirgeme yöntemlerinin metin
[1] Joachims, T., “A Probabilistic Analysis of the Rocchio
Algorithm with Tfidf for Text Categorization” in
Sıkıştırılmış Algılama Kullanarak Yeni Bir Yüz Gösterimi
[9] Viola P. ve Jones M., “Robust real time object
detection”. In IEEE ICCV Workshop on Statistical and
Computational Theories of Vision, 2001.
[10] Ojala, T., Pietikäinen M. ve Harwood, D., "A
Com...
YÜZ RESİMLERİNDEN YA BİLGİSİNİN TESPİT EDİLMESİ
sonucunu doğrudan etkileyen parametrelerden biridir.
Yüz örüntülerinden öznitelik elde etme işlemlerinde
genellikle iki tür öznitelikten faydalanılır. Bunlar geometrik
öznitelikler ve dokusal öznit...
Separating nut-shell pieces from hazelnuts and pistachio kernels
Processing, 2005. Proceedings.(ICASSP’05). IEEE International Conference on, vol. 5. IEEE, 2005, pp. v–649.
T. Pearson, A. E. Cetin, A. Tewfik, and V. Gokmen, “An overview
of signal processing for ...