BİLGİSAYARLI GÖRME
10. BİLGİSAYARLI GÖRME
İnsan yeteneklerini taklit eden ve onun gibi davranan makineler yapmak her zaman heyecan verici bir araştırma konusu olmuştur. Başlangıçta, bilgisayar insan kadar ve hatta ondan çok daha iyi hesap yapabilme yeteneğini kazanınca, düşünme, işitme, konuşma tanıma, görme gibi yeteneklerin de rahatlıkla gerçekleşebileceği düşünüldü. Amaç bilgisayarın, insan gibi, dış dünyayı algılamasının ve edindiği verileri akıllı bir biçimde işleyerek çeşitli problemlere çözüm üretmesini sağlamaktı[1].
[1].
10.1. NE YAPMAYA ÇALIŞIYORUZ VE NEDEN ÇOK ZOR?
İnsan görme sistemi dış dünyayı, adına “ışık” dediğimiz elektromanyetik enerjinin cisimlerden yansıyarak göz üzerindeki retinaya düşmesi ile algılar. Üç boyutlu evrenden algıladığı bu verileri iki boyutlu veri haline dönüştürerek işler ve yaşamı boyunca oluşturduğu bilgi bankasını da kullanarak değerlendirir. Bu işlemler sırasında bir yandan bilgi bankasını sürekli geliştirirken, diğer yandan da yaşamını sürdürmek için gerekli eylemleri yapar[1].
Pek de farkında olmadan sürekli yaptığımız bu işi nasıl gerçekleştirdiğimiz Aristo’dan beri üzerinde çalışılan bir araştırma konusudur. Ama sorunun cevabı hala tam olarak verilmiş değildir. Bu bilgi olmadan da kendi kendine gören ve gördüğünü değerlendiren bir bilgisayar yapabilmek olanaklı görünmemektedir. Ne yazık ki, insan görme sistemi henüz bizler için giriş ve çıkış elemanlarını bildiğimiz, kara bir kutudan ibarettir. Her geçen gün yeni deney ve buluşlarla bu kara kutunun orasını burasını anlamaya çalışıyorsak da hala kat edilmesi gereken uzun bir yolumuz mevcuttur. Üstelik bu kara kutuyu tam anlamı ile çözebilmemizin sorunu çözmek için yeterli olacağı da söylenemez. Zira göz-beyin yapısındaki karmaşıklığı bildiğimiz matematiksel araçlarla modelleyebilmemiz başlı başına bir sorun olarak karşımıza çıkmaktadır. Yine de, bu konudaki araştırmalar devam etmektedir[1].
Bu açıklamalardan sonra insan görme sistemini bilgisayarda canlandırmaya çalışmanın bilimden ziyade bir bilim kurgu olduğu rahatlıkla anlaşılabilir. Ama hala bilgisayarlı görme konusunda yapabileceğimiz yararlı işler ve çözebileceğimiz problemler vardır: İki boyutlu görüntülerden kısmi ama faydalı bilgiler çıkarabilmek ve bu bilgilerin bilgisayar tarafından değerlendirilerek belirli problemleri çözmesini sağlayan algoritmalar, yazılım ve donanımlar geliştirmek mümkündür[1].
Bilgisayarlı görme sistemlerinde, insan görme sistemini canlandırmaktan ziyade, problem çözümüne yönelik modeller ve yöntemler geliştirmemiz gerekmektedir. Bu tür yaklaşımın iki genel adımı mevcuttur:
1. Problemin özelliklerini belirleyerek bu probleme özgü matematiksel modeller geliştirmek,
2. Geliştirilen modelleri kullanarak problem çözümü için gerekli algoritmaları bulmak ve bu algoritmaları geçekleşebileceği yazılım ve donanımları geliştirmek.
Örneğin; amacımız posta zarflarının üstündeki adresleri otomatik olarak okuyan ve tasnif eden bir sistem geliştirmek olsun. Bu problemi çözebilmek için insan görme sistemini modelleyeceğimize, posta zarflarını bu problem için modellememiz ve daha sonra da bu zarfların üzerindeki yazıları tanıyacak bir yöntem geliştirmeniz yeterli olacaktır. Böylece, işi çok daha basite indirgeyebiliriz. İnsan görme sistemini canlandırmaya yönelen bir yaklaşımdan vazgeçerek, performansa yönelik bir yaklaşımla sorunumuza daha kolay çözüm üretebiliriz.
Bilgisayarla görme sistemleri performansa yönelik problem çözme yaklaşımı kullanılarak birçok uygulama alanında başarı ile kullanılmaktadır. Aşağıdaki bölümde bu konudaki popüler uygulamalardan bazı örnekler verilmektedir[1].
10.2. Bilgisayarlı Görmenin Uygulama Alanlarına Örnekler
1990’lı yıllarda bilgisayarlı görme ile ilgili teknolojiler, gelişmiş ülkelerde her yıl neredeyse ikiye katlanarak büyümüş ve milyarlarca dolarlık dev bir piyasa meydana getirmiştir. Aşağıda bu alanda geliştirilen bazı sistemlere örnekler verilmektedir:
10.2.1. Robot Görme Sistemleri
Bilgisayarlı Görme konusunun en önemli uygulama alanlarından birisi kameralar aracığı ile algıladığı görüntüleri değerlendiren ve bu değerlendirmeye göre iş yapan robotlardır. Tekrarlı işleri yapan robotlar 20. yüzyılın ikinci yarısından itibaren birçok üretim hattında kullanılmaktaydı. Ama bu robotların hemen hepsi, 10 yıl öncesine kadar kördü. Yanı işlerini görsel özellikleri olmadan yapıyorlardı. 2000’li yıllara girdiğimiz şu sıralarda, başta Amerika Birleşik Devletleri ve J Japonya’da olmak üzere yüz binlerce gören robot kullanılmaktadır[1].
Bilgisayar görme sistemleri karmaşıklık gösterse de, hepsi için geçerli olan birkaç teknik vardır. Kameradan gelen bir görüntünün kullanışlı bir şekilde işleme tabi tutulmasından önce, bu görüntünün bilgisayar tarafından anlaşılabilecek şekle dönüştürülmesi gerekmektedir. Bu dönüşüm işlemine görüntünün sayısallaştırılması denir[2].
Bu işlemde; görüntünün her bir piksel değeri bir sayı olarak hafızada depolanacak olan karelere bölünür. Her piksel noktasında görüntünün parlaklığını ve koyuluğunu temsil eden bir tamsayı bulunur. Bütün piksel değerleri için bu işlem gerçekleştirildiğinde, görüntü tamsayılardan oluşmuş bir matris şekline dönüşür. Resim bilgisi bu biçime getirildiği zaman, yazılım tarafından işlenmeye hazırdır[2].
Bilgisayar görmesi bazı ölçütlere göre sağlanır. Fakat bu ölçütler nelere bağlıdır, nelerle sınırlıdır tam olarak açıklanamaz. Bu sınırları daha iyi inceleyebilmek için, araştırmacılar bilgisayar görmesini aşağıdaki bölümlere ayırmışlardır[2].
q Resim işleme
q Görüntü işleme
q Örüntü tanıma
q Durum analizi
q Optik işleme
q Video işleme
q Görüntü yorumlama
a-) Kalite Denetiminde Bilgisayarlar: Hemen her türlü üretim hattında üretilen malzemenin kalite denetimini yapabilmek için mekanizmalar vardır. Tekstil, gıda, ağır sanayi, elektronik, beyaz eşya, savunma sanayi gibi birçok alanda üretim hattının sonunda bulunan insanlar “ürün doğru çıkmış mı’, “paketlemesi düzgün mü” gibi denetimleri yapmak için ürünü bazen evirip çevirerek, bazen de görsel olarak inceleyerek, saatlerce ayni işi tekrar ederler[1].
İnsanlar için sıkıcı olan bu iş, günümüzde yavaş yavaş bilgisayarlı görme sistemleri ile yapılmaya başlanmıştır. Kameralar ile ürün görüntüleri elde edilerek çeşitli yazılımlar aracılığı ile düzgün üretilip üretilmedikleri kontrol edilir (Şekil 10.1). Geliştirilen bu sistemlerden bazıları insan denetiminden çok daha mükemmel ve kusursuz çalışabilmektedir. Örneğin; optik kameralara ek olarak yeri geldikçe termal kameraların kullanımı ile ısıya dayanıklı malzemelerin kalite kontrolü yapılabilir. Röntgen kameraları, bavulları ve paketleri açmadan güvenlik kontrolü yapabilir. Gece görüş kameraları ile askeri karar destek sistemleri geliştirilir. Yorulmak bilmeden işlerini gören bu sistemler hem insanlardan daha hızlı hem de 24 saat ara vermeden ve hata yapmadan çalışabilirler[1].
b-) Robot İşçiler: Bir fabrikada tekrarlı ve basit işleri, görme yeteneği olan robotlara yaptırabilmek mümkündür. Örneğin; herhangi bir malzemenin belirli bir yerden diğer bir yere taşınması için taşıyıcı robotlar geliştirilmiştir. Bu robotlar taşıyacakları malzemeyi bir kamera ile gözlerler[1].
Belirli bir birikim olunca kepçeleri ile arkadaki hazneye yüklerler ve dolunca hareket ederek gereken yere götürürler. Yol boyu kameraları ile etraflarını gözleyerek kaçınılması gerekli tehlikelerden kaçınırlar. Duvarlara çarpmadan ilerler ve önlerine bir engel çıktığı zaman değerlendirme yaparak yön değiştirirler. Bu tür robotlar birçok askeri ve sivil uygulamada kullanılmaktadırlar. Örneğin; atılan bir topu tutarak tenis oynayabilirler, teknik resimleri okuyarak tasarım yapabilirler, yüksek hızda giden hedefleri yakalayarak otomatik olarak roket ateşleyebilirler ve hedefi yok edebilirler[1].
Şekil 10.1: Parça denetim ve tasnif sistemi.
10.2.2. Tıbbi Uygulamalar
Görüntü işleme ve bilgisayarlı görme sistemlerinin en yaygın olarak kullanıldığı alanlardan birisi tıbbi uygulamalardır[1].
Hastanelerdeki bilgisayarlı görüntü arşivleri, çekilen röntgen, tomografi ve ultrason görüntülerinin bilgisayar ortamında saklanmasını ve istenen bilgiye erişimini sağlayan görüntü veri tabanlarıdır. Çekilen her türlü tıbbı görüntü, bilgisayar ortamında sayısal olarak saklanabilir. Bu görüntüler, bir görüntü veri tabanı aracılığı ile sorgulanabilir. Hastanın ismine, görüntünün alındığı tarihe, hastanın çeşitli özelliklerine, (yaş, cinsiyet vb.) ya da hastalığa göre sorgulama yapılabilir. Böyle bir görüntü veri tabanında doktor “bana şu kişinin röntgenini getir” diyebileceği gibi, “bana akciğer kanseri olan 55 yaşının üstündeki kadınların röntgenlerini getir” diye de sorgulama yapabilir. Orta büyüklükteki bir hastanede günde yüzlerce tıbbi görüntü üretildiği göz önüne alınırsa, zamanla bu hastanelerde ne kadar çok sayıda görüntü oluşacağı rahatlıkla anlaşılabilir. Bu görüntüleri saklayacak alanı bulmak bir yana, saklanan binlerce görüntü arasından doktorun aradığı görüntüye ulaşması da önemli bir sorundur. Görüntü arşivleme sistemleri ile yüzlerce metrekarelik arşiv odaları birkaç CD’nin içine sıkışır. Günlerce süren aramalar saniye boyutlarına indirgenir[1].
Tıbbi uygulamaların diğer önemli bir alanı ise doktorlar için geliştirilen teşhis destek sistemleridir. Bu sistemler tıbbi görüntüleri görüntü işleme teknikleri ile işleyerek çıplak gözle bakıldığında görülemeyen bilgileri çıkarırlar ve doktorların teşhis koymalarında yardımcı olurlar[1].
Şekil 10.2: Tomografi ile 3 boyutlu görüntü çıkarımı sistemi.
10.2.3. Güvenlik Sistemleri
Bilgisayarlı görme sistemlerinin yaygın uygulama alanlarından birisi de askeri ve sivil amaçlı güvenlik sistemleridir. Bu konuda geliştirilmiş çok çeşitli teknoloji mevcuttur. Aşağıda birkaç örnek vermekle yetinelim:
a-) Giriş/Çıkış Denetimi: İşyerlerinde personel ve misafirlerin giriş-çıkışının denetimi için geliştirilen birçok sistem mevcuttur. Eskiden kullanılan kart basma sistemleri, yerlerini optik bir ortama atılan imzayı ya da basılan parmağın izini tanıyan sistemlere bırakmaktadır. Sayısallaştırılan imza veya parmak izi bu amaç için geliştirilmiş bir görüntü tanıma programı tarafından değerlendirilerek yerinin hangi personele ait olduğu belirlenir. Misafirler için ise kategorilere göre bir değerlendirme yapılır. Misafirin gideceği şube veya bölüm, ziyaret edeceği kimseler, ziyaret süresi vb. kaydedilir. Bu sistemler gün sonu, 0 kuruma kaç kişi girmiş-çıkmış, kurum içinde kimler nerelerde dolaşmış, gibi istatistiksel bilgileri üretebilirler ve kişi bazında devamsızlık değerlendirmeleri yaparlar. Hatta verilen maaş, sicil, izin gibi personel bilgi sistemlerine de otomatik olarak işleyebilirler. İnsan yüzünü tanıyarak kontrol yapabilen sistemler ise henüz geliştirme aşamasındadır[1].
b-) Akıllı Güvenlik Kameraları: Kameralar aracılığı ile gözlenen bir alanda, herhangi bir tehlikeyi değerlendiren yazılımlar, alarm sistemini harekete
geçirirler. Bunun için, kurumun izlenmesi gereken alanlarına sayısal kameralar yerleştirilir.
Kameralardan alınan görüntüler bir yazılım
tarafından değerlendirilir. Örneğin; gece güvenlik sistemlerinde kamera görüntüleri durağandır. Yanı, ortada hareket eden cisimler olmadığı için görüntü zaman içinde değişim göstermez. Ardı ardına çekilen görüntüler arasındaki fark hesaplanır. Bu fark sıfır çıktığı sürece sorun yoktur. Herhangi bir değişim ardışık olarak çekilen görüntülerde fark oluşturur ve bu değişim büyüklüğüne göre bir elektrik sinyali ile bekçiyi veya alarm sistemini uyarır. Tabii, sadece fark alarak karar veren bir sistemde içeri giren bir sineğin hırsız etkisi yapması son derece doğaldır. Dolayısı ile, bu sistemler fark almakla yetinmez, çok daha karmaşık yöntemler kullanırlar[1].
c-) Parmak İzi Tanıma Sistemleri: Biometrik sistemlerin kullanılmaya başlamasından bu yana parmak izi tanımlama sistemi en çok tercih edilen sistem olmuştur. Parmak izinin tek ve kesin sonuç getirdiği herkes tarafından kabul edilmiştir. Bir parmak izi yüzeyindeki birçok halka, ilmek, kemer ve adalardan oluşur. Hat bitimlerine minutiae adı verilir ve karşılaştırma bu minutiaelere göre yapılır. Parmak izi yüz yılı aşkın süredir kullanılan bir kimlik belirleme tekniğidir. Tek yumurta ikizleri dâhil olmak üzere; her insanın parmak izinin farklı oluşu, yıllar ile değişmemesi, kolay kullanım ve gelişen yeni teknolojiler bu tekniğin yaygın kullanımını sağlamıştır. Günümüzde parmak izi polisiyle uygulamaların yanı sıra, kapı giriş kontrolleri, bilgisayar giriş şifrelemesi, bilgisayar donanım şifrelemesi, elektronik imza, araba kapıları, kimlik kartları gibi pek çok alandaki uygulamalarda yerini bulmuştur[3].
Parmak İzi Sensörü Çalışma Prensibi: Parmak izi sensörü parmak izini elektrik dalgaları kullanarak tanımlar. Parmak sensöre yerleştirildiğinde elektrik dalgaları gönderir ve parmak izi kayıt edilir. Temasta kalma miktarı, yüzeye temas biçimi, basınç, ısı, elektrik dalgaları parmak izi tanımlamada kullanılır. Dolayısıyla parmak izini doğru okutmak parmak izini tanımlanması için son derece önemlidir. Parmak izini ilk defa okuturken parmağı temiz ve doğru okutmak daha sonraki giriş çıkışlarda kolaylık sağlar. Eğer parmak izini aynı pozisyonda okutmakta zorlanıyorsanız, Parmağınız farklı konumlarda birkaç kez kayıt ederek tanımlamayı kolaylaştırabilirsiniz. Parmağınızın yaralanma ve zedelenme riskini göz önünde bulundurarak farklı parmağınızı da kaydetmeniz önerilmektedir[3].
10.2.4. Optik Karakter Tanıma
Geçtiğimiz yüzyılın son 10 yılında kağıt üzerine elle yazılmış, ya da basılı metinleri Optik Karakter Tanıma (0CR Optical Character Recognition) sistemleri ile tanıma üzere yoğun araştırmalar yapılmış ve birçok ürün geliştirilmiştir. Bu ürünler uygulama alanına göre büyük değişiklik göstermekle birlikte, hemen hemen hepsinde,
- Kağıt üzerindeki verileri bilgisayar ortamında sayılaştıran bir tarayıcı,
- Sayısal verileri modelleyerek resim, yazı ve grafikleri ayrıştıran bir yazılım,
- Yazıları okuyarak ASCII koda dönüştüren akıllı bir sistem
bulunur. Optik Karakter Tanıma Sistemleri bazen bir lügatle bazen de gramer bilgilerini içeren veri tabanı ile zenginleştirilebilir.
Optik Karakter Tanıma Sistemleri, çevrim içi (on-line) ve çevrim dışı (off /line) olarak iki gruba ayrılırlar. Çevrim içi sistemlerde veri girişi sayısal bir tablet üzerine elektronik kalemle yapılır. Böylece, kullanıcı bilgisayara verilen kendi el yazısı ile girer. Bu yöntemin avantajı taslak şekillerin ve imzaların da bilgisayar ortamına rahatlıkla girilebilmesidir. Zorluğu ise elektronik kalemin gündelik hayatta kullandığımız kalemlerden daha rahatsız olmasıdır. Ayrıca, birçok kimse için klavye kullanmak elle yazmaktan daha kolay ve hızlıdır[1].
Çevrim dışı uygulamada ise daha önce kâğıda yazılmış veya basılı metinlerin kamera veya tarayıcı yardımı ile bilgisayara aktarıldıktan sonra tanınması gerçekleştirilir. Bu sistemlerin en önemli uygulama alanlarını elektronik kütüphaneler ve kâğıtsız ofisler oluşturmaktır. Her ne kadar son zamanlarda kitaplar, masa üstü yayıncılık dediğimiz bilişim teknolojileri ile üretilmekteyse de kütüphanelerde daha önceki matbaalarla üretilmiş kitap dergi ve gazeteleri de bilgisayar ortamına geçirmek isteyebiliriz. Özellikle, Osmanlı Arşivleri gibi tarihi arşivlerin bilgisayar ortamına geçirilmesi ile hem değerli eserler yıpranmaktan korunmuş hem de hızlı ve verimli erişim sağlanmış olur[1].
Optik karakter tanıma sistemleri nüfus cüzdanı, ehliyet, seçim kütükleri, tapu, kadastro gibi çeşitli formların bilgisayar ortamına aktarılarak veri tabanları oluşturabilmelerini sağlarlar. Böylelikle, bürokrasiye büyük bir \Terin1i1ik ve doğruluk kazandırabilirler. Tablo 1O.l’de çeşitli görüntüleri bilgisayar ortamında saklamak için gerekli depolama alanları verilmektedir. Karşılaştırma yapabilmek amacı ile insan beyninin depolama kapasitesi de tabloya eklenmiştir[1].
Tablo 1 0. 1:Bilgisayarda ve insan beyninde bilgi saklamak için gerekli depo/ama kapasitesi.
10.2. 5. Coğrafi Bilgi Sistemleri
Uzay ve hava fotoğraflarının değerlendirilmesi ile birçok alanda önemli uygulamalar geliştirilmiştir. Dünya çevresinde dönen yüzlerce uydu dünyanın ve diğer gök cisimlerinin çeşitli fotoğraflarımı çekerek bizi bilgi bombardımanına tutmaktadırlar. Bu uydulardan bazıları uzayın milyonlarca ışık yılı derinliğinden global resimler çekerken, bazıları da dünyamızın bir metre çözünürlükteki fotoğraflarını çekebilirler. Aşağıda birkaç örnek vermekle yetinelim:
a-) Haritacılık: Dünya çevresinde dönen uydulardan alınan fotoğraflar sayesinde çeşitli ölçekte coğrafi ve jeolojik haritalar mükemmel bir doğrulukla üretilebilir. Ayrıca, hava fotoğrafları ile üç boyutlu kara ve deniz haritaları çıkarılabilir ve bu haritaların üzerine eklenen uzman bilgiler aracılığı ile akıllı seyir sistemleri oluşturulabilir[1].
b-) Çevre, Şehir ve Bölge planlaması, Ormancılık, Tarım: Hava ve su kirliliği, bu kirliliğin zaman içindeki değişimleri ve doğa üzerindeki etkileri uydu fotoğrafları yardımı ile değerlendirilerek ileriye yönelik kestirimler üretilebilir. Şehirlerin elektrik, su, bina yapılaşması, yeşil alanları vb. planlanmasında hava fotoğrafları kullanılır. Bu fotoğrafların işlenmesi ile bakım, onarım, yeniden yapılaşma, kaçak yapılaşmanın engellenmesi gibi belediye hizmetlerinde verim artar. Ayrıca, ormanlarımızın gelişimi, ağaç hastalıkları, ekili alanlarımızdan beklenen ürün rekoltelerinin tahmin edilmesi, yine uydu fotoğraflarının görüntü işleme teknikleri ile değerlendirilmesi sonucu elde edilir[1].
c-) Meteoroloji: Uzaktan algılama ve görüntü işleme tekniklerinin başarı ile uygulandığı diğer bir alan ise meteorolojik tahminlerdir. Meteoroloji uydularından edinilen fotoğrafların değerlendirilmesi ve kestirim yöntemleri ile günlük hava tahmin raporlarının geliştirilmesi mümkün olmaktadır[1].
Yukarıdaki örnekler görüntü işleme ve bilgisayarlı görme sistemlerinin kullanıldığı yüzlerce alandan sadece birkaçını göstermektedir. Kolayca anlaşılacağı gibi bu sistemler sivil ve askeri hayatta birçok alanda başarı ile kullanılmakta ve hayatımıza yeni bir boyut getirmektedirler.
Şimdi de yukarıdaki pek çok uygulama alanında başarı ile kullanılan görüntü işleme ve bilgisayarlı görme sitemlerinin temel çalışma prensiplerini görelim[1].
Konu ile ilgili sunum dosyasını bu bağlantıdan ulaşabilirsiniz.
SORULAR
S.1) Aşağıdaki alanlardan hangisinde bilgisayarlı görme kullanılmaz?
A-) Plaka Tanıma Sistemi B-) Meteoroloji C-) Haritacılık
D-) Robot İşçiler E-) Eğitim Alanında
S.2) Aşağıdaki araçlardan hangisi OPTİK KAREKTER ALGILAMA(OCR) mantığıyla çalışmaktadır?
A-) Tarayıcılar B-) Mikrofonlar C-) MP3 Çalarlar
D-) Klavyeler E-) Hoparlörler
S.3) Aşağıdakilerden hangisi görme işleminin nasıl gerçekleştiğini ilk kez araştırmıştır?
A-) Aristo B-) Nicola TESLA C-) Einstain Albert
D-) David Filo E-) Jan Bake
S.4) Aşağıdakilerden hangisi tıbbi alanda kullanılan bilgisayarlı görmedir?
A-) Diyaliz Makinesi B-) Tomografi Cihazı C-) Basınç Cihazı
D-) Kalp grafiği (EKG) E-) Tansiyon cihazı
CEVAPLAR: 1-E, 2-A, 3-A, 4-B