04.12.2023
Gerçek zamanlı nesne takibi algoritması Convolitional Neural Network olarak bilinen CNN ile ifade edilir. Video ve görüntüler üzerindeki nesneleri biz insanlar kolayca takip edebiliriz. Bilgisayar sistemlerinde bu takibi sağlamak için CNN geliştirilmiştir.
CNN, video ve görüntü üzerindeki nesneleri algılayan bir algoritmadır. Verilen görüntüdeki nesnelerin feature denilen benzersiz özelliklerini kullanarak takibini sağlıyor.
Gerçek Zamanlı Nesne Takibi Algoritmasının Yapısı
Gerçek zamanlı nesne takibi algoritması genellikle girdi olarak görselleri alıp, işleyen derin bir öğrenme yapısına sahiptir. Görselin faturalarını farklı operasyonlarla yakalayıp, sınıflandırır. Algoritmanın işlevselliği için farklı katmanlar geliştirilmiştir.
Bu katmanlar şu şekildedir:
-
Convulutional Layer
-
Non-Linearity Layer
-
Pooling Layer
-
Fully Connected Layer
Gerçek zamanlı nesne takibi algoritması anlık nesne tespiti yapan bir misyona sahiptir. Gerçek zamanlı elde edilen görüntüyü işleyerek nesne takibi sağlar. Nesne veya nesneleri takip ederken kesin ve doğru sonuçlar üretebilen yüksek performanslı bir algoritmadır.
Convolutional Layer
Gerçek zamanlı nesne takibi algoritması katmanlarından ilki Convulutional Layer oluyor. Evrişim katmanı olarak da bilinen bu katman görselin benzersiz özelliklerini saptamakla görevlidir. Bilindiği üzere görseller veya videolar piksel taşıyan materislerdir.
Convulutional Layer katmanında bulunan ve orijinal görüntü boyutundan daha ufak bir filtre ile tarama yapılır. Filtre görselin üzerinde gezerek spesifik özellikleri yakalamaya çalışır.
Non-Linearity Layer
Elde edilen görüntü matrisinin imajını normalize eden katmandır. Non-Linearity katmanı, matrisi aktivasyon fonksiyonundan geçirir. Bu katmanda seçilen doğrusal olmayan aktivasyon fonksiyonu, gerçekleşecek sinir ağı eğitimini etkiler. Çünkü matriste bulunun negatif değerlerden bu katmanda kurtulmaya çalışılır.
Pooling Layer
Filtre uygulanan görseller orijinal görselin boyutundan daha küçük olur. Bu sorun Pooling Layer katmanında giderilir. Dolgulama işlemi yapılan bu katmanda matrisin ağırlık sayısı azaltılır. Görselin etrafı bir çerçeve oluşturur gibi sıfırlarla doldurulur. Bazı kullanıcılar Pooling Layer katmanını kullanmak yerine evrişim katmanında kullandığı filtre matrisinin boyutunu yükseltir.
Fully Connected Layer
Tam bağlantılı katman olarak da bilinen Fully Connected Layer, evrişimli ve Pooling katmanlarından birkaç kez geçen ve matrise dönüşen görseli düz bir vektöre çevirir. Aslında bu katmana kadar yapılan işlemler görüntüyü yapay sinir ağı için hazırlamaktadır. Yapay sinir ağı Fully Connected katmanında çalışır. Fully Connected Layer, CNN çıkış katmanıdır.