Bilgisayarla görü (Computer Vision), yapay zekanın en heyecan verici alanlarından biridir. Görüntü sınıflandırma, nesne tespiti, segmentasyon gibi görevleri içerir.
Tarihsel süreç:
- LeNet (1998): İlk başarılı CNN
- AlexNet (2012): Derin öğrenme devrimi
- ResNet (2015): Kalıntı bağlantılarla çok derin ağlar
- Vision Transformer (2020): Transformer'ın görü alanına uygulanması
Günümüzde DALL-E, Stable Diffusion gibi modeller, metinden görüntü üretebilmektedir.
← Bloglara Dön
Bilgisayarla Görü: CNN'den Vision Transformer'a
Bilgisayarla görü alanının CNN'lerden Vision Transformer'lara evrimi.