← Bloglara Dön

Bilgisayarla Görü: CNN'den Vision Transformer'a

Bilgisayarla görü alanının CNN'lerden Vision Transformer'lara evrimi.

Bilgisayarla görü (Computer Vision), yapay zekanın en heyecan verici alanlarından biridir. Görüntü sınıflandırma, nesne tespiti, segmentasyon gibi görevleri içerir.

Tarihsel süreç:
- LeNet (1998): İlk başarılı CNN
- AlexNet (2012): Derin öğrenme devrimi
- ResNet (2015): Kalıntı bağlantılarla çok derin ağlar
- Vision Transformer (2020): Transformer'ın görü alanına uygulanması

Günümüzde DALL-E, Stable Diffusion gibi modeller, metinden görüntü üretebilmektedir.