Apple'ın araştırmacıları, kullanıcıların fotoğraf düzenleme yazılımına dokunmadan, sade bir dil kullanarak istedikleri değişiklikleri belirtmelerini sağlayan bu yeni yapay zeka modelini tanıttı. MGIE veya MLLM-Guided Image Editing modeli, metin komutları ile görüntüleri kırpabilme, yeniden boyutlandırabilme, çevirebilme ve filtreler ekleyebilme özelliklerine sahiptir.Bu model, bir fotoğraftaki belirli nesneleri farklı bir şekle sokma veya daha parlak gösterme gibi basit ve karmaşık piksel düzeyinde görüntü düzenleme görevlerine adapte olabilir. MGIE, multimodal dil modellerinin (LLM) iki farklı kullanımını birleştirerek, kullanıcı komutlarını anlamayı öğrenir ve ardından düzenleme işleminin nasıl görüneceğini "hayal eder" (örneğin, bir fotoğrafta daha mavi bir gökyüzü istemek, bir görüntünün gökyüzü kısmındaki parlaklığı artırır).Yayınlanan makalede, MGIE'nin fotoğraf düzenleme sürecini basitleştirerek, sadece değiştirmek istenen öğenin yazılmasını gerektirdiği bir pizza örneği verildi. Örneğin, "Daha sağlıklı yap" komutu yazıldığında pizza üzerine sebzeler ekleniyor.Apple, MGIE'yi GitHub üzerinden indirilebilir hale getirdi ve aynı zamanda Hugging Face Spaces üzerinde bir web demosu sunmaktadır. Şirket, modelle ilgili gelecekteki planları hakkında henüz bir açıklama yapmamıştır.Bazı görüntü oluşturma platformları, metin girdileri aracılığıyla resimler üzerinde basit fotoğraf düzenleme görevlerini gerçekleştirebilirken, MGIE daha fazla esneklik sunarak dikkat çekiyor. Apple, yapay zeka alanında diğer büyük rakipleriyle karşılaştırıldığında belirgin bir geride kalış gösterse de, şirketin yeni gelişmeler ve test aşamasındaki projelerle teknolojik liderliği koruma yolunda ilerlediği görülmektedir. Apple, yakın zamanda ChatGPT ile rekabet edebilecek bir "Apple GPT" aracını test etti ve iOS 18'in yapay zeka odaklı büyük bir güncelleme getireceği iddia edilmektedir.
Yapay Zeka
Yayınlanma: 12 Şubat 2024 - 09:33
Apple'ın yeni yapay zekası fotoğraf düzenlemede devrim yaratıyor
Teknoloji devi Apple, MGIE veya MLLM-Guided Image Editing adını taşıyan açık kaynaklı bir yapay zeka modelini kullanıcıların doğal dil talimatlarına göre fotoğraf düzenleyebilmeleri için yayınladı.
Yapay Zeka
12 Şubat 2024 - 09:33