Haber

Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki…

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, gelişmiş modellerin genellikle detayları kaçırması durumunda tahmin yapmak zorunda kaldığını belirtiyor. Ancak Gemini 3 Flash’taki Agentic Vision, görüntü anlayışını geliştirerek bu sorunu çözüyor. Model, görüntüleri adım adım incelerken Agentic Vision’ın sunduğu destekle kod yürütme işlemini birleştiriyor ve kalite artışı sağlıyor. Agentic Vision, “Düşün, Harekete Geç, Gözlemle” döngüsünü kullanarak kullanıcıların sorgularını analiz ediyor ve kod çalıştırarak doğrudan tuvale çizim yapabiliyor. Ayrıca, görüntüdeki detayları yakınlaştırabiliyor ve Python kodunu çalıştırarak verileri daha iyi bir bağlamda inceleyebiliyor. Google, Agentic Vision yeteneğini Thinking modeli ile Gemini uygulamasında sunmaya başlıyor. Geliştiriciler, bu yeni yeteneğe Google AI Studio ve Vertex AI’daki Gemini API ile erişebilir.