Çizimler ve Fotoğrafların Ötesinde: Yapay Zekâ Destekli Görsellerin Edinilmiş Dil Bozukluklarında Olası Kullanımları üzerine Geleneksel bir Derleme

Şevket Özdemir Şükriye Kayhan Aktürk Eda İyigün Uzunöz Aylin Müge Tunçer
Özet

Amaç: Görseller edinilmiş dil bozukluklarında araştırma ve klinik uygulamalarda en çok tercih edilen uyaranlardan biridir. Dil ve konuşma terapistleri (DKT) afazili bireyler için görsel oluşturma, bulma veya seçme sürecinde zorlanabilir. Görsellerin anlamlı ve net olması beklenebilir. Bu sebepten, seçilen görselin karşılık geldiği sözcük, ileti ve kavramları net bir şekilde temsil etmesi gerekmektedir (Brown & Thiessen, 2018; Pierce, 2024). Afazili bireylerin dil becerileri heterojen olabilir ve dil modalitelerine ait performans modaliteye özgü değişkenlik gösterebilir (örn. İşitsel ve yazılı anlama, tekrarlama, adlandırma, okuma, yazma). Bununla birlikte metinden görsel oluşturma araçlarını içeren Yapay Zekâ (YZ) teknolojisindeki son gelişmeler, afazili bireyler için uygun görsel belirleme sürecinde DKT’lere farklı bir seçenek sunabilir. YZ teknolojisi halen gelişmeye devam etmektedir ve YZ destekli görsel oluşturma süreçlerinin görsel araştırmalarına nasıl katkıda bulunacağı merak konusudur. Dolayısıyla, bu derleme YZ’nin edinilmiş dil bozukluğu olan bireyler için dilsel ve kültürel açıdan uygun görseller oluşturmada kullanılıp kullanılamayacağı sorusunu Türkçe özelinde ele almayı amaçlamaktadır.

Yöntem: Bu çalışma geleneksel derleme metodolojisini benimsemiştir. Web of Science, Scopus ve EBSCO veri tabanlarında “edinilmiş dil bozuklukları”, “afazi”, “görsel araştırmaları”, “yapay zekâ”, “metinden görsel oluşturma”, ve “prompt mühendisliği” arama terimleri kullanılarak Haziran-Ağustos 2024 aralığında alan yazın taraması gerçekleştirilmiştir. Tarama sırasında son 10 yılda yayımlanan çalışmalar (2014-2024) öncelikli olarak incelenmiştir, ancak konunun edinilmiş dil bozukluklarındaki önemini vurgulamak ve kuramsal temellerini ortaya koymak amacıyla 2014 öncesinde yayımlanan bazı kaynaklar da dahil edilmiştir.

Bulgular: Bu amaç doğrultusunda derleme iki bölüme ayrılmıştır: İlk olarak, ideal bir görselde bulunması gereken özelliklerin neler olduğuna dair bilgi vermek üzere sağlıklı ve afazili bireyleri dahil eden görsel araştırmalarından bahsedilmiştir. Devamında, görsel oluşturma araçlarına odaklanarak YZ’nin edinilmiş dil bozukluklarında olası kullanımları hakkında bilgi verilmiştir. Görsel araştırmalarının bulguları incelendiğinde; görselin doğru şekilde tanınması, görselin türü ve bağlamı, görsellerin somut veya soyut olması ile kültürel faktörlerin dikkate alınması gerektiği belirtilmektedir. Görseller arasında özellikle el çizimlerinin araştırma ve klinik bağlamlarda uzun süreden beri kullanıldığı bilinmektedir. Bununla birlikte fotoğrafların popülerlik kazandığı; erişilebilirliği ve düşük maliyeti sebebiyle de bu popülerliğin arttığı bilinmektedir. Son yıllarda YZ’nin gelişmesi ile birlikte, metin üzerinden görsel oluşturma teknolojisinin DKT’ler için önemli bir seçenek olabileceği düşünülmektedir. Bu teknolojinin adlandırma da dahil olmak üzere farklı amaçlarla kullanılabileceği belirtilmektedir. Bu zamana kadar YZ tarafından oluşturulan görsellerin adlandırma veya ilişkili bir dil becerisi bağlamında incelenmediği gözlenmekle birlikte, sadece Pierce (2024) DALL-E 2 tarafından oluşturulan görsellerin işlevselliğini değerlendirdiği bir çalışma gerçekleştirmiştir. Çalışmanın bulguları, isimlere ait görsellerin eylem ve cümlelere kıyasla daha net olduğunu göstermiştir (Pierce, 2024). Derlemenin ikinci bölümünde, edinilmiş dil bozuklukları alanında görsel uyaran kullanan araştırmacı ve DKT’lere yol gösterebilecek birtakım bilgiler sunulmuştur. Öncelikle görsel üretim seçeneklerinden bahsedilmiştir (örn. DALL-E 3 , Midjourney, Stable Diffusion , Glide , Craiyon , gibi). Devamında “kısa ve betimleyici / açıklayıcı metin” olarak tanımlanan prompt hakkında bilgi verilmiş (Lo, 2023), prompt yazımı için ileri düzey bir teknik veya programlama becerisine ihtiyaç duyulmadığı vurgulanmıştır (Adikari ve ark., 2024). Buna rağmen promptun içeriğine ve sonrasında ortaya çıkan sonuca (veya ürüne) dikkat çekilmiş, prompt üzerinde yapılabilecek düzenlemeler ile prompt taksonomisinin içeriğinden bahsedilmiştir (Oppenlaender 2022; 2024). Son olarak, metinden görsel oluşturma araçlarının olası faydaları ile zorlukları ve görsellerin oluşturulmasında kültürel ve dilsel çeşitliliği göz önünde bulundurma ihtiyacı dile getirilmiştir.

Sonuç: YZ ve görsel araştırmalarını bir araya getiren araştırmaların sayısının oldukça az olduğu gözlenmiştir. Bu durum YZ ile afazi rehabilitasyonunda çalışan araştırmacılar arasında yakın bir iş birliği olması gerektiğini göstermektedir. Ayrıca, İngilizce dışında farklı bir dilde prompt yazılmasına olanak veren görsel üretim araçlarının ilgili dillerin kendine özgü dilsel ve kültürel özelliklerini dikkate alması gerekmektedir. Bu araçların dil ve konuşma terapistlerinin klinik uygulamalarında kullanımının teşvik edilmesi ve görsel üretiminin klinik uygulamanın bir parçası olabilmesi için bu araçlarla ilgili dil ve konuşma terapistlerinin deneyimlerinin incelenmesi önerilmektedir.


Anahtar Kelimeler

afazi rehabilitasyonu, edinilmiş dil bozuklukları, görsel araştırmaları, insan-bilgisayar etkileşimi, metinden görsel oluşturma, Türkçe, yapay zekâ


Referanslar