Google’ın bir araştırma makalesine göre yapay zekalı bir sohbet robotu, metin tabanlı görüşmelerde tıbbi rahatsızlıkları teşhis etme ve sonuçları aktarma konusunda insan doktorlardan daha iyi bir performans sergiledi.

Articulate Medical Intelligence Explorer (AMIE) adı verilen bu sistem, tıbbi bilgi toplamak ve klinik konuşmaları yürütmek için eğitilmiş büyük bir dil modeli. AMIE, kullanıcılar tarafından tanımlanan semptomları analiz etmek, sorular sormak ve teşhisleri tahmin etmek için tasarlandı.

Bir testte, gerçek olmayan hastalıklarla başvuran 20 sahte hasta, insan dokunuşunu eklemek için deney için işe alınan 20 profesyonel birinci basamak hekimiyle birlikte rastgele deneye katıldı.

Apple'ın satışlarındaki düşüş dikkatlerden kaçmadı Apple'ın satışlarındaki düşüş dikkatlerden kaçmadı

Hastalar, AMIE ile mi yoksa gerçek bir doktorla mı konuştuklarını bilmiyorlardı. Bir yapay zeka sohbet robotuyla mı yoksa bir insanla mı sohbet ettiklerini bilmeden, etkileşimlerinin kalitesini derecelendirmeleri istendi. Benzer şekilde sonuçlar, denemede test edilen 149 vaka senaryosunda sahte hastaların çoğunun gerçek doktorlara kıyasla AMIE ile sohbet etmeyi tercih ettiğini gösterdi. Katılımcılar, AI chatbot’un endişelerini anlamada daha iyi olduğunu ve yanıtların daha empatik, açık ve profesyonel olduğunu söyledi. Bir AI sohbet robotunun kişiliğinin ve tonunun, daha tutarlı davranacak ve yorulma veya dikkatin dağılması gibi insani sorunlar olmadan hareket edecek şekilde programlanabildiği düşünüldüğünde bunun çok da şaşırtıcı olmadığı söylenebilir.

İlginç bir şekilde AMIE tıbbi sorunları teşhis etmede de daha başarılı görünüyordu. Ancak Google’ın da belirttiği üzere bu, yapay zeka sohbet robotlarının tıbbi bakım sağlamada doktorlardan daha iyi olduğu anlamına gelmiyor.

Sonuçlar umut verici görünse de birinci basamak hekimleri ve hastalar yüz yüze etkileşime giriyor ve zaman içinde bir ilişki kurabiliyorlar. Klinisyenler teşhis koyarken metin açıklamalarının dışında diğer bilgi türlerine de daha fazla erişime sahip oluyor ve dolayısıyla Google’ın da kabul ettiği gibi bu pratik bir deney değil. Google araştırmacıları, “Araştırmamızın çeşitli sınırlamaları var ve hak ettiği dikkatle yorumlanmalıdır” diyor ve devam ediyor: “Öncelikle, çalışmamızdaki klinisyenler büyük ölçekli LLM-hasta etkileşimlerine izin veren ancak olağan klinik uygulamayı temsil etmeyen alışılmadık bir metin-sohbet arayüzü ile sınırlı olduğundan, değerlendirme tekniğimiz muhtemelen insan konuşmalarının gerçek dünyadaki değerini hafife alıyor.”

Bu testin amacı, LLM’lerin birinci basamak hekimlerinin yerini alabileceğini göstermek değildi. Bunun yerine Google, yapay zeka sohbet robotlarının sağlık hizmetlerine erişimi olmayan hastaları desteklemek için yararlı araçlar oluşturulabileceğine inanıyor. Ancak böyle bir sistemi gerçek dünyaya yerleştirmenin riskli olduğunu ve onu sorumlu bir şekilde kullanmak için daha fazla çalışma gerektireceğini de kabul ediyor.

Ekip makalede “Deneysel, simüle edilmiş öykü alma ve teşhis diyaloğunun bu sınırlı kapsamından, insanlar ve onlara bakım sağlayanlar için gerçek dünya araçlarına geçiş, teknolojinin güvenliği, güvenilirliği, adaleti, etkililiği ve mahremiyeti sağlamak için önemli miktarda ek araştırma ve geliştirme gerektirir” sonucuna varıyor.

Editör: Simge YILDIZ