ÖZ
Amaç
Subtalamik nükleusun (STN) derin beyin stimülasyonu (DBS), genellikle mikroelektrot kayıtları (MER) ile desteklenen hassas elektrot yerleşimi gerektirir. Ancak, MER’nin yorumlanması oldukça özneldir ve klinisyenler arasında deneyime bağlı olarak değişkenlik gösterebilir. Bu çalışma, bir yapay zeka (YZ) modelinin (ChatGPT 4.0) STN MER kayıtlarını sınıflandırma yetisini değerlendirerek, deneyimli ve daha az deneyimli klinisyenlerle tutarlılığını analiz etmektedir.
Gereç ve Yöntem
Toplam 32 STN MER kaydı, iki deneyimli klinisyen, iki daha az deneyimli klinisyen ve YZ modeli tarafından bağımsız olarak değerlendirildi. Kayıtlar artefakt, talamus, sessiz, STN, şüpheli STN, substantia nigra ve N/A (kayıt yok) kategorilerine ayrıldı. Değerlendiriciler arasındaki tutarlılık Fleiss’ Kappa, üretici önceden eğitilmiş dönüştürücü (GPT) ile her bir klinisyen arasındaki uyum ise Cohen’s Kappa ile ölçüldü. Ayrıca, her kategori için kesinlik ve duyarlılık hesaplandı.
Bulgular
Tüm değerlendiriciler arasında genel Fleiss’ Kappa 0,544 olarak bulundu; deneyimli klinisyenler arasında tutarlılık 0,738, daha az deneyimli klinisyenler arasında ise 0,631 idi. GPT’nin her iki grup ile uyumu düşük olup, Cohen’s Kappa 0,341 ila 0,375 arasında değişti. GPT, STN tespitinde en yüksek doğruluğu (%73,47) gösterse de, diğer kategorilerde performansı belirgin şekilde daha düşüktü. Kategori içi tutarlılığı %14,28 olarak belirlenen modelin, geçiş bölgelerindeki değişkenliği yüksek olup, klinisyenlerin çoğunluk görüşüne göre yanlış sınıflandırma oranı %45,87idi.
Sonuç
GPT, STN’yi tanımlamada klinisyenlerle kısmi bir tutarlılık gösterse de, geçiş bölgeleri ve komşu yapıları sınıflandırmadaki güvenilirliği düşüktü. YZ’nin STN hedeflemede güvenilir bir araç olabilmesi için algoritmalarının iyileştirilmesi ve eğitim veri setlerinin genişletilmesi gereklidir. GPT henüz klinik karar vermeye uygun olmasa da, gelecekteki DBS uygulamaları için umut vadetmektedir.