Bir insan hücresi, yaklaşık 42 milyon proteinin, sayısız karbonhidrat, lipit ve nükleik asidin bir arada işlediği yoğun bir kimyasal evrendir. Sitoplazma, sürekli reaksiyonların yaşandığı bir laboratuvar gibidir; çekirdekte ise binlerce gen açılıp kapanarak bu karmaşayı düzenli bir biyolojik senfoniye dönüştürür. Ancak bu karmaşıklık hâlâ insan zihninin kavrayamayacağı kadar büyüktür.
Bilim insanları şimdi bu bilinmezliği çözmek için yapay zekâdan (AI) yardım alıyor. Tıpkı ChatGPT’nin dilde yaptığı gibi, araştırmacılar da devasa biyolojik verileri analiz edip öğrenebilen “sanal hücre” modelleri geliştiriyor. Allen Enstitüsü’nden AI araştırmacısı Kasia Kedzierska, “İnsanlar biyoloji için de bir ChatGPT anı yaşamak istiyor” diyor.
Hücrenin dijital ikizi
Yaklaşık 25 yıl önce bilim insanları, hücreyi matematiksel denklemlerle taklit etmeye başladı. 2012’de Stanford Üniversitesi’nden Markus Covert ekibi, Mycoplasma genitalium bakterisinin tüm genomunu simüle eden ilk bütüncül hücre modelini tanıttı. Ancak bu modeller yalnızca geliştiricilerin belirlediği biyolojik kurallarla sınırlıydı.
Bugün geldiğimiz noktada, AI destekli modeller bu sınırı aşmayı hedefliyor. ChatGPT ve benzeri büyük dil modellerine benzer biçimde, bu “biyolojik yapay zekâlar” hücre verilerinden kendi kendine öğreniyor. Chan Zuckerberg Initiative (CZI) ekibinden Theofanis Karaletsos, “Bu modeller hücrenin işleyişine dair bütüncül bir bilgi haritası oluşturuyor” diyor.
Sanal hücre yarışması
Haziran ayında, Arc Institute’tan Hani Goodarzi liderliğinde bilim insanları “Virtual Cell Challenge” adlı bir yarışma başlattı. Yarışmaya 1000’den fazla ekip —“Cellamander”, “SmartCell” ve “Mean Predictors” gibi isimlerle— katıldı. Takımlar, CRISPR tekniğiyle susturulan 300 genin etkilerini tahmin etmeye çalışıyor. Aralık ayında açıklanacak sonuçlar, hangi modelin gerçeğe en yakın tahminlerde bulunduğunu gösterecek.
Geneformer ve TranscriptFormer
Yeni nesil modellerden Geneformer, 2023’te Nature’da yayımlandı. Kaliforniya Üniversitesi’nden Christina Theodoris, modeli 30 milyon insan hücresinin gen etkinliğiyle eğitti. Sonuçta Geneformer, kalp kası hastalığıyla ilişkili genleri belirleyip bunların kapatılmasının hücre fonksiyonlarını iyileştirdiğini öngördü. Laboratuvar deneyleri bu tahmini doğruladı.
Bir başka model, TranscriptFormer, 12 türden 112 milyon hücre verisiyle eğitildi. İnsan, fare, nematod, sünger ve sıtma paraziti gibi türlerden alınan veriler sayesinde model, SARS-CoV-2 ile enfekte hücreleri ayırt edebildi ve ilaç etkilerini sıfırdan (zero-shot) tahmin etti.
Zorluklar ve umut
Yine de tüm bu gelişmelere rağmen modeller hâlâ erken aşamada. Microsoft Research’ten Alex Lu, “Beklendiği kadar güçlü değiller, bazıları basit simülasyonlardan bile zayıf” diyor. Ancak araştırmacılar pes etmiyor. Kedzierska, “Bu modellerin başarısız olduğu yerler bize çok şey öğretiyor” diyerek geleceğe umutla bakıyor.
Bilim insanları, önümüzdeki yıllarda sanal hücrelerin dokulara ve organlara entegre edilmesiyle “biyolojik dijital ikizlerin” ortaya çıkabileceğini düşünüyor. Bu, yalnızca ilaç geliştirmeyi hızlandırmakla kalmayacak, aynı zamanda kişiye özel tıp ve hastalık modellemelerinde de devrim yaratabilir. (Science)




