Genel

Bu çalışma biyoteknoloji araçlarının geliştirilmesini hızlandırabilir!

Hesaplamalı algoritmalar, sayısız uygulama için RNA tabanlı araçların tanımlanmasını ve optimizasyonunu sağlar. DNA ve RNA, yaşayan “makinelerin” çalışması için gerekli bilgileri içeren “kullanım kılavuzları” ile karşılaştırılmıştır. Ancak bilgisayarlar ve robotlar gibi elektronik makineler sıfırdan belirli bir amaca hizmet edecek şekilde tasarlanırken, biyolojik organizmalar, ikili kodun öngörülebilirliği olmayan çok daha karmaşık, daha karmaşık işlevler tarafından yönetilir. Biyolojik sorunlara yeni çözümler bulmak, görünüşte zorlu değişkenleri ayırmayı gerektirir – bu, en cesur insan beyni için bile göz korkutucu bir görevdir.

BİR DİZİ MAKİNE ÖĞRENİMİ ALGORİTMASI GELİŞTİRDİLER

Harvard Üniversitesi’ndeki Wyss Enstitüsü ve Massachusetts Teknoloji Enstitüsü’nden iki bilim insanı ekibi, insan beyninin ötesine geçerek bu engelin etrafında yollar tasarladı; RNA tabanlı “tutulan” dizilerin yığınlarını analiz edebilen ve istenen bir hedef diziyi algılama ve buna yanıt vermede hangisinin en etkili olacağını tahmin edebilen bir dizi makine öğrenimi algoritması geliştirdiler. Nature Communications’da eşzamanlı olarak yayınlanan iki makalede bildirildiği gibi, algoritmalar sentetik biyolojideki diğer sorunlara da genellenebilir ve bilim ve tıbbı iyileştirmek ve hayat kurtarmaya yardımcı olmak için biyoteknoloji araçlarının geliştirilmesini hızlandırabilir.

Doktora sonrası araştırma görevlisi Luis Soenksen , “Bu başarılar heyecan verici çünkü anlamlı keşifler elde etmek ve faydalı biyolojik teknolojiler inşa etmek için bilmemiz gereken RNA katlamanın temel ilkeleri hakkında daha iyi sorular sorma yeteneğimizin başlangıç ​​noktasını işaret ediyorlar” dedi. Wyss Enstitüsü’nde ve MIT Jameel Kliniğinde Girişim Oluşturucu’da iki makalenin ilkinin ortak yazarlarından biri.

Wyss Institute’un Predictive BioAnalytics Initiative’den veri bilimcileri ile Wyss çekirdek öğretim üyesi Jim Collins’in MIT’deki laboratuvarındaki sentetik biyologlar arasındaki işbirliği, makine öğreniminin, sinir ağlarının ve diğer algoritmik mimarilerin hesaplama gücünü biyolojideki karmaşık problemlere uygulamak için oluşturuldu.

RNA MOLEKÜLÜ SINIFINA ODAKLANDI

Yaklaşımları için kanıtlayıcı bir zemin olarak, iki ekip belirli bir mühendislik ürünü RNA molekülü sınıfına odaklandı: “kapalı” durumdayken firkete benzeri bir şekle katlanan ayaklı anahtarlar . Tamamlayıcı bir RNA ipliği, firketenin bir ucundan gelen bir “tetik” sekansına bağlandığında, ayak tutucusu anahtarı “açık” durumuna açılır ve daha önce firkete içinde gizlenmiş sekansları açığa çıkararak ribozomların aşağı akışa bağlanmasına ve çevirmesine izin verir genini protein moleküllerine dönüştürür. Belirli bir molekülün varlığına yanıt olarak genlerin ekspresyonu üzerindeki bu hassas kontrol, çevredeki maddeleri algılamak, hastalığı tespit etmek ve diğer amaçlar için çok güçlü anahtarlar yapar.

Bununla birlikte, bilinen RNA katlama kurallarına dayalı olarak belirli bir girdiye yanıt olarak istenen bir çıktı üretmek üzere tasarlanmış olsalar bile, birçok ayaklı anahtar deneysel olarak test edildiğinde çok iyi çalışmaz. Bu sorunun farkına varan ekipler, büyük hacimli ayak tutma anahtar dizilerini analiz etmek için makine öğrenimini kullanmaya karar verdiler ve bu analizden elde edilen içgörüleri, hangi ayakların amaçlanan görevleri güvenilir bir şekilde yerine getireceğini daha doğru bir şekilde tahmin etmek için kullanmaya karar verdiler. çeşitli deneyler.

Karşılaştıkları ilk engel, derin öğrenme tekniklerinin etkili bir şekilde analiz edilebilmesi için yeterince büyük ayaklı anahtar dizilerinin veri kümesinin olmamasıydı. Yazarlar, bu tür modelleri eğitmek için yararlı olacak bir veri kümesi oluşturmayı kendilerine yüklediler.

Wyss Enstitüsü’nde çalışan Harvard lisansüstü öğrencisi Alex Garruss, “23 virüs ve 906 insan transkripsiyon faktörünün tüm genomları boyunca kısa tetikleme bölgelerini sistematik olarak örnekleyerek toplamda yaklaşık 100.000 adet büyük bir ayaklı anahtar kütüphanesi tasarladık ve sentezledik” dedi. ilk makalenin ilk yazarlarından biri. “Bu veri kümesinin benzeri görülmemiş ölçeği, hemen aşağı akış uygulamaları ve gelecekteki tasarım için yararlı anahtarları tanımlamak ve anlamak için gelişmiş makine öğrenimi tekniklerinin kullanılmasını sağlıyor.”

Yeterli veriye sahip olan ekipler, ilk olarak sentetik RNA moleküllerini analiz etmek için geleneksel olarak kullanılan araçları kullandılar ve artık çok sayıda örnek olduğu için ayaklı anahtarların davranışını doğru bir şekilde tahmin edip edemeyeceklerini gördü. Bununla birlikte, denedikleri yöntemlerin hiçbiri – termodinamik ve fiziksel özelliklere dayalı mekanik modelleme dahil – hangi ayak parmaklarının daha iyi çalıştığını yeterli doğrulukla tahmin edemedi.

BİR RESİM BİN BAZ ÇİFTİNE BEDELDİR

Araştırmacılar daha sonra daha iyi tahmin yeteneklerine sahip modeller oluşturup yaratamayacaklarını görmek için çeşitli makine öğrenimi tekniklerini araştırdılar. İlk makalenin yazarları, ayaklı anahtarları baz dizileri olarak değil, temel çift olasılıklarının iki boyutlu “görüntüleri” olarak incelemeye karar verdiler.

Nicolaas Angenent-Mari, “Bir RNA molekülünün baz çiftlerinin birbirine nasıl bağlandığına dair temel kuralları biliyoruz, ancak moleküller kıpır kıpır – hiçbir zaman tek bir mükemmel şekle sahip değiller, daha ziyade farklı şekillerde bulunma olasılıkları var,” dedi. Wyss Enstitüsü’nde çalışan bir MIT yüksek lisans öğrencisi ve ilk makalenin ortak ilk yazarı. “Bilgisayarla görme algoritmaları görüntüleri analiz etmede çok iyi hale geldi, bu nedenle her bir ayaklı anahtarın olası tüm katlanma durumlarının resim benzeri bir temsilini oluşturduk ve bu resimler üzerinde bir makine öğrenimi algoritması eğittik, böylece bir verilen resim iyi ya da kötü olabilir. ”

Görsel temelli yaklaşımlarının bir başka yararı da, takımın, belirli bir dizinin “iyi” veya “kötü” olup olmadığını belirlerken algoritmanın, ayak tutacağı anahtar dizisinin hangi kısımlarına en çok “dikkat ettiğini” görebilmesidir. Bu yorumlama yaklaşımını İkincil Yapı Belirginlik Haritalarını Görselleştirme veya VIS4Map olarak adlandırdılar ve tüm tek tutucu anahtar veri kümelerine uyguladılar. VIS4Map, ayak tutucu anahtarların performanslarını etkileyen fiziksel öğelerini başarıyla tanımladı ve araştırmacıların, potansiyel olarak daha fazla rekabet eden iç yapılara sahip ayak tutucuların “daha az” bu tür yapılara sahip olanlara göre daha düşük kaliteli olduğu sonucuna varmalarına izin vererek RNA katlama mekanizmaları hakkında bilgi sağladı. geleneksel analiz teknikleri kullanılarak keşfedilmemişti.

“Bazı araçların neden çalıştığını veya çalışmadığını anlayabilmek ve açıklayabilmek bir süredir yapay zeka topluluğunda ikincil bir hedefti, ancak yorumlanabilirlik biyoloji çalışırken endişelerimizin ön planda olması gerekiyor çünkü bunların altında yatan nedenler ilk makalenin kıdemli yazarı Jim Collins , sistemlerin davranışları genellikle sezilemez ”dedi . “Anlamlı keşifler ve kesintiler, doğanın nasıl çalıştığını derinlemesine anlamanın bir sonucudur ve bu proje, makine öğreniminin düzgün tasarlanıp uygulandığında biyolojik sistemler hakkında önemli içgörüler elde etme becerimizi büyük ölçüde artırabileceğini göstermektedir.” Collins aynı zamanda MIT’de Termeer Tıp Mühendisliği ve Bilim Profesörüdür.

ŞİMDİ BENİM DİLİMİ KONUŞUYORSUN

İlk ekip, kalitelerini tahmin etmek için ayaklı anahtar dizilerini 2D görüntüler olarak analiz ederken, ikinci ekip dikgen teknikler kullanarak zorluğa yaklaşan iki farklı derin öğrenme mimarisi oluşturdu. Daha sonra, üstün kaliteyi tahmin etmenin ötesine geçtiler ve modellerini, ikinci makalede bildirdikleri farklı amaçlar için düşük performanslı ayaklı anahtarları optimize etmek ve yeniden tasarlamak için kullandılar.

Evrişimli bir sinir ağına (CNN) ve çok katmanlı algılayıcıya (MLP) dayanan ilk model, tek tutulan dizileri 1 boyutlu görüntüler veya nükleotid baz çizgileri olarak ele alır ve iyiyi tahmin etmek için bu bazlar arasındaki baz kalıplarını ve potansiyel etkileşimleri tanımlar. kötü ayak parmakları. Ekip, bu modeli, bir ayak tutuşu dizisinin sıfırdan tamamen yeniden tasarlanmasını sağlayan STORM (Sıraya Dayalı Toehold Optimizasyonu ve Yeniden Tasarım Modeli) adlı bir optimizasyon yöntemi oluşturmak için kullandı. Bu “boş sayfa” aracı, sentetik bir genetik devrenin parçası olarak belirli bir işlevi yerine getirmek için yeni ayak tutucusu anahtarları oluşturmak için idealdir ve karmaşık biyolojik araçların oluşturulmasını sağlar.

“STORM ve onun altında yatan modelle ilgili gerçekten harika olan kısım, onu ilk kağıttaki giriş verileriyle tohumladıktan sonra, modele yalnızca 168 örnekle ince ayar yapabildik ve ayaklı anahtarları optimize etmek için geliştirilmiş modeli kullanabildik. Bu, yeni bir probleme bir makine öğrenimi algoritması uygulamak istediğiniz her seferinde büyük veri kümeleri oluşturmanız gerektiğine dair yaygın varsayımı sorgulamaya çağırıyor ve derin öğrenmenin potansiyel olarak sentetik biyologlar için düşündüğümüzden daha uygulanabilir olduğunu gösteriyor “dedi. yazar Jackie Valeri, MIT ve Wyss Enstitüsü’nde yüksek lisans öğrencisi.

İkinci model, doğal dil işlemeye (NLP) dayanır ve her bir tek tutulan diziyi, “kelimeler” kalıplarından oluşan bir “cümle” olarak ele alır ve sonunda tutarlı bir cümle oluşturmak için belirli kelimelerin nasıl bir araya getirildiğini öğrenir. “Her ayak parmağı anahtarını bir haiku şiiri olarak düşünmeyi seviyorum: bir haiku gibi, bu, ana dili – bu durumda, RNA – içindeki ifadelerin çok özel bir düzenlemesi. Wyss Enstitüsünde misafir doktora sonrası araştırmacı ve Sherlock Biosciences’da Makine Öğrenimi Bilimcisi olan ilk yazarlardan biri olan Pradeep Ramesh, temelde bu modeli iyi bir haiku yazmayı öğrenmek için onu çok sayıda örnek besleyerek eğitiyoruz ”dedi.

Ramesh ve ortak yazarları, bu NLP tabanlı modeli CNN tabanlı modelle entegre ederek, kalan 21 nükleotidi korurken belirli bir ayaklı anahtarın son 9 nükleotidini yeniden tasarlamalarına izin veren bir optimizasyon yaklaşımı olan NuSpeak’i (Nucleic Acid Speech) oluşturmak için entegre etti. bozulmamış. Bu teknik, spesifik patojenik RNA dizilerinin varlığını tespit etmek için tasarlanmış ayak tutacaklarının oluşturulmasına izin verir ve yeni teşhis testleri geliştirmek için kullanılabilir.

Ekip, SARS-CoV-2 viral genomundan parçaları algılamak için tasarlanmış ayaklı anahtarları optimize ederek bu platformların her ikisini de deneysel olarak doğruladı. NuSpeak, sensörlerin performanslarını ortalama yüzde 160 artırırken, STORM performansları 28 kata kadar artan dört “kötü” SARS-CoV-2 viral RNA sensörünün daha iyi versiyonlarını yarattı.

Ortak yazar Katie Collins, “STORM ve NuSpeak platformlarının gerçek bir avantajı, COVID-19 teşhisi için ayak tutucu sensörlerin geliştirilmesiyle gösterdiğimiz gibi, sentetik biyoloji bileşenlerini hızla tasarlamanıza ve optimize etmenize olanak sağlamasıdır,” dedi. Wyss Enstitüsünde ikinci makalenin ilgili yazarı olan MIT Doçenti Timothy Lu ile çalışan MIT lisans öğrencisi.

İkinci makalenin ilgili yazarı Diogo Camacho , “Makine öğreniminin sağladığı veriye dayalı yaklaşımlar, bilgisayar bilimi ve sentetik biyoloji arasındaki gerçekten değerli sinerjilerin kapısını açıyor ve biz daha yeni yüzeye çıkmaya başlıyoruz,” dedi. Kıdemli Biyoinformatik Bilimcisi ve Wyss Enstitüsünde Tahmine Dayalı Biyoanalitik Girişimi’nin eş başkanı. “Bu makalelerde geliştirdiğimiz araçların belki de en önemli yönü, indüklenebilir promoterler ve doğal olarak oluşan riboswitchler gibi diğer RNA bazlı dizilere genellenebilir olmaları ve bu nedenle çok çeşitli sorunlara ve fırsatlara uygulanabilmeleridir. biyoteknoloji ve tıp.

Makalelerin ek yazarları arasında Wyss çekirdek öğretim üyesi ve HMS George Church’te Genetik Profesörü ; ve Wyss ve MIT lisansüstü öğrencileri Miguel Alcantar ve Bianca Lepe.

Yapay zeka, bilimi ve endüstriyi etkilemeye yeni başlayan bir dalgadır ve zorlu sorunları çözmeye yardımcı olmak için inanılmaz bir potansiyele sahiptir. Wyss Enstitüsü’nün kurucusu Don Ingber , “Bu çalışmalarda açıklanan buluşlar, yeni ve daha güçlü biyo-esinlenmiş teknolojiler geliştirmek için tezgahta sentetik biyoloji ile hesaplamayı birleştirmenin gücünü gösteriyor, ayrıca biyolojik kontrolün temel mekanizmalarına yeni bakış açıları sağlıyor” dedi. yönetmen. Ingber ayrıca Harvard Tıp Fakültesi’nde ve Boston Çocuk Hastanesi’nde Vasküler Biyoloji Programı’nda Judah Folkman Vasküler Biyoloji Profesörü ve Harvard’daki John A. Paulson Mühendislik ve Uygulamalı Bilimler Okulu’nda biyomühendislik profesörüdür.

İlgili Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu