Нова светеща молекула, изобретена от AI, би отнела 500 милиона години, за да се развие в природата, казват учени

Модел на изкуствен интелект създаде нов протеин, който според изследователите щеше да отнеме 500 милиона години, за да се развие в природата - ако природата беше способна да произведе такова нещо.

Изображение на художник на esmGFP, новият флуоресцентен протеин, създаден от ESM3. (Изображение: EvolutionaryScale)

Според ново проучване модел на изкуствен интелект (AI) е симулирал половин милиард години молекулярна еволюция, за да създаде кода за неизвестен досега протеин. Светещият протеин, който е подобен на този в медузите и коралите, може да помогне при разработването на нови лекарства, казват изследователите.

Протеините са един от градивните елементи на живота и изпълняват различни функции в тялото, като изграждане на мускули и борба с болести. Симулираният протеин, наречен esmGFP, съществува само като компютърен код, но съдържа план за неизвестен досега тип зелен флуоресцентен протеин. В природата зелените флуоресцентни протеини придават блясъка на флуоресцентните медузи и корали.

Последователността от букви, които изписват инструкциите за направата на esmGFP, е само 58% подобна на най-близкия познат флуоресцентен протеин, който е модифицирана от човека версия на протеин, открит в морски анемонии с мехурчета (Entacmaea quadricolor) – цветни морски същества, които изглеждат така, сякаш имат мехурчета по краищата на пипалата си. Останалата част от последователността е уникална и ще изисква общо 96 различни генетични мутации, за да се развие. Тези промени биха отнели повече от 500 милиона години, за да се развият естествено, според проучването.

Изследователи от компанията, наречена EvolutionaryScale, разкриха esmGFP и AI модела, използван за създаването му, ESM3, в проучване за предпечат миналата година. Независими учени вече направиха партньорска проверка на тези открития, които бяха публикувани на 16 януари в списание Science.

ESM3 не проектира протеини в рамките на обичайните ограничения на еволюцията. Вместо това, това е средство за решаване на проблеми, което запълва празнини в непълен протеинов код, предоставен от изследователите, и по този начин проектира нещо, което би могло да съществува въз основа на всички потенциални пътища, които еволюцията може да поеме.

„Открихме, че ESM3 изучава фундаменталната биология и може да генерира функционални протеини извън пространството, изследвано от еволюцията“, каза съавторът на изследването Алекс Райвс, съосновател и главен учен на EvolutionaryScale, пред Live Science в имейл.

Новото проучване се основава на изследването, което Райвс и колегите му са започнали в Meta, компанията майка на Facebook и Instagram, преди да стартират EvolutionaryScale през 2024 г. ESM3 е последната им версия на генеративен езиков модел, подобен на GPT-4 на OpenAI, който управлява ChatGPT, но се основава на биологията.

Протеините са изградени от вериги от молекули, наречени аминокиселини, чиято последователност се осигурява от гени. Различните протеини имат различни аминокиселинни последователности. Те също така се различават структурно, като всеки се сгъва в уникална форма, която им позволява да изпълняват функцията си, според Nature Education. За да може ESM3 да разбере протеините, изследователите захранват модела с данни за основните свойства на протеина - аминокиселинна последователност, структура и функция - като серия от букви.

Екипът обучи ESM3 на данни от 2,78 милиарда протеини, открити в природата. След това изследователите скриха произволно части от план на протеин и накараха ESM3 да включи празнините, за да завърши кода въз основа на това, което е научил.

„По същия начин, по който човек може да попълни празните места в монолога „до _ или не до _, това е _“, ние можем да обучим езиков модел да попълва празните места в протеините“, каза Райвс. "Нашето изследване показа, че чрез решаването на тази проста задача в мрежата се появява информация за дълбоката структура на белтъчната биология."

Учените вече модифицират естествените протеини и създават нови за различни цели. Например зелените флуоресцентни протеини се използват широко в изследователски лаборатории. Техният генетичен код често се добавя към краищата на други ДНК последователности, за да оцветят протеините, които кодират, в зелено. Това позволява на учените лесно да проследяват протеини и клетъчни процеси. Райвс отбеляза, че възможностите на ESM3 могат да ускорят широк спектър от приложения за протеиново инженерство, включително с помощта за проектиране на нови лекарства.

Тифани Тейлър, еволюционен биолог от Университета на Бат в Обединеното кралство, който не е участвал в изследването, докладва за предпечатната версия на изследването за Live Science през 2024 г. В своя анализ Тейлър пише, че AI модели като ESM3 ще позволят иновации в протеиновото инженерство, което еволюцията не може. Въпреки това тя също така отбеляза, че твърдението на изследователите за симулиране на 500 милиона години еволюция е фокусирано само върху отделни протеини и не отчита многото етапи на естествения подбор, които в крайна сметка създават живота.

„Протеиновото инженерство, управлявано от изкуствен интелект, е интригуващо, но не мога да не чувствам, че може да сме твърде уверени в предположението, че можем да надхитрим сложните процеси, усъвършенствани от милиони години естествен подбор“, каза Тейлър.

Източник за статията

Публикуване на коментар

По-нова По-стара

Гласувай за блога