Компания OpenAI представила GPT-Rosalind — большую языковую модель, специально адаптированную для задач в области биологии. Модель получила имя в честь Розалинд Франклин, выдающейся ученой в молекулярной биологии. В отличие от универсальных систем, GPT-Rosalind сфокусирована на 50 ключевых биологических процессах и умеет работать с крупными открытыми научными базами данных.
Разработчики подчёркивают, что новая модель призвана облегчить обработку огромных массивов данных, накопленных за десятилетия исследований в геномике и биохимии, а также помочь ученым, сталкивающимся с междисциплинарными сложностями. GPT-Rosalind способна выстраивать связи между генотипом и фенотипом, анализировать белковые структуры и прогнозировать потенциальные мишени для лекарств.
Особое внимание при создании модели уделялось снижению эффекта «галлюцинаций» — склонности языковых моделей выдавать уверенные, но неверные ответы. GPT-Rosalind стала более скептичной и умеет указывать на слабые гипотезы и сомнительные цели исследований. Результаты тестов показывают, что модель демонстрирует экспертный уровень биологических рассуждений.
Впрочем, OpenAI ограничивает доступ к GPT-Rosalind из-за опасений возможного злоупотребления, например, для создания опасных вирусов. На данный момент работать с моделью могут только доверенные организации из США, а для широкой аудитории планируется выпустить упрощённый плагин Life Sciences Research Plugin.
В отличие от многих мультидисциплинарных моделей, GPT-Rosalind сосредоточена именно на биологии, что может стать преимуществом в лабораторных и исследовательских задачах. Эффективность узкой специализации станет ясна после получения первых независимых отзывов и практического использования.
