(←) предыдущая запись ; следующая запись (→)

⚡️⚡️⚡️
Наша лаборатория совместно с всемирно известными специалистами в молекулярной биологии и биоинформатике запускает международный конкурс IBIS (Inference of Binding Specificities, определение специфичности узнавания)

Конкурс посвящен предсказанию паттернов в последовательностях ДНК, узнаваемых специальными белками - факторами транскрипции. Участвовать в конкурсе можно как людям из машинного обучения, так и классическим биоинформатикам. Он отлично подходит и новичкам для того, чтобы попробовать свои силы.

Победа в конкурсе дает сооавторство в высокорейтинговой публикации, а также является хорошей возможностью порекламировать свой подход и навыки в биоинформатике или машинном обучении. Особая ценность конкурса заключается в том, что его данные по сути “исчерпают” список регуляторных белков человека, для которых ДНК-паттерн связывания неизвестен или известен плохо. Таким образом, победа практически гарантирует повсеместное дальнейшее использование победившего подхода для целого ряда биоинформатических задач, включая построение сложных генных сетей и объяснение эффектов мутаций, влияющих на работу генов.

Большое число заболеваний связано с мутациями не в кодирующих белки, а в управляющих работой генов “регуляторных” областях генома. На уровне последовательности, механизм функционирования этих последовательностей (“регуляторная грамматика”) основан на связывании специальных белков – транскрипционных факторов (ТФ). На данный момент разработано большое число методов, как классической биоинформатики, так и машинного обучения, для предсказания связывания ТФ с последовательностью ДНК.

В то же время существует несколько проблем:
Отсутствуют современные бенчмарки этих программ, тестовые данные из которых не были бы известны на момент разработки тестируемых методов;
Плохо решена задача переноса предсказаний между различными видами экспериментов (оценивающими связывание для “природных” последовательностей из генома человека или для случайных последовательностей).

IBIS должен решить обе проблемы – за счет новых и разнообразных данных для транскрипционных факторов, о которых ранее не было ничего известно, и за счет честного независимого сравнения простых классических и сложных современных моделей.

Ждем всех желающих! Не упустите возможность заявить о себе!

Твиттер-тред конкурса

(@@kehrlaehda)