(←) предыдущая запись ; следующая запись (→)
HOCOMOCO v9, 2013 года покрывала 401 человеческий белок. Эта версия была в значительной степени собрана ещё на данных low-throughput методах изучения специфичности типа футпринтов и ChIP-on-chip. Получившийся сайт базы был олдскульный, с кучей текстовых ссылок и статической табличкой мотивов. Там, правда, есть понтовое (для тех времён) дерево кластеризации мотивов, но оно больше ради фана, чем ради пользы. Собрала 278 цитирований. Потому что модели были дюже хороши.
HOCOMOCO v10, 2016 года покрыла 601 человечий и 396 мышиных белков. Тут уже активно использовались высокопроизводительные методы: ChIP-Seq и HT-SELEX. Мы применили итеративное взвешивание датасетов и моделей, чтобы отфильтровать мусорные данные. База включала моно- и динуклеотидные модели, а также софт для предподсчёта порогов и для работы с динуклеотидными моделями. Заодно мы сильно вложились в сайт: сделали кучу фильтров, визуализировали степень покрытия различных семейств в виде дерева, сделали исчерпывающий раздел Downloads, чтобы отдать наши модели во всех известных форматах. Статья собрала 246 цитирований.
HOCOMOCO v11, 2018 года покрыла 680 человечьих и 453 мышиных белка. Она тоже включала моно- и динуклеотидные модели. А ещё мы перешли на использовали несколько спорной метрики качества вместо ROC AUC. В качестве свистелок к этой версии мы сделали интерактивный инструмент для предсказания сайтов MoLoTool, который прямо в браузере раскрашивает последовательность в разные цвета. Эта версия собрала 652 цитирования.
(2/3)