(←) предыдущая запись ; следующая запись (→)

машинное_обучение, образовательное

Долгие годы машинное обучение было наукой про скучные задачи классификации (по набору признаков отнести объект к одной из групп) и регрессии (по признакам предсказать какое-то число). Мне очень нравится то, как нейросети Made Machine Learning Great Again и вернули машинному обучению буквальный смысл. Теперь мы, наконец, занимаемся обучением, а не просто конструированием моделей.

Сконструировать архитектуру нейросети часто не самая сложная и не самая интересная задача. Архитектуры порой банальны. Да, подбирать удачные параметры всё равно ужасно муторно. Но самое важное происходит ещё на предыдущем этапе.

Чтобы построить архитектуру нам надо сначала определиться с тем, какую задачу мы решаем: чему мы учим нейросеть. Долгие годы человечество даже с помощью нейросетей решало банальные проблемы регрессии и классификации, и заставляло компьютер отличать котиков от собачек.

Но сейчас всё изменилось, и спектр задач необыкновенно вырос. Во-первых, есть более интересные задачи. Во-вторых, даже типовые задачи решать в лоб не так-то просто, и лучше их переформулировать.
Весь современный deep learning — искусство так сформулировать задачу, чтобы было на чём тренироваться её решать, и чтобы можно было численно оценить качество её решения. Ну и описать процедуру обучения.

Давайте посмотрим, как преломляется в этом ключе одна из главных проблем на пути к искусственному интеллекту — недостаток размеченных данных.

Машинное обучение — это наука про выявление закономерностей в данных. Беда в том, что все котики разные, особенно если смотреть на них пиксель-за-пикселем. А значит, чтобы закономерность уловить, нужно показать компьютеру очень много примеров. Не десять, не сто, а сотни тысяч подписанных (размеченных) картинок.

Казалось бы, к нашим услугам весь интернет, так что с картинками проблем нет. Но… Есть проблемы с тем, что подписаны они как попало. «Если на клетке с тигром увидишь надпись буйвол не верь глазам своим».

Даже в такой простой задаче как категоризация фотографий мы сталкиваемся с недостатком разметки, а ведь это одна из самых простых задач.

Представьте, что вам нужно научиться классифицировать медицинские снимки и выделять на них проблемые области. Теперь вам нужна команда профессиональных (и дорогостоящих) врачей, чтобы отмечать подозрительные объекты на десятках тысяч снимков.

Или переводить тексты — тогда для каждого предложения вам понадобится его правильный перевод.
Или вы хотите детектировать мошенничество в финансовых транзакциях — тут у вас скорее всего будет мало объектов для обучения.
А если вы хотите рисовать фотожабы про знаменитостей, то у нейросети принципиально нет набора правильных ответов: это ведь фейки.

(1/2)