(←) предыдущая запись ; следующая запись (→)
образование
Мне кажется, один из самых тяжело укладываемых в голове курсов — статистика. Меня самого пытались научить статистике несколько раз, и это всякий раз было фиаско. Я не понимал буквально ничего. Считаем какие-то хи-квадраты из неясно каких данных и неясно, зачем.
Пока Андрей Райгородский буквально за одну лекцию не объяснил основы так, что всё остальное встало на свои места. Статистику я так и не стал знать хорошо, но понимаю её основы и, кажется, научился их рассказывать.
В какой-то момент на «Слоне» мы с Л.В. делали курс двухнедельный курс по основам теорвера и статистики. Мы много где накосячили, но я всё ещё доволен тем опытом. Главный мой вывод с той школы заключался в том, что статистику обязательно надо преподавать с программированием. И, скажу больше, её категорически нельзя преподавать без программирования. Сейчас я в рамках курса биоинформатики пытаюсь дать блок статистики. Тоже выходит далеко от идеала, конечно, но косячу уже меньше (следует читать так: раньше косячил ещё больше). Программа очень сырая, но очень уж хочется её довести до хорошей.
Было бы здорово увидеть курс такого рода. Срочно покажите мне такой, пока я не захотел сам его делать!
Я представляю это как учебник в формате интерактивной тетрадки, в которой можно будет писать код, смотреть на каноническое решение, менять в нём параметры и смотреть на графики.
Сразу скажу, что мне кажутся бессмысленными курсы вида «Язык R для статистики», потому что основные проблемы возникают не с языком (хотя R на редкость дурной), а с пониманием статистики. Туториалы, которые говорят «примените функцию бубубу, чтобы посчитать P-value точного теста Фишера» — бессмысленны, потому что весь текст после запятой для читателя оказывается в лучшем случае шумом. Хуже, когда у читателя складывается ложное ощущение, что он что-то понимает.
Я предпочитаю использовать Python вместо R, потому что чем меньше магии, тем лучше. Чтобы понимать статистику, нужно научиться с ней работать руками, а не при помощи кем-то другим написанных. Поэтому для работы я беру связку numpy.random + scipy.random + matplotlib/seaborn. Иногда прибавляю pandas.
Если вам близко то, о чём я говорю, давайте замутим курс. Или отговорите меня от этой идеи, показав, что такое уже есть. И желательно от людей, которые (в отличие от меня), по-настоящему знают статистику.
Если хотите покритиковать, тоже welcome. Обычно нельзя, но в этом посте можно. Я недостаточно уверенно себя чувствую в теме, и буду рад улучшить своё понимание того, как должен выглядеть курс, и как он выглядеть не должен.
Дальше ↓, извините читатели, будет техническая часть.