Опрос: Какое понимание вам интуитивно ближе?

Всего проголосовало: 93

  • Весы — прибор, который измеряет вес: 77 (82.8%)
  • Вес — это то, что измеряют весы: 5 (5.4%)
  • Не измеряйте мой голос, просто покажите результаты: 11 (11.8%)

Опрос: Когда вы видите число на весах, считаете ли вы это реальным весом?

Всего проголосовало: 89

  • Да: 58 (65.2%)
  • Нет: 19 (21.3%)
  • Показать результаты: 12 (13.5%)

В детстве мы много работали с задачами, в которых написано, что длина предмета составляет столько-то сантиметров, а вес — столько-то килограммов.
В былые времена помыслить такие задачи было бы невозможно.

Во-первых, в разных локациях единицы измерения были разные: фунты и пуды, ярды, аршины и локти, градусы Цельсия и Фаренгейта.
Oh wait!.. И сейчас есть отдельные ретроградные страны, которые ценят суверенитет своей системы единиц превыше разумности и удобства, и не хотят присоединиться к метрической системе.

Но даже если вы измеряете вес в килограммах, измерительные приборы могли быть просто были неодинаковыми. Слово «обвесить» и рассказы про подкрученные весы, которые завышают вес, сопровождали мои походы на рынок в 90-е.
Oh wait!.. Некоторые весы и сейчас завышают мой вес! Нууу… мне хочется так думать.

Самое идиотское, что у нас на лабораторных работах были понятия «систематическая и случайная ошибки». Но о том, что систематическая ошибка — это не просто неточность прибора, а иногда и реально ошибка, я как-то и не думал…

Я, кстати, один из немногих отщепенцев, которые интуитивно думают, что вес — это то, что показывают весы, а температура — то, что показывает градусник. Но при этом число на весах реальным весом я не считаю, потому что разные весы показывают мне разное.

Но вес, правда, сложная величина: то ты поел, то прыгнул на весы. С ростом всё проще? Ну…
Когда вас спрашивают ваш рост, вы скорее говорите «175 см», чем «175 см согласно рулетке у меня дома (в утреннее время, до макушку, при измерении кудри не сбривались)».
Хотя вообще-то вы понятия не имеете, каков ваш реальный рост. Вы знаете только рост, согласно какому-то доверенному прибору.
Но вы едва ли проверяли, что ваша рулетка правильно калибрована, что ваш рост вообще является фиксированной величиной (а он — не) и, что вы вообще меряете ровно то, что ростом считается согласно определению.

Мы обычно думаем, что любой измерительный прибор показывает измеряемое значение характеристики объекта, хотя в действительности показанное им значение — это функция объекта, прибора и процедуры измерения.


Читаю тут одно исследование по архивным источникам и испытываю очень смешанные чувства.

С одной стороны оно родилось как результат Digital Humanities хакатона, который в ковидный год проводила наша летняя школа «Слон» (и ваш покорный слуга). И сделано это исследование на базе данных военнопленных «ОБД Мемориал», которую мне принесли ангелы.

Но в то же время, я чудовищно негодую. Ребята опубликовали статью не у себя на странице, а в сборнике конференции, индексируемом РИНЦ. Но не заморочились тем, чтобы превратить исследование в нормальную научную работу. :(


Ладно, на самом деле я не про то хотел поговорить…
Когда мы исследовали документы из этой же БД, мы все волосы на себе изорвали, пытаясь убедить себя, что та НЕрепрезентативность данных, которая есть, не слишком влияет на результаты нашего исследования. Мы проверяли, проверяли, проверяли. Обосновывали, писали длинные ремарки об ограничениях метода. Это было одной из главных причин того, что мы делали исследование, кажется, больше года.

А на примере этой студенческой работы я вижу типичную ошибку начинающего исследователя: думать, будто предоставленные данные — это истина в последней инстанции. То, что куратор выдал данные, ещё не значит, что на них можно полагаться.

У меня папа занимается ЯМР-спектроскопией и регулярно жалуется на то, что нынешние студенты и научные сотрудники понятия не имеют о том, как устроен прибор. Их это вообще не интересует. Спектры делает чёрный ящик, а не реальная машина из плоти и крови катушек и датчиков, которая может барахлить по сотне разных причин.

Я ту же тенденцию вижу в области программирования и в области ML. Уровень абстракции повысился, и большинство программистов уже не волнует, что делает процессор, как работает сетевое оборудование или хотя бы операционная система. Это просто магия, которая почему-то просто работает (ну, или они в это верят).
В анализе данных и машинном обучении многие вообще не задумываются, откуда данные пришли: натравить-то модель можно на что угодно. Fit-predict — и в продакшн! А что фигня получится — так это не наша проблема.

Постиндустриальный мир забыл, что скелет у него индустриальный. И в попытке пользоваться миром, пытается опереться на те кости, которых в скелете нет и никогда не было.

И… этим постом я продолжаю серию «Ковид и Холокост», начало которой тут.