(←) предыдущая запись ; следующая запись (→)
Мы — то, что мы едим. Я безнадёжно испорчен Системным Блоком (один из лучших научпоп журналов, я крайне рекомендую всем, кому интересен стык цифрового и гуманитарного).
Всякий раз как я рассказываю про n-граммы, меня тянет рассказать про статистику гугла встречаемости энграм по годам. А иллюстрирую я это на автомате давно увиденным примером про популярность различных классов наркотиков в литературе 19–20 веков.
Кстати, я почти уверен, что Александр Дюма получил солидную сумму за product placement гашиша в «Графе Монте-Кристо».
Когда я опомнился, мы конечно нашли более адекватные примеры. Не в том даже смысле, что без веществ, но про n-граммы (n > 1), а не униграммы.
В том же Системном Блоке встретилось объяснение про диграммы — можно посмотреть какое слово чаще всего шло за словом «боевая».
Но изучая ngram viewer мои школьники не могли удержаться от того, чтобы не проверить слово “putin”.
И… вы не поверите, но пик встречаемости этого слова пришёлся на… 1812 год!
Потому что слово “putin” по французски означает «чёртов» или «проклятый».
И сюда пробрался putin Putin!