В следующих заметках я покажу, как комбинируя способы упорядочивания объектов на осях из предыдущего совета, сконструировать самые полезные и часто используемые форматы визуализации — столбиковую диаграмму, линейный график, хитмап, график разброса и карту. А попутно у нас получатся ещё кое‑какие интересные способы представления данных.
Начнём с частиц‑сотрудников, разложенных по возрасту по отсекам на горизонтальной оси:
Упорядочим их по вертикали в стопку:
Узнаёте, прообраз какого формата у нас получился? Это столбиковая диаграмма, которая показывает количество сотрудников в каждом возрастном диапазоне.
Возможно, это не очевидно, но именно так устроены столбиковые диаграммы: столбики как бы сложены из материальных или нематериальных частиц. Аналогично можно сконструировать другие подобные графики, например, распределения сотрудников по должностям. Для этого нужно на горизонтальной оси отсеков возрастные группы заменить на должности:
Этот график ничем не отличается от предыдущего, кроме параметра, который привязан к горизонтальной оси. Подход алгоритма Δλ позволяет управлять осями и визуальными атомами по отдельности, итеративно приближаясь к максимально удачному результату.
Ещё немного поэкспериментируем с возрастными группами. Когда мы используем в качестве визуального атома пиктограмму человечка, мы показываем распределение количества сотрудников. А давайте теперь заменим визуальный атом на столбик, высота которого будет пропорциональна зарплате сотрудника. Что за график у нас получится в этом случае?
Зарплаты отдельных сотрудников в сумме дадут количество денег, которое уходят на зарплаты каждой возрастной группы. Получается, что на этом графике мы тоже видим распределение по возрастным группам, но уже не сотрудников, а зарплатного фонда.
А если мы вспомним, что количество сотрудников внутри возрастных групп разное, то можно провернуть ещё один интересный фокус. Можно на горизонтальной оси сделать отсеки тем шире, чем больше сотрудников в соответствующих возрастных группах.
После чего увеличить ширину зарплатных прямоугольников, сохраняя их площадь:
Что за величина в таком случае окажется отложенной по вертикали? Увеличив ширину и пропорционально уменьшив высоту, мы поделили суммарный зарплатный фонд на количество сотрудников в этой возрастной группе. Естественным образом получилась средняя зарплата.
При этом на последней диаграмме мы не просто видим, что пик средней зарплаты приходится на возрастную группу 50…59 лет, но и видим прямоугольники отдельных сотрудников, из которых это значение складывается. А общая площадь прямоугольника каждой возрастной группы всё ещё пропорциональна зарплатному фонду этой группы, и хотя прямоугольники разной ширины и высоты в точности сравнить сложно, общее представление о распределении зарплатного фонда нам доступно.
Кстати, о пиках. Наши графики проявили, что больше всего сотрудников приходилось на возрастную группу 30…39, больше всего денег уходит на зарплаты для группы 40…49 (и 30…39 совсем рядышком), а средняя зарплата выше всего для 50…59. Вот такая интересная закономерность есть в исходных данных.
Вот как с точки зрения алгоритма устроены обычные столбиковые диаграммы и их производные, более глубокие и многомерные версии.