На прошлом шаге мы перенесли данные на экран и каждому экземпляру частицы данных поставили в соответствие графический примитив (точку, фигуру, изображение или линию), визуальные свойства которого задаются свойствами частицы данных. Таким образом мы материализовали наши данные на экране, превратили их в «осязаемые» объекты, которые можно двигать и группировать, а кроме того проявили одно или несколько свойств, не задействуя оси.
Теперь пришло время для самого увлекательного процесса — конструирования из этой визуальной массы разных диаграмм и графиков. Подход алгоритма Δλ отличается от обычной схемы, когда для визуализации выбирают формат из библиотеки форматов. Мы будем конструировать графики и диаграммы исходя из понимания, какие свойства для частицы данных самые важные, и проявляя эти свойства на осях и через визуальный атом.
Вернёмся к датасету о сотрудниках небольшой компании. Мы начали с ним работать, когда разбирали понятие визуального атома.
Частицы, сотрудники компании, представленные в виде визуальных атомов — пиктограмм. Формой показан пол, цветом — зарплата
Для начала разберём, какие есть способы упорядочить наши объекты (в данном случае, сотрудников) согласно их свойствам вдоль одной оси. Таких способа всего три.
Первый способ — сложить стопкой
Частицы, сотрудники компании, по горизонтали сложены стопкой
В этом случае мы просто ставим частицы бок о бок, пока они не закончатся. Какой параметр в этом случае проявится вдоль оси? Разумеется, количество частиц. При этом частицы можно поставить в произвольном порядке, а можно расположить по убыванию или возрастанию одного из параметров. Ниже показаны частицы, упорядоченные по размеру зарплаты.
Частицы, сотрудники компании, по горизонтали сложены стопкой и отсортированы по размеру зарплаты
Если использовать другую сортировку, например, по возрасту, получится другая картина. Попробуйте сделать выводы о том, как зарплата сотрудников компании зависит от возраста:
Частицы, сотрудники компании по горизонтали сложены стопкой и отсортированы по возрасту
Конечно, это ещё не полноценная визуализация, но кое‑какие особенности оплаты труда в компании нам уже видны, не так ли?
Способ «сложить стопкой» хорош для базовых визуализаций и обычно используется в сочетании со вторым способом.
Второй способ — разложить по отсекам
Частицы, сотрудники компании, по горизонтали разложены по отсекам, соответствующим диапазонам возраста
В этом случае частицы оказываются привязанными к отрезкам оси, которым поставлены в соответствие значения выбранного параметра. Внутри отрезка порядок частиц не имеет значения, они не привязаны к конкретным координатам. Задано только соответствие между частицей с конкретным значение параметра и отрезком, которому он соответствует или в который попадает.
Самое важное преимущество этого способа в том, что он прекрасно подходит не только для количественных, но и для качественных параметров. Скажем, мы можем упорядочить наши частицы по должности в компании.
Частицы, сотрудники компании, по горизонтали разложены по отсекам, соответствующим должности
При этом отрезки могут быть равной ширины или учитывать свойства данных. Например, можно задать возрастные группы не десятилетиями, а оттолкнувшись от внутренних регламентов компании, которые поощряют молодых (до 25 лет) и возрастных (после 50) сотрудников дополнительными выплатами.
Частицы, сотрудники компании, по горизонтали разложены по отсекам, соответствующим диапазонам возраста, ширина отсека пропорциональна количеству лет в возрастной группе
В этом примере видно, что плотность сотрудников на один год в основной группе гораздо выше чем в «спонсируемых».
Третий способ — привязать к координате
Частицы, сотрудники компании, по горизонтали привязаны к координате по возрасту
Это, наверное, самый понятный способ: мы ставим в соответствие значения параметра координате на оси. Таким образом, у каждой частицы будет своё единственно подходящее ей место.
При этом если частиц много, они начинают накладываться друг на друга. Управляя прозрачностью, мы можем увидеть не отдельные частицы, а облако плотности со сгущениями и пробелами:
Частицы, сотрудники компании, по горизонтали привязаны к координате по возрасту. Для большого количества частиц
И всё. Комбинируя эти три способа на горизонтали и вертикали, можно получить любой из стандартных форматов представления данных, а также какой‑нибудь нестандартный или вообще несуществующий, — но идеально подходящий для наших данных.
Связь между экранными измерениями (горизонталью и вертикалью) и параметрами данных с учётом способа упорядочивания на каждой из осей, я называю каркасом визуализации. В следующих советах обсудим конструирование каркасов на основе описанных способов.