Про переверстку табличек и сусликов, которые есть
Я сам статистик и математик, но коммуникация с "заказчиками" — это важная часть моей работы. Дизайн, чистота, читаемость и эстетика моих отчетов для меня важны. Я подписан на всякие каналы про визуализацию данных, на ребят из мира BI и дэшбордиков, с интересом слежу за тем, что делают в Бюро Горбунова и около него.
Читать мнения дизайнерских кругов нужно, но вот следовать их советам вслепую не стоит. Сегодня про курс Игоря Штанга и Миши Капанаги Таблицы и прочие радости, точнее про одну табличку на его главной странице.
Подписывайтесь на канал Миши табличный дизайн, там здорово!
🧵 1/7
Я сам статистик и математик, но коммуникация с "заказчиками" — это важная часть моей работы. Дизайн, чистота, читаемость и эстетика моих отчетов для меня важны. Я подписан на всякие каналы про визуализацию данных, на ребят из мира BI и дэшбордиков, с интересом слежу за тем, что делают в Бюро Горбунова и около него.
Читать мнения дизайнерских кругов нужно, но вот следовать их советам вслепую не стоит. Сегодня про курс Игоря Штанга и Миши Капанаги Таблицы и прочие радости, точнее про одну табличку на его главной странице.
Подписывайтесь на канал Миши табличный дизайн, там здорово!
🧵 1/7
www.igorshtang.ru
Таблицы и прочие радости
Как понятно и красиво представить данные в виде таблицы
Посмотрим на переверстку таблички, которую показывают на главной страничке курса. Слева как было, справа вариант после тюнинга.
🧵 2/7
🧵 2/7
Я не дизайнер, поэтому не буду обсуждать выбор шрифтов-отступов — веб в 2023 по умолчанию читабельнее, чем методички на бумаге из 1993 года от универского издательства. Обсудим изменения в структуре данных.
Таблицу транспонировали. Они прямо пишут: в шапке текста много, в первом столбце мало, надо поменять местами.
Выбросили строку-итог, где в каждом столбце получалось по 100%. Кажется, с точки зрения дизайнера, это избыточная информация и ей можно пренебречь.
Добавили столбец с галочками и крестиками. Видимо, попытка быть дружелюбным к читателю.
Вторая таблица читается легче, это правда. Зачем тогда пост? А затем, что переверстывали дизайнеры, а не люди со знанием статистики, и с водой выплеснули ребеночка.
🧵 3/7
Таблицу транспонировали. Они прямо пишут: в шапке текста много, в первом столбце мало, надо поменять местами.
Выбросили строку-итог, где в каждом столбце получалось по 100%. Кажется, с точки зрения дизайнера, это избыточная информация и ей можно пренебречь.
Добавили столбец с галочками и крестиками. Видимо, попытка быть дружелюбным к читателю.
Вторая таблица читается легче, это правда. Зачем тогда пост? А затем, что переверстывали дизайнеры, а не люди со знанием статистики, и с водой выплеснули ребеночка.
🧵 3/7
👍1
Проблема философская
Насколько я вижу, сейчас модно заботиться о пользователях и делать так, чтобы им приходилось поменьше думать. Галочка с крестиком про это же:
Мы подумаем за читателя, и раз 37% самая большая доля, то обозначим вариант В галочкой, а вариант Г крестиком, вдруг пользователь не освоил программу начальной школы и у него не получится сравнить четыре числа.
Давайте смотреть детальнее. Варианты Б и В по количеству ответов "Оправдано" отличаются всего на один процент; вряд ли разница статитистически значима. Так почему он отмечен галочкой? Или мы его выбрали потому, что у него меньше всего ответов "Неоправдано"? Здесь нет однозначной метрики. Более того, вообще не факт, что на основании этой таблицы можно принять такое решение или что такая цель стояла.
В терминах Тафти галочка с крестиком — это визуальный шум. Он сбивает с толку и вызывает больше вопросов, чем дает ответов.
Что делать? Это вопрос целевой аудитории и жанра текста.
В коммерции, популярных и "продающих" текстах для широкой аудитории такой подход окнорм и на своем месте. В академии и BI погода другая.
* Если это табличка в рапорте для топ-манагера, то мб это и оправдано.
* Пишете отчет для коллеги-ученого без статобразования и он четко сформулировал шкалу лучше-хуже? Может, да, а, может, не да.
* Если речь идет про текст от равного для равных, то разделение на секции Results и Discussion придумали не просто так. Твердые числа — отдельно, ваши интерпретации — отдельно. Читатель не тупой, позвольте ему вчитаться в данные и самому составить свое мнение.
Здесь еще можно развести конспирологию про то, что если вы не думаете сами, а кто-то думает за вас, то теория наджа, гроб гроб кладбище, кто заплатил дизайнеру, чтобы галочка появилась у варианта В, масоны-рептилоиды, мы все под колпаком, но мы устоим перед этим искушением.
🧵 4/7
Насколько я вижу, сейчас модно заботиться о пользователях и делать так, чтобы им приходилось поменьше думать. Галочка с крестиком про это же:
Мы подумаем за читателя, и раз 37% самая большая доля, то обозначим вариант В галочкой, а вариант Г крестиком, вдруг пользователь не освоил программу начальной школы и у него не получится сравнить четыре числа.
Давайте смотреть детальнее. Варианты Б и В по количеству ответов "Оправдано" отличаются всего на один процент; вряд ли разница статитистически значима. Так почему он отмечен галочкой? Или мы его выбрали потому, что у него меньше всего ответов "Неоправдано"? Здесь нет однозначной метрики. Более того, вообще не факт, что на основании этой таблицы можно принять такое решение или что такая цель стояла.
В терминах Тафти галочка с крестиком — это визуальный шум. Он сбивает с толку и вызывает больше вопросов, чем дает ответов.
Что делать? Это вопрос целевой аудитории и жанра текста.
В коммерции, популярных и "продающих" текстах для широкой аудитории такой подход окнорм и на своем месте. В академии и BI погода другая.
* Если это табличка в рапорте для топ-манагера, то мб это и оправдано.
* Пишете отчет для коллеги-ученого без статобразования и он четко сформулировал шкалу лучше-хуже? Может, да, а, может, не да.
* Если речь идет про текст от равного для равных, то разделение на секции Results и Discussion придумали не просто так. Твердые числа — отдельно, ваши интерпретации — отдельно. Читатель не тупой, позвольте ему вчитаться в данные и самому составить свое мнение.
Здесь еще можно развести конспирологию про то, что если вы не думаете сами, а кто-то думает за вас, то теория наджа, гроб гроб кладбище, кто заплатил дизайнеру, чтобы галочка появилась у варианта В, масоны-рептилоиды, мы все под колпаком, но мы устоим перед этим искушением.
🧵 4/7
👍4
Нарушение конвенций
Табличка относится к интервенционному исследованию: респондентам предлагают разные формулировки (treatment / независимая переменная), а потом сравнивают их реакцию (response / зависимая переменная).
В той литературе, с которой сталкивался я, обычно уровни тритмента расположены в шапке (по столбцам), а уровни респонса ставят по строкам (в боковик). В исходной таблице эту конвенцию соблюдают, а вот в переверстанной таблице на это забили.
Табличка в вакууме выглядит красивее; как оно будет работать в реальном тексте — вопрос.
Как быть? Отвечу за "академию", в других избушках свои погремушки.
Пункт ноль. Выбрать один вариант (тритмент по строкам или по столбцам) и придерживаться его на протяжении всей единицы текста. Понимание структуры эксперимента первично, конкретные уровни тритмента и респонса вторичны и разжевываются в главах перед самой таблицей несколько раз.
Формулировки в исходной таблице закодированы буквами А–Г. Если не нравится разползающаяся шапка, то я бы оставил только буквы, а сами формулировки либо убрал вообще, либо вынес списком в текст перед таблицей / в подзаголовок таблицы / в примечания к таблице / в подпись к таблице.
🧵 5/7
Табличка относится к интервенционному исследованию: респондентам предлагают разные формулировки (treatment / независимая переменная), а потом сравнивают их реакцию (response / зависимая переменная).
В той литературе, с которой сталкивался я, обычно уровни тритмента расположены в шапке (по столбцам), а уровни респонса ставят по строкам (в боковик). В исходной таблице эту конвенцию соблюдают, а вот в переверстанной таблице на это забили.
Табличка в вакууме выглядит красивее; как оно будет работать в реальном тексте — вопрос.
Как быть? Отвечу за "академию", в других избушках свои погремушки.
Пункт ноль. Выбрать один вариант (тритмент по строкам или по столбцам) и придерживаться его на протяжении всей единицы текста. Понимание структуры эксперимента первично, конкретные уровни тритмента и респонса вторичны и разжевываются в главах перед самой таблицей несколько раз.
Формулировки в исходной таблице закодированы буквами А–Г. Если не нравится разползающаяся шапка, то я бы оставил только буквы, а сами формулировки либо убрал вообще, либо вынес списком в текст перед таблицей / в подзаголовок таблицы / в примечания к таблице / в подпись к таблице.
🧵 5/7
👍2
О чем эта таблица?
Посмотрите на переверстанную таблицу; какого она типа? в ней указаны какие-то проценты, но проценты чего в структуре чего?
Может, это таблица сопряженности 4×3, а проценты — это доля респондентов в конкретной ячейке от всех опрошенных?
Или это таблица в которой сделали conditioning по строкам: проценты в ячейках — это доля респондентов от тех, кому была предложена конкретная формулировка?
Лично я на этом подзавис. Разгадка проста: строчка со 100% строго говоря избыточна, но она несет важную информацию об устройстве самой таблицы. Можно и без нее, но придется потратить время и заняться сложением чисел в строчках, а потом еще и дурное послевкусие сомнений и неуверенности остается: я все правильно посчитал? я правильно разгадал, что хотел сказать автор?
Как быть? Оставить столбец "Всего" с построчными суммами. Для лучшей читаемости отделить его от тела таблицы отступом побольше, мб 100% печатать не жирным шрифтом, а обычным. Кому надо, те сразу поймут, что в таблице оценки условных вероятностей. При этом засчет отделения столбик не будет путать остальных.
🧵 6/7
Посмотрите на переверстанную таблицу; какого она типа? в ней указаны какие-то проценты, но проценты чего в структуре чего?
Может, это таблица сопряженности 4×3, а проценты — это доля респондентов в конкретной ячейке от всех опрошенных?
Или это таблица в которой сделали conditioning по строкам: проценты в ячейках — это доля респондентов от тех, кому была предложена конкретная формулировка?
Лично я на этом подзавис. Разгадка проста: строчка со 100% строго говоря избыточна, но она несет важную информацию об устройстве самой таблицы. Можно и без нее, но придется потратить время и заняться сложением чисел в строчках, а потом еще и дурное послевкусие сомнений и неуверенности остается: я все правильно посчитал? я правильно разгадал, что хотел сказать автор?
Как быть? Оставить столбец "Всего" с построчными суммами. Для лучшей читаемости отделить его от тела таблицы отступом побольше, мб 100% печатать не жирным шрифтом, а обычным. Кому надо, те сразу поймут, что в таблице оценки условных вероятностей. При этом засчет отделения столбик не будет путать остальных.
🧵 6/7
Вместо заключения
"Избыточность" и "шум" в глазу смотрящего
Что дизайнеру избыточная строка, то статистику важная опора, облегчающая жизнь и понимание. Где дизайнер видит упрощение для пользователя и подсветку главной мысли, там исследователь видит тенденциозность и предвзятость.
Суслик, скорее всего, есть. Хоть вы его и не видите.
Хороший дизайн — это когда на вопрос "почему так" есть ответ. Если дизайнер не понимает, что хотел сказать автор, и не видит ответа на вопрос "почему и зачем", то это не значит, что этого ответа нет и не предполагается. Более того, если сам автор таблички не может ответить на этот вопрос внятно и говорит что-то типа "все так делают и я тоже", то это тоже не значит, что этого ответа нет. Просто автор таблички может быть не статистиком, а человеком, который делает, как статистики.
Контекст и его понимание роляют
Если брать еще шире, то переверстки таблиц в вакууме — сегодняшней таблицы, таблицы про выбросы химотходов на курсе Ильи Бирмана или таблица про сварщиков из разбора Миши Капанаги — это упражнение для студентов и дизайнерский междусобойчик, а не реальная ситуация. Потому что если вы не знаете откуда и зачем эта таблица, кто ей будет пользоваться, в каких условиях и на какие вопросы она должна отвечать,
если вы не понимаете прикладную область (domain-specific knowledge, он самый), то с ненулевой вероятностью при переверстке потеряется информация и появится шум.
Никто не знает ваши данные лучше вас
Если вам не нравится, как верстак составил табличку, вам перестало быть понятно, что в ней, у вас есть несогласия — возможно, стоит послать верстака / дизайнера лесом. Потому что у дизайнеров другой анамнез и решают они другие задачи.
Сходите на канал к Михаилу, читайте Илью Бирмана, развивайте насмотренность. Но прежде всего думайте своей головой.
🧵 7/7
"Избыточность" и "шум" в глазу смотрящего
Что дизайнеру избыточная строка, то статистику важная опора, облегчающая жизнь и понимание. Где дизайнер видит упрощение для пользователя и подсветку главной мысли, там исследователь видит тенденциозность и предвзятость.
Суслик, скорее всего, есть. Хоть вы его и не видите.
Хороший дизайн — это когда на вопрос "почему так" есть ответ. Если дизайнер не понимает, что хотел сказать автор, и не видит ответа на вопрос "почему и зачем", то это не значит, что этого ответа нет и не предполагается. Более того, если сам автор таблички не может ответить на этот вопрос внятно и говорит что-то типа "все так делают и я тоже", то это тоже не значит, что этого ответа нет. Просто автор таблички может быть не статистиком, а человеком, который делает, как статистики.
Контекст и его понимание роляют
Если брать еще шире, то переверстки таблиц в вакууме — сегодняшней таблицы, таблицы про выбросы химотходов на курсе Ильи Бирмана или таблица про сварщиков из разбора Миши Капанаги — это упражнение для студентов и дизайнерский междусобойчик, а не реальная ситуация. Потому что если вы не знаете откуда и зачем эта таблица, кто ей будет пользоваться, в каких условиях и на какие вопросы она должна отвечать,
если вы не понимаете прикладную область (domain-specific knowledge, он самый), то с ненулевой вероятностью при переверстке потеряется информация и появится шум.
Никто не знает ваши данные лучше вас
Если вам не нравится, как верстак составил табличку, вам перестало быть понятно, что в ней, у вас есть несогласия — возможно, стоит послать верстака / дизайнера лесом. Потому что у дизайнеров другой анамнез и решают они другие задачи.
Сходите на канал к Михаилу, читайте Илью Бирмана, развивайте насмотренность. Но прежде всего думайте своей головой.
🧵 7/7
👍1🔥1
душно про дату
Нарушение конвенций Табличка относится к интервенционному исследованию: респондентам предлагают разные формулировки (treatment / независимая переменная), а потом сравнивают их реакцию (response / зависимая переменная). В той литературе, с которой сталкивался…
Всяко лыко в строку. Вот тут Илья говорит, что привычка — важная штука, и не стоит ломать ожидания пользователя при пересборке таблички.
YouTube
На курсе: дизайн универсальных таблиц с непредсказуемым содержимым
Участник курса спрашивает о том, как подходить к дизайну таблиц для всяких админок и внутренних сервисов, где содержимое в общем случае может быть каким угодно. Я отвечаю в двух частях. Во-первых о том, что нет причин считать таблицы «для админки» особенными…