Forwarded from Цифровой геноцид
Как на самом деле оценивается продукт с точки зрения опыта пользователя?
Я хотел бы начать с истории про красоту и воспринимаемое удобство, которая, вероятно, многим из нас знакома. В 1995 году японские исследователи Масааки Куросу и Каори Касимура из корпорации Hitachi ( производителя ЭВМ и промышленных авто) продемонстрировали в своем исследовании эффект эстетики и удобства использования. Результаты анализа показывают, что «явное удобство использования в меньшей степени коррелирует с субъективным удобством использования по сравнению с видимой красотой или эстетикой. На пользователя может сильно влиять эстетический аспект интерфейса, даже когда он пытается оценить интерфейс исключительно в функциональных аспектах, а дизайнерам стоит увеличить эстетическую составляющую интерфейса. Красивое - удобно, полагает пользователь
https://dl.acm.org/doi/pdf/10.1145/223355.223680
Эксперимент несколько раз был подтвержден, если верить википедии, конечно, кроме юзабилити есть сильное влияние на воспринимаемую стоимость и так называемые ценовые исследования.
Вода мокрая, да, я понимаю, но давайте взглянем на этот эффект - aesthetic–usability effect - более подробно и попробуем дать экономическое обоснование природы красоты в цифровых продуктах. Есть некоторые мои размышления на этот счет, которые, как кажется, стыкуются с реальностью
Кейнсианский конкурс красоты — мыслительный эксперимент, разработанный Джоном Мейнардом Кейнсом в главе 12 его работы «Общая теория занятости, процента и денег» (1936) для объяснения колебаний цен на фондовых рынках. В ней описывается воображаемый конкурс красоты, в котором награждаются не самые популярные участники конкурса, а те судьи, которые наиболее точно смогли угадать, кто из участников конкурса окажется наиболее популярным, и, строго говоря, будет признан самым красивым.
Кейнс описал действия рациональных агентов на рынке, используя аналогию, основанную на вымышленном конкурсе для читателей газеты, в котором участников просят выбрать шесть самых привлекательных лиц из ста фотографий. Те, кто выбрал самые популярные лица, имеют право на получение приза. В мире, где красота становится валютой, а восприятие превращается в актив, смелость выбора самого очаровательного лица кажется наивной стратегией. Скорее надо угадать лицо, действительно удовлетворяющее среднему вкусу, а еще точнее предугадать, каково будет среднее мнение относительно всех людей насчет того, каким должно быть среднее мнение.
Мы играем в игру, где правила определяются не нами, но нашими представлениями о представлениях других людей. На наше восприятие удобства и красоты интерфейса влияет имидж компании, общественное мнение, расходы на дизайн-митапы и дизайн сообщества: думаю, что именно в этом секрет того, что так много денег тратится на поддержание этого корпоративного буллшита - самый простой способ повлиять на восприятие своего мобильного зеленого или красного банка или условного Авито - это просто заплатить деньги и потратить ресурсы на выступления. Пресловутый common knowledge эпистемологии в проектировании.
https://en.wikipedia.org/wiki/Keynesian_beauty_contest
Я хотел бы начать с истории про красоту и воспринимаемое удобство, которая, вероятно, многим из нас знакома. В 1995 году японские исследователи Масааки Куросу и Каори Касимура из корпорации Hitachi ( производителя ЭВМ и промышленных авто) продемонстрировали в своем исследовании эффект эстетики и удобства использования. Результаты анализа показывают, что «явное удобство использования в меньшей степени коррелирует с субъективным удобством использования по сравнению с видимой красотой или эстетикой. На пользователя может сильно влиять эстетический аспект интерфейса, даже когда он пытается оценить интерфейс исключительно в функциональных аспектах, а дизайнерам стоит увеличить эстетическую составляющую интерфейса. Красивое - удобно, полагает пользователь
https://dl.acm.org/doi/pdf/10.1145/223355.223680
Эксперимент несколько раз был подтвержден, если верить википедии, конечно, кроме юзабилити есть сильное влияние на воспринимаемую стоимость и так называемые ценовые исследования.
Вода мокрая, да, я понимаю, но давайте взглянем на этот эффект - aesthetic–usability effect - более подробно и попробуем дать экономическое обоснование природы красоты в цифровых продуктах. Есть некоторые мои размышления на этот счет, которые, как кажется, стыкуются с реальностью
Кейнсианский конкурс красоты — мыслительный эксперимент, разработанный Джоном Мейнардом Кейнсом в главе 12 его работы «Общая теория занятости, процента и денег» (1936) для объяснения колебаний цен на фондовых рынках. В ней описывается воображаемый конкурс красоты, в котором награждаются не самые популярные участники конкурса, а те судьи, которые наиболее точно смогли угадать, кто из участников конкурса окажется наиболее популярным, и, строго говоря, будет признан самым красивым.
Кейнс описал действия рациональных агентов на рынке, используя аналогию, основанную на вымышленном конкурсе для читателей газеты, в котором участников просят выбрать шесть самых привлекательных лиц из ста фотографий. Те, кто выбрал самые популярные лица, имеют право на получение приза. В мире, где красота становится валютой, а восприятие превращается в актив, смелость выбора самого очаровательного лица кажется наивной стратегией. Скорее надо угадать лицо, действительно удовлетворяющее среднему вкусу, а еще точнее предугадать, каково будет среднее мнение относительно всех людей насчет того, каким должно быть среднее мнение.
Мы играем в игру, где правила определяются не нами, но нашими представлениями о представлениях других людей. На наше восприятие удобства и красоты интерфейса влияет имидж компании, общественное мнение, расходы на дизайн-митапы и дизайн сообщества: думаю, что именно в этом секрет того, что так много денег тратится на поддержание этого корпоративного буллшита - самый простой способ повлиять на восприятие своего мобильного зеленого или красного банка или условного Авито - это просто заплатить деньги и потратить ресурсы на выступления. Пресловутый common knowledge эпистемологии в проектировании.
https://en.wikipedia.org/wiki/Keynesian_beauty_contest
Papers с тулами для анализа и визуализации sequential data.
Sequential data встречается много где, но в моей практике это анализ...:
- ...последовательности шагов в процессах
- ...действий пользователя в сессиях
https://docs.google.com/presentation/d/1fJBku_-BIet8k45POYJiHuIE7R52Lpg9Ts4nb6g_ng4/edit?usp=sharing
Sequential data встречается много где, но в моей практике это анализ...:
- ...последовательности шагов в процессах
- ...действий пользователя в сессиях
https://docs.google.com/presentation/d/1fJBku_-BIet8k45POYJiHuIE7R52Lpg9Ts4nb6g_ng4/edit?usp=sharing
Визуал различных математических концептов
https://math.stackexchange.com/questions/733754/visually-stunning-math-concepts-which-are-easy-to-explain
https://math.stackexchange.com/questions/733754/visually-stunning-math-concepts-which-are-easy-to-explain
Mathematics Stack Exchange
Visually stunning math concepts which are easy to explain
Since I'm not that good at (as I like to call it) 'die-hard-mathematics', I've always liked concepts like the golden ratio or the dragon curve, which are easy to understand and explain but are
Forwarded from p13n
Чтобы улучшить рекомендации аудиокниг, Spotify использует новую комбинацию гетерогенных графовых нейронных сетей (HGNN) и двухбашенной модели (2Т).
Графовая нейронная сеть. HGNN работает на основе устоявшейся парадигмы передачи сообщений: начальные представления для каждого узла "передаются" через агрегатные функции соседним узлам, а затем градиентное обучение обновляет каждое представление в соответствии с "сообщениями", переданными его соседями. Это повторяется в течение нескольких эпох для получения окончательных представлений аудиокниг/подкастов, как показано на рис. 2A.
Двухбашенная модель. Представления HGNN затем поступают в модель 2T, которая учитывает дополнительные сигналы пользователей, такие как демографические данные. Этот компонент также учитывает музыкальные предпочтения пользователей. В целом 2T-модель связывает векторы пользователя и аудиокниги, поэтому их можно сравнивать в одном и том же математическом пространстве. Мы также используем слабые сигналы, такие как предварительный просмотр или следование за аудиокнигой.
Сочетание HGNN с легкой 2T-моделью также обеспечивает масштабируемость, поскольку это означает, что можно реализовать пользовательскую сторону моделирования вне HGNN. Поэтому HGNN обучается на графе совместного прослушивания (рис. 1B), а не на графе пользовательских потоков (рис. 1A), содержащем огромное количество индивидуальных взаимодействий пользователя с контентом.
После успешного тестирования новой модели на офлайн-данных был проведен A/B-тест с участием миллионов пользователей. В результате онлайн-тестирования количество слушаний аудиокниг увеличилась на 23%. Примечательно, что был 46-процентный всплеск числа людей, начинающих прослушивание новых аудиокниг.
https://research.atspotify.com/2024/05/personalizing-audiobooks-and-podcasts-with-graph-based-models/
Графовая нейронная сеть. HGNN работает на основе устоявшейся парадигмы передачи сообщений: начальные представления для каждого узла "передаются" через агрегатные функции соседним узлам, а затем градиентное обучение обновляет каждое представление в соответствии с "сообщениями", переданными его соседями. Это повторяется в течение нескольких эпох для получения окончательных представлений аудиокниг/подкастов, как показано на рис. 2A.
Двухбашенная модель. Представления HGNN затем поступают в модель 2T, которая учитывает дополнительные сигналы пользователей, такие как демографические данные. Этот компонент также учитывает музыкальные предпочтения пользователей. В целом 2T-модель связывает векторы пользователя и аудиокниги, поэтому их можно сравнивать в одном и том же математическом пространстве. Мы также используем слабые сигналы, такие как предварительный просмотр или следование за аудиокнигой.
Сочетание HGNN с легкой 2T-моделью также обеспечивает масштабируемость, поскольку это означает, что можно реализовать пользовательскую сторону моделирования вне HGNN. Поэтому HGNN обучается на графе совместного прослушивания (рис. 1B), а не на графе пользовательских потоков (рис. 1A), содержащем огромное количество индивидуальных взаимодействий пользователя с контентом.
После успешного тестирования новой модели на офлайн-данных был проведен A/B-тест с участием миллионов пользователей. В результате онлайн-тестирования количество слушаний аудиокниг увеличилась на 23%. Примечательно, что был 46-процентный всплеск числа людей, начинающих прослушивание новых аудиокниг.
https://research.atspotify.com/2024/05/personalizing-audiobooks-and-podcasts-with-graph-based-models/
Процесс экспериментов и способ принятия решений в Спотике
https://engineering.atspotify.com/2024/03/risk-aware-product-decisions-in-a-b-tests-with-multiple-metrics/
https://engineering.atspotify.com/2024/03/risk-aware-product-decisions-in-a-b-tests-with-multiple-metrics/
Spotify Engineering
Risk-Aware Product Decisions in A/B Tests with Multiple Metrics
Risk-Aware Product Decisions in A/B Tests with Multiple Metrics - Spotify Engineering
https://engineering.atspotify.com/2024/05/fixed-power-designs-its-not-if-you-peek-its-what-you-peek-at/
Некий новый способ дизайна экспериментов
Некий новый способ дизайна экспериментов
Spotify Engineering
Fixed-Power Designs: It’s Not IF You Peek, It’s WHAT You Peek at
Fixed-Power Designs: It’s Not IF You Peek, It’s WHAT You Peek at - Spotify Engineering
Google Illuminate
Экспериментальный сервис Google превращает научные публикации во что-то вроде подкастов, где эта тема раскрывается в дискуссии.
Экспериментальный сервис Google превращает научные публикации во что-то вроде подкастов, где эта тема раскрывается в дискуссии.
TL;DR – Spotify повышает CTR по рекомендованным блокам, когда объясняет при помощи LLM почему он показывается
https://research.atspotify.com/2024/12/contextualized-recommendations-through-personalized-narratives-using-llms/
https://research.atspotify.com/2024/12/contextualized-recommendations-through-personalized-narratives-using-llms/
Что такое "хорошо используемый ИИ"? Зависит от задачи.
Концепт от одного информационного архитектора https://jarango.com/2024/10/01/exploring-the-ai-solution-space/
Концепт от одного информационного архитектора https://jarango.com/2024/10/01/exploring-the-ai-solution-space/
Еще один материал про купед. На этот раз от мордокниги и с примером кода
https://medium.com/@AnalyticsAtMeta/how-meta-scaled-regression-adjustment-to-improve-power-across-hundreds-of-thousands-of-experiments-624e08aaf560
https://medium.com/@AnalyticsAtMeta/how-meta-scaled-regression-adjustment-to-improve-power-across-hundreds-of-thousands-of-experiments-624e08aaf560
Medium
How Meta scaled regression adjustment to improve power across hundreds of thousands of experiments…
Author: John Meakin, Saurabh Sangwan
Training Data Attribution (TDA) - метод, который помогает понять какие примеры из обучающий выборки сильнее влияют на знание модели
https://medium.com/people-ai-research/scaling-training-data-attribution-f7d1eddd85da
https://medium.com/people-ai-research/scaling-training-data-attribution-f7d1eddd85da
Medium
Scaling Training Data Attribution
The science of how training data influences LLM behavior
Интересный подход: логировать полезность фичей в моделях в общем хранилище, чтобы потом ускорять подбор для новых моделей