По какой-то причине творчество покойного Егора Летова часто переплетается с искусственным интеллектом. Несколько лет назад нейросеть, которую обучили на песнях «Гражданской обороны», записала целый альбом в стиле этой группы. Если до сих пор не слушали — welcome.
Теперь, как любят выражаться телевизионные журналисты, в Сети набирает популярность новая работа. На YouTube выложили клип на песню «Всё идёт по плану». Фишка в том, что его собрали из картинок, которые сгенерировала модель Midjourney.
Каждую строчку (и даже отдельные слова) проиллюстрировали красивыми изображениями. Уже с первых кадров мы видим памятник батюшки-Ленина, который непривычно сидит на постаменте. На следующей картинке — интересная и немного пугающая иллюстрация строчки про плесень и липовый мёд. Можно включить клип хотя бы ради этого момента.
На самом деле большая часть изображений выглядит как современное произведение искусства. ИИ-модель отлично справилась с задачей — некоторые картинки можно смело выставлять в музей. В комментариях справедливо замечают, что Москва здесь напоминает локацию какой-то игры — такой могла бы быть Half Life 3.
Я бы с удовольствием посмотрела, какие конкретные запросы для нейросети вводил автор клипа. Есть ощущение, что он задействовал не только слова из песни, но и другие описания. Потому что весь клип пропитан коммунизмом больше, чем оригинальная песня, — красные знамёна мелькают чуть ли не в каждом кадре.
В общем, советую оценить. Но только если не боитесь увидеть, как нейросеть нарисовала самые спорные фразы из песни (их ведь, как известно, не выкинуть). Ну и ещё в песне есть мат, но вы наверняка знаете и без меня.
Теперь, как любят выражаться телевизионные журналисты, в Сети набирает популярность новая работа. На YouTube выложили клип на песню «Всё идёт по плану». Фишка в том, что его собрали из картинок, которые сгенерировала модель Midjourney.
Каждую строчку (и даже отдельные слова) проиллюстрировали красивыми изображениями. Уже с первых кадров мы видим памятник батюшки-Ленина, который непривычно сидит на постаменте. На следующей картинке — интересная и немного пугающая иллюстрация строчки про плесень и липовый мёд. Можно включить клип хотя бы ради этого момента.
На самом деле большая часть изображений выглядит как современное произведение искусства. ИИ-модель отлично справилась с задачей — некоторые картинки можно смело выставлять в музей. В комментариях справедливо замечают, что Москва здесь напоминает локацию какой-то игры — такой могла бы быть Half Life 3.
Я бы с удовольствием посмотрела, какие конкретные запросы для нейросети вводил автор клипа. Есть ощущение, что он задействовал не только слова из песни, но и другие описания. Потому что весь клип пропитан коммунизмом больше, чем оригинальная песня, — красные знамёна мелькают чуть ли не в каждом кадре.
В общем, советую оценить. Но только если не боитесь увидеть, как нейросеть нарисовала самые спорные фразы из песни (их ведь, как известно, не выкинуть). Ну и ещё в песне есть мат, но вы наверняка знаете и без меня.
YouTube
Егор Летов - Все идёт по плану Нейросеть Midjourney нарисовала клип к песне
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
👍17🔥2❤1
Новый ИИ поможет автономно управлять атомной электростанцией
🔎 По их задумке, искусственный интеллект будет постоянно проверять тысячи датчиков и производительность всех главных компонентов системы — клапанов, насосов и теплообменников. Сейчас этим занимаются люди. И человеческий фактор на таком предприятии — самое тонкое место. Сразу вспоминается Гомер Симпсон на работе.
Чтобы испытать автономную систему, исследователи разработали «цифровой двойник» усовершенствованного ядерного реактора. Грубо говоря, это компьютерная симуляция современной навороченной АЭС. С её помощью ИИ тренируется искать проблемы на виртуальной станции и собирать все важные данные.
❗️Обученный инструмент видит потенциальную неисправность на самом раннем этапе. Если он замечает аномалию, то сразу же сообщает о ней оператору. А ещё предлагает, как можно решить эту проблему. С одной стороны, такие подсказки могут предотвратить дорогостоящий ремонт. С другой — избавят от ненужного обслуживания оборудования, то есть сэкономят деньги.
💰 Хотя систему в первую очередь делали для новых ядерных реакторов, она вполне гибкая, чтобы её можно было применять на других станциях. Учёные подсчитали, что их ИИ поможет сэкономить атомной отрасли более 500 млн долларов в год.
👉 Модель разрабатывали примерно полтора года. Системы контроля и диагностики уже готовы, поэтому теперь учёные сосредоточились на финальном этапе — инструменте для принятия решений.
☢ На работу АЭС приходится тратить много денег, ведь станции нужно постоянно контролировать и обслуживать (человечество знает, чем может обернуться любая ошибка). Кажется, учёные из Аргоннской национальной лаборатории Министерства энергетики США нашли способ снизить затраты на ядерную энергию — они предлагают отдать часть «грязной» работы роботам.🔎 По их задумке, искусственный интеллект будет постоянно проверять тысячи датчиков и производительность всех главных компонентов системы — клапанов, насосов и теплообменников. Сейчас этим занимаются люди. И человеческий фактор на таком предприятии — самое тонкое место. Сразу вспоминается Гомер Симпсон на работе.
Чтобы испытать автономную систему, исследователи разработали «цифровой двойник» усовершенствованного ядерного реактора. Грубо говоря, это компьютерная симуляция современной навороченной АЭС. С её помощью ИИ тренируется искать проблемы на виртуальной станции и собирать все важные данные.
❗️Обученный инструмент видит потенциальную неисправность на самом раннем этапе. Если он замечает аномалию, то сразу же сообщает о ней оператору. А ещё предлагает, как можно решить эту проблему. С одной стороны, такие подсказки могут предотвратить дорогостоящий ремонт. С другой — избавят от ненужного обслуживания оборудования, то есть сэкономят деньги.
💰 Хотя систему в первую очередь делали для новых ядерных реакторов, она вполне гибкая, чтобы её можно было применять на других станциях. Учёные подсчитали, что их ИИ поможет сэкономить атомной отрасли более 500 млн долларов в год.
👉 Модель разрабатывали примерно полтора года. Системы контроля и диагностики уже готовы, поэтому теперь учёные сосредоточились на финальном этапе — инструменте для принятия решений.
👍8🔥3😱3🏆1
Сбер запатентовал систему распознавания дипфейков на видео с несколькими людьми
🎭 Развлекаться с нейросетями может быть очень весело. Сколько мы уже увидели смешных трейлеров, где лица актёров заменили физиономией Николаса Кейджа? Но многие недооценивают опасность дипфейков.
Ведь эту технологию легко использовать во вред. Страшно представить, что будет, если журналисты поведутся на дипфейк с главой какого-нибудь государства.
👆 Я уже как-то писала, что Google Colab даже ввёл ограничения на создание дипфейков. Тогда поддельное видео с Бараком Обамой репостнули в соцсетях больше 2 млн раз. И с тех пор проблема стала ещё актуальнее — мошенники всё чаще используют дипфейк для обмана и наживы.
Потенциальную проблему видят и в Сбере. Там уже запатентовали систему, которая помогает определять, меняли ли лицо на видео. В основе технологии — нейросетевые модели класса EfficientNet и метод амплификации и анализа микроизменений в цветах объектов на кадрах.
Если объяснять на пальцах, то первый метод выглядит так: ИИ определяет лица на видео и рассчитывает векторное представление их геометрических характеристик. Потом алгоритм анализирует разные вероятности того, что лицо синтетически изменили. В конце он выдаёт оценку. Подробнее можно почитать здесь.
🎨 Второй способ работает с цветом. Здесь алгоритмы разбивают видео на множество фреймов и сравнивают, как в них менялись значения красного спектра для каждого пикселя. Если интересно — вот описание технологии в патенте.
Для максимальной точности оба метода объединили в одну систему. Так шанс определить фейковое видео сильно выше.
Вообще, уже есть похожие технологии, которые распознают дипфейки. Но в основном они хорошо справляются с видео, на которых есть только один человек.
👥 Алгоритм Сбера показывает хорошие результаты, даже если в кадре несколько людей. Замеры на независимых тестовых выборках показали, что система работает с точностью 98%, — это намного выше, чем у других аналогов в открытом доступе.
Новую технологию можно будет использовать для защиты от кибератак на системы Face Recognition и Liveness Detection. Она же позволит спастись от информационных дипфейк-атак и от злоумышленников, которые притворяются другими людьми во время конференц-колов.
🎭 Развлекаться с нейросетями может быть очень весело. Сколько мы уже увидели смешных трейлеров, где лица актёров заменили физиономией Николаса Кейджа? Но многие недооценивают опасность дипфейков.
Ведь эту технологию легко использовать во вред. Страшно представить, что будет, если журналисты поведутся на дипфейк с главой какого-нибудь государства.
👆 Я уже как-то писала, что Google Colab даже ввёл ограничения на создание дипфейков. Тогда поддельное видео с Бараком Обамой репостнули в соцсетях больше 2 млн раз. И с тех пор проблема стала ещё актуальнее — мошенники всё чаще используют дипфейк для обмана и наживы.
Потенциальную проблему видят и в Сбере. Там уже запатентовали систему, которая помогает определять, меняли ли лицо на видео. В основе технологии — нейросетевые модели класса EfficientNet и метод амплификации и анализа микроизменений в цветах объектов на кадрах.
Если объяснять на пальцах, то первый метод выглядит так: ИИ определяет лица на видео и рассчитывает векторное представление их геометрических характеристик. Потом алгоритм анализирует разные вероятности того, что лицо синтетически изменили. В конце он выдаёт оценку. Подробнее можно почитать здесь.
🎨 Второй способ работает с цветом. Здесь алгоритмы разбивают видео на множество фреймов и сравнивают, как в них менялись значения красного спектра для каждого пикселя. Если интересно — вот описание технологии в патенте.
Для максимальной точности оба метода объединили в одну систему. Так шанс определить фейковое видео сильно выше.
Вообще, уже есть похожие технологии, которые распознают дипфейки. Но в основном они хорошо справляются с видео, на которых есть только один человек.
👥 Алгоритм Сбера показывает хорошие результаты, даже если в кадре несколько людей. Замеры на независимых тестовых выборках показали, что система работает с точностью 98%, — это намного выше, чем у других аналогов в открытом доступе.
Новую технологию можно будет использовать для защиты от кибератак на системы Face Recognition и Liveness Detection. Она же позволит спастись от информационных дипфейк-атак и от злоумышленников, которые притворяются другими людьми во время конференц-колов.
🔥8👍5⚡2
История вселенной за три минуты
🌎 Посмотрела на YouTube красивый ролик бельгийского блогера Ксандера Стинбрюгге. На трёхминутном видео — рождение нашей планеты и краткая история человечества. Конечно, интерпретации на эту тему мы уже неоднократно видели в кино. Но здесь, как мне кажется, задумка поинтереснее.
Все картинки для ролика нарисовал новый генератор изображений Stable Diffusion от компаний Stability AI и Runway. Он пока открыт только для бета-тестеров — видимо, блогер оказался в их числе.
Стинбрюгге сделал 36 запросов для нейросети. На каждое описание алгоритм выдавал по несколько картинок. Причём генерировал их последовательно, учитывая предыдущие результаты. Блогеру оставалось выбрать самые подходящие и склеить их в один ролик.
🙊 Получилось захватывающе. На первых секундах — результат Большого взрыва. На десятой формируются галактики, а сразу после этого — буквально рождается планета. Примерно на 33 секунде в океане появляется жизнь. Ну а дальше динозавры, обезьяны, человеки, цивилизация.
Любопытно, как нейросеть видит наше будущее. Зелёные мегаполисы превращаются в безжизненные футуристичные небоскрёбы, а люди становятся киборгами. Концовку вообще сложно описать без философских отступлений — лучше посмотрите сами, если интересно.
🤖 Ну и пара слов о самой нейросети. Stable Diffusion запустили только в начале августа, но ей уже пророчат большое будущее. Разработчики говорят, что после полноценного запуска ИИ-модель с открытым исходным кодом сможет работать даже на стандартных ПК. Минимальные требования — видеокарта с 5 ГБ памяти. В теории, запустить нейронку на своём компьютере смогут даже владельцы бюджетной NVIDIA GTX 1660.
Изображения генерируются всего пару секунд. На выходе получаются картинки с разрешением 512x512 пикселей. Модель обучали на кластере из 4000 графических процессоров NVIDIA A100 Erza-1. Ей «скормили» 5,6 млрд изображений из интернета с текстовыми описаниями.
Важное отличие от DALL-E 2 — здесь нет фильтров на генерацию лиц знаменитостей. Так что ждём лавину новых шедевров с актёрами, политиками и спортсменами.
🌎 Посмотрела на YouTube красивый ролик бельгийского блогера Ксандера Стинбрюгге. На трёхминутном видео — рождение нашей планеты и краткая история человечества. Конечно, интерпретации на эту тему мы уже неоднократно видели в кино. Но здесь, как мне кажется, задумка поинтереснее.
Все картинки для ролика нарисовал новый генератор изображений Stable Diffusion от компаний Stability AI и Runway. Он пока открыт только для бета-тестеров — видимо, блогер оказался в их числе.
Стинбрюгге сделал 36 запросов для нейросети. На каждое описание алгоритм выдавал по несколько картинок. Причём генерировал их последовательно, учитывая предыдущие результаты. Блогеру оставалось выбрать самые подходящие и склеить их в один ролик.
🙊 Получилось захватывающе. На первых секундах — результат Большого взрыва. На десятой формируются галактики, а сразу после этого — буквально рождается планета. Примерно на 33 секунде в океане появляется жизнь. Ну а дальше динозавры, обезьяны, человеки, цивилизация.
Любопытно, как нейросеть видит наше будущее. Зелёные мегаполисы превращаются в безжизненные футуристичные небоскрёбы, а люди становятся киборгами. Концовку вообще сложно описать без философских отступлений — лучше посмотрите сами, если интересно.
🤖 Ну и пара слов о самой нейросети. Stable Diffusion запустили только в начале августа, но ей уже пророчат большое будущее. Разработчики говорят, что после полноценного запуска ИИ-модель с открытым исходным кодом сможет работать даже на стандартных ПК. Минимальные требования — видеокарта с 5 ГБ памяти. В теории, запустить нейронку на своём компьютере смогут даже владельцы бюджетной NVIDIA GTX 1660.
Изображения генерируются всего пару секунд. На выходе получаются картинки с разрешением 512x512 пикселей. Модель обучали на кластере из 4000 графических процессоров NVIDIA A100 Erza-1. Ей «скормили» 5,6 млрд изображений из интернета с текстовыми описаниями.
Важное отличие от DALL-E 2 — здесь нет фильтров на генерацию лиц знаменитостей. Так что ждём лавину новых шедевров с актёрами, политиками и спортсменами.
YouTube
Voyage through Time - a Generative AI journey
This video was made with StableDiffusion, combining 36 prompts in a single, seamless video morph taking you on a trip through evolution.
You can now make your own at https://eden.art/
More info: https://twitter.com/xsteenbrugge/status/1558508866463219712…
You can now make your own at https://eden.art/
More info: https://twitter.com/xsteenbrugge/status/1558508866463219712…
👍24🤯3❤2🔥1😁1💯1
Уже не раз писала, как нейросети всё сильнее переплетаются с культурой и искусством. Сначала они помогали с картинами и клипами. Теперь дело зашло ещё дальше — пользователь Twitter под ником Nao_u выпустил браузерную игру с графикой, которую полностью нарисовала Midjourney.
🕹 Сама по себе игра не слишком интересная. Это обычная аркадная 2D-стрелялка, сделанная на коленке за три дня. Вы летите на истребителе и стреляете по другим самолётам и гигантским жукам (при чём тут вообще насекомые?). За попаданиями игра следит не всегда точно, враги перемещаются хаотично, управление тоже довольно посредственное.
Но геймплей в таких вещах — дело второстепенное. Важнее сам факт появления такой игры (тем более она бесплатная). Ведь для отрисовки всех элементов не пришлось нанимать ни одного дизайнера.
🎨 Достаточно просто сделать несколько запросов нейросетке, чтобы она отрисовала целый город, который мелькает на фоне. Да и монстров она сгенерировала, и даже логотип.
Правда, автор столкнулся с некоторыми ограничениями. Во-первых, у него не получилось разделить элементы фона. Nao_u хотел вынести облака на передний план, а здания — на средний, чтобы изображение получилось объёмным. Но нейросеть для такой задачи пока не очень подходит.
👾 Во-вторых, спрайты персонажей здесь без анимации. Если бы среди врагов остались только самолёты, проблем бы не было. Но автор добавил ещё и больших жуков, лапы которых не двигались. Выглядит как минимум странно.
Эти ограничения, вроде отсутствия анимации, сильно сужают возможности для создания игр. Потому что даже двигающегося человека отрисовать не получится — статичные картинки подойдут разве что для каких-нибудь текстовых квестов или новелл.
👆 Но в любом случае даже такие маленькие шаги в будущем могут пойти геймингу на пользу. Ведь создание текстур и моделей — это чуть ли не самые дорогие процессы в разработке игр. И даже если ИИ пока не заменит профессиональных гейм-дизайнеров, скоро он сможет упростить им работу.
🕹 Сама по себе игра не слишком интересная. Это обычная аркадная 2D-стрелялка, сделанная на коленке за три дня. Вы летите на истребителе и стреляете по другим самолётам и гигантским жукам (при чём тут вообще насекомые?). За попаданиями игра следит не всегда точно, враги перемещаются хаотично, управление тоже довольно посредственное.
Но геймплей в таких вещах — дело второстепенное. Важнее сам факт появления такой игры (тем более она бесплатная). Ведь для отрисовки всех элементов не пришлось нанимать ни одного дизайнера.
🎨 Достаточно просто сделать несколько запросов нейросетке, чтобы она отрисовала целый город, который мелькает на фоне. Да и монстров она сгенерировала, и даже логотип.
Правда, автор столкнулся с некоторыми ограничениями. Во-первых, у него не получилось разделить элементы фона. Nao_u хотел вынести облака на передний план, а здания — на средний, чтобы изображение получилось объёмным. Но нейросеть для такой задачи пока не очень подходит.
👾 Во-вторых, спрайты персонажей здесь без анимации. Если бы среди врагов остались только самолёты, проблем бы не было. Но автор добавил ещё и больших жуков, лапы которых не двигались. Выглядит как минимум странно.
Эти ограничения, вроде отсутствия анимации, сильно сужают возможности для создания игр. Потому что даже двигающегося человека отрисовать не получится — статичные картинки подойдут разве что для каких-нибудь текстовых квестов или новелл.
👆 Но в любом случае даже такие маленькие шаги в будущем могут пойти геймингу на пользу. Ведь создание текстур и моделей — это чуть ли не самые дорогие процессы в разработке игр. И даже если ИИ пока не заменит профессиональных гейм-дизайнеров, скоро он сможет упростить им работу.
👍11💩2👎1🔥1
📚 Держите подборку книг про ИИ. Точнее, про будущее, которое ждёт нас с его развитием.
«Петля: как технологии создают мир без выбора и как с этим бороться»
Предостерегающая история о том, как технологии могут поработить человечество через пару поколений. И речь не о зловещих терминаторах. Авторы пишут о созданной человеком петле, в которой ИИ принимает всё больше решений. И с каждым поколением выбираться из этой петли становится сложнее. Но унывать пока рано — с ИИ можно жить в гармонии.
Автор книги — американский журналист Джейкоб Уорд — описал много интересных исследований и пообщался с экспертами в области ИИ. Получилось интересно.
«Надёжный ИИ: бизнес-руководство по этике искусственного интеллекта»
Бина Амманат написала книгу об этичном использовании искусственного интеллекта в бизнесе. У автора огромный опыт в этих вопросах: она курировала направления информационных технологий в компаниях Hewlett Packard, General Electric и Bank of America.
В книге Амманат рассказывает, как отличить надёжный алгоритм от ненадёжного. А ещё она рекомендует, как внедрить ИИ в бизнес-процессы. Я бы посоветовала эту работу руководителям и топ-менеджерам.
«Новый огонь. Война, мир и демократия в эпоху искусственного интеллекта»
Бен Бьюкенен и Эндрю Имбри стараются не запугать читателей скорым апокалипсисом из-за восстания машин. Авторы сравнивают новые технологии с огнём. ИИ может как освещать путь, так и приводить к разрушениям.
Сейчас некоторые автократы используют ИИ во вред: распространяют дезинформацию, создают хакерские инструменты и боевое оружие. Но авторы книги экспертно доказывают, что ещё не всё потеряно. При правильном подходе технологии не должны потворствовать тирании.
«ИИ 2041: десять возможных картин нашего будущего»
Бывший президент Google China Кай-Фу Ли написал книгу вместе со знаменитым писателем Чэнь Цюфанем. Они в красках показали, каким будет мир в течение двух следующих десятилетий. ИИ произведёт революцию в медицине и образовании, создаст новые формы общения и развлечений. Но и опасностей для жизни тоже станет больше.
Заинтриговала? Тогда добавлю, что произведение признали лучшей книгой года по версии Wall Street Journal, Washington Post и Financial Times. К прочтению обязательна!
«Петля: как технологии создают мир без выбора и как с этим бороться»
Предостерегающая история о том, как технологии могут поработить человечество через пару поколений. И речь не о зловещих терминаторах. Авторы пишут о созданной человеком петле, в которой ИИ принимает всё больше решений. И с каждым поколением выбираться из этой петли становится сложнее. Но унывать пока рано — с ИИ можно жить в гармонии.
Автор книги — американский журналист Джейкоб Уорд — описал много интересных исследований и пообщался с экспертами в области ИИ. Получилось интересно.
«Надёжный ИИ: бизнес-руководство по этике искусственного интеллекта»
Бина Амманат написала книгу об этичном использовании искусственного интеллекта в бизнесе. У автора огромный опыт в этих вопросах: она курировала направления информационных технологий в компаниях Hewlett Packard, General Electric и Bank of America.
В книге Амманат рассказывает, как отличить надёжный алгоритм от ненадёжного. А ещё она рекомендует, как внедрить ИИ в бизнес-процессы. Я бы посоветовала эту работу руководителям и топ-менеджерам.
«Новый огонь. Война, мир и демократия в эпоху искусственного интеллекта»
Бен Бьюкенен и Эндрю Имбри стараются не запугать читателей скорым апокалипсисом из-за восстания машин. Авторы сравнивают новые технологии с огнём. ИИ может как освещать путь, так и приводить к разрушениям.
Сейчас некоторые автократы используют ИИ во вред: распространяют дезинформацию, создают хакерские инструменты и боевое оружие. Но авторы книги экспертно доказывают, что ещё не всё потеряно. При правильном подходе технологии не должны потворствовать тирании.
«ИИ 2041: десять возможных картин нашего будущего»
Бывший президент Google China Кай-Фу Ли написал книгу вместе со знаменитым писателем Чэнь Цюфанем. Они в красках показали, каким будет мир в течение двух следующих десятилетий. ИИ произведёт революцию в медицине и образовании, создаст новые формы общения и развлечений. Но и опасностей для жизни тоже станет больше.
Заинтриговала? Тогда добавлю, что произведение признали лучшей книгой года по версии Wall Street Journal, Washington Post и Financial Times. К прочтению обязательна!
👍15🔥2🤔2
Apple научилась создавать дипфейки на основе очень коротких роликов
🙈 Пока одни корпорации всеми силами борются с дипфейками, другие, наоборот, улучшают уже спорные технологии. Недавно отличилась Apple с её новой нейросетью NeuMan.
Купертиновцы выложили на GitHub исходный код алгоритма, который умеет генерировать дипфейки на основе очень коротких видео. Даже десятисекундного ролика хватит, чтобы нейросетка сделала свою работу.
🤸♂️ Сразу уточню. Эппловский инструмент не просто «пересаживает» какое-нибудь лицо на голову другого актёра. По сути, NeuMan создаёт 3D-модель человека в кадре. Поэтому автор дипфейка может заставить её делать всё, что угодно: танцевать, прыгать или заниматься физкультурой. Здесь всё ограничивается фантазией монтажёра (ну и нынешними возможностями нейросети).
📏 ИИ-система состоит из двух моделей нейрорадиального излучения (NeRF). Первая анализирует силуэт героя кадра, геометрию его тела. Причём неважно, в какой позе человека запечатлели на камеру, — нейросеть в любом случае справится. А вторая модель работает с фоном — например выравнивает трясущееся изображение и дорисовывает недостающие детали.
Разработчики алгоритма приложили несколько видео с тестами технологии. Честно говоря, не могу сказать, что качество этих роликов меня повергло в шок. Сгенерированные 3D-модельки в некоторых кадрах выглядят не слишком реалистично — как в бюджетных мультфильмах. А фон периодически смазывается и рассыпается на пиксели 🖼.
Но в любом случае работа авторов инструмента достойна уважения. Ведь нейросеть обучается на очень коротких роликах, снятых на смартфон без стабилизации. И если делать на это скидку, то результаты получаются отличные.
👉 В Apple говорят, что её технологию будут применять в дополненной реальности. Учитывая хайп вокруг метавселенных — не сомневаюсь, что разработчики мобильных приложений будут пользоваться этим инструментом.
🙈 Пока одни корпорации всеми силами борются с дипфейками, другие, наоборот, улучшают уже спорные технологии. Недавно отличилась Apple с её новой нейросетью NeuMan.
Купертиновцы выложили на GitHub исходный код алгоритма, который умеет генерировать дипфейки на основе очень коротких видео. Даже десятисекундного ролика хватит, чтобы нейросетка сделала свою работу.
🤸♂️ Сразу уточню. Эппловский инструмент не просто «пересаживает» какое-нибудь лицо на голову другого актёра. По сути, NeuMan создаёт 3D-модель человека в кадре. Поэтому автор дипфейка может заставить её делать всё, что угодно: танцевать, прыгать или заниматься физкультурой. Здесь всё ограничивается фантазией монтажёра (ну и нынешними возможностями нейросети).
📏 ИИ-система состоит из двух моделей нейрорадиального излучения (NeRF). Первая анализирует силуэт героя кадра, геометрию его тела. Причём неважно, в какой позе человека запечатлели на камеру, — нейросеть в любом случае справится. А вторая модель работает с фоном — например выравнивает трясущееся изображение и дорисовывает недостающие детали.
Разработчики алгоритма приложили несколько видео с тестами технологии. Честно говоря, не могу сказать, что качество этих роликов меня повергло в шок. Сгенерированные 3D-модельки в некоторых кадрах выглядят не слишком реалистично — как в бюджетных мультфильмах. А фон периодически смазывается и рассыпается на пиксели 🖼.
Но в любом случае работа авторов инструмента достойна уважения. Ведь нейросеть обучается на очень коротких роликах, снятых на смартфон без стабилизации. И если делать на это скидку, то результаты получаются отличные.
👉 В Apple говорят, что её технологию будут применять в дополненной реальности. Учитывая хайп вокруг метавселенных — не сомневаюсь, что разработчики мобильных приложений будут пользоваться этим инструментом.
🔥6⚡4👍4
Хочу затронуть не очень весёлую тему. Но я увидела хороший повод немного пофилософствовать о роли искусственного интеллекта в жизни (или, в этом случае, смерти) человека. Все там будем, поэтому нет смысла игнорировать такие вопросы.
😲 Соучредитель компании StoryFile, которая создаёт цифровые копии людей, Стивен Смит устроил крайне необычные похороны своей мамы Марины.
Прощание началось с того, что покойная «предстала» (даже не знаю, нужны ли здесь кавычки) перед гостями в виде голограммы. Сначала она «зачитала» речь, а потом даже «поотвечала» на вопросы присутствующих. И всё это сразу после кремации!
Естественно, не обошлось без ИИ. Но нейросеть работала не так, как вы могли подумать. Она не генерировала ответы покойной — реплики записали заранее, ещё при жизни Марины.
Алгоритм анализировал вопросы гостей и подбирал самые подходящие реплики из базы. А заодно он обрабатывал ответы, чтобы они звучали максимально естественно — как будто общаешься с живым человеком по видеосвязи. 📲
📹 Саму голограмму создавали с помощью 20 камер, которые записывали видео одновременно. Идея технологии родилась у другой соучредительницы фирмы Хизер Майо-Смит, когда она брала интервью у Роуз Шиндлер для выставки про Холокост.
Любопытно, что основатели компании не хотят, чтобы искусственный интеллект обучался на словах покойных и сам генерировал ответы на вопросы. Смит считает, что современные технологии к этому ещё не готовы. «Вы не сможете создать синтетическую версию меня, даже если она будет выглядеть в точности, как я», — говорил он журналистам. 👥
👆 Проблема в том, что эта тема слишком деликатная. ИИ может вложить ложный смысл в высказывания человека, и тем самым опорочить его память. А этого никто не хочет.
Кстати, когда прочитала эту новость, мне сразу вспомнилась история про пермского изобретателя. Он загрузил в робота семь часов видео со своим покойным дедушкой и научил его отвечать на вопросы голосом родственника. Если не видели — вот ролик на YouTube.
😲 Соучредитель компании StoryFile, которая создаёт цифровые копии людей, Стивен Смит устроил крайне необычные похороны своей мамы Марины.
Прощание началось с того, что покойная «предстала» (даже не знаю, нужны ли здесь кавычки) перед гостями в виде голограммы. Сначала она «зачитала» речь, а потом даже «поотвечала» на вопросы присутствующих. И всё это сразу после кремации!
Естественно, не обошлось без ИИ. Но нейросеть работала не так, как вы могли подумать. Она не генерировала ответы покойной — реплики записали заранее, ещё при жизни Марины.
Алгоритм анализировал вопросы гостей и подбирал самые подходящие реплики из базы. А заодно он обрабатывал ответы, чтобы они звучали максимально естественно — как будто общаешься с живым человеком по видеосвязи. 📲
📹 Саму голограмму создавали с помощью 20 камер, которые записывали видео одновременно. Идея технологии родилась у другой соучредительницы фирмы Хизер Майо-Смит, когда она брала интервью у Роуз Шиндлер для выставки про Холокост.
Любопытно, что основатели компании не хотят, чтобы искусственный интеллект обучался на словах покойных и сам генерировал ответы на вопросы. Смит считает, что современные технологии к этому ещё не готовы. «Вы не сможете создать синтетическую версию меня, даже если она будет выглядеть в точности, как я», — говорил он журналистам. 👥
👆 Проблема в том, что эта тема слишком деликатная. ИИ может вложить ложный смысл в высказывания человека, и тем самым опорочить его память. А этого никто не хочет.
Кстати, когда прочитала эту новость, мне сразу вспомнилась история про пермского изобретателя. Он загрузил в робота семь часов видео со своим покойным дедушкой и научил его отвечать на вопросы голосом родственника. Если не видели — вот ролик на YouTube.
❤11👍7🔥1🤔1🤬1
Мы этого не хотели. Мы этого боялись. Но в глубине души понимали, что рано или поздно это должно было произойти. И вот свершилось: искусственный интеллект добрался до рэпа. Но, как говорится, есть нюанс, и даже не один.
Журналист The Guardian протестировал приложение iRap — оно помогает рифмовать слова и целые предложения с помощью ИИ. Причём создатели утверждают, что ПО подбирает правильные фразы не только по ритму, но и по их семантическому значению. А ещё программа предлагает перестроить предложение так, чтобы оно лучше рифмовалось.
Здесь работает сразу несколько нейросеток. Первая преобразует устную речь в текст (журналист похвалил качество транскрипции). Вторая классифицирует части речи и ударные слоги. Потом языковые модели предлагают новые слова — похоже на то, как работают подсказки на клавиатурах смартфонов.
В теории звучит отлично, но на практике всё оказалось не так радужно. Приведу примеры из текста. Когда обозреватель сказал фразу Big red dog in the house («Большая красная собака в доме»), ему предложили рифмы Mouse («мышь»), Grouse («тетерев») и Slaughterhouse («скотобойня»). Здесь всё ещё терпимо, это можно превратить в странноватый рэп про забой животных на ферме.
Но функция с подбором синонимов сработала очень странно. Алгоритмы предложили три варианта на замену фразы про собаку в доме — Adult redhead goat in the accommodation («Взрослая рыжая коза в общежитии»), Cosmic coco cow in the compound («Космическая кокосовая корова в комплексе») и Monolithic rouge man in the manor («Монолитный румяный мужчина в усадьбе»). Кажется, русским рэперам пора напрячься — их карьера под угрозой.
А ещё журналист заметил, что алгоритм собрал в себе все замшелые стереотипы о рэперах. В синонимах к названию этого жанра он увидел слова «головорезы», «бандиты» и «сутенёры».
В общем, ложная тревога — искусственный интеллект пока не готов заменить наших любимых рэперов. Но держим в уме, что это только первый шаг, ведь программа обучается и на неудачных попытках.
Журналист The Guardian протестировал приложение iRap — оно помогает рифмовать слова и целые предложения с помощью ИИ. Причём создатели утверждают, что ПО подбирает правильные фразы не только по ритму, но и по их семантическому значению. А ещё программа предлагает перестроить предложение так, чтобы оно лучше рифмовалось.
Здесь работает сразу несколько нейросеток. Первая преобразует устную речь в текст (журналист похвалил качество транскрипции). Вторая классифицирует части речи и ударные слоги. Потом языковые модели предлагают новые слова — похоже на то, как работают подсказки на клавиатурах смартфонов.
В теории звучит отлично, но на практике всё оказалось не так радужно. Приведу примеры из текста. Когда обозреватель сказал фразу Big red dog in the house («Большая красная собака в доме»), ему предложили рифмы Mouse («мышь»), Grouse («тетерев») и Slaughterhouse («скотобойня»). Здесь всё ещё терпимо, это можно превратить в странноватый рэп про забой животных на ферме.
Но функция с подбором синонимов сработала очень странно. Алгоритмы предложили три варианта на замену фразы про собаку в доме — Adult redhead goat in the accommodation («Взрослая рыжая коза в общежитии»), Cosmic coco cow in the compound («Космическая кокосовая корова в комплексе») и Monolithic rouge man in the manor («Монолитный румяный мужчина в усадьбе»). Кажется, русским рэперам пора напрячься — их карьера под угрозой.
А ещё журналист заметил, что алгоритм собрал в себе все замшелые стереотипы о рэперах. В синонимах к названию этого жанра он увидел слова «головорезы», «бандиты» и «сутенёры».
В общем, ложная тревога — искусственный интеллект пока не готов заменить наших любимых рэперов. Но держим в уме, что это только первый шаг, ведь программа обучается и на неудачных попытках.
the Guardian
Rapper’s delight or weapons-grade nonsense? The app that uses AI to help MCs bust a rhyme
New tech is promising to take rap artists to new lyrical heights. But will its algorithm be able to handle our novice writer’s rubbish rhymes?
😁11👍5🔥3
Лучшие фильмы об искусственном интеллекте
Решила не включать в подборку совсем попсовые работы вроде «Матрицы» и «Терминатора» — вы их и так наверняка смотрели.
🎬 «Она», 2013 год (16+)
История одинокого писателя Теодора, который купил голосового помощника с искусственным интеллектом. Саманта (так звали ассистентку) постоянно учится и постепенно начинает понимать человеческие эмоции. Через какое-то время главный герой и Саманта влюбляются друг в друга.
Фильм стоит посмотреть хотя бы ради гениального Хоакина Феникса в главной роли и отличного сценария — не зря картина получила «Оскар» и «Золотой глобус».
🎬 «Из машины», 2014 год (16+)
Тоже оскароносный фильм, но уже за визуальные эффекты. Этот научно-фантастический триллер — о программисте Калебе Смите. Начальник попросил его протестировать первый в мире полноценный ИИ — так Калеб оказался на неделю в одном доме с человекоподобным роботом по имени Ава. Как вы могли догадаться, в какой-то момент эксперимент идёт не по плану.
🎬 «Игра в имитацию», 2014 год (16+)
Действие фильма разворачивается во время Второй мировой войны. В центре сюжета — британский математик Алан Тьюринг, который пытается взломать немецкую шифровальную машину Enigma. Он вооружается помощью лучших разгадывателей кроссвордов и создаёт первый в истории компьютер.
Советую посмотреть картину, даже если вы не любите Бенедикта Камбербэтча (но надеюсь, что вы не из таких). Ведь здесь хорошо показана биография «отца» компьютерных наук.
🎬 «АльфаГо», 2017 (0+)
Документальный фильм об исследователях из DeepMind, которые создали алгоритм для игры в го — древнюю китайскую настолку. До недавнего времени её считали слишком сложной, чтобы машина могла играть на уровне кожаных профессионалов. Но программа AlphaGo доказала, что это не так.
Против AlphaGo выступил южнокорейский чемпион мира по игре в го Ли Седоль. Если вы читали новости, то знаете, чем закончилось эпичное противостояние. Но всё равно посмотреть документалку и «заглянуть за кулисы» битвы будет интересно.
Решила не включать в подборку совсем попсовые работы вроде «Матрицы» и «Терминатора» — вы их и так наверняка смотрели.
🎬 «Она», 2013 год (16+)
История одинокого писателя Теодора, который купил голосового помощника с искусственным интеллектом. Саманта (так звали ассистентку) постоянно учится и постепенно начинает понимать человеческие эмоции. Через какое-то время главный герой и Саманта влюбляются друг в друга.
Фильм стоит посмотреть хотя бы ради гениального Хоакина Феникса в главной роли и отличного сценария — не зря картина получила «Оскар» и «Золотой глобус».
🎬 «Из машины», 2014 год (16+)
Тоже оскароносный фильм, но уже за визуальные эффекты. Этот научно-фантастический триллер — о программисте Калебе Смите. Начальник попросил его протестировать первый в мире полноценный ИИ — так Калеб оказался на неделю в одном доме с человекоподобным роботом по имени Ава. Как вы могли догадаться, в какой-то момент эксперимент идёт не по плану.
🎬 «Игра в имитацию», 2014 год (16+)
Действие фильма разворачивается во время Второй мировой войны. В центре сюжета — британский математик Алан Тьюринг, который пытается взломать немецкую шифровальную машину Enigma. Он вооружается помощью лучших разгадывателей кроссвордов и создаёт первый в истории компьютер.
Советую посмотреть картину, даже если вы не любите Бенедикта Камбербэтча (но надеюсь, что вы не из таких). Ведь здесь хорошо показана биография «отца» компьютерных наук.
🎬 «АльфаГо», 2017 (0+)
Документальный фильм об исследователях из DeepMind, которые создали алгоритм для игры в го — древнюю китайскую настолку. До недавнего времени её считали слишком сложной, чтобы машина могла играть на уровне кожаных профессионалов. Но программа AlphaGo доказала, что это не так.
Против AlphaGo выступил южнокорейский чемпион мира по игре в го Ли Седоль. Если вы читали новости, то знаете, чем закончилось эпичное противостояние. Но всё равно посмотреть документалку и «заглянуть за кулисы» битвы будет интересно.
👍21🔥3❤1
Уже сложно вспомнить, сколько раз я рассказывала про то, как нейросети учатся самостоятельно писать тексты по запросу. Пока у них это получается с переменным успехом — финальный вариант в любом случае приходится редактировать или собирать по крупицам из нескольких фрагментов.
📝 Но с мелкими задачами вроде написания слоганов или коротких описаний они уже неплохо справляются. Я чаще всего пользуюсь сберовскими алгоритмами, потому что они понимают русский язык.
👉 mGPT умеет достраивать предложения. Вы пишете часть фразы, а нейросеть выдаёт продолжение. Её обучили на 600 Гб данных из «Википедии» и других открытых источников. Она понимает 61 язык и даже учитывает культурный контекст.
Поэтому сетку можно использовать в онлайн-торговле и маркетинге — например, чтобы локализовывать карточки товаров в интернет-магазинах. А если нейросеть дообучить, она даже сможет «подрабатывать» чат-ботом.
👉 Сервис «Рерайтер», как понятно из названия, умеет переписывать текст другими словами, с помощью синонимов. Естественно, первоначальный смысл сохраняется (по крайней мере, должен).
Пока доступна бесплатная демо-версия. Лучше всего она работает с небольшими фрагментами — в крупных текстах нейросетка пока теряется. В любом случае даже сейчас её можно использовать для рерайта маленьких новостей или рекламных сообщений. В будущем инструмент прокачают — он научится переписывать текст в определённом стиле.
👉 Нейросеть «Суммаризатор» обрабатывает текст и убирает из него все лишние детали, без которых материал становится чище. В теории это удобный инструмент, если нужно сократить объём без искажения смысла. Например, чтобы уложиться в ограниченное количество символов в рекламном объявлении. Он без проблем уберёт 15–20% бесполезного контента.
Но я не устану повторять. Пока все эти сервисы — помощники, а не полноценные работники. Они ещё учатся, и поэтому результат лучше перепроверять вручную.
📝 Но с мелкими задачами вроде написания слоганов или коротких описаний они уже неплохо справляются. Я чаще всего пользуюсь сберовскими алгоритмами, потому что они понимают русский язык.
👉 mGPT умеет достраивать предложения. Вы пишете часть фразы, а нейросеть выдаёт продолжение. Её обучили на 600 Гб данных из «Википедии» и других открытых источников. Она понимает 61 язык и даже учитывает культурный контекст.
Поэтому сетку можно использовать в онлайн-торговле и маркетинге — например, чтобы локализовывать карточки товаров в интернет-магазинах. А если нейросеть дообучить, она даже сможет «подрабатывать» чат-ботом.
👉 Сервис «Рерайтер», как понятно из названия, умеет переписывать текст другими словами, с помощью синонимов. Естественно, первоначальный смысл сохраняется (по крайней мере, должен).
Пока доступна бесплатная демо-версия. Лучше всего она работает с небольшими фрагментами — в крупных текстах нейросетка пока теряется. В любом случае даже сейчас её можно использовать для рерайта маленьких новостей или рекламных сообщений. В будущем инструмент прокачают — он научится переписывать текст в определённом стиле.
👉 Нейросеть «Суммаризатор» обрабатывает текст и убирает из него все лишние детали, без которых материал становится чище. В теории это удобный инструмент, если нужно сократить объём без искажения смысла. Например, чтобы уложиться в ограниченное количество символов в рекламном объявлении. Он без проблем уберёт 15–20% бесполезного контента.
Но я не устану повторять. Пока все эти сервисы — помощники, а не полноценные работники. Они ещё учатся, и поэтому результат лучше перепроверять вручную.
👍16🔥2
Поздравляю с Первым сентября тех, кому сегодня не нужно на учёбу! В честь такого праздника собрала несколько интересных ИИ-стартапов в EdTech.
👩🏫 Южнокорейская компания Riiid использует искусственный интеллект, чтобы адаптировать обучение английскому языку под каждого пользователя. Флагманский продукт — приложение Santa для подготовки к международному экзамену TOEIC.
Здесь используют весь набор технологий — компьютерное зрение, обработку естественного языка и машинное обучение. Алгоритм прогнозирует оценки и поведение учеников, поэтому приложение может в реальном времени подстраивать контент под запросы пользователя.
Большой плюс в том, что технологию может использовать и адаптировать любая школа или университет.
👩🏫 Стартап ELSA Speak появился благодаря тому, что его основательница — вьетнамка Ву Ван — приехала учиться в США и не смогла найти общий язык с местными. Ни преподаватели, ни одногруппники не понимали её из-за сильного акцента. Тогда ей пришла идея необычного приложения.
Программа использует технологию распознавания речи: она слушает пользователя и оценивает его произношение. Сразу во время тренировки ИИ говорит, где речь поставлена хорошо, а где ещё нужно что-то подтянуть. Алгоритм обучался на голосах людей, говорящих на английском с разными акцентами. И он продолжает совершенствоваться!
👩🏫 Мы более-менее привыкли к распознаванию лиц на улицах и в общественном транспорте, но некоторые компании пошли дальше. Например, китайская Hikvision Digital Technology устанавливает камеры в местных школах.
Там нейросети отслеживают эмоции учеников — это позволяет понять, насколько внимательно они слушают преподавателя. ПО различает семь выражений лица: нейтральное, счастливое, грустное, разочарованное, злое, испуганное и удивлённое. Учитель видит все эти данные прямо во время урока.
К слову, похожие технологии разрабатывают и в России. В Перми уже даже начали внедрять распознавание эмоций учеников в школах (пока в тестовом режиме).
👩🏫 Южнокорейская компания Riiid использует искусственный интеллект, чтобы адаптировать обучение английскому языку под каждого пользователя. Флагманский продукт — приложение Santa для подготовки к международному экзамену TOEIC.
Здесь используют весь набор технологий — компьютерное зрение, обработку естественного языка и машинное обучение. Алгоритм прогнозирует оценки и поведение учеников, поэтому приложение может в реальном времени подстраивать контент под запросы пользователя.
Большой плюс в том, что технологию может использовать и адаптировать любая школа или университет.
👩🏫 Стартап ELSA Speak появился благодаря тому, что его основательница — вьетнамка Ву Ван — приехала учиться в США и не смогла найти общий язык с местными. Ни преподаватели, ни одногруппники не понимали её из-за сильного акцента. Тогда ей пришла идея необычного приложения.
Программа использует технологию распознавания речи: она слушает пользователя и оценивает его произношение. Сразу во время тренировки ИИ говорит, где речь поставлена хорошо, а где ещё нужно что-то подтянуть. Алгоритм обучался на голосах людей, говорящих на английском с разными акцентами. И он продолжает совершенствоваться!
👩🏫 Мы более-менее привыкли к распознаванию лиц на улицах и в общественном транспорте, но некоторые компании пошли дальше. Например, китайская Hikvision Digital Technology устанавливает камеры в местных школах.
Там нейросети отслеживают эмоции учеников — это позволяет понять, насколько внимательно они слушают преподавателя. ПО различает семь выражений лица: нейтральное, счастливое, грустное, разочарованное, злое, испуганное и удивлённое. Учитель видит все эти данные прямо во время урока.
К слову, похожие технологии разрабатывают и в России. В Перми уже даже начали внедрять распознавание эмоций учеников в школах (пока в тестовом режиме).
👍13🔥3👎1😁1
За последние пару месяцев генераторы изображений создали столько контента, что впечатлить меня этими картинками уже сложно. Но преобразование текста в видео ещё не приелось. Так что знакомлю вас с новым шедевром — короткометражкой The Crow («Ворон») от ирландского художника и композитора Гленна Маршалла.
🏆 Слово «шедевр» я использовала не случайно, ведь картина получила приз жюри Каннского кинофестиваля. Конечно, это далеко не первый фильм, созданный с помощью ИИ. Но предыдущие творения не удостаивались таких высоких наград.
За основу для короткометражки Маршалл взял ролик Painted на YouTube. На нём девушка в чёрном платье танцует в заброшке под эпичную музыку. Это видео он «скормил» нейросети CLIP от OpenAI. Затем предложил системе создать новый ролик с «изображением вороны в пустынном пейзаже».
💃 Получилось, будто поверх оригинального видео наложили красивую анимацию. Поэтому создаётся ощущение, что ворона периодически превращается в танцовщицу, но всего на долю секунды. А потом вновь становится птицей. Маршалл увидел в этом глубокий символизм (видимо, жюри Каннского фестиваля тоже).
В будущем художник хочет добавить 3D-анимацию в свои творения. Ещё он продолжает экспериментировать с CLIP: Маршалл пытается научиться выставлять ракурсы с помощью подробных текстовых запросов для нейросети.
🎬 Мне кажется, The Crow — это добротный вклад в киноиндустрию. Работу Маршалла уже признали на одной престижной премии, а скоро он примет участие и в другой (BAFTA Awards). А широкий интерес к теме ИИ точно не повредит никому.
👉 Кстати, имя Маршалл уже не первый раз мелькает в СМИ. В прошлом году он прославился благодаря клипу на песню группы Daft Punk. Правда, тогда художник воспользовался нейросетью Story2Hallucination. Но результат всё равно достойный — советую глянуть, если любите этих французов.
🏆 Слово «шедевр» я использовала не случайно, ведь картина получила приз жюри Каннского кинофестиваля. Конечно, это далеко не первый фильм, созданный с помощью ИИ. Но предыдущие творения не удостаивались таких высоких наград.
За основу для короткометражки Маршалл взял ролик Painted на YouTube. На нём девушка в чёрном платье танцует в заброшке под эпичную музыку. Это видео он «скормил» нейросети CLIP от OpenAI. Затем предложил системе создать новый ролик с «изображением вороны в пустынном пейзаже».
💃 Получилось, будто поверх оригинального видео наложили красивую анимацию. Поэтому создаётся ощущение, что ворона периодически превращается в танцовщицу, но всего на долю секунды. А потом вновь становится птицей. Маршалл увидел в этом глубокий символизм (видимо, жюри Каннского фестиваля тоже).
В будущем художник хочет добавить 3D-анимацию в свои творения. Ещё он продолжает экспериментировать с CLIP: Маршалл пытается научиться выставлять ракурсы с помощью подробных текстовых запросов для нейросети.
🎬 Мне кажется, The Crow — это добротный вклад в киноиндустрию. Работу Маршалла уже признали на одной престижной премии, а скоро он примет участие и в другой (BAFTA Awards). А широкий интерес к теме ИИ точно не повредит никому.
👉 Кстати, имя Маршалл уже не первый раз мелькает в СМИ. В прошлом году он прославился благодаря клипу на песню группы Daft Punk. Правда, тогда художник воспользовался нейросетью Story2Hallucination. Но результат всё равно достойный — советую глянуть, если любите этих французов.
👍15🔥6
Сегодня, 5 сентября, — международный день благотворительности. Поэтому решила собрать тематические стартапы, которые используют ИИ для поддержки нуждающихся.
Dataro
Австралийская компания помогает фондам собирать больше денег с помощью бигдаты. Например, Dataro уже увеличила чистый доход организации Flying Doctor Service (одна из крупнейших авиамедицинских НКО) на 35 тысяч долларов.
Её алгоритмы машинного обучения анализируют всю историю пожертвований: любые транзакции и коммуникации с донором. После такого анализа ПО присваивает каждому жертвователю прогностический балл — вероятность, с которой человек пожертвует деньги. Так можно экономить деньги и время на тех людей, которые не собираются жертвовать в ближайшее время.
Candid
Этот стартап помогает не только некоммерческим организациям, но и потенциальным донорам. Сервис на основе ИИ подсказывает людям, как лучше распределить пожертвования.
Для этого нужно оставить запрос на сайте: умные алгоритмы всё проанализируют и подберут самый подходящий фонд. В базе данных — более 2 млн НКО по всему миру. У большинства можно посмотреть их статус, миссию, персонал и финансовые отчёты.
Crisis Text Line
Сервис для тех, кто оказался в сложной ситуации. По сути, это горячая текстовая линия, в которой сообщения распределяют между волонтёрами-консультантами с помощью ИИ. Алгоритмы помогают сильно сократить время ожидания. Чем важнее проблема, тем быстрее человек получит помощь.
Служба работает 24/7. Сначала пользователю отвечает бот — он спрашивает, что произошло, а потом выбирает подходящего сотрудника. Обычно волонтёр приходит на помощь в течение пяти минут.
City Mass Mobility Map
Удобный навигатор для людей с ограниченной подвижностью. Человеку нужно один раз заполнить профиль и указать в нём все детали (например, передвигается ли он на коляске или ходит с палочкой). После этого достаточно ввести пункт назначения, и алгоритмы искусственного интеллекта предложат самый оптимальный маршрут с учётом всех ограничений.
Dataro
Австралийская компания помогает фондам собирать больше денег с помощью бигдаты. Например, Dataro уже увеличила чистый доход организации Flying Doctor Service (одна из крупнейших авиамедицинских НКО) на 35 тысяч долларов.
Её алгоритмы машинного обучения анализируют всю историю пожертвований: любые транзакции и коммуникации с донором. После такого анализа ПО присваивает каждому жертвователю прогностический балл — вероятность, с которой человек пожертвует деньги. Так можно экономить деньги и время на тех людей, которые не собираются жертвовать в ближайшее время.
Candid
Этот стартап помогает не только некоммерческим организациям, но и потенциальным донорам. Сервис на основе ИИ подсказывает людям, как лучше распределить пожертвования.
Для этого нужно оставить запрос на сайте: умные алгоритмы всё проанализируют и подберут самый подходящий фонд. В базе данных — более 2 млн НКО по всему миру. У большинства можно посмотреть их статус, миссию, персонал и финансовые отчёты.
Crisis Text Line
Сервис для тех, кто оказался в сложной ситуации. По сути, это горячая текстовая линия, в которой сообщения распределяют между волонтёрами-консультантами с помощью ИИ. Алгоритмы помогают сильно сократить время ожидания. Чем важнее проблема, тем быстрее человек получит помощь.
Служба работает 24/7. Сначала пользователю отвечает бот — он спрашивает, что произошло, а потом выбирает подходящего сотрудника. Обычно волонтёр приходит на помощь в течение пяти минут.
City Mass Mobility Map
Удобный навигатор для людей с ограниченной подвижностью. Человеку нужно один раз заполнить профиль и указать в нём все детали (например, передвигается ли он на коляске или ходит с палочкой). После этого достаточно ввести пункт назначения, и алгоритмы искусственного интеллекта предложат самый оптимальный маршрут с учётом всех ограничений.
Startup Daily
AI-led 'givetech' Dataro lands $2.5 million seed round to help charities innovate fundraising
Dataro's machine learning algorithms analyse patterns in fundraising to paint a much more detailed picture of giving.
👍8🔥2
😱 Уже несколько лет нас пугают заголовками о том, что роботы заменят людей в разных профессиях
Мол, нейросети-бухгалтеры будут выполнять всю бюрократическую работу, беспилотные такси — развозить людей, а робокурьеры — доставлять товары.
🕺 Креативный класс оставался в относительной безопасности, пока нейронки не научились почти идеально рисовать картины и неплохо работать с текстом. Теперь настала очередь артистов…
На Financial Times вышла колонка о том, что актёры и музыканты всерьёз переживают о своём профессиональном будущем. 65% опрошенных британцев из этой сферы считают, что ИИ представляет угрозу для отрасли. Попробую порассуждать, действительно ли всё так серьёзно 🤔
Как по мне, страх артистов вполне объясним — взять хотя бы дипфейки. Из громких примеров можно вспомнить, как создатели «Звёздных войн» «оживили» актрису Кэрри Фишер, чтобы она вновь появилась на экранах в образе принцессы Леи. Сегодня дипфейки неплохо делают даже бесплатные мобильные приложения.
🗣 Актёрам озвучки тоже есть о чём переживать. За последние пару лет появилось как минимум несколько сервисов, которые генерируют «живые» голоса, практически неотличимые от реальных. У компании VocaliD есть несколько персонажей на выбор, говорящих разным тембром.
А у Sonantic (её недавно купила Spotify) искусственные голоса могут смеяться, плакать и кричать. И эти фишки уже использовали разработчики компьютерных игр при озвучке героев.
🧑⚖️ Пугает и правовой аспект. Компании всё чаще предлагают артистам контракты, по которым могут использовать синтезированные лицо или голос актёра в любое время. Молодые работники шоу-бизнеса могут поддаться искушению из-за предоплаты, а в будущем пожалеть из-за последствий.
Мне кажется, поводов для переживания и правда достаточно. И хотя вся эта проблема вряд ли сильно затронет топовых актёров уровня Ди Каприо, второстепенным артистам точно станет тяжелее найти работу.
Мол, нейросети-бухгалтеры будут выполнять всю бюрократическую работу, беспилотные такси — развозить людей, а робокурьеры — доставлять товары.
🕺 Креативный класс оставался в относительной безопасности, пока нейронки не научились почти идеально рисовать картины и неплохо работать с текстом. Теперь настала очередь артистов…
На Financial Times вышла колонка о том, что актёры и музыканты всерьёз переживают о своём профессиональном будущем. 65% опрошенных британцев из этой сферы считают, что ИИ представляет угрозу для отрасли. Попробую порассуждать, действительно ли всё так серьёзно 🤔
Как по мне, страх артистов вполне объясним — взять хотя бы дипфейки. Из громких примеров можно вспомнить, как создатели «Звёздных войн» «оживили» актрису Кэрри Фишер, чтобы она вновь появилась на экранах в образе принцессы Леи. Сегодня дипфейки неплохо делают даже бесплатные мобильные приложения.
🗣 Актёрам озвучки тоже есть о чём переживать. За последние пару лет появилось как минимум несколько сервисов, которые генерируют «живые» голоса, практически неотличимые от реальных. У компании VocaliD есть несколько персонажей на выбор, говорящих разным тембром.
А у Sonantic (её недавно купила Spotify) искусственные голоса могут смеяться, плакать и кричать. И эти фишки уже использовали разработчики компьютерных игр при озвучке героев.
🧑⚖️ Пугает и правовой аспект. Компании всё чаще предлагают артистам контракты, по которым могут использовать синтезированные лицо или голос актёра в любое время. Молодые работники шоу-бизнеса могут поддаться искушению из-за предоплаты, а в будущем пожалеть из-за последствий.
Мне кажется, поводов для переживания и правда достаточно. И хотя вся эта проблема вряд ли сильно затронет топовых актёров уровня Ди Каприо, второстепенным артистам точно станет тяжелее найти работу.
👍12🔥5😱3
🖼 Нарисованная нейросетью картина победила в крупном конкурсе. Настоящие художники в ярости
Новость вышла ещё в конце августа, а я до неё добралась только сейчас. Но уж очень руки чешутся обсудить её. Я про американца Джейсона Аллена, который победил на конкурсе изобразительных искусств.
🤖 Фишка в том, что мужчина даже не прикасался к кисти, — его картину «Театр космической оперы» нарисовала нейросеть Midjourney.
Аллен уверяет, что работа заняла у него «многие недели». Он долго подбирал правильный запрос и создал за это время сотни изображений. В конце концов конкурсант выбрал три лучших картины, отредактировал их в фотошопе и напечатал на холстах. Он предварительно растянул работы с помощью другой нейросети Gigapixel AI.
🤬 В интернете сразу же начался очередной холивар на тему того, что настоящие художники скоро останутся без работы. Вечно недовольные пользователи Twitter отреагировали на новость в своей привычной манере. «Мы наблюдаем, как на наших глазах умирает ремесло художника», — посыл у самых популярных комментариев примерно такой.
Но Аллен заранее понимал, что его творчество вызовет споры. Он говорит, что люди почему-то судят искусство по методу его создания. Поэтому победитель обратился к ненавистникам с риторическим вопросом: «А что, если художник написал бы картину, вися вниз головой, и во время работы его били? Следовало бы оценивать его творчество как-то иначе?» 🤔
Ещё конкурсант иронически заметил, что хейтеры выступают против искусства, сгенерированного нейросетью. При этом они же первыми бросаются на живого человека, без которого произведения бы просто не получилось. Аллен считает это лицемерием.
👆 Кстати, американец и не скрывал, что картину рисовала нейросеть, — он открыто говорил об этом на конкурсе. А победа воодушевила его, даже несмотря на комментарии критиков.
Я в этом споре, скорее, на стороне Аллена. Сгенерированные изображения — это новый вид искусства. И игнорировать его абсолютно бессмысленно, оно уже проникло в нашу культуру. И уж тем более нет причин обвинять победителя, который честно признался, что изображение создала Midjourney.
Но Аллен поднял несколько важных вопросов о будущем сгенерированных картин и их месте в современном мире. Можно ли оценивать творчество ИИ наравне с работой живых художников? И можно ли вообще назвать человека автором такой картины?
👉 Как по мне, смешивать реальную живопись и произведение Midjourney на одном конкурсе, наверное, не совсем корректно. По-хорошему организаторам нужно было выделять работу Аллена в отдельную номинацию.
Новость вышла ещё в конце августа, а я до неё добралась только сейчас. Но уж очень руки чешутся обсудить её. Я про американца Джейсона Аллена, который победил на конкурсе изобразительных искусств.
🤖 Фишка в том, что мужчина даже не прикасался к кисти, — его картину «Театр космической оперы» нарисовала нейросеть Midjourney.
Аллен уверяет, что работа заняла у него «многие недели». Он долго подбирал правильный запрос и создал за это время сотни изображений. В конце концов конкурсант выбрал три лучших картины, отредактировал их в фотошопе и напечатал на холстах. Он предварительно растянул работы с помощью другой нейросети Gigapixel AI.
🤬 В интернете сразу же начался очередной холивар на тему того, что настоящие художники скоро останутся без работы. Вечно недовольные пользователи Twitter отреагировали на новость в своей привычной манере. «Мы наблюдаем, как на наших глазах умирает ремесло художника», — посыл у самых популярных комментариев примерно такой.
Но Аллен заранее понимал, что его творчество вызовет споры. Он говорит, что люди почему-то судят искусство по методу его создания. Поэтому победитель обратился к ненавистникам с риторическим вопросом: «А что, если художник написал бы картину, вися вниз головой, и во время работы его били? Следовало бы оценивать его творчество как-то иначе?» 🤔
Ещё конкурсант иронически заметил, что хейтеры выступают против искусства, сгенерированного нейросетью. При этом они же первыми бросаются на живого человека, без которого произведения бы просто не получилось. Аллен считает это лицемерием.
👆 Кстати, американец и не скрывал, что картину рисовала нейросеть, — он открыто говорил об этом на конкурсе. А победа воодушевила его, даже несмотря на комментарии критиков.
Я в этом споре, скорее, на стороне Аллена. Сгенерированные изображения — это новый вид искусства. И игнорировать его абсолютно бессмысленно, оно уже проникло в нашу культуру. И уж тем более нет причин обвинять победителя, который честно признался, что изображение создала Midjourney.
Но Аллен поднял несколько важных вопросов о будущем сгенерированных картин и их месте в современном мире. Можно ли оценивать творчество ИИ наравне с работой живых художников? И можно ли вообще назвать человека автором такой картины?
👉 Как по мне, смешивать реальную живопись и произведение Midjourney на одном конкурсе, наверное, не совсем корректно. По-хорошему организаторам нужно было выделять работу Аллена в отдельную номинацию.
🔥16👍7❤3
📺 Пару лет назад рекламщики сделали дипфейк Леонида Куравлёва — оживили и омолодили его легендарного персонажа Милославского из гайдаевской комедии про Ивана Грозного.
Ролик получился действительно классный и один из первых в этом жанре, поэтому особенных вопросов об авторских правах он не вызвал. Актёр был ещё жив, а его семья согласилась на использование образа (и получила за это хороший гонорар).
🧑🎨 Но теперь мы всё чаще видим, как телевизионщики «оживляют» уже давно почивших актёров на экране. Мода перекочевала с Запада быстрее, чем я этого ждала.
Сначала по Первому показали новый сезон сериала «Диверсант» с дипфейком Владислава Галкина. Теперь телеканал работает над фильмом, героями которого станут сразу пять (!) покойных советских актёров. Ну, точнее, не сами актёры, а их аватары.
🤔 Обсуждать сюжет вольного ремейка «Семи самураев» я точно не хочу. Но вот поразмышлять над этическими и правовыми вопросами — почему бы и нет? Правда, ответов не ждите — их у меня пока нет…
☝️ Во-первых, меня печалит тот факт, что лица актёров будут использовать без их разрешения. Ведь если фильм получится, кхм, некачественным, то память даже безупречного артиста будет опорочена другими людьми. Давайте признаемся: риски очень велики.
✌️ Во-вторых, имеют ли моральное право родственники звёзд распоряжаться таким «наследством»? Ведь эти артисты при жизни наверняка даже не знали о подобных технологиях. И уж точно не могли предположить, что их физиономии можно будет «наклеить» на головы других людей.
С живыми артистами в таких случаях всё гораздо проще. Они могут просто подписать договор с киноделами — на год, пять или всю жизнь. И тогда режиссёры смогут абсолютно легально и без зазрений совести делать фильмы с дипфейками.
👉 В общем, эти тенденции меня настораживают. Масло в огонь подливает и то, что современные алгоритмы ещё не научились делать дипфейки без технических косяков. Даже в высокобюджетных «Звёздных войнах» ожившая принцесса Лея иногда выглядит как персонаж компьютерной игры. Зрителя такими приёмами не обмануть. А тогда зачем всё это нужно?
Ролик получился действительно классный и один из первых в этом жанре, поэтому особенных вопросов об авторских правах он не вызвал. Актёр был ещё жив, а его семья согласилась на использование образа (и получила за это хороший гонорар).
🧑🎨 Но теперь мы всё чаще видим, как телевизионщики «оживляют» уже давно почивших актёров на экране. Мода перекочевала с Запада быстрее, чем я этого ждала.
Сначала по Первому показали новый сезон сериала «Диверсант» с дипфейком Владислава Галкина. Теперь телеканал работает над фильмом, героями которого станут сразу пять (!) покойных советских актёров. Ну, точнее, не сами актёры, а их аватары.
🤔 Обсуждать сюжет вольного ремейка «Семи самураев» я точно не хочу. Но вот поразмышлять над этическими и правовыми вопросами — почему бы и нет? Правда, ответов не ждите — их у меня пока нет…
☝️ Во-первых, меня печалит тот факт, что лица актёров будут использовать без их разрешения. Ведь если фильм получится, кхм, некачественным, то память даже безупречного артиста будет опорочена другими людьми. Давайте признаемся: риски очень велики.
✌️ Во-вторых, имеют ли моральное право родственники звёзд распоряжаться таким «наследством»? Ведь эти артисты при жизни наверняка даже не знали о подобных технологиях. И уж точно не могли предположить, что их физиономии можно будет «наклеить» на головы других людей.
С живыми артистами в таких случаях всё гораздо проще. Они могут просто подписать договор с киноделами — на год, пять или всю жизнь. И тогда режиссёры смогут абсолютно легально и без зазрений совести делать фильмы с дипфейками.
👉 В общем, эти тенденции меня настораживают. Масло в огонь подливает и то, что современные алгоритмы ещё не научились делать дипфейки без технических косяков. Даже в высокобюджетных «Звёздных войнах» ожившая принцесса Лея иногда выглядит как персонаж компьютерной игры. Зрителя такими приёмами не обмануть. А тогда зачем всё это нужно?
👍11🔥5
Топ лучших книг об искусственном интеллекте
И я снова к вам с книжной подборкой. Эти произведения — мастрид для человека, который интересуется ИИ.
⚙️ «Будущее без работы. Технологии, автоматизация и стоит ли их бояться» (18+)
На протяжении веков люди переживали, что новые технологии их заменят. Сначала боялись ткацких станков, потом — двигателей внутреннего сгорания… Все опасения оказались напрасными, ведь эти новшества в итоге только создавали дополнительные рабочие места.
Но автор книги — экономист и писатель Дэниел Сасскинд — доказывает, что на этот раз ситуация изменилась. ИИ действительно может лишить работы большую часть человечества.
Что нужно сделать, чтобы смягчить «удар»? И главное: как мы будем использовать наше время и искать цели в жизни, в которой людям больше не нужно работать? Спойлер — простых ответов нет, но не всё так страшно.
🧠 «Создатели искусственного гения. О бунтарях, которые наделили интеллектом Google, Facebook и весь мир» (16+)
Журналист The New York Times Кейд Метц написал историю о создании и развитии ИИ. В основе книги — сотни репортажей и интервью. Герои произведения — люди, без которых революция в области ИИ не произошла бы. Это Джеффри Хинтон, Демис Хассабис, Ян ЛеКун, Джефф Дин и другие деятели, о которых вы наверняка слышали неоднократно.
Книга читается легко, потому что автор не скучно описывает разные факты и даты, но и делится «закулисными» подробностями. В общем, если интересуетесь областью ИИ — вам почти наверняка понравится.
🌅 «Клара и Солнце» (16+)
Последний на сегодняшний день роман нобелевского лауреата Кадзуо Исигуро уже стал бестселлером. И неслучайно: художественное произведение не хуже документалистики поднимает важные вопросы ИИ.
Сюжет разворачивается в будущем. Героиня книги — андроид по имени Клара, от лица которой и ведётся повествование. Она очень умна и наблюдательна. Но могут ли роботы испытывать эмоции? И, что ещё важнее, смогут ли они заменить человека или хотя бы жить наравне с ним? На это и пытается ответить автор.
И я снова к вам с книжной подборкой. Эти произведения — мастрид для человека, который интересуется ИИ.
⚙️ «Будущее без работы. Технологии, автоматизация и стоит ли их бояться» (18+)
На протяжении веков люди переживали, что новые технологии их заменят. Сначала боялись ткацких станков, потом — двигателей внутреннего сгорания… Все опасения оказались напрасными, ведь эти новшества в итоге только создавали дополнительные рабочие места.
Но автор книги — экономист и писатель Дэниел Сасскинд — доказывает, что на этот раз ситуация изменилась. ИИ действительно может лишить работы большую часть человечества.
Что нужно сделать, чтобы смягчить «удар»? И главное: как мы будем использовать наше время и искать цели в жизни, в которой людям больше не нужно работать? Спойлер — простых ответов нет, но не всё так страшно.
🧠 «Создатели искусственного гения. О бунтарях, которые наделили интеллектом Google, Facebook и весь мир» (16+)
Журналист The New York Times Кейд Метц написал историю о создании и развитии ИИ. В основе книги — сотни репортажей и интервью. Герои произведения — люди, без которых революция в области ИИ не произошла бы. Это Джеффри Хинтон, Демис Хассабис, Ян ЛеКун, Джефф Дин и другие деятели, о которых вы наверняка слышали неоднократно.
Книга читается легко, потому что автор не скучно описывает разные факты и даты, но и делится «закулисными» подробностями. В общем, если интересуетесь областью ИИ — вам почти наверняка понравится.
🌅 «Клара и Солнце» (16+)
Последний на сегодняшний день роман нобелевского лауреата Кадзуо Исигуро уже стал бестселлером. И неслучайно: художественное произведение не хуже документалистики поднимает важные вопросы ИИ.
Сюжет разворачивается в будущем. Героиня книги — андроид по имени Клара, от лица которой и ведётся повествование. Она очень умна и наблюдательна. Но могут ли роботы испытывать эмоции? И, что ещё важнее, смогут ли они заменить человека или хотя бы жить наравне с ним? На это и пытается ответить автор.
🔥10👍4
«Благими намерениями ЕС вымощена дорога в ад регулирования»
Так эксперты в области ИИ оценивают новый законопроект Евросоюза о регулировании нашей любимой сферы. Они уверены, что новые правила ограничат инновации — использовать передовые инструменты с открытым исходным кодом станет сложнее. Но обо всём по порядку.
Драфт законопроекта показали ещё год назад, но споры не утихают до сих пор. Европейцы предложили ограничивать использование многих технологий на основе ИИ, которые могут угрожать сохранности персональных данных граждан ЕС.
💼 Собеседники TechCrunch считают, что под такие критерии может попасть любая модель — с юридической точки зрения правила прописаны слишком расплывчато. Поэтому под ударом все компании, даже некоммерческие.
Вообще, в готовящемся законе есть исключения для некоторых категорий ИИ с открытым исходным кодом (например, для тех, что используются исключительно для исследований). Но невозможно предотвратить использование таких проектов злоумышленниками, говорит аналитик центра Brookings Алекс Энглер.
Свежий пример — система Stable Diffusion, которая генерирует изображения по текстовым подсказкам. Её недавно выпустили в открытый доступ с лицензией, которая запрещает создавать определённые типы контента. Но не помогло — инструмент моментально стали использовать для создания порнографических дипфейков со знаменитостями 🤵♀️
Гендиректор НИИ Allen Institute for AI Орен Эциони тоже видит угрозу для мелких и средних компаний. Он считает, что разработчиков коммерческого ПО и ПО с открытым кодом нужно разделять. В противном случае любые инновации будут появляться только у корпораций, которые и без того чувствуют себя неплохо. Места для конкуренции не останется.
👓 В Hugging Face называют закон «размытым». Пока вообще не понятно, будет он относиться к моделям ИИ или только к ПО, работающему на его базе.
В общем, вопросов пока много. Но я рада, что они поднимаются. Ведь в этом споре рано или поздно зародится истина (я на это надеюсь).
Так эксперты в области ИИ оценивают новый законопроект Евросоюза о регулировании нашей любимой сферы. Они уверены, что новые правила ограничат инновации — использовать передовые инструменты с открытым исходным кодом станет сложнее. Но обо всём по порядку.
Драфт законопроекта показали ещё год назад, но споры не утихают до сих пор. Европейцы предложили ограничивать использование многих технологий на основе ИИ, которые могут угрожать сохранности персональных данных граждан ЕС.
💼 Собеседники TechCrunch считают, что под такие критерии может попасть любая модель — с юридической точки зрения правила прописаны слишком расплывчато. Поэтому под ударом все компании, даже некоммерческие.
Вообще, в готовящемся законе есть исключения для некоторых категорий ИИ с открытым исходным кодом (например, для тех, что используются исключительно для исследований). Но невозможно предотвратить использование таких проектов злоумышленниками, говорит аналитик центра Brookings Алекс Энглер.
Свежий пример — система Stable Diffusion, которая генерирует изображения по текстовым подсказкам. Её недавно выпустили в открытый доступ с лицензией, которая запрещает создавать определённые типы контента. Но не помогло — инструмент моментально стали использовать для создания порнографических дипфейков со знаменитостями 🤵♀️
Гендиректор НИИ Allen Institute for AI Орен Эциони тоже видит угрозу для мелких и средних компаний. Он считает, что разработчиков коммерческого ПО и ПО с открытым кодом нужно разделять. В противном случае любые инновации будут появляться только у корпораций, которые и без того чувствуют себя неплохо. Места для конкуренции не останется.
👓 В Hugging Face называют закон «размытым». Пока вообще не понятно, будет он относиться к моделям ИИ или только к ПО, работающему на его базе.
В общем, вопросов пока много. Но я рада, что они поднимаются. Ведь в этом споре рано или поздно зародится истина (я на это надеюсь).
👍14🔥4
Какие заболевания ИИ ищет у москвичей и немного про точность (в продолжении)
Часто вижу новости медицинской тематики о том, что ИИ научился диагностировать разные болезни. Но обычно речь идёт о западных концептах.
Поэтому меня зацепила новость про похожую нейросеть, которую запустили в московских клиниках ещё весной. Пока она, вроде бы, работает в экспериментальном режиме. Как следует из сообщения на mos.ru, сервис уже проанализировал 28 тысяч медицинских изображений и «хорошо зарекомендовал себя у врачей» 🤑
Правда, кое-что в этой новости меня всё-таки смущает. Начнем с количества заболеваний. Обычно нейросети натаскивают на поиск какого-то одного заболевания (ну, или парочки, если у них похожие признаки). Но отечественная чудо-нейронка определяет семь патологий разом!
🔬 На изображениях компьютерной томографии она находит рак лёгких, остеопороз позвоночника, аневризму грудного отдела аорты, ишемическую болезнь сердца, легочную гипертензия, гидротораксу и даже коронавирус. Предположу, что здесь работает целая система из разных моделей ИИ.
По словам представителей Департамента здравоохранения, диагностическая точность сервисов ИИ — 94%, а доля ложноотрицательных результатов минимальная (но здесь уже почему-то без цифр) 😱
На первый взгляд есть понятный обывателю термин «точность», да ещё и с внушительным уровнем 94%. И тут мы подходим ко второму «сомнительному моменту» — что же такое точность в диагностике. Продолжение в следующем посте.
Часто вижу новости медицинской тематики о том, что ИИ научился диагностировать разные болезни. Но обычно речь идёт о западных концептах.
Поэтому меня зацепила новость про похожую нейросеть, которую запустили в московских клиниках ещё весной. Пока она, вроде бы, работает в экспериментальном режиме. Как следует из сообщения на mos.ru, сервис уже проанализировал 28 тысяч медицинских изображений и «хорошо зарекомендовал себя у врачей» 🤑
Правда, кое-что в этой новости меня всё-таки смущает. Начнем с количества заболеваний. Обычно нейросети натаскивают на поиск какого-то одного заболевания (ну, или парочки, если у них похожие признаки). Но отечественная чудо-нейронка определяет семь патологий разом!
🔬 На изображениях компьютерной томографии она находит рак лёгких, остеопороз позвоночника, аневризму грудного отдела аорты, ишемическую болезнь сердца, легочную гипертензия, гидротораксу и даже коронавирус. Предположу, что здесь работает целая система из разных моделей ИИ.
По словам представителей Департамента здравоохранения, диагностическая точность сервисов ИИ — 94%, а доля ложноотрицательных результатов минимальная (но здесь уже почему-то без цифр) 😱
На первый взгляд есть понятный обывателю термин «точность», да ещё и с внушительным уровнем 94%. И тут мы подходим ко второму «сомнительному моменту» — что же такое точность в диагностике. Продолжение в следующем посте.
👍8🔥5
Что такое точность в диагностике и почему сама по себе она бессмысленна (продолжение)
Итак, я вчера писала про нейросеть, которая диагностирует заболевания у москвичей. На портале mos.ru из характеристик диагностики назвали только точность 👀
Когда мы говорим о каком-то «черном ящике», которому мы даём на вход какую-то информацию и получаем ответ «да» или «нет» сама по себе точность бессмысленна без характеристик «чувствительность» и «специфичность».
Это не зависит от того, какая механика внутри этого «чёрного ящика», будь то полимеразная цепная реакция теста на «ковид» или же алгоритм с глубоким обучением — главное, что это какой-то классификатор. Разберём подробнее.
☝️Чувствительность (sensitivity) — это то, насколько хорошо наш «ящик» распознаёт больных. То есть если человек болен, то он всегда будет распознан. Это доля предсказанных больных от числа реально больных.
☝️Специфичность (specificity) — это то, насколько тест ошибается на небольных. То есть представьте себе ситуацию, что тест просто всегда говорит «да» — это значит, что чувствительность у него будет 1 (он и правда предскажет всех больных), но вот для небольных даст огромное количество ошибок. Таким образом, специфичность — это то, сколько из реально небольных тест определит как реально небольных. Тоже в идеале 1.
В итоге разработчики любых диагностических механизмов обычно оптимизируют оба значения — и чувствительность, и специфичность. И это главные параметры 🫣
Что же касается точности (accuracy) — то это просто результат деления всех правильных диагнозов на все диагнозы. Это плохая характеристика, потому что она зависит от того, сколько у нас больных и небольных.
Представьте себе тест, который всегда говорит «нет». И тогда если у вас миллион здоровых и тысяча больных, то такой тест будет иметь точность 99,9%. Неплохо, не так ли? Поэтому без данных о чувствительности и специфичности — никуда. И это относится к любому тесту 🤔
Итак, я вчера писала про нейросеть, которая диагностирует заболевания у москвичей. На портале mos.ru из характеристик диагностики назвали только точность 👀
Когда мы говорим о каком-то «черном ящике», которому мы даём на вход какую-то информацию и получаем ответ «да» или «нет» сама по себе точность бессмысленна без характеристик «чувствительность» и «специфичность».
Это не зависит от того, какая механика внутри этого «чёрного ящика», будь то полимеразная цепная реакция теста на «ковид» или же алгоритм с глубоким обучением — главное, что это какой-то классификатор. Разберём подробнее.
☝️Чувствительность (sensitivity) — это то, насколько хорошо наш «ящик» распознаёт больных. То есть если человек болен, то он всегда будет распознан. Это доля предсказанных больных от числа реально больных.
☝️Специфичность (specificity) — это то, насколько тест ошибается на небольных. То есть представьте себе ситуацию, что тест просто всегда говорит «да» — это значит, что чувствительность у него будет 1 (он и правда предскажет всех больных), но вот для небольных даст огромное количество ошибок. Таким образом, специфичность — это то, сколько из реально небольных тест определит как реально небольных. Тоже в идеале 1.
В итоге разработчики любых диагностических механизмов обычно оптимизируют оба значения — и чувствительность, и специфичность. И это главные параметры 🫣
Что же касается точности (accuracy) — то это просто результат деления всех правильных диагнозов на все диагнозы. Это плохая характеристика, потому что она зависит от того, сколько у нас больных и небольных.
Представьте себе тест, который всегда говорит «нет». И тогда если у вас миллион здоровых и тысяча больных, то такой тест будет иметь точность 99,9%. Неплохо, не так ли? Поэтому без данных о чувствительности и специфичности — никуда. И это относится к любому тесту 🤔
👍16🔥2