#по_понятиям
Ну и если кто не знал, то астротурфинг — это понятие, производное от бренда AstroTurf — синтетического травяного покрытия для стадионов, напоминающего настоящий дерн. Здесь обыгрывается другая метафора из английского языка — grassroots — то, что произрастает само по себе, инициатива снизу.
У понятия долгая история, но сейчас под ним обычно понимают создание видимости широкой общественной поддержки какой-либо инициативы или решения, либо симуляции появления данной инициативы снизу с помощью специально нанятых людей — «ботов», проплаченных публикаций и сюжетов в СМИ, а также посредством современного программного обеспечения — истинных цифровых ботов.
Ну и если кто не знал, то астротурфинг — это понятие, производное от бренда AstroTurf — синтетического травяного покрытия для стадионов, напоминающего настоящий дерн. Здесь обыгрывается другая метафора из английского языка — grassroots — то, что произрастает само по себе, инициатива снизу.
У понятия долгая история, но сейчас под ним обычно понимают создание видимости широкой общественной поддержки какой-либо инициативы или решения, либо симуляции появления данной инициативы снизу с помощью специально нанятых людей — «ботов», проплаченных публикаций и сюжетов в СМИ, а также посредством современного программного обеспечения — истинных цифровых ботов.
👍5❤1
#почитать_на_выходных (16+)
Вместе с фантастом Гарри Гаррисоном над романом «Выбор по Тьюрингу» (The Turing Option, 1992) работал один из пионеров кибернетики, сооснователь Лаборатории искусственного интеллекта MIT и автор основополагающих теоретических работ о нейросетях и фреймах Марвин Минский.
Возможно, под его влиянием дуэт произвёл любопытный феномен: роман из 1990-х, написан так, будто на дворе стоят ранние 1950-е, и не было ни «новой волны», ни прорывов киберпанка. Получилась старая добрая научная фантастика — морализаторская, прямолинейная, с многостраничными лекциями и детективной интригой, которая нужна лишь для того, чтобы переходить из локации в локацию.
Инженер Брайан Дилени оказывается жертвой нападения на лабораторию по разработке ИИ. Он становится пациентом нейрохирургической клиники, подопытной свинкой для выдающегося хирурга. Расследование инцидента перемежается многословными монологами врачей и учёных об устройстве человеческого мозга, технических проблемах и этических парадоксах ИИ.
Вместе с фантастом Гарри Гаррисоном над романом «Выбор по Тьюрингу» (The Turing Option, 1992) работал один из пионеров кибернетики, сооснователь Лаборатории искусственного интеллекта MIT и автор основополагающих теоретических работ о нейросетях и фреймах Марвин Минский.
Возможно, под его влиянием дуэт произвёл любопытный феномен: роман из 1990-х, написан так, будто на дворе стоят ранние 1950-е, и не было ни «новой волны», ни прорывов киберпанка. Получилась старая добрая научная фантастика — морализаторская, прямолинейная, с многостраничными лекциями и детективной интригой, которая нужна лишь для того, чтобы переходить из локации в локацию.
Инженер Брайан Дилени оказывается жертвой нападения на лабораторию по разработке ИИ. Он становится пациентом нейрохирургической клиники, подопытной свинкой для выдающегося хирурга. Расследование инцидента перемежается многословными монологами врачей и учёных об устройстве человеческого мозга, технических проблемах и этических парадоксах ИИ.
🔥5👍1
ИИ задал нейрофизиологам вопросы о происхождении аутизма
Нейросеть научилась распознавать признаки аутизма по записям речи пациентов. Причём, на двух языках — английском и кантонском диалекте китайского. Последний является тональным языком и на слух сильно отличается от английского. Тем не менее модель успешно справляется в обоих случаях.
🧠 По мнению международной группы учёных, это указывает на универсальную — генетическую или эмбриональную — природу изменений, происходящих с мозгом и речью страдающих аутизмом людей.
В последние десятилетия диагноз «расстройство аутистического спектра» встречается всё чаще. Основные симптомы: дефицит общения и социальных взаимодействий, крайняя ограниченность эмоциональной жизни и интересов, стереотипность действий и речи. Хотя при этом иногда возможны прекрасные математические способности и наблюдательность.
👩🏼⚕️ Опытный врач легко распознает речь аутиста на слух. Следовательно, этот признак можно использовать и для автоматической диагностики, а также количественной оценки расстройства.
💬 Исследователи собрали базу аудиозаписей речи детей и подростков из США и Китая. Среди них были как здоровые, так и с диагностированным аутистическим расстройством. Все участники выборки пересказывали сюжет популярной детской книги Мерсер Майер «Лягушка, ты где?» (Frog, Where Are You?).
Затем учёные натренировали модель-классификатор, используя обучение с учителем. Выяснилось, что наиболее важными для диагностики являются ритмические характеристики речи. Они в равной степени эффективно работали для обоих языков. А вот интонационные — только для английского.
💊 В дальнейшем модель поможет оценить результаты различных методов терапии — прогресс, достигнутый в лечении. Но уже сейчас она вновь поставила вопросы о происхождении заболевания, на которые до сих нет точных ответов.
#Машинное_обучение, #Нейросети, #ИИ_в_ медицине
Нейросеть научилась распознавать признаки аутизма по записям речи пациентов. Причём, на двух языках — английском и кантонском диалекте китайского. Последний является тональным языком и на слух сильно отличается от английского. Тем не менее модель успешно справляется в обоих случаях.
🧠 По мнению международной группы учёных, это указывает на универсальную — генетическую или эмбриональную — природу изменений, происходящих с мозгом и речью страдающих аутизмом людей.
В последние десятилетия диагноз «расстройство аутистического спектра» встречается всё чаще. Основные симптомы: дефицит общения и социальных взаимодействий, крайняя ограниченность эмоциональной жизни и интересов, стереотипность действий и речи. Хотя при этом иногда возможны прекрасные математические способности и наблюдательность.
👩🏼⚕️ Опытный врач легко распознает речь аутиста на слух. Следовательно, этот признак можно использовать и для автоматической диагностики, а также количественной оценки расстройства.
💬 Исследователи собрали базу аудиозаписей речи детей и подростков из США и Китая. Среди них были как здоровые, так и с диагностированным аутистическим расстройством. Все участники выборки пересказывали сюжет популярной детской книги Мерсер Майер «Лягушка, ты где?» (Frog, Where Are You?).
Затем учёные натренировали модель-классификатор, используя обучение с учителем. Выяснилось, что наиболее важными для диагностики являются ритмические характеристики речи. Они в равной степени эффективно работали для обоих языков. А вот интонационные — только для английского.
💊 В дальнейшем модель поможет оценить результаты различных методов терапии — прогресс, достигнутый в лечении. Но уже сейчас она вновь поставила вопросы о происхождении заболевания, на которые до сих нет точных ответов.
#Машинное_обучение, #Нейросети, #ИИ_в_ медицине
journals.plos.org
Cross-linguistic patterns of speech prosodic differences in autism: A machine learning study
Differences in speech prosody are a widely observed feature of Autism Spectrum Disorder (ASD). However, it is unclear how prosodic differences in ASD manifest across different languages that demonstrate cross-linguistic variability in prosody. Using a supervised…
👍7🔥3
Действительно большой бенчмарк
⁉️ Какая модель лучше всех справляется с той или иной задачей? Например, понимает естественный язык? Чтобы это выяснить, нужно сравнить их производительность между собой и сопоставить с человеком. Желательно максимально объективно. Для этого существуют особые инструменты — бенчмарки. Они разрабатываются на основе определённой методологии и включают один или несколько разных тестовых заданий.
Проблема: За последние годы в области обработки естественного языка (Natural Language Processing, NLP) произошла серия грандиозных прорывов. Языковые модели резко увеличили свои размеры и эффективность. Теперь им по плечу даже такие задачи, как генерация программного кода и музыки, генетика и медицинская диагностика. А вот бенчмарки за ними не поспевают. Они или быстро устаревают, или чрезмерно специализированы.
Решение: Международная коллаборация, объединившая 442 специалиста из 132 организаций со всего мира, включая Россию, создали новый мультимодальный бенчмарк BIG-bench. Он предназначен для оценки моделей, имеющих от от нескольких миллионов до десятков миллиардов параметров. С его помощью можно будет оценить перформанс даже алгоритмов следующего поколения, которые только предстоит создать.
Особенности: BIG-bench отличается экстремальной сложностью, что отражено даже в его названии: BIG — Beyond the Imitation Game или, «За пределами имитационной игры». Явная отсылка к классическому тесту Тьюринга и долгожданному выходу за его границы.
Всего в бенчмарке 204 задачи, которые охватывают широкий спектр языков и тематик: от стандартных лингвистических способностей (чтение, понимание, генерация текстов) до написания кода и прохождения видеоигр. Кроме того, API системы позволяет создавать новые специализированные задания — в виде JSON-файлов или кода на Python.
👩🏻🎓 Российская участница коллаборации Татьяна Шаврина так подытожила работу над BIG-bench: «NLP — очень "жадная" область, которая постепенно подминает под себя всё большее число разных задач. Поэтому в бенчмарк включены самые разнообразные задания, например, шахматные ходы, записанные текстом. Впрочем, одновременно NLP является и донором — многие из архитектур, которые изначально были придуманы для неё, теперь плотно вошли в практику решения совершенно других задач».
Для продвинутых:
1️⃣ Препринт на arXiv. Аккуратнее — там 100 страниц!
2️⃣ Код, задачи, инструкции и прочие материалы проекта доступны в репозитории GitHub.
3️⃣ Для быстрой оценки моделей есть сокращённый и облегченный вариант бенчмарка BIG-bench Lite.
#Обработка_естественного_языка, #Бенчмарки
⁉️ Какая модель лучше всех справляется с той или иной задачей? Например, понимает естественный язык? Чтобы это выяснить, нужно сравнить их производительность между собой и сопоставить с человеком. Желательно максимально объективно. Для этого существуют особые инструменты — бенчмарки. Они разрабатываются на основе определённой методологии и включают один или несколько разных тестовых заданий.
Проблема: За последние годы в области обработки естественного языка (Natural Language Processing, NLP) произошла серия грандиозных прорывов. Языковые модели резко увеличили свои размеры и эффективность. Теперь им по плечу даже такие задачи, как генерация программного кода и музыки, генетика и медицинская диагностика. А вот бенчмарки за ними не поспевают. Они или быстро устаревают, или чрезмерно специализированы.
Решение: Международная коллаборация, объединившая 442 специалиста из 132 организаций со всего мира, включая Россию, создали новый мультимодальный бенчмарк BIG-bench. Он предназначен для оценки моделей, имеющих от от нескольких миллионов до десятков миллиардов параметров. С его помощью можно будет оценить перформанс даже алгоритмов следующего поколения, которые только предстоит создать.
Особенности: BIG-bench отличается экстремальной сложностью, что отражено даже в его названии: BIG — Beyond the Imitation Game или, «За пределами имитационной игры». Явная отсылка к классическому тесту Тьюринга и долгожданному выходу за его границы.
Всего в бенчмарке 204 задачи, которые охватывают широкий спектр языков и тематик: от стандартных лингвистических способностей (чтение, понимание, генерация текстов) до написания кода и прохождения видеоигр. Кроме того, API системы позволяет создавать новые специализированные задания — в виде JSON-файлов или кода на Python.
👩🏻🎓 Российская участница коллаборации Татьяна Шаврина так подытожила работу над BIG-bench: «NLP — очень "жадная" область, которая постепенно подминает под себя всё большее число разных задач. Поэтому в бенчмарк включены самые разнообразные задания, например, шахматные ходы, записанные текстом. Впрочем, одновременно NLP является и донором — многие из архитектур, которые изначально были придуманы для неё, теперь плотно вошли в практику решения совершенно других задач».
Для продвинутых:
1️⃣ Препринт на arXiv. Аккуратнее — там 100 страниц!
2️⃣ Код, задачи, инструкции и прочие материалы проекта доступны в репозитории GitHub.
3️⃣ Для быстрой оценки моделей есть сокращённый и облегченный вариант бенчмарка BIG-bench Lite.
#Обработка_естественного_языка, #Бенчмарки
Telegram
Душа Питона
«Сексизм» теста Тьюринга
Не знаю как вы, а я обожаю читать про культурную историю математики и технологий. В двух словах — это о том, как культура и общество порождает какие-то изобретения, и как они потом сами влияют на общество и культуру. Лучший пример…
Не знаю как вы, а я обожаю читать про культурную историю математики и технологий. В двух словах — это о том, как культура и общество порождает какие-то изобретения, и как они потом сами влияют на общество и культуру. Лучший пример…
👍8
Изобретатель странного
Любите «Звёздные войны»? Фильмы по вселенным Marvel или DC? Ну уж ещё разок посмотреть «Симпсонов» точно не откажетесь!
А вот парижский фотограф Матьё Стерн обожает одновременно три вещи: современную поп-культуру, винтажные фотокамеры и генерировать изображения с помощью модели DALL-E 2.
Объединив свои увлечения, он создал целую коллекцию фотоаппаратов, внешне напоминающих главных героев культовых кинофраншиз и сериалов. Здесь все — от трогательного малыша Грогу из «Мандалорца» до банального Супермена.
Правда существуют эти мэшап-фотокамеры только на картинках. Каждая из них сгенерирована DALL-E 2 по затравкам типа «среднеформатная камера, которая выглядит как Человек-паук». Но каковы качество изображений, фотореалистичность и художественная выразительность образов — настоящее нейроискусство!
Осталось понять — было ли уже это в «Симпсонах».
#нейроискусство #генеративные_модели #text2image
Любите «Звёздные войны»? Фильмы по вселенным Marvel или DC? Ну уж ещё разок посмотреть «Симпсонов» точно не откажетесь!
А вот парижский фотограф Матьё Стерн обожает одновременно три вещи: современную поп-культуру, винтажные фотокамеры и генерировать изображения с помощью модели DALL-E 2.
Объединив свои увлечения, он создал целую коллекцию фотоаппаратов, внешне напоминающих главных героев культовых кинофраншиз и сериалов. Здесь все — от трогательного малыша Грогу из «Мандалорца» до банального Супермена.
Правда существуют эти мэшап-фотокамеры только на картинках. Каждая из них сгенерирована DALL-E 2 по затравкам типа «среднеформатная камера, которая выглядит как Человек-паук». Но каковы качество изображений, фотореалистичность и художественная выразительность образов — настоящее нейроискусство!
Осталось понять — было ли уже это в «Симпсонах».
#нейроискусство #генеративные_модели #text2image
👍9🔥1
А вот и небольшое видео от Матьё Стерна, где он сам рассказывает про свои опыты с DALL-E 2 и показывает ещё больше изображений, например, по «Властелину колец». Есть сам Саурон и назгулы.
YouTube
Creating INSANE Cameras with Artificial intelligence (Dalle.2 demo)
The full camera collection: https://www.instagram.com/mathieustern/
The Waitlist for Dall-e 2 :https://labs.openai.com/waitlist
⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓
Please Support my work on PATREON: https://www.patreon.com/mathieustern
SOCIAL
►•Please consider…
The Waitlist for Dall-e 2 :https://labs.openai.com/waitlist
⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓⇩↓
Please Support my work on PATREON: https://www.patreon.com/mathieustern
SOCIAL
►•Please consider…
👍5🔥1
В этом канале обычно много текстов. Он вообще для тех, кто любит почитать на досуге. Но сегодня у нас прямо художественный день.
Не могу обойти вниманием новость — обложку для свежего Cosmopolitan нарисовала DALL-E 2. Всего за 20 секунд.
Интересна затравка:
«широкоугольный снимок, расположенной снизу камеры, женщины-астронавта с атлетическим феминным телом, идущей жеманной походкой к объективу по поверхности Марса на фоне бесконечной Вселенной, всё в стиле цифрового синтивейв».
Настоящее магическое заклинание шаманов технологической эры!
Не могу обойти вниманием новость — обложку для свежего Cosmopolitan нарисовала DALL-E 2. Всего за 20 секунд.
Интересна затравка:
«широкоугольный снимок, расположенной снизу камеры, женщины-астронавта с атлетическим феминным телом, идущей жеманной походкой к объективу по поверхности Марса на фоне бесконечной Вселенной, всё в стиле цифрового синтивейв».
Настоящее магическое заклинание шаманов технологической эры!
👍9🤩2
СледИИ за её левой рукой
💪🏻 Россия в очередной раз подтверждает, что несмотря на все санкции остаётся серьёзным игроком в области технологий искусственного интеллекта. Вслед за моделью Kandinsky отечественные специалисты выложили в открытый доступ огромный датасет для систем распознавания жестов HaGRID (HAnd Gesture Recognition Image Dataset). В нём почти 553 000 анонимизированных и размеченных изображений. Более 90% из них в FullHD. Общий размер данных — 716 Гб!
🖖🏻 В фильме «Особое мнение» (по рассказу крышесносного Филипа Дика) главный герой жестами управляет проекциями будущего на огромном экране. Кино вышло 20 лет назад, однако будущее так и не наступило — жестовое управление до сих пор остаётся экзотикой. А ведь это крайне недооцененный способ взаимодействия с гаджетами, роботами, элементами умного дома или автомобиля.
👉🏻 Основная причина такого положения — отсутствие хороших и полных датасетов жестов для машинного обучения. Теперь ситуацию может изменить HaGRID. Для его формирования использовались популярные краудсорсинговые платформы сбора и разметки данных «Яндекс.Толока» и ABC Elementary. Полученный массив включает изображения 34 700 разных человек (мужчин и женщин возрастом от 18 до 60 лет), снятых при широком спектре условий — разном освещении, дистанции (1-4 м), ракурсах.
✌🏻 Все изображения HaGRID размечены — совершающая жест рука помещена в обрамляющий прямоугольник, а сам жест отнесен к одному из 18-ти функциональных классов: «звонок» (call), «кулак» (fist), «ок» (ok), «нравится» (like), «не нравится» (dislike) и т.д. Таким образом, для каждого класса в HaGRID имеется примерно по 30 тыс. изображений. Это позволяет обучать модели-классификаторы распознавать соответствующие движения рук и использовать их в качестве команд жестового интерфейса как поодиночке, так и в различных комбинациях.
🤞🏻 Для проверки готового датасета были подготовлены несколько классических моделей-классификаторов (прежде всего, ResNet) и трансформер (ViT). Все модели тренировались на платформе ML Space с использование суперкомпьютера Christofari.
Палец вверх, друзья!
Для профессионалов: поиграться с моделями или скачать датасет.
Для всех: почитать подробнее.
#Машинное_обучение, #Обработка_изображений, #Датасеты
💪🏻 Россия в очередной раз подтверждает, что несмотря на все санкции остаётся серьёзным игроком в области технологий искусственного интеллекта. Вслед за моделью Kandinsky отечественные специалисты выложили в открытый доступ огромный датасет для систем распознавания жестов HaGRID (HAnd Gesture Recognition Image Dataset). В нём почти 553 000 анонимизированных и размеченных изображений. Более 90% из них в FullHD. Общий размер данных — 716 Гб!
🖖🏻 В фильме «Особое мнение» (по рассказу крышесносного Филипа Дика) главный герой жестами управляет проекциями будущего на огромном экране. Кино вышло 20 лет назад, однако будущее так и не наступило — жестовое управление до сих пор остаётся экзотикой. А ведь это крайне недооцененный способ взаимодействия с гаджетами, роботами, элементами умного дома или автомобиля.
👉🏻 Основная причина такого положения — отсутствие хороших и полных датасетов жестов для машинного обучения. Теперь ситуацию может изменить HaGRID. Для его формирования использовались популярные краудсорсинговые платформы сбора и разметки данных «Яндекс.Толока» и ABC Elementary. Полученный массив включает изображения 34 700 разных человек (мужчин и женщин возрастом от 18 до 60 лет), снятых при широком спектре условий — разном освещении, дистанции (1-4 м), ракурсах.
✌🏻 Все изображения HaGRID размечены — совершающая жест рука помещена в обрамляющий прямоугольник, а сам жест отнесен к одному из 18-ти функциональных классов: «звонок» (call), «кулак» (fist), «ок» (ok), «нравится» (like), «не нравится» (dislike) и т.д. Таким образом, для каждого класса в HaGRID имеется примерно по 30 тыс. изображений. Это позволяет обучать модели-классификаторы распознавать соответствующие движения рук и использовать их в качестве команд жестового интерфейса как поодиночке, так и в различных комбинациях.
🤞🏻 Для проверки готового датасета были подготовлены несколько классических моделей-классификаторов (прежде всего, ResNet) и трансформер (ViT). Все модели тренировались на платформе ML Space с использование суперкомпьютера Christofari.
Палец вверх, друзья!
Для профессионалов: поиграться с моделями или скачать датасет.
Для всех: почитать подробнее.
#Машинное_обучение, #Обработка_изображений, #Датасеты
Telegram
Душа Питона
Очень большой Кандинский — и точка (на плоскости)
Сбер вновь подарил миру немного красоты. Команды из Sber AI и SberDevices дообучили самую большую русскоязычную модель генерации изображений по текстовому описанию — Kandinsky. Теперь её файнтьюн («тонкая…
Сбер вновь подарил миру немного красоты. Команды из Sber AI и SberDevices дообучили самую большую русскоязычную модель генерации изображений по текстовому описанию — Kandinsky. Теперь её файнтьюн («тонкая…
👍15
Наш ответ Чемберлену! Вернее, редакции модного журнала Cosmopolitan. Сгенерировали им по-настоящему душевную альтернативную обложку в модели Kandinsky.
Использовали такую же затравку, как их дизайнер. Только в переводе на русский: «Фотореалистичный широкоугольный снимок, расположенной снизу камеры, женщины-космонавта с атлетическим феминным телом, идущей жеманной походкой к объективу по поверхности Марса на фоне бесконечной Вселенной, всё в стиле цифрового синтивейв». Единственное — добавили слово «фотореалистичный» и заменили «астронавта» на «космонавта». А улучшали RealESRGAN.
Ну разве она не милая?
Использовали такую же затравку, как их дизайнер. Только в переводе на русский: «Фотореалистичный широкоугольный снимок, расположенной снизу камеры, женщины-космонавта с атлетическим феминным телом, идущей жеманной походкой к объективу по поверхности Марса на фоне бесконечной Вселенной, всё в стиле цифрового синтивейв». Единственное — добавили слово «фотореалистичный» и заменили «астронавта» на «космонавта». А улучшали RealESRGAN.
Ну разве она не милая?
🔥14👍3🥰2❤1
Пойманные в нейросети
Считалось, что сбежать из Алькатраса не смог никто. 36 наиболее отъявленных преступников США предприняли 14 попыток покинуть тюрьму на острове в заливе Сан-Франциско. Почти всех поймали, застрелили или обнаружили утопленными в ледяной морской воде.
👱♂️👨🏻🦱👨🏼 Однако тела троих — Фрэнка Морриса и братьев Джона и Кларенса Энглинов бесследно исчезли. Уже 60 лет они считаются пропавшими без вести. Утонули ли трое, без сомнения криминальных гениев (IQ Морриса — 133), или же им удалось выжить и оставить полицию и ФБР с носом?
📷 В 2010-х внезапно всплыла фотография. На ней двое мужчин, отдалённо похожих на братьев Энглинов, были запечатлены около 1977 года на фоне бразильской сельвы. Однако достоверно идентифицировать личности на снимке не было возможности, пока в 2020 году к делу не подключились специалисты креативного агентства Rothco.
👥 Для начала они нашли скан старой фотокарточки в максимальном разрешении. Так как оба человека на снимке стоят полубоком, то для фронтализации — поворота лиц анфас — использовали технологию Deep Face. Алгоритм на основе двумерного изображения реконструировал 3D-модели лиц и развернул их.
🫂 Затем полученные реконструкции сравнили с многочисленными имеющимися фото братьев до июня 1962 года с помощью свёрточной нейронной сети. Проанализировав портреты и сравнив несколько тысяч различных параметров (главным образом расстояния между 20 базовыми точками на лице) система выдала результат. С вероятностью более 99% на снимке из Бразилии братья Энглины.
👨🏿🦳 Но раз они выжили и вполне припеваючи провели остаток своих лет в Южной Америке, а может быть даже и в США, значит должны быть свидетели? Люди, знакомые с беглецами, знавшие их в лицо, но под другим именем. Чтобы их найти Служба маршалов США предприняла последнюю отчаянную попытку — ведь в 2030 году дело окончательно закроют. На сайте службы появились состаренные нейросетью фотографии трёх самых разыскиваемых беглецов в истории.
🔗 Благодаря технологии прогнозирования возрастных изменений, созданной ещё в 2014 году, а сейчас реализованной даже в виде приложений на смартфонах, на нас глядят три суровых старика. Когда-то они заточенными ложками просверлили стену, сделали переносной плот из прорезиненных плащей и надули его ручной гармошкой. А после, сделав хитрый и рискованный манёвр, проплыли несколько километров против течения к острову, где их стали бы искать в последнюю очередь.
🏝 И если кто-то из этих стариков жив до сих пор, то с улыбкой греясь под cолнцем на песке Ипанемы, он наверняка размышляет, что никакие технологии не смогут сравниться с человеческой волей к свободе.
#глубокое_обучение, #нейросети, #распознавание_лиц, #ИИ_в_полиции
Считалось, что сбежать из Алькатраса не смог никто. 36 наиболее отъявленных преступников США предприняли 14 попыток покинуть тюрьму на острове в заливе Сан-Франциско. Почти всех поймали, застрелили или обнаружили утопленными в ледяной морской воде.
👱♂️👨🏻🦱👨🏼 Однако тела троих — Фрэнка Морриса и братьев Джона и Кларенса Энглинов бесследно исчезли. Уже 60 лет они считаются пропавшими без вести. Утонули ли трое, без сомнения криминальных гениев (IQ Морриса — 133), или же им удалось выжить и оставить полицию и ФБР с носом?
📷 В 2010-х внезапно всплыла фотография. На ней двое мужчин, отдалённо похожих на братьев Энглинов, были запечатлены около 1977 года на фоне бразильской сельвы. Однако достоверно идентифицировать личности на снимке не было возможности, пока в 2020 году к делу не подключились специалисты креативного агентства Rothco.
👥 Для начала они нашли скан старой фотокарточки в максимальном разрешении. Так как оба человека на снимке стоят полубоком, то для фронтализации — поворота лиц анфас — использовали технологию Deep Face. Алгоритм на основе двумерного изображения реконструировал 3D-модели лиц и развернул их.
🫂 Затем полученные реконструкции сравнили с многочисленными имеющимися фото братьев до июня 1962 года с помощью свёрточной нейронной сети. Проанализировав портреты и сравнив несколько тысяч различных параметров (главным образом расстояния между 20 базовыми точками на лице) система выдала результат. С вероятностью более 99% на снимке из Бразилии братья Энглины.
👨🏿🦳 Но раз они выжили и вполне припеваючи провели остаток своих лет в Южной Америке, а может быть даже и в США, значит должны быть свидетели? Люди, знакомые с беглецами, знавшие их в лицо, но под другим именем. Чтобы их найти Служба маршалов США предприняла последнюю отчаянную попытку — ведь в 2030 году дело окончательно закроют. На сайте службы появились состаренные нейросетью фотографии трёх самых разыскиваемых беглецов в истории.
🔗 Благодаря технологии прогнозирования возрастных изменений, созданной ещё в 2014 году, а сейчас реализованной даже в виде приложений на смартфонах, на нас глядят три суровых старика. Когда-то они заточенными ложками просверлили стену, сделали переносной плот из прорезиненных плащей и надули его ручной гармошкой. А после, сделав хитрый и рискованный манёвр, проплыли несколько километров против течения к острову, где их стали бы искать в последнюю очередь.
🏝 И если кто-то из этих стариков жив до сих пор, то с улыбкой греясь под cолнцем на песке Ипанемы, он наверняка размышляет, что никакие технологии не смогут сравниться с человеческой волей к свободе.
#глубокое_обучение, #нейросети, #распознавание_лиц, #ИИ_в_полиции
🔥14👍6💯2👎1
ИИ защитит людей от рук роботов
🦾 Первым павшим от рук роботов стал в 1979 году фабричный рабочий Роберт Уильямс. Вернее, руки — манипулятор весом в тонну случайно ударил его на сборочном конвейере Ford. Причиной инцидента посчитали нарушение техники безопасности. А семье жертвы выплатили многомиллионную компенсацию.
🤖 С годами проблема стала острее. Сегодня роботы-манипуляторы используются уже не только на производстве, но и в логистике, сфере обслуживания и даже иногда в быту. Вопросы их безопасной работы в присутствии или совместно с людьми — одна из самых острых для промышленной робототехники.
👁🗨 Помочь в её решении может компьютерное зрение. Искусственный интеллект способен постоянно мониторить движения манипуляторов и предупреждать ситуации, несущие потенциальный риск.
📉 Так, недавно учёные из Бразилии собрали и разметили датасет из записей траекторий движения промышленных манипуляторов UR-5 от Universal Robots. На его основе они обучили свёрточную нейросеть SCNet, получив модуль SCConv. Он распознаёт манипулятор и определяет его положение в пространстве. Эти данные поступают на алгоритм EML, реализованный на основе архитектуры долгой краткосрочной памяти (LSTM) с управляемыми рекуррентными блоками (GRU).
👷🏼 Эффективность своей модели учёные испытали на практике, отслеживая взаимодействия манипулятора UR-5 с оператором-человеком. Алгоритм смог в режиме реального времени и предсказать движения машины и определить все потенциально опасные траектории.
🛠 Подобными проектами активно занимаются во многих странах. Не так давно на международной конференции по робототехнике ICRA 2022 исследователи из Nvidia продемонстрировали не менее интересный подход к повышению безопасности взаимодействия людей и роботов. Их предиктивная модель на основе фреймворка STORM предсказывает возможные серии движений манипулятора. Это позволяет ему аккуратно передать или принять разнообразные объекты из рук человека, не навредив ему.
👍🏿 Система способна оценивать параллельно до 500 возможных траекторий, обновляя инструкции для машины с частотой в несколько раз в секунду. Таким образом, движения манипулятора постоянно корректируются в соответствии с изменяющейся обстановкой и поведением человека. Эффективность STORM также была подтверждена лабораторными испытаниями.
Для профессионалов: препринт на ArXiv
#Робототехника, #Машинное_обучение, #Компьютерное_зрение, #Промышленная_робототехника
🦾 Первым павшим от рук роботов стал в 1979 году фабричный рабочий Роберт Уильямс. Вернее, руки — манипулятор весом в тонну случайно ударил его на сборочном конвейере Ford. Причиной инцидента посчитали нарушение техники безопасности. А семье жертвы выплатили многомиллионную компенсацию.
🤖 С годами проблема стала острее. Сегодня роботы-манипуляторы используются уже не только на производстве, но и в логистике, сфере обслуживания и даже иногда в быту. Вопросы их безопасной работы в присутствии или совместно с людьми — одна из самых острых для промышленной робототехники.
👁🗨 Помочь в её решении может компьютерное зрение. Искусственный интеллект способен постоянно мониторить движения манипуляторов и предупреждать ситуации, несущие потенциальный риск.
📉 Так, недавно учёные из Бразилии собрали и разметили датасет из записей траекторий движения промышленных манипуляторов UR-5 от Universal Robots. На его основе они обучили свёрточную нейросеть SCNet, получив модуль SCConv. Он распознаёт манипулятор и определяет его положение в пространстве. Эти данные поступают на алгоритм EML, реализованный на основе архитектуры долгой краткосрочной памяти (LSTM) с управляемыми рекуррентными блоками (GRU).
👷🏼 Эффективность своей модели учёные испытали на практике, отслеживая взаимодействия манипулятора UR-5 с оператором-человеком. Алгоритм смог в режиме реального времени и предсказать движения машины и определить все потенциально опасные траектории.
🛠 Подобными проектами активно занимаются во многих странах. Не так давно на международной конференции по робототехнике ICRA 2022 исследователи из Nvidia продемонстрировали не менее интересный подход к повышению безопасности взаимодействия людей и роботов. Их предиктивная модель на основе фреймворка STORM предсказывает возможные серии движений манипулятора. Это позволяет ему аккуратно передать или принять разнообразные объекты из рук человека, не навредив ему.
👍🏿 Система способна оценивать параллельно до 500 возможных траекторий, обновляя инструкции для машины с частотой в несколько раз в секунду. Таким образом, движения манипулятора постоянно корректируются в соответствии с изменяющейся обстановкой и поведением человека. Эффективность STORM также была подтверждена лабораторными испытаниями.
Для профессионалов: препринт на ArXiv
#Робототехника, #Машинное_обучение, #Компьютерное_зрение, #Промышленная_робототехника
YouTube
Reactive Human Collision Avoidance
👍9🔥2😁1
Признаки гениальности с юности. Любовь к математике. Однополое влечение. Чудаковатое поведение. Атеист и материалист. Королевский колледж Кембриджа. Спорил с Витгенштейном. Решал абстрактные проблемы математической логики. Попутно придумал машину Тьюринга. Формализовал алгоритмы. Заложил основы математики и компьютерной техники. Любил конструировать приборы. Увлёкся криптографией. Криптоаналитик в Блетчли-парке. Среди коллег «Проф». Взломал коды «Энигмы» и «Лоренц». Приближал победу. Построил один из первых компьютеров. Орден Британской империи из рук короля. Создал шифраторы голоса. Компьютерная память и хранение программ. Бегал марафоны. Олимпийский уровень. Могут ли машины мыслить? Тест Тьюринга. Искусственный интеллект. Гомофобия в Британии. Химическая кастрация. Депрессия. Математическая биология. Огромные перспективы. Глубокая депрессия. Цианистый калий. Надкушенное яблоко. Вечность.
110 лет со дня рождения Алана Тьюринга
110 лет со дня рождения Алана Тьюринга
👍23😢2🎉2🔥1
#посмотреть_на_выходных (16+)
Призрак в доспехах (Koukaku Kidoutai / Ghost in Shell, 1995)
Мамору Осии удалось снять культовое аниме для взрослых в эстетике посткиберпанка. (Не путать с фильмом — жалкой голливудской поделкой 2017 года.) Оригинальная японская интерпретация психофизиологической проблемы на основе идей британского философа Гилберта Райла.
Гениальный хакер (а на самом деле ИИ) по прозвищу Кукловод научился дистанционно «взламывать» человеческое сознание, перезаписывать память, накладывать ложные воспоминания — и умело манипулировать людьми. Все японские спецслужбы с их продвинутыми технологиями, давно обогнавшими европейские и американские, не могут установить его личность.
Проблема не только в том, что Кукловод отлично шифруется и никогда не действует напрямую. В этом мире роботы похожи на людей, а люди — на роботов — до полного неразличения. Тело главной героини — сексапильной полицейской Мотоко Кусанаги — легко разбирается на «запчасти», но она остаётся человеком.
Кукловод пытается проверить на прочность исчезающую границу между искусственным и естественным, между живым и зародившимся в недрах компьютерных сетей — и выйти на новый уровень, где границы не существует ни практически, ни юридически.
Аниме предлагает своеобразное прочтение дуализма Рене Декарта: превратится ли наша душа в программу, если тело заменит механика и электроника? Или же она не сводится к запертому «в доспехах призраку», а значит неотделима от тела и жизни как таковой.
Все посты о фильмах — по тегу #посмотреть_на_выходных
Призрак в доспехах (Koukaku Kidoutai / Ghost in Shell, 1995)
Мамору Осии удалось снять культовое аниме для взрослых в эстетике посткиберпанка. (Не путать с фильмом — жалкой голливудской поделкой 2017 года.) Оригинальная японская интерпретация психофизиологической проблемы на основе идей британского философа Гилберта Райла.
Гениальный хакер (а на самом деле ИИ) по прозвищу Кукловод научился дистанционно «взламывать» человеческое сознание, перезаписывать память, накладывать ложные воспоминания — и умело манипулировать людьми. Все японские спецслужбы с их продвинутыми технологиями, давно обогнавшими европейские и американские, не могут установить его личность.
Проблема не только в том, что Кукловод отлично шифруется и никогда не действует напрямую. В этом мире роботы похожи на людей, а люди — на роботов — до полного неразличения. Тело главной героини — сексапильной полицейской Мотоко Кусанаги — легко разбирается на «запчасти», но она остаётся человеком.
Кукловод пытается проверить на прочность исчезающую границу между искусственным и естественным, между живым и зародившимся в недрах компьютерных сетей — и выйти на новый уровень, где границы не существует ни практически, ни юридически.
Аниме предлагает своеобразное прочтение дуализма Рене Декарта: превратится ли наша душа в программу, если тело заменит механика и электроника? Или же она не сводится к запертому «в доспехах призраку», а значит неотделима от тела и жизни как таковой.
Все посты о фильмах — по тегу #посмотреть_на_выходных
YouTube
Призрак в доспехах (1995) - Дублир трейлер HD
"Призрак в доспехах"("Ghost in the Shell") (1995)-полнометражный
научно-фантастический анимационный фильм-победитель
на всемирном анимационном фестивале 1997 года
в номинациях: «лучший фильм» и «лучший режиссёр».
От режиссёра Мамору Осии, создателя фильмов:…
научно-фантастический анимационный фильм-победитель
на всемирном анимационном фестивале 1997 года
в номинациях: «лучший фильм» и «лучший режиссёр».
От режиссёра Мамору Осии, создателя фильмов:…
🔥12👍3
Друзья, хотим попробовать новый формат — большой разбор исследования или создания модели. Краткое превью здесь, а лонгрид в Telegraph по ссылке. Нужна ваша помощь. Палец вверх, если зашло. И вниз — если длинно, скучно и не нужно.
Проект «Геном человека» завершился в 2003 году, когда учёные определили последовательность нашей ДНК на 85%. Оставшиеся 15% потребовали ещё почти 20 лет кропотливой работы. А сейчас в институте AIRI на датасете с полным геномом впервые в мире обучили языковую модель для анализа ДНК.
Проблема: Код ДНК — это тоже текст, поэтому в работе с ним неплохо показали себя модели для обработки естественного языка. Они могут определять участки, ответственные за кодирование белков (гены), регулирование их активности, а также элементы, нужные для поддержания структуры хромосом. Однако до сих пор все подобные алгоритмы можно было обучить лишь на неполных данных о геноме человека, собранных почти 20 лет назад. Новый массив, содержащий на 100% полную последовательность ДНК, появился лишь весной 2022 года.
Решение: Российские учёные разработали модель-трансформер GENA-LM, а затем обучили его на самом полном массиве данных о последовательности ДНК человека. Алгоритм на основе архитектуры BERT с механизмом внимания способен анализировать в разы более длинные последовательности, чем предыдущие SOTA-модели, и демонстрирует более точные результаты. Он выложен в открытый доступ для всех исследователей, занятых изучением работы генома, генетических и онкологических заболеваний.
Проект «Геном человека» завершился в 2003 году, когда учёные определили последовательность нашей ДНК на 85%. Оставшиеся 15% потребовали ещё почти 20 лет кропотливой работы. А сейчас в институте AIRI на датасете с полным геномом впервые в мире обучили языковую модель для анализа ДНК.
Проблема: Код ДНК — это тоже текст, поэтому в работе с ним неплохо показали себя модели для обработки естественного языка. Они могут определять участки, ответственные за кодирование белков (гены), регулирование их активности, а также элементы, нужные для поддержания структуры хромосом. Однако до сих пор все подобные алгоритмы можно было обучить лишь на неполных данных о геноме человека, собранных почти 20 лет назад. Новый массив, содержащий на 100% полную последовательность ДНК, появился лишь весной 2022 года.
Решение: Российские учёные разработали модель-трансформер GENA-LM, а затем обучили его на самом полном массиве данных о последовательности ДНК человека. Алгоритм на основе архитектуры BERT с механизмом внимания способен анализировать в разы более длинные последовательности, чем предыдущие SOTA-модели, и демонстрирует более точные результаты. Он выложен в открытый доступ для всех исследователей, занятых изучением работы генома, генетических и онкологических заболеваний.
Telegraph
Российскую модель первой в мире обучили на полном геноме человека
Главное Команда разработчиков из научной группы «Биоинформатика» российского Института изучения искусственного интеллекта AIRI (Artificial Intelligence Research Institute) представила языковую модель GENA-LM. Впервые в мире система была обучена на новейшем…
👍27🔥2🥰1