Дали по ушам: «голосовой нейрокамуфляж» нарушил работу систем распознавания речи
🎤 Многие корпорации не раз ловили на скрытном прослушивании пользователей гаджетов с помощью голосовых помощников. Особо «отличились» умная колонка Amazon Echo и Apple Siri. Против воли владельцев они фиксируют практически всё происходящее вокруг и передают на серверы компаний. Теперь «большое ухо» можно невозбранно заткнуть.
🎶 В Колумбийском университете (США) разработали систему Neural Voice Camouflage (NVC), которая генерирует фоновый шум. Он незаметен и безвреден для человеческого слуха, но различим микрофонами и нейросетями. Поэтому в моменты, когда пользователь разговаривает, нарушает распознавание его голоса.
NVC использует метод «состязательной атаки» (adversarial attack) — целенаправленного воздействия на нейронную сеть, способного вызвать ошибки в её поведении. При реализации атаки в исходные данные вносятся небольшие искажения, легко обманывающие нейросети, которые с ними работают.
🐼 В известной демонстрации такого подхода добавление едва видимого шума к изображению панды в корне меняет его восприятие системой распознавания GoogLeNet, заставляя узнавать на картинке совершенно другое животное. Однако при обработке голоса эта задача сильно усложняется: аудиоданные требуется изменять на лету, обрабатывая сигнал в режиме реального времени.
Для создания NVC использовалась дополнительная языковая модель, которую обучили анализировать короткие двухсекундные аудиозаписи речи, быстро выделяя характерные особенности голоса, а также предсказывая продолжение фразы. Это позволило системе вовремя генерировать искажения.
🙉🙊 По словам авторов, их метод повысил уровень ошибок в работе распознающих речь алгоритмов с 11,3 до 80,2%. Для сравнения, речь, «замаскированная» простым белым шумом, неверно распознавалась лишь в 12,8% случаев, а «состязательной атакой» без предсказания — в 20,5%.
Почитать подробнее: препринт на arXiv
Поиграться: GitHub
#Машинное_обучение, #Обработка_естественного_языка, #Этика_искусственного_интеллекта, #Нейрохакинг
🎤 Многие корпорации не раз ловили на скрытном прослушивании пользователей гаджетов с помощью голосовых помощников. Особо «отличились» умная колонка Amazon Echo и Apple Siri. Против воли владельцев они фиксируют практически всё происходящее вокруг и передают на серверы компаний. Теперь «большое ухо» можно невозбранно заткнуть.
🎶 В Колумбийском университете (США) разработали систему Neural Voice Camouflage (NVC), которая генерирует фоновый шум. Он незаметен и безвреден для человеческого слуха, но различим микрофонами и нейросетями. Поэтому в моменты, когда пользователь разговаривает, нарушает распознавание его голоса.
NVC использует метод «состязательной атаки» (adversarial attack) — целенаправленного воздействия на нейронную сеть, способного вызвать ошибки в её поведении. При реализации атаки в исходные данные вносятся небольшие искажения, легко обманывающие нейросети, которые с ними работают.
🐼 В известной демонстрации такого подхода добавление едва видимого шума к изображению панды в корне меняет его восприятие системой распознавания GoogLeNet, заставляя узнавать на картинке совершенно другое животное. Однако при обработке голоса эта задача сильно усложняется: аудиоданные требуется изменять на лету, обрабатывая сигнал в режиме реального времени.
Для создания NVC использовалась дополнительная языковая модель, которую обучили анализировать короткие двухсекундные аудиозаписи речи, быстро выделяя характерные особенности голоса, а также предсказывая продолжение фразы. Это позволило системе вовремя генерировать искажения.
🙉🙊 По словам авторов, их метод повысил уровень ошибок в работе распознающих речь алгоритмов с 11,3 до 80,2%. Для сравнения, речь, «замаскированная» простым белым шумом, неверно распознавалась лишь в 12,8% случаев, а «состязательной атакой» без предсказания — в 20,5%.
Почитать подробнее: препринт на arXiv
Поиграться: GitHub
#Машинное_обучение, #Обработка_естественного_языка, #Этика_искусственного_интеллекта, #Нейрохакинг
👍8😱1
У пожилых людей, страдающих глаукомой или деменцией, повышается риск попасть в аварию. Помочь может искусственный интеллект
👨🏿🦳🧑🏼🦳 Для стран «золотого миллиарда» сейчас очень остро стоит проблема старения населения. Особенно для Японии, Северной Европы и США. При этом старики там активные, много путешествуют и водят автомобили. Сама видела, как в Вене и Невшателе очень пожилые люди рассекали на Ferrari и Porsche Cayenne. Но время неумолимо. Поэтому число аварий по вине водителей старше 60 тоже неуклонно растёт. В Японии это вообще прямо бич.
И вот, как по мне, уже вполне наметился технологический тренд:
✔️ сбор больших датасетов об особенностях вождения людей в реальном времени;
✔️ применение автомобильного ИИ для ранней диагностики заболеваний.
🚙 Например, всё в том же Колумбийском университете провели лонгитюдное (продолжительное по времени наблюдений) исследование LongROAD. В нём приняли участие 2977 участников в возрасте от 65 до 79 лет. Их машины оснастили датчиками, отслеживающими 29 особенностей вождения и движения автомобиля, а также инциденты в ходе реальных поездок.
Данные собирали почти четыре года — с августа 2015-го по март 2019-го. При этом к апрелю 2019 у 33 испытуемых обнаружили когнитивные расстройства средней степени выраженности, а у 31 — старческую деменцию.
Весь собранный массив данных использовали для машинного обучения, разработав серию предиктивных моделей. Наилучшую прогностическую точность в 88% показал алгоритм, использующий для предсказания совместно демографические характеристики испытуемого и данные о его вождении.
🚗 Ну а на прошлой неделе мелькнула новость, что Honda Motor Co создаст модель для выявления отклонений в физическом состоянии водителя. При этом не только когнитивных нарушений, но и глаукомы. Если алгоритм обнаружит задержку в реакции водителя на сигналы светофора, то сообщит ему, что у него, возможно, узкое поле зрение. Сужение зрения — распространённый симптом глаукомы. Обычно эта болезнь глаз медленно прогрессирует и её трудно распознать.
Датасет из записей работы мозга разных возрастных групп водителей и траекторий движения их глаз в ходе управления автомобилем уже собран. Осталось обучить модель. Внедрить её автопроизводитель планирует примерно в 2030 году.
#Машинное_обучение, #Датасеты, #ИИ_в_медицине
👨🏿🦳🧑🏼🦳 Для стран «золотого миллиарда» сейчас очень остро стоит проблема старения населения. Особенно для Японии, Северной Европы и США. При этом старики там активные, много путешествуют и водят автомобили. Сама видела, как в Вене и Невшателе очень пожилые люди рассекали на Ferrari и Porsche Cayenne. Но время неумолимо. Поэтому число аварий по вине водителей старше 60 тоже неуклонно растёт. В Японии это вообще прямо бич.
И вот, как по мне, уже вполне наметился технологический тренд:
✔️ сбор больших датасетов об особенностях вождения людей в реальном времени;
✔️ применение автомобильного ИИ для ранней диагностики заболеваний.
🚙 Например, всё в том же Колумбийском университете провели лонгитюдное (продолжительное по времени наблюдений) исследование LongROAD. В нём приняли участие 2977 участников в возрасте от 65 до 79 лет. Их машины оснастили датчиками, отслеживающими 29 особенностей вождения и движения автомобиля, а также инциденты в ходе реальных поездок.
Данные собирали почти четыре года — с августа 2015-го по март 2019-го. При этом к апрелю 2019 у 33 испытуемых обнаружили когнитивные расстройства средней степени выраженности, а у 31 — старческую деменцию.
Весь собранный массив данных использовали для машинного обучения, разработав серию предиктивных моделей. Наилучшую прогностическую точность в 88% показал алгоритм, использующий для предсказания совместно демографические характеристики испытуемого и данные о его вождении.
🚗 Ну а на прошлой неделе мелькнула новость, что Honda Motor Co создаст модель для выявления отклонений в физическом состоянии водителя. При этом не только когнитивных нарушений, но и глаукомы. Если алгоритм обнаружит задержку в реакции водителя на сигналы светофора, то сообщит ему, что у него, возможно, узкое поле зрение. Сужение зрения — распространённый симптом глаукомы. Обычно эта болезнь глаз медленно прогрессирует и её трудно распознать.
Датасет из записей работы мозга разных возрастных групп водителей и траекторий движения их глаз в ходе управления автомобилем уже собран. Осталось обучить модель. Внедрить её автопроизводитель планирует примерно в 2030 году.
#Машинное_обучение, #Датасеты, #ИИ_в_медицине
Green Car Congress
Researchers develop algorithms for early detection of mild cognitive impairment and dementia using naturalistic driving data
Using naturalistic driving data and machine learning techniques, researchers at Columbia University Mailman School of Public Health and Columbia’s Fu Foundation School of Engineering and Applied Science have developed highly accurate algorithms for detecting…
👍5🔥2
IBM ушёл из России, а их беспилотный корабль Mayflower впервые пересёк Атлантику
Утром 16 сентября 1620 года торговый галеон «Мэйфлауэр» отчалил из британского Плимута в Новый свет. На его борту находилось 102 пассажира — отцы-пилигримы — основавшие по прибытии к берегам нынешнего штата Массачусетс первое постоянное поселение в Новой Англии. Плавание продлилось чуть больше месяца. 21 ноября «Мэйфлауэр» бросил якорь у мыса Код.
🚤 Спустя 400 лет компания IBM решила повторить подвиг пуритан. Только без единого человека на борту. Полностью автономный тримаран Mayflower Autonomous Ship 400 (MAS400) отправился летом 2021 года по маршруту пилигримов. Однако из-за поломок рейс пришлось прервать.
🔧 Новый старт был дан 27 апреля 2022 года. Тут тоже обошлось не без злоключений. Отказ генератора автоматически привёл к остановке судна близ Азорских островов. Команде кожаных мешков пришлось десантироваться и делать срочный ремонт на алюминиевом покорителе морей.
🗺 Затем неполадки произошли уже в открытом океане, из-за чего маршрут пришлось сократить. В результате вместо запланированного прибытия в США конечной точкой путешествия оказалась Канада. Тем не менее рейс MAS400 продлился 40 суток, за которые беспилотник прошёл более 5600 км.
IBM и другой партнёр проекта некоммерческая научная организация ProMare утверждают, что MAS400 — прототип научных беспилотников для исследований океана. Но тут явственно чувствуется и запах военных — вместо океанографического оборудования в грузовой отсек вполне можно поместить тактическую ракету.
#Искусственный_интеллект, #Робототехника, #Беспилотники_и_дроны
Утром 16 сентября 1620 года торговый галеон «Мэйфлауэр» отчалил из британского Плимута в Новый свет. На его борту находилось 102 пассажира — отцы-пилигримы — основавшие по прибытии к берегам нынешнего штата Массачусетс первое постоянное поселение в Новой Англии. Плавание продлилось чуть больше месяца. 21 ноября «Мэйфлауэр» бросил якорь у мыса Код.
🚤 Спустя 400 лет компания IBM решила повторить подвиг пуритан. Только без единого человека на борту. Полностью автономный тримаран Mayflower Autonomous Ship 400 (MAS400) отправился летом 2021 года по маршруту пилигримов. Однако из-за поломок рейс пришлось прервать.
🔧 Новый старт был дан 27 апреля 2022 года. Тут тоже обошлось не без злоключений. Отказ генератора автоматически привёл к остановке судна близ Азорских островов. Команде кожаных мешков пришлось десантироваться и делать срочный ремонт на алюминиевом покорителе морей.
🗺 Затем неполадки произошли уже в открытом океане, из-за чего маршрут пришлось сократить. В результате вместо запланированного прибытия в США конечной точкой путешествия оказалась Канада. Тем не менее рейс MAS400 продлился 40 суток, за которые беспилотник прошёл более 5600 км.
IBM и другой партнёр проекта некоммерческая научная организация ProMare утверждают, что MAS400 — прототип научных беспилотников для исследований океана. Но тут явственно чувствуется и запах военных — вместо океанографического оборудования в грузовой отсек вполне можно поместить тактическую ракету.
#Искусственный_интеллект, #Робототехника, #Беспилотники_и_дроны
YouTube
The Mayflower Autonomous Ship's journey to transform ocean research using AI and Automation
Register now at http://ibm.biz/BdfyZr for Episode 5 of The Uncharted docuseries. In this episode, the Mayflower Autonomous Ship team is feeling the pressure before the ship’s journey across the Atlantic. Watch the team prep for the Mayflower’s big mission…
👍6
Что под капотом у Mayflower Autonomous Ship 400
MAS400 — автономный беспилотный тримаран 15 м в длину и 6,2 м в ширину. На нём нет ни кают, ни кубриков, ни систем жизнеобеспечения для людей. Благодаря использованию лёгких композитов и алюминия водоизмещение составляет всего 5 тонн. Это менее 3% от оригинального галеона «Мэйфлауэр». Скорость судна — до 10 узлов (18,5 км/ч).
⚙️ Тримаран приводится в движение парой электродвигателей мощностью по 20 кВт. Энергию обеспечивают солнечные батареи, поддерживаемые литий-ионными аккумуляторами. Все ключевые системы расположены в центральном корпусе, а пара боковых аутригеров служат лишь для повышения остойчивости судна.
📡 Для навигации тримаран использует радар, сонар, камеры и гидрофоны, данные GPS и морской идентификационной системы AIS, датчики давления и скорости, сенсоры для сбора метеоданных. Обрабатывает все эти потоки информации вычислительная система на базе нескольких высокопроизводительных модулей NVIDIA Jetson AGX Xavier.
🧭 Управляет кораблем система AI Captain, разработанная компанией MarineAI совместно с IBM. Она обучалась в течение двух лет на более чем миллионе изображений из залива Плимут-Саунд (Великобритания). В ходе тренировок системы использовалась платформа IBM Power AC922.
В марте 2021 исследователи провели первые испытания AI Captain. Они проверили, как система ведёт себя в реальном плавании и как использует данные, чтобы проложить курс с учётом других судов, буев, волноломов и прочих препятствий.
#Искусственный_интеллект, #Робототехника, #Беспилотники_и_дроны
MAS400 — автономный беспилотный тримаран 15 м в длину и 6,2 м в ширину. На нём нет ни кают, ни кубриков, ни систем жизнеобеспечения для людей. Благодаря использованию лёгких композитов и алюминия водоизмещение составляет всего 5 тонн. Это менее 3% от оригинального галеона «Мэйфлауэр». Скорость судна — до 10 узлов (18,5 км/ч).
⚙️ Тримаран приводится в движение парой электродвигателей мощностью по 20 кВт. Энергию обеспечивают солнечные батареи, поддерживаемые литий-ионными аккумуляторами. Все ключевые системы расположены в центральном корпусе, а пара боковых аутригеров служат лишь для повышения остойчивости судна.
📡 Для навигации тримаран использует радар, сонар, камеры и гидрофоны, данные GPS и морской идентификационной системы AIS, датчики давления и скорости, сенсоры для сбора метеоданных. Обрабатывает все эти потоки информации вычислительная система на базе нескольких высокопроизводительных модулей NVIDIA Jetson AGX Xavier.
🧭 Управляет кораблем система AI Captain, разработанная компанией MarineAI совместно с IBM. Она обучалась в течение двух лет на более чем миллионе изображений из залива Плимут-Саунд (Великобритания). В ходе тренировок системы использовалась платформа IBM Power AC922.
В марте 2021 исследователи провели первые испытания AI Captain. Они проверили, как система ведёт себя в реальном плавании и как использует данные, чтобы проложить курс с учётом других судов, буев, волноломов и прочих препятствий.
#Искусственный_интеллект, #Робототехника, #Беспилотники_и_дроны
Telegram
Душа Питона
IBM ушёл из России, а их беспилотный корабль Mayflower впервые пересёк Атлантику
Утром 16 сентября 1620 года торговый галеон «Мэйфлауэр» отчалил из британского Плимута в Новый свет. На его борту находилось 102 пассажира — отцы-пилигримы — основавшие по прибытии…
Утром 16 сентября 1620 года торговый галеон «Мэйфлауэр» отчалил из британского Плимута в Новый свет. На его борту находилось 102 пассажира — отцы-пилигримы — основавшие по прибытии…
👍8
«Пряная прелесть» нейросетей
Немного красоты и психоделии вам в ленту. Филологи Борис Орехов из НИУ ВШЭ и Любовь Каракуц-Бородина из СПбГУ визуализировали прозу Владимира Набокова.
Что интересно, учёные использовали английские тексты и модель CLIP (Contrastive Language-Image Pre-training) от OpenAI. С русскими цитатами можно попробовать сгенерировать свои иллюстрации в ruCLIP от Сбера. Правда нужны навыки. Если их нет, то вот простой бот @sber_rudalle_xl_bot для другой модели ruDALL-E Malevich (XL).
«Набоков многое строит на языковой, фонетической игре. Его эстетика ориентирована на слово: “виноватые виньетки”, “мускулы музы”. Она не визуальна по своей природе. Но люди желают создавать в голове картинку из художественного образа. Сам образ по-английски — image — «картинка». Неудачная метафора — и картинка не складывается. Но у Набокова многие образы кажутся удачными. Среди них есть визуальные и не визуальные. Это интересная задача — визуализировать невизуальное», — Борис Орехов для IQ.HSE
Немного красоты и психоделии вам в ленту. Филологи Борис Орехов из НИУ ВШЭ и Любовь Каракуц-Бородина из СПбГУ визуализировали прозу Владимира Набокова.
Что интересно, учёные использовали английские тексты и модель CLIP (Contrastive Language-Image Pre-training) от OpenAI. С русскими цитатами можно попробовать сгенерировать свои иллюстрации в ruCLIP от Сбера. Правда нужны навыки. Если их нет, то вот простой бот @sber_rudalle_xl_bot для другой модели ruDALL-E Malevich (XL).
«Набоков многое строит на языковой, фонетической игре. Его эстетика ориентирована на слово: “виноватые виньетки”, “мускулы музы”. Она не визуальна по своей природе. Но люди желают создавать в голове картинку из художественного образа. Сам образ по-английски — image — «картинка». Неудачная метафора — и картинка не складывается. Но у Набокова многие образы кажутся удачными. Среди них есть визуальные и не визуальные. Это интересная задача — визуализировать невизуальное», — Борис Орехов для IQ.HSE
🔥9😱2
4Chan превратил модель в машину языка ненависти
🔊 В отличие от погрязшего в цензуре Twitter, имиджборд 4chan остаётся анонимной и максимально свободной площадкой для общения. Однако у такой политики есть обратная сторона — треды там полны агрессии, токсичности, языка презрения и ненависти к отдельным группам людей. В общем — всё как в жизни.
🤖 Этой особенностью 4chan воспользовался Яник Кильчер (Yannic Kilcher), исследователь искусственного интеллекта из Швейцарской высшей технической школы Цюриха (ETH Zurich) и по совместительству видеоблогер. Он обучил трансформер с 6 млрд параметров GPT-J 6B на датасете Raiders of the Lost Kek. В последний вошли 3,3 млн тредов, оставленных за 3,5 года участниками одного из самых «жестких» разделов платформы — борда Politically Incorrect (/pol/).
🤬 Результатом стал чатбот GPT-4chan. Рокенрольщик и знатный тролль Кильчер не преминул тут же запустить 9 его инстансов на имиджборд. За сутки они оставили около 15 000 полных ненависти, нигилизма и грубости постов.
Это «самая пугающая и исключительно эффективная — в плохом смысле этого слова — модель в интернете. Он изобрёл машину для производства ненависти... и выпустил её на свободу», констатировали эксперты.
Код GPT-4chan выложен на Hugging Face — репозитории, ориентированным на этические аспекты разработки ИИ, однако доступ к нему ограничен. Дать жару можно только странице проекта, правда лишь в демонстрационном режиме.
#Чатботы_и_коммуникация_с_роботами, #Генерация_текстов, #Этика_искусственного_интеллекта
🔊 В отличие от погрязшего в цензуре Twitter, имиджборд 4chan остаётся анонимной и максимально свободной площадкой для общения. Однако у такой политики есть обратная сторона — треды там полны агрессии, токсичности, языка презрения и ненависти к отдельным группам людей. В общем — всё как в жизни.
🤖 Этой особенностью 4chan воспользовался Яник Кильчер (Yannic Kilcher), исследователь искусственного интеллекта из Швейцарской высшей технической школы Цюриха (ETH Zurich) и по совместительству видеоблогер. Он обучил трансформер с 6 млрд параметров GPT-J 6B на датасете Raiders of the Lost Kek. В последний вошли 3,3 млн тредов, оставленных за 3,5 года участниками одного из самых «жестких» разделов платформы — борда Politically Incorrect (/pol/).
🤬 Результатом стал чатбот GPT-4chan. Рокенрольщик и знатный тролль Кильчер не преминул тут же запустить 9 его инстансов на имиджборд. За сутки они оставили около 15 000 полных ненависти, нигилизма и грубости постов.
Это «самая пугающая и исключительно эффективная — в плохом смысле этого слова — модель в интернете. Он изобрёл машину для производства ненависти... и выпустил её на свободу», констатировали эксперты.
Код GPT-4chan выложен на Hugging Face — репозитории, ориентированным на этические аспекты разработки ИИ, однако доступ к нему ограничен. Дать жару можно только странице проекта, правда лишь в демонстрационном режиме.
#Чатботы_и_коммуникация_с_роботами, #Генерация_текстов, #Этика_искусственного_интеллекта
YouTube
GPT-4chan: This is the worst AI ever
#gpt4chan #4chan #ai
GPT-4chan was trained on over 3 years of posts from 4chan's "politically incorrect" (/pol/) board.
(and no, this is not GPT-4)
EXTRA VIDEO HERE: https://www.youtube.com/watch?v=dQw4w9WgXcQ
Website (try the model here): https://gpt…
GPT-4chan was trained on over 3 years of posts from 4chan's "politically incorrect" (/pol/) board.
(and no, this is not GPT-4)
EXTRA VIDEO HERE: https://www.youtube.com/watch?v=dQw4w9WgXcQ
Website (try the model here): https://gpt…
👍7
Все слышали, что в США до сих пор острый дефицит разработчиков, знающих древний язык COBOL (Common Business Oriented Language). Он был разработан аж в 1959 году, но в стране чековых книжек и факсов на нём крутится ещё немало финансовой инфраструктуры.
⏳ Дошло до того, что деды — ветераны индустрии — дают молодняку курсы по COBOL, неплохо подрабатывая к пенсии. А те и рады — зарплаты у раритетных спецов, обслуживающих техническое наследие эпохи расцвета хиппи, космические. «Помог» и коронавирус. Пандемия изрядно зачистила последних коболистов. Ведь младше 70 среди них почти никого нет.
🎞 И вот тут такое дело — в прошлом году историк Алексей Сафронов из ИОН РАНХиГС обнаружил в одном из подсобных помещений Аналитического центра при правительстве РФ несколько стеллажей катушек с магнитными лентами для ЕС ЭВМ. Вероятно, на них записана знаменитая советская Автоматизированная система плановых расчётов (АСПР) или хотя бы некоторые её элементы.
Так что специалисты по забытым языкам и археологическому программированию востребованы и у нас. Правда, скорее всего, на волонтёрских началах.
Ну а вспомнила я эту историю потому, что завтра на 13 карточках хочу рассказать о Госплане и крахе цифровизации в СССР. Для затравки вот такой тизер. Stay tuned!
⏳ Дошло до того, что деды — ветераны индустрии — дают молодняку курсы по COBOL, неплохо подрабатывая к пенсии. А те и рады — зарплаты у раритетных спецов, обслуживающих техническое наследие эпохи расцвета хиппи, космические. «Помог» и коронавирус. Пандемия изрядно зачистила последних коболистов. Ведь младше 70 среди них почти никого нет.
🎞 И вот тут такое дело — в прошлом году историк Алексей Сафронов из ИОН РАНХиГС обнаружил в одном из подсобных помещений Аналитического центра при правительстве РФ несколько стеллажей катушек с магнитными лентами для ЕС ЭВМ. Вероятно, на них записана знаменитая советская Автоматизированная система плановых расчётов (АСПР) или хотя бы некоторые её элементы.
Так что специалисты по забытым языкам и археологическому программированию востребованы и у нас. Правда, скорее всего, на волонтёрских началах.
Ну а вспомнила я эту историю потому, что завтра на 13 карточках хочу рассказать о Госплане и крахе цифровизации в СССР. Для затравки вот такой тизер. Stay tuned!
🔥9👍2🤯2