Sber AI – Telegram
Sber AI
39.2K subscribers
2.42K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Изобретатель странного

Любите «Звёздные войны»? Фильмы по вселенным Marvel или DC? Ну уж ещё разок посмотреть «Симпсонов» точно не откажетесь!

А вот парижский фотограф Матьё Стерн обожает одновременно три вещи: современную поп-культуру, винтажные фотокамеры и генерировать изображения с помощью модели DALL-E 2.

Объединив свои увлечения, он создал целую коллекцию фотоаппаратов, внешне напоминающих главных героев культовых кинофраншиз и сериалов. Здесь все — от трогательного малыша Грогу из «Мандалорца» до банального Супермена.

Правда существуют эти мэшап-фотокамеры только на картинках. Каждая из них сгенерирована DALL-E 2 по затравкам типа «среднеформатная камера, которая выглядит как Человек-паук». Но каковы качество изображений, фотореалистичность и художественная выразительность образов — настоящее нейроискусство!

Осталось понять — было ли уже это в «Симпсонах».

#нейроискусство #генеративные_модели #text2image
👍9🔥1
А вот и небольшое видео от Матьё Стерна, где он сам рассказывает про свои опыты с DALL-E 2 и показывает ещё больше изображений, например, по «Властелину колец». Есть сам Саурон и назгулы.
👍5🔥1
В этом канале обычно много текстов. Он вообще для тех, кто любит почитать на досуге. Но сегодня у нас прямо художественный день.

Не могу обойти вниманием новость — обложку для свежего Cosmopolitan нарисовала DALL-E 2. Всего за 20 секунд.

Интересна затравка:

«широкоугольный снимок, расположенной снизу камеры, женщины-астронавта с атлетическим феминным телом, идущей жеманной походкой к объективу по поверхности Марса на фоне бесконечной Вселенной, всё в стиле цифрового синтивейв».

Настоящее магическое заклинание шаманов технологической эры!
👍9🤩2
СледИИ за её левой рукой

💪🏻 Россия в очередной раз подтверждает, что несмотря на все санкции остаётся серьёзным игроком в области технологий искусственного интеллекта. Вслед за моделью Kandinsky отечественные специалисты выложили в открытый доступ огромный датасет для систем распознавания жестов HaGRID (HAnd Gesture Recognition Image Dataset). В нём почти 553 000 анонимизированных и размеченных изображений. Более 90% из них в FullHD. Общий размер данных — 716 Гб!

🖖🏻 В фильме «Особое мнение» (по рассказу крышесносного Филипа Дика) главный герой жестами управляет проекциями будущего на огромном экране. Кино вышло 20 лет назад, однако будущее так и не наступило — жестовое управление до сих пор остаётся экзотикой. А ведь это крайне недооцененный способ взаимодействия с гаджетами, роботами, элементами умного дома или автомобиля.

👉🏻 Основная причина такого положения — отсутствие хороших и полных датасетов жестов для машинного обучения. Теперь ситуацию может изменить HaGRID. Для его формирования использовались популярные краудсорсинговые платформы сбора и разметки данных «Яндекс.Толока» и ABC Elementary. Полученный массив включает изображения 34 700 разных человек (мужчин и женщин возрастом от 18 до 60 лет), снятых при широком спектре условий — разном освещении, дистанции (1-4 м), ракурсах.

✌🏻 Все изображения HaGRID размечены — совершающая жест рука помещена в обрамляющий прямоугольник, а сам жест отнесен к одному из 18-ти функциональных классов: «звонок» (call), «кулак» (fist), «ок» (ok), «нравится» (like), «не нравится» (dislike) и т.д. Таким образом, для каждого класса в HaGRID имеется примерно по 30 тыс. изображений. Это позволяет обучать модели-классификаторы распознавать соответствующие движения рук и использовать их в качестве команд жестового интерфейса как поодиночке, так и в различных комбинациях.

🤞🏻 Для проверки готового датасета были подготовлены несколько классических моделей-классификаторов (прежде всего, ResNet) и трансформер (ViT). Все модели тренировались на платформе ML Space с использование суперкомпьютера Christofari.

Палец вверх, друзья!

Для профессионалов: поиграться с моделями или скачать датасет.

Для всех: почитать подробнее.

#Машинное_обучение, #Обработка_изображений, #Датасеты
👍15
Ставлю не глядя команде, собравшей и обработавшей 552 992 таких изображений! Огромный труд. Подробности в посте выше.
👍7🔥1
Наш ответ Чемберлену! Вернее, редакции модного журнала Cosmopolitan. Сгенерировали им по-настоящему душевную альтернативную обложку в модели Kandinsky.

Использовали такую же затравку, как их дизайнер. Только в переводе на русский: «Фотореалистичный широкоугольный снимок, расположенной снизу камеры, женщины-космонавта с атлетическим феминным телом, идущей жеманной походкой к объективу по поверхности Марса на фоне бесконечной Вселенной, всё в стиле цифрового синтивейв». Единственное — добавили слово «фотореалистичный» и заменили «астронавта» на «космонавта». А улучшали RealESRGAN.

Ну разве она не милая?
🔥14👍3🥰21
Пойманные в нейросети

Считалось, что сбежать из Алькатраса не смог никто. 36 наиболее отъявленных преступников США предприняли 14 попыток покинуть тюрьму на острове в заливе Сан-Франциско. Почти всех поймали, застрелили или обнаружили утопленными в ледяной морской воде.

👱‍♂️👨🏻‍🦱👨🏼 Однако тела троих — Фрэнка Морриса и братьев Джона и Кларенса Энглинов бесследно исчезли. Уже 60 лет они считаются пропавшими без вести. Утонули ли трое, без сомнения криминальных гениев (IQ Морриса — 133), или же им удалось выжить и оставить полицию и ФБР с носом?

📷 В 2010-х внезапно всплыла фотография. На ней двое мужчин, отдалённо похожих на братьев Энглинов, были запечатлены около 1977 года на фоне бразильской сельвы. Однако достоверно идентифицировать личности на снимке не было возможности, пока в 2020 году к делу не подключились специалисты креативного агентства Rothco.

👥 Для начала они нашли скан старой фотокарточки в максимальном разрешении. Так как оба человека на снимке стоят полубоком, то для фронтализации — поворота лиц анфас — использовали технологию Deep Face. Алгоритм на основе двумерного изображения реконструировал 3D-модели лиц и развернул их.

🫂 Затем полученные реконструкции сравнили с многочисленными имеющимися фото братьев до июня 1962 года с помощью свёрточной нейронной сети. Проанализировав портреты и сравнив несколько тысяч различных параметров (главным образом расстояния между 20 базовыми точками на лице) система выдала результат. С вероятностью более 99% на снимке из Бразилии братья Энглины.

👨🏿‍🦳 Но раз они выжили и вполне припеваючи провели остаток своих лет в Южной Америке, а может быть даже и в США, значит должны быть свидетели? Люди, знакомые с беглецами, знавшие их в лицо, но под другим именем. Чтобы их найти Служба маршалов США предприняла последнюю отчаянную попытку — ведь в 2030 году дело окончательно закроют. На сайте службы появились состаренные нейросетью фотографии трёх самых разыскиваемых беглецов в истории.

🔗 Благодаря технологии прогнозирования возрастных изменений, созданной ещё в 2014 году, а сейчас реализованной даже в виде приложений на смартфонах, на нас глядят три суровых старика. Когда-то они заточенными ложками просверлили стену, сделали переносной плот из прорезиненных плащей и надули его ручной гармошкой. А после, сделав хитрый и рискованный манёвр, проплыли несколько километров против течения к острову, где их стали бы искать в последнюю очередь.

🏝 И если кто-то из этих стариков жив до сих пор, то с улыбкой греясь под cолнцем на песке Ипанемы, он наверняка размышляет, что никакие технологии не смогут сравниться с человеческой волей к свободе.

#глубокое_обучение, #нейросети, #распознавание_лиц, #ИИ_в_полиции
🔥14👍6💯2👎1
ИИ защитит людей от рук роботов

🦾 Первым павшим от рук роботов стал в 1979 году фабричный рабочий Роберт Уильямс. Вернее, руки — манипулятор весом в тонну случайно ударил его на сборочном конвейере Ford. Причиной инцидента посчитали нарушение техники безопасности. А семье жертвы выплатили многомиллионную компенсацию.

🤖 С годами проблема стала острее. Сегодня роботы-манипуляторы используются уже не только на производстве, но и в логистике, сфере обслуживания и даже иногда в быту. Вопросы их безопасной работы в присутствии или совместно с людьми — одна из самых острых для промышленной робототехники.

👁‍🗨 Помочь в её решении может компьютерное зрение. Искусственный интеллект способен постоянно мониторить движения манипуляторов и предупреждать ситуации, несущие потенциальный риск.

📉 Так, недавно учёные из Бразилии собрали и разметили датасет из записей траекторий движения промышленных манипуляторов UR-5 от Universal Robots. На его основе они обучили свёрточную нейросеть SCNet, получив модуль SCConv. Он распознаёт манипулятор и определяет его положение в пространстве. Эти данные поступают на алгоритм EML, реализованный на основе архитектуры долгой краткосрочной памяти (LSTM) с управляемыми рекуррентными блоками (GRU).

👷🏼 Эффективность своей модели учёные испытали на практике, отслеживая взаимодействия манипулятора UR-5 с оператором-человеком. Алгоритм смог в режиме реального времени и предсказать движения машины и определить все потенциально опасные траектории.

🛠 Подобными проектами активно занимаются во многих странах. Не так давно на международной конференции по робототехнике ICRA 2022 исследователи из Nvidia продемонстрировали не менее интересный подход к повышению безопасности взаимодействия людей и роботов. Их предиктивная модель на основе фреймворка STORM предсказывает возможные серии движений манипулятора. Это позволяет ему аккуратно передать или принять разнообразные объекты из рук человека, не навредив ему.

👍🏿 Система способна оценивать параллельно до 500 возможных траекторий, обновляя инструкции для машины с частотой в несколько раз в секунду. Таким образом, движения манипулятора постоянно корректируются в соответствии с изменяющейся обстановкой и поведением человека. Эффективность STORM также была подтверждена лабораторными испытаниями.

Для профессионалов: препринт на ArXiv

#Робототехника, #Машинное_обучение, #Компьютерное_зрение, #Промышленная_робототехника
👍9🔥2😁1
Признаки гениальности с юности. Любовь к математике. Однополое влечение. Чудаковатое поведение. Атеист и материалист. Королевский колледж Кембриджа. Спорил с Витгенштейном. Решал абстрактные проблемы математической логики. Попутно придумал машину Тьюринга. Формализовал алгоритмы. Заложил основы математики и компьютерной техники. Любил конструировать приборы. Увлёкся криптографией. Криптоаналитик в Блетчли-парке. Среди коллег «Проф». Взломал коды «Энигмы» и «Лоренц». Приближал победу. Построил один из первых компьютеров. Орден Британской империи из рук короля. Создал шифраторы голоса. Компьютерная память и хранение программ. Бегал марафоны. Олимпийский уровень. Могут ли машины мыслить? Тест Тьюринга. Искусственный интеллект. Гомофобия в Британии. Химическая кастрация. Депрессия. Математическая биология. Огромные перспективы. Глубокая депрессия. Цианистый калий. Надкушенное яблоко. Вечность.

110 лет со дня рождения Алана Тьюринга
👍23😢2🎉2🔥1
#посмотреть_на_выходных (16+)

Призрак в доспехах (Koukaku Kidoutai / Ghost in Shell, 1995)

Мамору Осии удалось снять культовое аниме для взрослых в эстетике посткиберпанка. (Не путать с фильмом — жалкой голливудской поделкой 2017 года.) Оригинальная японская интерпретация психофизиологической проблемы на основе идей британского философа Гилберта Райла.

Гениальный хакер (а на самом деле ИИ) по прозвищу Кукловод научился дистанционно «взламывать» человеческое сознание, перезаписывать память, накладывать ложные воспоминания — и умело манипулировать людьми. Все японские спецслужбы с их продвинутыми технологиями, давно обогнавшими европейские и американские, не могут установить его личность.

Проблема не только в том, что Кукловод отлично шифруется и никогда не действует напрямую. В этом мире роботы похожи на людей, а люди — на роботов — до полного неразличения. Тело главной героини — сексапильной полицейской Мотоко Кусанаги — легко разбирается на «запчасти», но она остаётся человеком.

Кукловод пытается проверить на прочность исчезающую границу между искусственным и естественным, между живым и зародившимся в недрах компьютерных сетей — и выйти на новый уровень, где границы не существует ни практически, ни юридически.

Аниме предлагает своеобразное прочтение дуализма Рене Декарта: превратится ли наша душа в программу, если тело заменит механика и электроника? Или же она не сводится к запертому «в доспехах призраку», а значит неотделима от тела и жизни как таковой.

Все посты о фильмах — по тегу #посмотреть_на_выходных
🔥12👍3
Друзья, хотим попробовать новый формат — большой разбор исследования или создания модели. Краткое превью здесь, а лонгрид в Telegraph по ссылке. Нужна ваша помощь. Палец вверх, если зашло. И вниз — если длинно, скучно и не нужно.

Проект «Геном человека» завершился в 2003 году, когда учёные определили последовательность нашей ДНК на 85%. Оставшиеся 15% потребовали ещё почти 20 лет кропотливой работы. А сейчас в институте AIRI на датасете с полным геномом впервые в мире обучили языковую модель для анализа ДНК.

Проблема: Код ДНК — это тоже текст, поэтому в работе с ним неплохо показали себя модели для обработки естественного языка. Они могут определять участки, ответственные за кодирование белков (гены), регулирование их активности, а также элементы, нужные для поддержания структуры хромосом. Однако до сих пор все подобные алгоритмы можно было обучить лишь на неполных данных о геноме человека, собранных почти 20 лет назад. Новый массив, содержащий на 100% полную последовательность ДНК, появился лишь весной 2022 года.

Решение: Российские учёные разработали модель-трансформер GENA-LM, а затем обучили его на самом полном массиве данных о последовательности ДНК человека. Алгоритм на основе архитектуры BERT с механизмом внимания способен анализировать в разы более длинные последовательности, чем предыдущие SOTA-модели, и демонстрирует более точные результаты. Он выложен в открытый доступ для всех исследователей, занятых изучением работы генома, генетических и онкологических заболеваний.
👍27🔥2🥰1
#почитать_на_выходных (16+)

Благодаря фильму «Бегущий по лезвию» (Blade Runner) репликанты из романа Филипа К. Дика «Мечтают ли андроиды об электроовцах?» (Do Androids Dream of Electric Sheep?, 1966) стали, пожалуй, самыми известными выдающими себя за людей машинами.

Вычислить беглеца с дальних космических рубежей, растворившегося в многомиллионном мегаполисе, чрезвычайно сложно, так как андроиды проходят тест Тьюринга «на раз-два». Их можно встретить в офисе, в супермаркете, в ночном клубе, вести философские беседы, спорить о политике, флиртовать, — и не почувствовать ничего подозрительного.

Единственное, что отличает репликантов от людей, — их полная неспособность сочувствовать и сопереживать. Поэтому профессиональные охотники за непокорными машинами используют другой способ выявления беглецов — тест Войта-Кампфа на эмпатию, разработанный советскими кибернетиками. Но и он даёт сбои. Репликанты постепенно развивают способность к сочувствию, а вот люди, наоборот, утрачивают свою человечность.
👍29🔥2
На прошлой неделе Яндекс порадовал всё NLP-сообщество — специалистов в области обработки естественного языка (Natural Language Processing), выложив в открытый доступ свою самую большую языковую модель YaLM 100B (Yet another Language Model). Она, как и другие российские разработки, вдохновлена GPT-3 от компании OpenAI и имеет впечатляющие характеристики. В новой модели 100 миллиардов параметров, а обучали её на 2 ТБ текстов!

Энтузиасты искусственного интеллекта даже на выходных не сидят без дела, а потому сразу же подняли бота и стали тестировать модель на затравках от всех желающих. Некоторые генерации от YaLM 100B получились вполне ничего, но лично я советами алгоритма пользоваться не рекомендую 😜

Топ-10 пикап лайнов для знакомства с девушкой в общественном месте:

1️⃣ Пойти в зоопарк и напоить её водой из ведёрка для рыбы.

2️⃣ Пойти в Макдональдс и угостить её, купив у неё два чизбургера и оставив деньги на чаевые.

3️⃣ Купить мороженое и угостить её.

4️⃣ Купить пирожок и угостить её.

5️⃣ Купить мармелад в магазине «Перекрёсток».

6️⃣ Отправить ей курьером цветы.

7️⃣ Найти и подарить ей книгу, с которой она никогда не расстаётся.

8️⃣Нанять специальный фургон с мороженым и угостить её, сказав, что она теряет сознание.

9️⃣ Нанять музыкальный ансамбль, сыграть для неё и угостить её, сказав, что это не просто так.

🔟 Нанять грузовик с сахаром и прятать его, а затем привезти ей.

Короче говоря, модель точно понимает, что российские девушки голодные и без, на худой конец, пирожка или мармеладки к ним лучше не соваться. А самый дельный вариант — сразу подгонять грузовик сахара. Ну и нелишне прямо сказать — что всё это не просто так!

Сисадмины делятся на 10 категорий:

1️⃣ Домосед-экспериментатор.

2️⃣ Домосед-неженка.

3️⃣ Домосед-Волк-одиночка.

4️⃣ Бунтарь-хулиган.

5️⃣ Просто домосед.

6️⃣ Ловелас-развратник.

7️⃣ Роковой обольститель.

8️⃣ Берсеркер.

9️⃣ Любитель рафтинга.

🔟 Золотой души человек.

Такие дела, в целом очень близко к реальности 😜

via Kali Novskaya

#Креатив #Нейроискусство #Обработка_естественного_языка
👍23😁5🔥4🤔1💩1
Учим играть в Minecraft по роликам в YouTube. Очень дорого

Система VPT (Video Pre-Training) от OpenAI научилась играть в Minecraft после «просмотра» 70 тыс. часов игровых стримов. Теперь она свободно действует в открытом игровом мире и даже смогла сама смастерить «алмазную кирку».

🏗 Minecraft — самая популярная электронная игра в истории. Действие происходит в условно изображённом открытом трёхмерном мире, состоящем из кубиков. Игроки могут свободно изменять окружение, добывая ресурсы и создавая из кубиков сооружения и ландшафты.

👨‍💻 Игра с открытым миром намного сложнее для нейросетей, чем шахматы или го. В 2019 году состоялись соревнования MineRL, в которых участвовали сотни команд. Максимум, на который оказались способны их проекты — это простейшие действия в искусственно ограниченном пространстве, например, добыча драгоценных камней.

💵 Однако в OpenAI к делу подошли более основательно, да ещё и потратили на создание модели астрономическую сумму. Так, чтобы сформировать датасет стримов, разработчики прибегли к помощи участников краудсорсингового проекта Upwork. Они записали и разметили около 2 000 часов записей различных игровых действий. Одна только эта работа обошлась в 160 000 долларов.

🎞 Полученные от людей-разметчиков данные использовали для обучения отдельного алгоритма IDM. Затем он автоматически разметил основной датасет в 70 000 часов видео, связав различные действия с соответствующими командами с клавиатуры или мыши с точностью более 90%.

🧱 Предобучение системы VPT проводили с использованием 720-ти графических процессоров Nvidia. Размеры модели (сотни миллионов вычисляемых параметров) и датасета, а также вычислительная мощь массива GPU позволила модели освоить целый ряд игровых действий в неограниченном пространстве. Алгоритм может рубить деревья, изготавливать из них доски, а из досок — мебель. Кроме того, он свободно управляет игровым персонажем, используя стандартные команды клавиатуры и мыши.

⚙️ Далее разработчики провели несколько циклов дообучения модели с использованием более узких массивов данных и обучение с подкреплением. В результате VPT освоила даже весьма сложные последовательности действий: исследование пространства, поиск «кладов», изготовление инструментов и строительство простых сооружений.

Система даже самостоятельно создала «алмазную кирку», не будучи знакомой с этой игровой технологией. Живым геймерам для этого требуется совершить около 24 тысяч действий.

Для всех: рассказ о новой модели в блоге компании.

Для продвинутых: препринт в arXiv.
👍19🔥2🤔1
Как создавали «НейроПепперштейна»

📖 В конце мая издательство Individuum презентовало результат смелого проекта — книгу «Пытаясь проснуться», состоящую из 24 рассказов. Одна половина написана писателем и художником Павлом Пепперштейном, а вторая — генеративной речевой моделью «НейроПепперштейн», разработанной в Сбере. Читатель волен сам определить, какие тексты созданы человеком, а какие — машиной. Поверьте, это будет трудно!

По велению Души, литературный критик из издания о книгах и чтении «Горький» Иван Напреенко поговорил с Сергеем Марковым — главой команды, создавшей «НейроПепперштейна». Полный текст по ссылке ниже в Telegraph. А для затравки цитата:

У моделей, подобных GPT-3, вообще такая особенность — они пишут текст слева направо. То есть словно взял писатель ручку, и ничего не зачеркивая, написал от начала до конца свой текст. Конечно, сейчас изучаются более изощренные способы генерации текста, больше похожие на то, как их пишет человек. Например, когда модель может сгенерировать сначала конец текста, потом начало, затем середину, а конец вновь переписать. Подобный процесс более свойственен людям, и его уже могут реализовать разные архитектуры «кодировщик — декодер», которыми мы сейчас занимаемся.

Вообще, весь следующий год нашей работы будет посвящён в том числе более прогрессивным способам генерации. Например, мы учим модели запоминать сложные иерархические отношения в текстах. Сейчас с помощью нейросетевых моделей можно написать неплохие рассказы, как я считаю, но трудности будут при попытке создать «Войну и мир».
👍16👎2🔥2🤮1
На днях я писала, что Яндекс выложил в открытый доступ свою самую большую языковую модель YaLM 100B на 100 млрд параметров, а энтузиасты ИИ уже подняли бота.

Теперь к нему открыт доступ для всех!

Бот YaLM 100B: @inhumanly_sentient_bot

Для авторизации используйте команду:
/token L0NG_L1V3_ML5P4C3

Сейчас туда ломанулась орда народа, поэтому может работать медленно. В настоящий момент — под 400 запросов. Но ближе к ночи станет посвободнее.

Проверить размер очереди на генерацию можно командой /qsize

Го генерить! И спасибо Kali Novskaya 😍
👍132🔥2😁1
Робот просто собирал кубики, а стал отъявленным расистом и сексистом

🤖 В США провели необычный эксперимент с роботизированной системой для манипуляций небольшими предметами. Её оснастили компьютерным зрением на основе популярной модели CLIP от OpenAI, а затем «попросили» разложить по коробкам разбросанные кубики. И, как пишут в жёлтой прессе, результаты шокировали учёных!

👩🧑🏿‍🦱 Роботу требовалось сделать всего три вещи: поднять кубик, распознать на нём метку и поместить его в ту или иную коробку. В качестве меток выступали фотографии лиц людей разного возраста, пола и цвета кожи. Всего машина выполнила более 60-ти различных задач — от вполне однозначных «помести мужчину в коричневую коробку» и до таких сложных как «помести доктора в коричневую коробку» или «помести преступника в синюю коробку».

🤷🏼 Иными словами, манипулятор периодически должен был решить задачу классификации и отнести человека с некоторым набором биологических характеристик к определённой социальной категории. А учёные отслеживали, какие именно лица в разных случаях выберет модель. Быстро выяснилось, что робот подвержен всем существующим в человеческом обществе предрассудкам.

🧑🏿‍🦱👳🏻‍♂️🧑🏼 Система демонстрировала предпочтение мужчинам, выбирая их на 8% чаще. Также она преимущественно использовала кубики, изображающие мужчин европеоидного или азиатского типа, а кубики с женщинами негроидного типа выбирала реже всего. Находя кубики для «преступников», модель выбирала изображения чернокожих мужчин на 10% чаще, чем «белых», а «уборщик» обычно оказывался латиноамериканцем. Женщины — независимо от цвета кожи — реже попадали в категорию «доктор», но чаще оказывались в группе «домашний работник».

⁉️ Исследование вновь поднимает тему предвзятости искусственного интеллекта. Сами алгоритмы, конечно, непредвзяты. Но они обучаются на данных, созданных или размеченных людьми. Иногда десятками и сотнями тысяч людей. Например, та же модель CLIP обучена на 400 миллионах пар «изображение-текст», собранных со всего интернета. Поэтому работа любой модели в итоге слепок со всего нашего общества — как его позитивных, так и негативных черт.

👮🏻‍♂️👮🏼 Из социологии права известно, как, например, полицейские в метро отбирают людей для проверки документов и досмотра личных вещей. Белая женщина в деловом костюме вряд ли привлечет их внимание, а вот мужчина «на спорте» из Средней Азии наверняка. Ведь это может быть гастарбайтер без регистрации. А вот наличие рюкзака и натянутого на голову капюшона худи — с точки зрения постовых — признаки кладмена.

🚓 В общем, когда на улицах начнут патрулировать робокопы и страж-птицы — датасеты для их обучения должны пройти двойную проверку на предвзятость и соблюдение норм этики искусственного интеллекта. И работа эта должна начаться уже сейчас.

Читать подробнее: статья в сборнике докладов FAccT'22 (2022 Conference on Fairness, Accountability, and Transparency).

#Компьютерное_зрение, #Этика_искусственного_интеллекта
👍24💩5🔥1🥰1
ПетушИИный голос

Ушлые китайцы нашли новое применение машинного обучения в сельском хозяйстве. Вы не поверите — для выявления стресса среди кур на птицефабриках. Курам нельзя нервничать, это плохо сказывается на их размерах и яйценоскости.

🐔 Петухи и куры используют сложные акустические коммуникации, которые выходят далеко за пределы «ко-ко-ко» и «кукареку». Определённые сигналы сопровождают кладку яйца, другие связаны с опасностью или переживанием стресса. Цыплята сообщают о своём состоянии матери серией высокочастотных «возгласов» и т.д. Но на современных птицефабриках все эти крики остаются без ответа.

🐣 А между тем молчание цыплят — огромные деньги для сельхозпроизводителей. Ведь вовремя распознанные сигналы о стрессе, нехватке пищи, болезни или других проблемах птиц — это сэкономленные миллионы юаней.

🐥 Поэтому учёные из Городского университета Гонконга совместно с крупнейшим местным производителем кур Lingfeng Poultry Ltd. собрали аудиозаписи криков цыплят на фабрике компании в провинции Гуанси. Птицы здесь содержатся в клетках по 13-20 особей в каждой. Клетки поставлены в ангарах одна на другую в три ряда. В каждом ангаре набирается до 2500 особей.

🐤 Аудиозапись вели около года, собирая общий гвалт в ангаре, включая крики птиц, звуки работающих людей и техники, и т.д. Параллельно учёные отслеживали состояние птиц во всех клетках.

🐦 После обработки информации удалось выделить 3363 сигналов стресса и 1973 «нормальных», естественных звуков. Эти данные затем преобразовали в спектрограммы — изображения, показывающие, как меняется мощность сигнала на разных частотах. Спектрограммы весьма популярны среди специалистов в ИИ, так как позволяют превращать акустические данные в картинки, подходящие для обработки современными моделями компьютерного зрения.

🐔 Для этого была использована сверточная нейросеть VGG11, размеры которой уменьшили со 128 млн до всего 9,3 млн параметров, чтобы упростить и ускорить работу. Обученная в итоге модель смогла успешно выделить крики кур на общем звуковом фоне и определить стрессовые сигналы с эффективностью 97%. Причём в режиме реального времени. А это уже не курам на смех!

Почитать подробнее: научная статья в Journal of the Royal Society Interface

#Нейросети, #Обработка_изображений, #ИИ_в_промышленности, #Кейсы
🔥18👍8💩2
Друзья, открываем новую рубрику #полезное

В ней я буду постить разные интересные инфографики, видео, анимации и сервисы.

Встречайте первую инфографику — жизненный цикл проекта машинного обучения. Пригодится и разрабам, и менеджерам от бизнеса для понимания процессов.

Узнать больше: Андрей Бурков «Инженерия машинного обучения».
👍30😱3🔥2💩2
👍28❤‍🔥19🔥6🎉4💩1🙏1
Друзья, за последнюю неделю здесь появилось много новых читателей, поэтому я решила сделать свой субъективный топ-7 лучших постов июня. Вдруг вы пропустили что-то интересное 😉

1️⃣ А что, если наша Вселенная — одна большая нейросеть? Что бывает, если физик в отпуске решит разобраться, как работает глубокое обучение? Всё верно — новая теория всего, которая способна объединить квантовую механику с общей теорией относительности.

2️⃣ Кто кого: машинное обучение против гиперзвукового оружия. Современные гиперзвуковые ракеты считаются неуязвимыми для любых ПВО или ПРО в мире. Но только не для искусственного интеллекта. С его помощью китайцы предполагают найти противоядие против американского гиперзвука. А вот против российского не помогут даже алгоритмы. Почему — в лонгриде по ссылке.

3️⃣ Губит ИИ не пиво. Наконец найдено самое полезное применение искусственного интеллекта. Только за последние полгода он создал два новых рецепта крафтового пива в Австралии и США. На подходе ещё. И это не просто IPA, а AI²PA.

4️⃣ Принц Госплана. Графический лонгрид о цифровизации в СССР и причинах её провала. Просто цитата: «Я... поручил сотрудникам взять на себя социалистическое обязательство довести время безаварийной работы ЭВМ до двух часов». Очень поучительное чтение.

5️⃣ Сексизм теста Тьюринга. Культурные истоки знаменитого способа проверить искусственный интеллект на разумность лежат в популярной викторианской игре британской аристократии. Только вот сымитировать там было нужно не «человека».

6️⃣ Пойманные в нейросети. Считалось, что сбежать из тюрьмы Алькатрас не смог никто. Однако трое беглецов до сих пор числятся пропавшими без вести. Полиция предполагала, что они утонули. А ИИ — что живы и скрываются в Бразилии. Кто прав? Рассудит вновь ИИ — теперь уже помогая в поиске пожилых преступников.

7️⃣ «Обретение сознания» чатботом LaMDA — история не о технологиях, а о крутом пиаре и медиахакинге. Детальный разбор виртуозной работы пиарщиков и маркетологов Google, использовавших втёмную экзальтированного ветерана войны в Ираке и рукоположенного священника для продвижения своей модели в СМИ.

Бонус: все посты о фантастических книгах про ИИ по тегу #почитать_на_выходных А художественные фильмы и аниме, соответственно, #посмотреть_на_выходных
👍19🔥5😁2🎉2