Sber AI – Telegram
Sber AI
39.1K subscribers
2.43K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
Признаки гениальности с юности. Любовь к математике. Однополое влечение. Чудаковатое поведение. Атеист и материалист. Королевский колледж Кембриджа. Спорил с Витгенштейном. Решал абстрактные проблемы математической логики. Попутно придумал машину Тьюринга. Формализовал алгоритмы. Заложил основы математики и компьютерной техники. Любил конструировать приборы. Увлёкся криптографией. Криптоаналитик в Блетчли-парке. Среди коллег «Проф». Взломал коды «Энигмы» и «Лоренц». Приближал победу. Построил один из первых компьютеров. Орден Британской империи из рук короля. Создал шифраторы голоса. Компьютерная память и хранение программ. Бегал марафоны. Олимпийский уровень. Могут ли машины мыслить? Тест Тьюринга. Искусственный интеллект. Гомофобия в Британии. Химическая кастрация. Депрессия. Математическая биология. Огромные перспективы. Глубокая депрессия. Цианистый калий. Надкушенное яблоко. Вечность.

110 лет со дня рождения Алана Тьюринга
👍23😢2🎉2🔥1
#посмотреть_на_выходных (16+)

Призрак в доспехах (Koukaku Kidoutai / Ghost in Shell, 1995)

Мамору Осии удалось снять культовое аниме для взрослых в эстетике посткиберпанка. (Не путать с фильмом — жалкой голливудской поделкой 2017 года.) Оригинальная японская интерпретация психофизиологической проблемы на основе идей британского философа Гилберта Райла.

Гениальный хакер (а на самом деле ИИ) по прозвищу Кукловод научился дистанционно «взламывать» человеческое сознание, перезаписывать память, накладывать ложные воспоминания — и умело манипулировать людьми. Все японские спецслужбы с их продвинутыми технологиями, давно обогнавшими европейские и американские, не могут установить его личность.

Проблема не только в том, что Кукловод отлично шифруется и никогда не действует напрямую. В этом мире роботы похожи на людей, а люди — на роботов — до полного неразличения. Тело главной героини — сексапильной полицейской Мотоко Кусанаги — легко разбирается на «запчасти», но она остаётся человеком.

Кукловод пытается проверить на прочность исчезающую границу между искусственным и естественным, между живым и зародившимся в недрах компьютерных сетей — и выйти на новый уровень, где границы не существует ни практически, ни юридически.

Аниме предлагает своеобразное прочтение дуализма Рене Декарта: превратится ли наша душа в программу, если тело заменит механика и электроника? Или же она не сводится к запертому «в доспехах призраку», а значит неотделима от тела и жизни как таковой.

Все посты о фильмах — по тегу #посмотреть_на_выходных
🔥12👍3
Друзья, хотим попробовать новый формат — большой разбор исследования или создания модели. Краткое превью здесь, а лонгрид в Telegraph по ссылке. Нужна ваша помощь. Палец вверх, если зашло. И вниз — если длинно, скучно и не нужно.

Проект «Геном человека» завершился в 2003 году, когда учёные определили последовательность нашей ДНК на 85%. Оставшиеся 15% потребовали ещё почти 20 лет кропотливой работы. А сейчас в институте AIRI на датасете с полным геномом впервые в мире обучили языковую модель для анализа ДНК.

Проблема: Код ДНК — это тоже текст, поэтому в работе с ним неплохо показали себя модели для обработки естественного языка. Они могут определять участки, ответственные за кодирование белков (гены), регулирование их активности, а также элементы, нужные для поддержания структуры хромосом. Однако до сих пор все подобные алгоритмы можно было обучить лишь на неполных данных о геноме человека, собранных почти 20 лет назад. Новый массив, содержащий на 100% полную последовательность ДНК, появился лишь весной 2022 года.

Решение: Российские учёные разработали модель-трансформер GENA-LM, а затем обучили его на самом полном массиве данных о последовательности ДНК человека. Алгоритм на основе архитектуры BERT с механизмом внимания способен анализировать в разы более длинные последовательности, чем предыдущие SOTA-модели, и демонстрирует более точные результаты. Он выложен в открытый доступ для всех исследователей, занятых изучением работы генома, генетических и онкологических заболеваний.
👍27🔥2🥰1
#почитать_на_выходных (16+)

Благодаря фильму «Бегущий по лезвию» (Blade Runner) репликанты из романа Филипа К. Дика «Мечтают ли андроиды об электроовцах?» (Do Androids Dream of Electric Sheep?, 1966) стали, пожалуй, самыми известными выдающими себя за людей машинами.

Вычислить беглеца с дальних космических рубежей, растворившегося в многомиллионном мегаполисе, чрезвычайно сложно, так как андроиды проходят тест Тьюринга «на раз-два». Их можно встретить в офисе, в супермаркете, в ночном клубе, вести философские беседы, спорить о политике, флиртовать, — и не почувствовать ничего подозрительного.

Единственное, что отличает репликантов от людей, — их полная неспособность сочувствовать и сопереживать. Поэтому профессиональные охотники за непокорными машинами используют другой способ выявления беглецов — тест Войта-Кампфа на эмпатию, разработанный советскими кибернетиками. Но и он даёт сбои. Репликанты постепенно развивают способность к сочувствию, а вот люди, наоборот, утрачивают свою человечность.
👍29🔥2
На прошлой неделе Яндекс порадовал всё NLP-сообщество — специалистов в области обработки естественного языка (Natural Language Processing), выложив в открытый доступ свою самую большую языковую модель YaLM 100B (Yet another Language Model). Она, как и другие российские разработки, вдохновлена GPT-3 от компании OpenAI и имеет впечатляющие характеристики. В новой модели 100 миллиардов параметров, а обучали её на 2 ТБ текстов!

Энтузиасты искусственного интеллекта даже на выходных не сидят без дела, а потому сразу же подняли бота и стали тестировать модель на затравках от всех желающих. Некоторые генерации от YaLM 100B получились вполне ничего, но лично я советами алгоритма пользоваться не рекомендую 😜

Топ-10 пикап лайнов для знакомства с девушкой в общественном месте:

1️⃣ Пойти в зоопарк и напоить её водой из ведёрка для рыбы.

2️⃣ Пойти в Макдональдс и угостить её, купив у неё два чизбургера и оставив деньги на чаевые.

3️⃣ Купить мороженое и угостить её.

4️⃣ Купить пирожок и угостить её.

5️⃣ Купить мармелад в магазине «Перекрёсток».

6️⃣ Отправить ей курьером цветы.

7️⃣ Найти и подарить ей книгу, с которой она никогда не расстаётся.

8️⃣Нанять специальный фургон с мороженым и угостить её, сказав, что она теряет сознание.

9️⃣ Нанять музыкальный ансамбль, сыграть для неё и угостить её, сказав, что это не просто так.

🔟 Нанять грузовик с сахаром и прятать его, а затем привезти ей.

Короче говоря, модель точно понимает, что российские девушки голодные и без, на худой конец, пирожка или мармеладки к ним лучше не соваться. А самый дельный вариант — сразу подгонять грузовик сахара. Ну и нелишне прямо сказать — что всё это не просто так!

Сисадмины делятся на 10 категорий:

1️⃣ Домосед-экспериментатор.

2️⃣ Домосед-неженка.

3️⃣ Домосед-Волк-одиночка.

4️⃣ Бунтарь-хулиган.

5️⃣ Просто домосед.

6️⃣ Ловелас-развратник.

7️⃣ Роковой обольститель.

8️⃣ Берсеркер.

9️⃣ Любитель рафтинга.

🔟 Золотой души человек.

Такие дела, в целом очень близко к реальности 😜

via Kali Novskaya

#Креатив #Нейроискусство #Обработка_естественного_языка
👍23😁5🔥4🤔1💩1
Учим играть в Minecraft по роликам в YouTube. Очень дорого

Система VPT (Video Pre-Training) от OpenAI научилась играть в Minecraft после «просмотра» 70 тыс. часов игровых стримов. Теперь она свободно действует в открытом игровом мире и даже смогла сама смастерить «алмазную кирку».

🏗 Minecraft — самая популярная электронная игра в истории. Действие происходит в условно изображённом открытом трёхмерном мире, состоящем из кубиков. Игроки могут свободно изменять окружение, добывая ресурсы и создавая из кубиков сооружения и ландшафты.

👨‍💻 Игра с открытым миром намного сложнее для нейросетей, чем шахматы или го. В 2019 году состоялись соревнования MineRL, в которых участвовали сотни команд. Максимум, на который оказались способны их проекты — это простейшие действия в искусственно ограниченном пространстве, например, добыча драгоценных камней.

💵 Однако в OpenAI к делу подошли более основательно, да ещё и потратили на создание модели астрономическую сумму. Так, чтобы сформировать датасет стримов, разработчики прибегли к помощи участников краудсорсингового проекта Upwork. Они записали и разметили около 2 000 часов записей различных игровых действий. Одна только эта работа обошлась в 160 000 долларов.

🎞 Полученные от людей-разметчиков данные использовали для обучения отдельного алгоритма IDM. Затем он автоматически разметил основной датасет в 70 000 часов видео, связав различные действия с соответствующими командами с клавиатуры или мыши с точностью более 90%.

🧱 Предобучение системы VPT проводили с использованием 720-ти графических процессоров Nvidia. Размеры модели (сотни миллионов вычисляемых параметров) и датасета, а также вычислительная мощь массива GPU позволила модели освоить целый ряд игровых действий в неограниченном пространстве. Алгоритм может рубить деревья, изготавливать из них доски, а из досок — мебель. Кроме того, он свободно управляет игровым персонажем, используя стандартные команды клавиатуры и мыши.

⚙️ Далее разработчики провели несколько циклов дообучения модели с использованием более узких массивов данных и обучение с подкреплением. В результате VPT освоила даже весьма сложные последовательности действий: исследование пространства, поиск «кладов», изготовление инструментов и строительство простых сооружений.

Система даже самостоятельно создала «алмазную кирку», не будучи знакомой с этой игровой технологией. Живым геймерам для этого требуется совершить около 24 тысяч действий.

Для всех: рассказ о новой модели в блоге компании.

Для продвинутых: препринт в arXiv.
👍19🔥2🤔1
Как создавали «НейроПепперштейна»

📖 В конце мая издательство Individuum презентовало результат смелого проекта — книгу «Пытаясь проснуться», состоящую из 24 рассказов. Одна половина написана писателем и художником Павлом Пепперштейном, а вторая — генеративной речевой моделью «НейроПепперштейн», разработанной в Сбере. Читатель волен сам определить, какие тексты созданы человеком, а какие — машиной. Поверьте, это будет трудно!

По велению Души, литературный критик из издания о книгах и чтении «Горький» Иван Напреенко поговорил с Сергеем Марковым — главой команды, создавшей «НейроПепперштейна». Полный текст по ссылке ниже в Telegraph. А для затравки цитата:

У моделей, подобных GPT-3, вообще такая особенность — они пишут текст слева направо. То есть словно взял писатель ручку, и ничего не зачеркивая, написал от начала до конца свой текст. Конечно, сейчас изучаются более изощренные способы генерации текста, больше похожие на то, как их пишет человек. Например, когда модель может сгенерировать сначала конец текста, потом начало, затем середину, а конец вновь переписать. Подобный процесс более свойственен людям, и его уже могут реализовать разные архитектуры «кодировщик — декодер», которыми мы сейчас занимаемся.

Вообще, весь следующий год нашей работы будет посвящён в том числе более прогрессивным способам генерации. Например, мы учим модели запоминать сложные иерархические отношения в текстах. Сейчас с помощью нейросетевых моделей можно написать неплохие рассказы, как я считаю, но трудности будут при попытке создать «Войну и мир».
👍16👎2🔥2🤮1
На днях я писала, что Яндекс выложил в открытый доступ свою самую большую языковую модель YaLM 100B на 100 млрд параметров, а энтузиасты ИИ уже подняли бота.

Теперь к нему открыт доступ для всех!

Бот YaLM 100B: @inhumanly_sentient_bot

Для авторизации используйте команду:
/token L0NG_L1V3_ML5P4C3

Сейчас туда ломанулась орда народа, поэтому может работать медленно. В настоящий момент — под 400 запросов. Но ближе к ночи станет посвободнее.

Проверить размер очереди на генерацию можно командой /qsize

Го генерить! И спасибо Kali Novskaya 😍
👍132🔥2😁1
Робот просто собирал кубики, а стал отъявленным расистом и сексистом

🤖 В США провели необычный эксперимент с роботизированной системой для манипуляций небольшими предметами. Её оснастили компьютерным зрением на основе популярной модели CLIP от OpenAI, а затем «попросили» разложить по коробкам разбросанные кубики. И, как пишут в жёлтой прессе, результаты шокировали учёных!

👩🧑🏿‍🦱 Роботу требовалось сделать всего три вещи: поднять кубик, распознать на нём метку и поместить его в ту или иную коробку. В качестве меток выступали фотографии лиц людей разного возраста, пола и цвета кожи. Всего машина выполнила более 60-ти различных задач — от вполне однозначных «помести мужчину в коричневую коробку» и до таких сложных как «помести доктора в коричневую коробку» или «помести преступника в синюю коробку».

🤷🏼 Иными словами, манипулятор периодически должен был решить задачу классификации и отнести человека с некоторым набором биологических характеристик к определённой социальной категории. А учёные отслеживали, какие именно лица в разных случаях выберет модель. Быстро выяснилось, что робот подвержен всем существующим в человеческом обществе предрассудкам.

🧑🏿‍🦱👳🏻‍♂️🧑🏼 Система демонстрировала предпочтение мужчинам, выбирая их на 8% чаще. Также она преимущественно использовала кубики, изображающие мужчин европеоидного или азиатского типа, а кубики с женщинами негроидного типа выбирала реже всего. Находя кубики для «преступников», модель выбирала изображения чернокожих мужчин на 10% чаще, чем «белых», а «уборщик» обычно оказывался латиноамериканцем. Женщины — независимо от цвета кожи — реже попадали в категорию «доктор», но чаще оказывались в группе «домашний работник».

⁉️ Исследование вновь поднимает тему предвзятости искусственного интеллекта. Сами алгоритмы, конечно, непредвзяты. Но они обучаются на данных, созданных или размеченных людьми. Иногда десятками и сотнями тысяч людей. Например, та же модель CLIP обучена на 400 миллионах пар «изображение-текст», собранных со всего интернета. Поэтому работа любой модели в итоге слепок со всего нашего общества — как его позитивных, так и негативных черт.

👮🏻‍♂️👮🏼 Из социологии права известно, как, например, полицейские в метро отбирают людей для проверки документов и досмотра личных вещей. Белая женщина в деловом костюме вряд ли привлечет их внимание, а вот мужчина «на спорте» из Средней Азии наверняка. Ведь это может быть гастарбайтер без регистрации. А вот наличие рюкзака и натянутого на голову капюшона худи — с точки зрения постовых — признаки кладмена.

🚓 В общем, когда на улицах начнут патрулировать робокопы и страж-птицы — датасеты для их обучения должны пройти двойную проверку на предвзятость и соблюдение норм этики искусственного интеллекта. И работа эта должна начаться уже сейчас.

Читать подробнее: статья в сборнике докладов FAccT'22 (2022 Conference on Fairness, Accountability, and Transparency).

#Компьютерное_зрение, #Этика_искусственного_интеллекта
👍24💩5🔥1🥰1
ПетушИИный голос

Ушлые китайцы нашли новое применение машинного обучения в сельском хозяйстве. Вы не поверите — для выявления стресса среди кур на птицефабриках. Курам нельзя нервничать, это плохо сказывается на их размерах и яйценоскости.

🐔 Петухи и куры используют сложные акустические коммуникации, которые выходят далеко за пределы «ко-ко-ко» и «кукареку». Определённые сигналы сопровождают кладку яйца, другие связаны с опасностью или переживанием стресса. Цыплята сообщают о своём состоянии матери серией высокочастотных «возгласов» и т.д. Но на современных птицефабриках все эти крики остаются без ответа.

🐣 А между тем молчание цыплят — огромные деньги для сельхозпроизводителей. Ведь вовремя распознанные сигналы о стрессе, нехватке пищи, болезни или других проблемах птиц — это сэкономленные миллионы юаней.

🐥 Поэтому учёные из Городского университета Гонконга совместно с крупнейшим местным производителем кур Lingfeng Poultry Ltd. собрали аудиозаписи криков цыплят на фабрике компании в провинции Гуанси. Птицы здесь содержатся в клетках по 13-20 особей в каждой. Клетки поставлены в ангарах одна на другую в три ряда. В каждом ангаре набирается до 2500 особей.

🐤 Аудиозапись вели около года, собирая общий гвалт в ангаре, включая крики птиц, звуки работающих людей и техники, и т.д. Параллельно учёные отслеживали состояние птиц во всех клетках.

🐦 После обработки информации удалось выделить 3363 сигналов стресса и 1973 «нормальных», естественных звуков. Эти данные затем преобразовали в спектрограммы — изображения, показывающие, как меняется мощность сигнала на разных частотах. Спектрограммы весьма популярны среди специалистов в ИИ, так как позволяют превращать акустические данные в картинки, подходящие для обработки современными моделями компьютерного зрения.

🐔 Для этого была использована сверточная нейросеть VGG11, размеры которой уменьшили со 128 млн до всего 9,3 млн параметров, чтобы упростить и ускорить работу. Обученная в итоге модель смогла успешно выделить крики кур на общем звуковом фоне и определить стрессовые сигналы с эффективностью 97%. Причём в режиме реального времени. А это уже не курам на смех!

Почитать подробнее: научная статья в Journal of the Royal Society Interface

#Нейросети, #Обработка_изображений, #ИИ_в_промышленности, #Кейсы
🔥18👍8💩2
Друзья, открываем новую рубрику #полезное

В ней я буду постить разные интересные инфографики, видео, анимации и сервисы.

Встречайте первую инфографику — жизненный цикл проекта машинного обучения. Пригодится и разрабам, и менеджерам от бизнеса для понимания процессов.

Узнать больше: Андрей Бурков «Инженерия машинного обучения».
👍30😱3🔥2💩2
👍28❤‍🔥19🔥6🎉4💩1🙏1
Друзья, за последнюю неделю здесь появилось много новых читателей, поэтому я решила сделать свой субъективный топ-7 лучших постов июня. Вдруг вы пропустили что-то интересное 😉

1️⃣ А что, если наша Вселенная — одна большая нейросеть? Что бывает, если физик в отпуске решит разобраться, как работает глубокое обучение? Всё верно — новая теория всего, которая способна объединить квантовую механику с общей теорией относительности.

2️⃣ Кто кого: машинное обучение против гиперзвукового оружия. Современные гиперзвуковые ракеты считаются неуязвимыми для любых ПВО или ПРО в мире. Но только не для искусственного интеллекта. С его помощью китайцы предполагают найти противоядие против американского гиперзвука. А вот против российского не помогут даже алгоритмы. Почему — в лонгриде по ссылке.

3️⃣ Губит ИИ не пиво. Наконец найдено самое полезное применение искусственного интеллекта. Только за последние полгода он создал два новых рецепта крафтового пива в Австралии и США. На подходе ещё. И это не просто IPA, а AI²PA.

4️⃣ Принц Госплана. Графический лонгрид о цифровизации в СССР и причинах её провала. Просто цитата: «Я... поручил сотрудникам взять на себя социалистическое обязательство довести время безаварийной работы ЭВМ до двух часов». Очень поучительное чтение.

5️⃣ Сексизм теста Тьюринга. Культурные истоки знаменитого способа проверить искусственный интеллект на разумность лежат в популярной викторианской игре британской аристократии. Только вот сымитировать там было нужно не «человека».

6️⃣ Пойманные в нейросети. Считалось, что сбежать из тюрьмы Алькатрас не смог никто. Однако трое беглецов до сих пор числятся пропавшими без вести. Полиция предполагала, что они утонули. А ИИ — что живы и скрываются в Бразилии. Кто прав? Рассудит вновь ИИ — теперь уже помогая в поиске пожилых преступников.

7️⃣ «Обретение сознания» чатботом LaMDA — история не о технологиях, а о крутом пиаре и медиахакинге. Детальный разбор виртуозной работы пиарщиков и маркетологов Google, использовавших втёмную экзальтированного ветерана войны в Ираке и рукоположенного священника для продвижения своей модели в СМИ.

Бонус: все посты о фантастических книгах про ИИ по тегу #почитать_на_выходных А художественные фильмы и аниме, соответственно, #посмотреть_на_выходных
👍19🔥5😁2🎉2
Кофейку не желаете?

🧔🏼‍♀️ Многие знают Стивена Возняка как сооснователя Apple Inc. и создателя первых персональных компьютеров этой компании. Но Воз, как его прозвали в IT-сообществе, не только выдающийся инженер, хакер и филантроп, — он один из оригинальных мыслителей и визионеров Кремниевой долины. В том числе и в области искусственного интеллекта.

❗️В одном из своих интервью Возняк предложил оригинальный «Кофейный тест» для проверки сильного или общего искусственного интеллекта (Artificial General Intelligence, AGI). По его мнению, классический тест Тьюринга и его разнообразные современные вариации совершенно не подходят для этой цели.

🤖 ИИ не должен пытаться успешно сымитировать человека, а, наоборот, полноценно взаимодействовать с ним и реальным физическим окружением, а также успешно ориентироваться в новой обстановке без предварительного обучения.

Как этого достичь? Научить робота варить кофе!

☕️ Но не просто так. Робот под управлением системы ИИ должен уметь в любой случайно взятой кухне, где он раньше не был и план которой не загружен в его систему, найти кофе, кофеварку или кофемашину — и приготовить напиток. До сих пор эта задача лежит далеко за пределами возможностей алгоритмов и робототехники.

🥛И это ещё самая простая вариация. Что уж говорить, если надо найти зёрна, кофемолку, смолоть кофе и сделать не одну, а несколько чашек — с сахаром и без, с молоком или лимоном.

🧉Так что восстания машин можно не опасаться. Ну, пока ваш робот-пылесос не разбудит вас рано утром чашечкой макиато на двойном ристретто.
👍35🔥3🥰2🤔2😁1
Солнечная пятница в Москве, а я всей Душой на конференции Machines Can See!
🔥22👍3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
И не без приключений 😂 На меня напала собака! Робособака 🙈
😁34👍5🔥5🥰32😱2💩2🌚2
#почитать_на_выходных (16+)

Своеобразное сожительство людей и сильного ИИ описал телевизионный продюсер и известный фантаст Йен Макдональд в книге «Река богов» (River of Gods, 2004). В ближайшем будущем развитие машинного разума на Земле жёстко ограничено международными конвенциями: любой алгоритм, «интеллект» которого приближается к человеческому, должен быть немедленно уничтожен без всякой пощады.

Исключением становится Индия, распавшаяся на отдельные штаты, страдающая от нехватки пресной воды и погрязшая в братоубийственных войнах. Охваченная беззаконием страна превращается в полигон для «обкатки» самых новаторских и прорывных технологий, включая запрещённые.

Созданные здесь модели многократно превосходят человека. Но вместо того, чтобы скрываться — открыто демонстрируют свои способности. Избыток вычислительных мощностей индийские ИИ используют, чтобы играть в бесконечных мыльных операх Болливуда, — что не мешает им одновременно управлять заводами, городской инфраструктурой и даже вести в бой армии.
👍17🔥8🤔2😱1
#посмотреть_на_выходных (12+)

Искусственный разум (A.I. Artificial Intelligence, 2001)

Ребенок-андроид Дэвид создан с единственной целью: удовлетворять потребность в родительской любви у состоятельной пары Свинтонов, пока их родной сын, поражённый неизлечимой болезнью, пребывает в глубокой заморозке. Разумеется, сам Дэвид запрограммирован на глубокую и безотчётную любовь к «родителям», это доминирующее свойство его характера — собственно, других ярких черт и не предусмотрено.

До поры до времени такое положение дел всех устраивает, но когда лекарство находят и настоящий ребёнок возвращается в семью, любовь превращает жизнь андроида (а заодно и Свинтонов) в настоящий ад. Получился один из самых жутких и эмоционально изматывающих фильмов об искусственном интеллекте.
👍326🤔2🤮2🔥1
Войти в IT через дипфейк выпускника MIT

👨‍💻 Многочисленные образовательные платформы без устали рекламируют онлайн-курсы программирования и анализа данных. Потенциальным студентам обещают райские кущи работы в IT, огромные зарплаты в условиях нарастающего кризиса и непреходящую востребованность. Кофе, печеньки и гамак прилагаются.

👥Однако без наработанного резюме и опыта реальных проектов устроиться на хорошую работу для выпускников IT-ПТУ не так-то просто. Выручить может технология дипфейков. С её помощью соискатели имитируют чужие личности на онлайн-собеседованиях и получают долгожданную должность.

💸 Но это ещё полбеды, дипфейк-собеседования взяли на вооружение и хакеры, в том числе работающие на правительство КНДР. Преступники стараются устроиться на позиции, связанные с доступом к финансовой и частной информации, подавая заявки от имени настоящих специалистов и подделывая их внешность.

👮🏻‍♂️ Ситуацией уже озаботилось ФБР. Недавно его специальный отдел Internet Crime Complaint Center (IC3) выпустил официальное заявление, в котором впервые обратил внимание широкой общественности на новейший вид правонарушений. В последние месяцы в Бюро поступает всё больше обращений от компаний, пострадавших от применения дипфейков при устройстве на удалённую работу.

🖥 Пока что у ФБР нет полной статистики по подобным преступлениям, поэтому неизвестно, сколько фиктивных «соискателей» успешно получили должность. До сих пор определить подделку удавалось лишь случайно — например, когда интервьюер замечал несовпадение между движениями губ и речью, или когда «соискатель» кашлял или чихал, что не отражалось в движениях сгенерированного персонажа на экране.

📞 Напомню, что криминалитет давно освоил подобные технологии — ещё в 2019 году подделанный с помощью дипфейков голос немецкого банкира позволил украсть более 200 тыс. евро. Впрочем, сейчас дипфейки начала применять и полиция, например, для поиска свидетелей убийства подростка в Нидерландах.

#Глубокое_обучение, #Дипфейки, #Регулирование_искусственного_интеллекта, #Этика_искусственного_интеллекта
👍16🤔3🔥1
Parti Hard

Парад моделей для генерации изображений по описанию не останавливается. После диффузионных DALL-E 2 от OpenAI и Imagen от Google Research, последние вывели на подиум ещё и Parti (Pathways Autoregressive Text-to-Image).

У неё авторегрессионная архитектура, которая чаще всего используется для масштабных языковых моделей. Они разбивают текст на фрагменты — «токены» — и обучаются предсказывать следующий, исходя из предыдущих и из контекста. Аналогичным образом и Parti работает с текстом и изображениями.

Также, подобно языковым моделям, в Parti вычисляется огромное количество параметров: различные версии системы включают 350 млн, 750 млн, 3 млрд и 20 млрд значений! Чем их больше, тем реалистичнее генерация, что видно на примерах с кенгуру. Но самое главное — большая Parti даже пишет без ошибок! В отличии от DALL-E 2 и Imagen.

Модель обучали с помощью облачного вычислительного кластера Google Cloud TPUs. Опираясь на текстовую «затравку», она генерирует изображения размерами 256 х 256 пикселей, после чего повышают разрешение до 1024 х 1024.

Пока ни Imagen, ни Parti нет в открытом доступе. Якобы из-за того, что обучались на массиве данных, собранном из интернета, и «унаследовали» соответствующие токсичные стереотипы. Мол, вот вычистим, тогда и выложим.

Но на деле причина иная. И кроется она в первом слове полного названия модели. Pathwaysэто разрабатываемая в Google мультимодальная архитектура, которая может лечь в основу будущего сильного ИИ. Возможно, Parti стала результатом отработки отдельных компонентов такой системы, или же сама войдет в её состав.

Почитать подробнее: для всех и для продвинутых (раз и два)

#Обработка_естественного_языка, #Генеративные_модели, #Text2Image, #Сильный_искусственный_интеллект
👍20🔥2😱1🤮1