Sber AI – Telegram
Sber AI
39.5K subscribers
2.42K photos
620 videos
1 file
2.05K links
AI для людей: всё об искусственном интеллекте в мире и Сбере 💚

Рассказываем, как AI меняет нашу жизнь, разбираем тренды технологий и делимся новыми разработками!
Download Telegram
😁9
Часть 1
🔥17👍31
Часть 2
👍9🔥6
Кто кого: машинное обучение против гиперзвукового оружия

До недавнего времени гиперзвуковые ракеты считались неуязвимым супероружием. Ни одна система ПВО или ПРО пока неспособна их сбить. Особую опасность гиперзвук представляет для Китая. В случае обострения ситуации вокруг Тайваня США в будущем сможет легко и безнаказанно поражать любые цели на территории Поднебесной.

Однако Пекин не зря вкладывал десятилетиями миллиарды юаней в математиков и специалистов по искусственному интеллекту. Группа учёных и инженеров из Уханя натравила на гиперзвуковые ракеты машинное обучение и придумала способ, как перехватить американские AGM-183 ARRW. Но вот с российским «Цирконом» нового поколения этот фокус не пройдёт, почему — разбираемся в гостевом лонгриде от автора канала «Научпопик».
👍18🔥3
#посмотреть_на_выходных (16+)

Культовая классика, положившая начало эстетике киберпанка. В фильме Ридли Скотта «Бегущий по лезвию» (1982) андроиды выдают себя за людей ради выживания.

Прежде чем отправить разумные машины на космический фронтир, дальновидный производитель Tyrell Corporation снабдила их встроенным механизмом самоуничтожения. Часики тикают, завод вот-вот подойдёт к концу. Чтобы остановить эту бомбу замедленного действия, надо вернуться на Землю, а для этого придётся пройти тест Войта-Кампфа на эмпатию — притвориться человеком.

При этом в душе андроиды презирают человечество, и не без оснований — они изначально умнее, сильнее, хитрее подавляющего большинства людей. Не говоря уже об уникальном жизненном опыте: «Я видел такое, что вам, людям, и не снилось. Боевые корабли, пылающие близ плеча Ориона. Я наблюдал, как сверкают си-лучи во мраке у врат Тангейзера...» — убедительно вспоминает один из них.

Впрочем, профессиональные охотники на андроидов, те самые «бегущие по лезвию», в плане любви к ближнему далеко от машин не ушли. Да и их собственная принадлежность к роду людскому вызывает обоснованные сомнения, особенно если судить по полной режиссёрской версии фильма.

Пост памяти величайшего композитора электронной музыки Вангелиса, ушедшего от нас меньше месяца назад. Его саундтрек стал неотъемлемой частью атмосферы футуристического нуара «Бегущего по лезвию».
🔥82👍1
#почитать_на_выходных (18+)

В романе Чарльза Стросса «Аччелерандо» (Accelerando, 2005) мир на пороге технологической сингулярности. А может быть — перешагнул эту грань. Вычислительные мощности в Солнечной системе растут экспоненциально. Дополненные личности, разумы, перенесенные на электронный носитель, финансовые инструменты, обладающие самосознанием, — здесь всё переплелось и смешалось до полной неразличимости. Самого человека уже не отличить от эволюционировавшего чатбота.

Впрочем, это никого особенно не волнует. Важно только, к каким вычислительным мощностям имеет доступ твой собеседник. Тест Тьюринга не просто пройден, он забыт, как давние подростковые мечты. Единственным партнёром одного из центральных героев книги, чьё происхождение действительно важно, выступают лангусты, «декодированные» и понейронно выгруженные в Сеть «Московским объединением пользователей Windows NT». Ну, и ещё оцифрованный кот, превратившийся в местного божка и свысока взирающий на смешное копошение постчеловечества.
👍8
👍16🔥3👏2🎉1
#по_понятиям

Получила тут комментарий, мол, не все знают, что такое технологическая сингулярность. И действительно, думаю, может постоянную рубрику завести с объяснением разных терминов и понятий из мира ИИ? Если вам зайдёт, то продолжу. Буду судить по реакциям

Главное — все знают, что такое Windows NT!!!

Технологическая сингулярность — понятие, введённое изобретателем, бизнесменом и визионером Рэем Курцвейлем. Это момент, начиная с которого прогресс начнёт развиваться быстрее, чем наш мозг способен его осознать. Такая сингулярность — главное ожидание человечества от появления сильного или общего ИИ (AGI). Обретя способность самостоятельно мыслить и обладая невероятными мощностями, он сможет удовлетворять все наши потребности и решать проблемы, сделав существование людей максимально комфортным.
👍141
«Рыжий кот сидит на заборе» — потрясающе фотореалистичный результат генерации изображений от модели Kandinsky.

Хочется погладить пушистого! ☺️
🔥7👍5🥰3
Очень большой Кандинский — и точка (на плоскости)

Сбер вновь подарил миру немного красоты. Команды из Sber AI и SberDevices дообучили самую большую русскоязычную модель генерации изображений по текстовому описанию — Kandinsky. Теперь её файнтьюн («тонкая настройка» — допиливание модели под конкретную задачу или набор данных) Surrealist XXL создаёт потрясающе реалистичные и детализированные изображения. Впечатляют они не меньше «импрессий» самого Василия Кандинского.

Под капотом

👨‍💻 У Kandinsky 64 слоя и 12 млрд параметров. Основная архитектура такая же, как у оригинальной DALL-E, но компоненты другие (например, используется собственный кодировщик изображений Sber-VQ-GAN). Здесь важно отметить, что ребята из Сбера не просто русифицируют модели OpenAI, как думают некоторые, а по факту создают их для русского языка с нуля, в соответствии с архитектурой англоязычного оригинала.

Главное — данные!

📊 Как обычно — весь цимес в данных. Сперва модель обучала команда SberDevices в течение 20 352 GPU-V100 дней. Это практически 56 лет машинного времени! Здесь использовался датасет на около 60 млн пар «изображение-описание».

🌄🌅 Однако самым важным был следующий этап. Специалисты из Sber AI провели серьёзную работу по очистке датасета LAION-5B, изначально включавшего в себя свыше 170 млн изображений и описаний к ним, от «мусорных» картинок и бессмысленных текстов. В итоге осталось только 119 млн наиболее качественных уникальных пар. На них Kandinsky тренировали ещё 7 680 GPU-A100 дней — более 21 года машинного времени.

Как это всё работает?

🐱 Фраза на русском языке «Рыжий кот сидит на заборе» и соответствующее изображение — это разные типы данных. С помощью энкодеров внутри модели их можно превратить в эмбеддинги, то есть представить как сжатые векторные пространства. Суть в том, что теперь пространства легко соизмерить и обнаружить сходство, а значит взаимно сопоставить описание и картинку.

🔠 Однако предварительно её нужно сгенерировать. Задача тут решается аналогично переводу, только в данном случае с русского на язык визуальной кодовой книги. Для этого фраза токенизируется — преобразуется в последовательность элементарных составных частей — токенов.

🗑 Далее эта последовательность выступает как контекстное условие для генерации в авторегрессионной модели — декодере — последовательности визуальной кодовой книги. После чего состязательно-генеративная модель VQ-GAN превращает последнюю в набор из 64 изображений. А другая модель ruCLIP Large выбирает из них 16 лучших вариантов, проверяя сходство эмбеддингов полученных изображений и текста в общем векторном пространстве.

На последнем этапе отобранные эмбеддинги вновь отправляются в диффузионную или состязательно-генеративную модель (Real-ESRGAN), где происходит апскейл (увеличение разрешения изображения) и добавляется фотореалистичная детализация. Интересно, что диффузионные модели лучше работают для картинок с соотношением сторон 1:1. А Real-ESRGAN — для всех вариантов. Но качество при диффузии всё же обычно выше — лучше передаются текстуры, тени и отражения.

Для профессионалов: увы, поиграться пока можно только с предыдущей моделью Malevich. Её чекпоинт на Hugging Face, а последние файнтюны на GitHub. Но скоро доступ будет и к API Kandinsky.

Для всех: модель доступна в мобильном приложении Салют, на умных устройствах Sber по запросу «Включи художника»
👍7🔥3👏1🤩1