Исследователи из Yandex Research разработали новый подход генерации изображений и назвали Switty (Scale-wise transformer for text-to-image synthesis). Он не уступает диффузионным моделям по качеству, но при этом намного быстрее. Switti генерирует изображения всего за 0,1 секунды - буквально космическая скорость!
Для сравнения: это в 7 раз быстрее, чем у оригинального SDXL и в 2 раза быстрее, чем у ускоренных версий, таких как SDXL-Turbo и SDXL-DMD2! (Надеюсь, вы следите за разработками в сфере генеративных нейросетей и знаете, что такое SDXL-Turbo и SDXL-DMD2😅).
Хоть модель и создана на базе авторегрессионных моделей, Switti уже превосходит как предыдущие AR, так и зарубежные диффузионные модели в скорости.
Демка на huggingface
Статья на arxiv
А вот тут код
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍10❤1
Буст в мире языковых моделей: T-Pro и T-Lite от «Т-Технологий»
🐺 Группа «Т-Технологии», куда входит и Т–Банк, представила две новые открытые языковые модели на русском языке — T-Pro и обновленную T-Lite, которые по результатам индустриальных бенчмарков «ruMMLU», «Ru Arena Hard» и еще ряда превосходят существующие аналоги.
🏆 Модель T-Pro с 32 миллиардами параметров занимает первое место среди открытых моделей на русском языке, а T-Lite с 7 миллиардами параметров — лучшее решение в категории до 10 миллиардов параметров. Эти модели позволяют российским компаниям сэкономить до 90% затрат на разработку собственных решений. То есть теперь изи использовать мощные инструменты для автоматизации процессов, создания чат-ботов и ассистентов.
🦈 Фишка у T-Pro и T-Lite в высокой точности, контекстуальности и адаптивности - это позволяет легко настраивать их под специфические задачи различных доментов, от финансов до медицины. Например, T-Lite лучше улавливает контекст и выдает более точные ответы, а T-Pro позволяет дообучаться под конкретные
бизнес-задачи.
🎚 ️ Почему это круто? Появление и последующих языковых моделей не только ускорит развитие кучу бизнесов, но и даст мощный импульс для экономики в целом.
бизнес-задачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24🔥14👍9👎7🎉3
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37❤8👎5🔥5⚡4
This media is not supported in your browser
VIEW IN TELEGRAM
👍13🔥12🏆8👎3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥18❤8⚡7
Forwarded from AI Education (Elena Kantonistova)
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, друзья! 👋
Мы продолжаем выпускать материалы, посвященные Computer Vision и приуроченные к старту специализации по компьютерному зрению!
Уже появилась наша статья про построение HOG-дескрипторов - классический подход для получения признаков из изображений.
В современном глубинном обучении для извлечения признаков используют свертки и сверточные сети - про них мы хотим вам рассказать на открытом вебинаре, который пройдет 16 декабря в 19:30 по Мск! На вебинаре мы также упомянем тему обработки видеопотоков в реальном времени.
Ждем вас на вебинаре (ссылка появится в нашем канале накануне)! Всегда Ваш, @ai_edu🎄
Мы продолжаем выпускать материалы, посвященные Computer Vision и приуроченные к старту специализации по компьютерному зрению!
Уже появилась наша статья про построение HOG-дескрипторов - классический подход для получения признаков из изображений.
В современном глубинном обучении для извлечения признаков используют свертки и сверточные сети - про них мы хотим вам рассказать на открытом вебинаре, который пройдет 16 декабря в 19:30 по Мск! На вебинаре мы также упомянем тему обработки видеопотоков в реальном времени.
Ждем вас на вебинаре (ссылка появится в нашем канале накануне)! Всегда Ваш, @ai_edu
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍1
Я парень простой, вижу как коллеги из вышки что-то полезно запускают - делюсь!
🔥18❤3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe показали прикольную фичу MultiFoley — генерацию ЗВУКОВ под ваше видео.
Идея бомбезная: можно не просто генерировать соответствующие звуки, но и что-то сюрреалистичное, но воспринимаемое правдоподобно. Например, рычащего как лев кота🤬
Кроме того, модель теперь умеет принимать в качестве промта другое аудио (как референс), а также удлинять аудио (очень удобно, если где-то запороли звук).
Кода нет (это же Адобе), ждем в продуктах компании.
🎚️ @datafeeling
Идея бомбезная: можно не просто генерировать соответствующие звуки, но и что-то сюрреалистичное, но воспринимаемое правдоподобно. Например, рычащего как лев кота
Кроме того, модель теперь умеет принимать в качестве промта другое аудио (как референс), а также удлинять аудио (очень удобно, если где-то запороли звук).
Кода нет (это же Адобе), ждем в продуктах компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤22🎃6
Media is too big
VIEW IN TELEGRAM
Одну из серий полностью посвятили нейросетям. Например, рассказали, как устроен пайплайн моделей в сервисе «Нейро». Выглядит он следующим образом:
Рефразер: Преобразует вопрос в оптимальный поисковый запрос, сохраняя контекст диалога. Он может формулировать до 5 вариантов запроса.
Поисковая система: Извлекает наиболее релевантные ответы на основе уточненных запросов.
Инфоконтекст: Задействуется база данных для создания развернутых ответов.
YandexGPT: Нейросеть генерирует готовый ответ.
Еще из интересного: в «Нейро» интегрировали мультимодальные VLM (Vision-Language Models). Сервис может обрабатывать и анализировать не только тексты, но и всю визуальную информацию на фото.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥6❤5👎4
Meta решили перебить анонсы от OpenAI и выпустили LLaMa 3.3 70b.
Релиз РЕВОЛЮЦИОННЫЙ: модель среднего размера (70b) почти не отстаёт (!), а в некоторых тестах и опережает (!!) 405b модели, и даже GPT-4o (!!!) 😱
🎚️ Сама моделька здесь, но на домашнем компе не потянет.
Релиз РЕВОЛЮЦИОННЫЙ: модель среднего размера (70b) почти не отстаёт (!), а в некоторых тестах и опережает (!!) 405b модели, и даже GPT-4o (!!!) 😱
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍2
Ты: мечтаешь найти работу в ИИ.
Вакансии, на которые тебя зовут:🤣
Вторая, кстати, звучит не так плохо.
🎚️ #юмор @datafeeling
Вакансии, на которые тебя зовут:
Вторая, кстати, звучит не так плохо.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁43👍4🔥4❤1
Please open Telegram to view this post
VIEW IN TELEGRAM
😁68😈3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥На днях посмотрел подкаст о развитии в сферах ML и Data Science.
На канале MLinside вышло интервью с Алексеем Толстиковым, руководителем Школы анализа данных Яндекса. Его стоит посмотреть тем, кто хочет прокачать свои навыки в ML/DS.
Что обсудили:
🔵 Какие скиллы нужны, чтобы быть востребованным ML-специалистом
🔵 Почему без математики и алгоритмов не обойтись, но только технических навыков недостаточно
🔵 Можно ли изучать DS самостоятельно
🔵 Как поступить и осилить учебу в ШАДе
Смотрите подкаст – тык
🎚️ Вдохновляйтесь, учитесь и делайте мир лучше! 🚀
На канале MLinside вышло интервью с Алексеем Толстиковым, руководителем Школы анализа данных Яндекса. Его стоит посмотреть тем, кто хочет прокачать свои навыки в ML/DS.
Что обсудили:
🔵 Какие скиллы нужны, чтобы быть востребованным ML-специалистом
🔵 Почему без математики и алгоритмов не обойтись, но только технических навыков недостаточно
🔵 Можно ли изучать DS самостоятельно
🔵 Как поступить и осилить учебу в ШАДе
Смотрите подкаст – тык
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤6👍2🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь у ChatGPT есть свой номер телефона, и вы можете ему звонить или писать, даже если у вас нет аккаунта! 😱
📱 Праздничные сюрпризы от OpenAI продолжаются. OpenAI представила возможность общения с ChatGPT через телефонный номер, включая отправку сообщений через WhatsApp.
Эта функция работает даже на старых проводных телефонах!
Номер для звонков ChatGPT (для США и Канады) - 1-800-242-8478. В других регионах можно писать ChatGPT в WhatsApp.
👉🏻 Чтобы начать пользоваться этой функцией, добавьте номер +1 (800) 242-8478 в свои контакты. После этого вы сможете отправлять сообщения ChatGPT в WhatsApp, как обычному контакту.
❗️Для пользователей из США предоставляется 15 минут звонков в месяц на один номер телефона. ❗️Отправка сообщений через WhatsApp доступна везде, где работает ChatGPT.
🎚️ Кто уже пробовал? Я пока жду ответа от ChatGPT в WhatsApp.
📱 Праздничные сюрпризы от OpenAI продолжаются. OpenAI представила возможность общения с ChatGPT через телефонный номер, включая отправку сообщений через WhatsApp.
Эта функция работает даже на старых проводных телефонах!
Номер для звонков ChatGPT (для США и Канады) - 1-800-242-8478. В других регионах можно писать ChatGPT в WhatsApp.
👉🏻 Чтобы начать пользоваться этой функцией, добавьте номер +1 (800) 242-8478 в свои контакты. После этого вы сможете отправлять сообщения ChatGPT в WhatsApp, как обычному контакту.
❗️Для пользователей из США предоставляется 15 минут звонков в месяц на один номер телефона. ❗️Отправка сообщений через WhatsApp доступна везде, где работает ChatGPT.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15👎10🔥4 4❤1
Попробуйте сами себе прическу подобрать. Очень качественно получается. Определенно полный балл за проект!
🤯
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23😁10👍7👎4❤3