Пупырка AI – Telegram
Пупырка AI
117 subscribers
733 photos
373 videos
1 file
707 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Forwarded from vc.ru
This media is not supported in your browser
VIEW IN TELEGRAM
Китайская Tencent выпустила модель Hunyuan3D World Model. Она создаёт интерактивные 3D-миры для игр, фильмов и VR-приложений.

По получившимся 3D-сценам можно перемещаться или «осматривать» их в режиме панорамы

vc.ru/ai/2125050
Qwen выпустил новую видеомодель Wan 2.2

Теперь вы можете создавать кинематографические кадры, создавать видео с реальными эмоциями и управлять движением камеры с гораздо большей детализацией.

Детали:

🔴Первая в мире видеомодель MoE с открытым исходным кодом: наша архитектура Mix-of-Experts масштабирует емкость модели без увеличения вычислительных затрат.

Специализированные эксперты совместно справляются с диффузионным шумоподавлением временных шагов!

🔴Кинематографическая система управления: напрямую управляйте освещением, цветом, движением камеры, композицией и многим другим!

🔴Модели и возможности с полностью открытым исходным кодом: доступ к преобразованию текста в видео (wan2.2-t2V-A14B), преобразованию изображения в видео (wan2.2-i2V-A14B) и унифицированному созданию видео (wan2.2-TI2V-5B)!

🔴Превосходная способность генерировать сложные движения и многие другие фундаментальные улучшения!

Эта модель поддерживает как преобразование текста в видео, так и изображение в видео с разрешением 720P и частотой 24 кадра в секунду.

Тестить тут
Гитхаб
Hugging Face

#новости@dailyprompts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Runway выпустила функцию Aleph

Runway выпустила Aleph, мощную контекстную видео-модель для редактирования и генерации видео непосредственно на платформе.

Основные моменты:

🔴Современное редактирование видео в режиме чата

🔴Редактируйте, анимируйте и создавайте видео в диалоговом режиме

🔴Система построена на той же инфраструктуре, что и Runway Gen 4, для обеспечения согласованности сцен и снимков

Тестить тут

#новости@dailyprompts
Please open Telegram to view this post
VIEW IN TELEGRAM
Продолжаем грызть науку LLM-строения.
В прошлых 5 публикациях мы поняли, из каких кубиков состоит LLM-система. Сейчас пришло время из них что-то собирать.
А как собирать?

Тема 6. Этапы LLM-проекта


Я делю разработку на 4 этапа:

1) Бизнес постановка

2) Создание прототипа

3) Упрощение протототипа

4) Деплой системы и мониторинг качества

Бизнес постановка

Нам нужны частотные и дорогие задачи. Важно, чтобы была толерантность к ошибкам — близкое к 100% качество у LLM бывает разве что в простой классификации. Классические примеры:

- Бот поддержки клиентов — большой объем, средняя толерантность, средняя стоимость операции

- Copilot для разработчика — средний объем, высокая толерантность (copilot же), высокая стоимость операции

- Автоматизация документооборота— средний объем, средняя толерантность, средняя стоимость операции

Создание прототипа

Проблема подавляющего большинства ИИ-проектов: когда начинается плотная разработка никто не понимает, что надо сделать. И начинают выдумывать на ходу, когда надо не выдумывать, а надо уже делать. Подумать надо было заранее. И все ваше подумывание отразить в прототипе.

Цель прототипа: получить продуктовый ориентир, что наша система должна уметь. При этом там могут быть какие угодно большие модели, он может работать час на запрос и ломаться от промпт-инъекций. Не ругайте его. Он исправится на следующем этапе. Признак успеха этого этапа: человек, который делал бизнес постановку скажет: "вот сделайте такое, только быстро, и я буду счастлив".

Важно: прототип могут и должны собирать люди, которые участвовали в этапе бизнес постановки. Иначе у вас получится опять сферическая LLM в вакууме. Про это читайте пост.

Упрощение протототипа

Здесь сильные технические люди крутят-вертят LLM. Чтобы прототип не стоил, как запуск ракеты Илона Маска.
Большое разнообразие различных вариантов:

1) Дистилляция. Большие модели нужно сжать в модели поменьше. Качество может теряться, но если мы решаем конкретную узкую задачу, должно упасть не сильно. Вот тут подробный разбор метода.

2) Дообучение. Можно не дистиллировать, а просто взять модель поменьше. Но тогда придется их покрутить, так как они справляться будут хуже. Здесь приходит на помощь дообучение (особенно Reinforcement Learning). Вот тут много примеров по дообучению разных LLM разными методами.

3) Работа с контекстом окном. Убирание лишнего из контекста, суммаризация (я пока не устал шутить про контекст-инженера)

4) Оптимизации. Тут отдельный мир: размер батча/квантизация/спекулятивный декодинг. Про это есть отдельная методичка в этом посте.

И еще куча-куча всего. Тут живет мощная LLM-инженерия.

Деплой и мониторинг качества

Здесь происходит классическая разработка. Пишется сервис, в котором работает наша эффективная система. Самое важное: нам нужно контролировать качество этого сервиса. При чем не разово, а постоянно. Зачем?

Во-первых, мы могли где-то набагать при написании сервиса. Во-вторых, мы можем набагать попозже. И еще есть distribution shift, когда пользователи по-другому начинаются пользоваться системой, и она начинает хуже работать. Про это неплохо написано в моем любимом учебнике по DL.

Литература для обязательного изучения

- Довольно понятная (мне) моя статья. Часть материала пересекается с постом.

- Гайд, как быстро улучшать AI-продукты

- Очень крутая статья про мониторинг и distribution shift


Как всегда, жду вопросы в комментариях или в личных сообщениях.
Дальше будем разбирать методы оценки качества для LLM, готовьтесь.

#llm_system_design
Forwarded from эйай ньюз
Для подписчиков Claude введут недельные лимиты

Изменение войдёт в силу через месяц — 28 августа и будет касаться как подписчиков Plus так и подписчиков Max. По словам Anthropic, это нужно так как некоторые пользователи подписки Max используют запросов в Claude Code на десятки тысяч долларов по API прайсингу.

Сейчас лимиты полностью сбрасываются каждые 5 часов, после апдейта этот лимит останется, но поверх него будет введён новый лимит на использование, который будет сбрасываться раз в неделю. После достижения лимита продолжить пользователям предложат платить за API. По словам Anthropic, изменения заденут менее 5% пользователей.

@ai_newz
Forwarded from vc.ru
Microsoft начала тестировать в Edge режим Copilot — он добавляет в браузер ИИ-помощника, который умеет просматривать страницы, сравнивать содержимое вкладок, анализировать действия в интернете и помогать с бронированиями или покупками.

Пока он доступен бесплатно

vc.ru/ai/2126234
Forwarded from Сиолошная
А разработчики Cursor уже во всю тестируют какую-то новую модель. Интересно, что там за название за размытием 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3
Forwarded from Denis Sexy IT 🤖
В ChatGPT добавили режим обучения – теперь она будет не отвечать на вопрос, если нужно, а будет помогать на него отвечать самому и оценивать знания, и так по кругу пока тема не закрепится

В веб-версии и аппах уже работает
1
Forwarded from e/acc
Кто-то собрал целую команду стартапа из Клод-агентов. Скачать бесплатно и без регистрации тут.
2👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Notebook LM научили делать видео-овервью и другие апдейты. Собирает такие видео-презы с картинками, в анонсе выглядит прикольно, надо тестить

Блог заметка
2
Google продолжать превращать AI mode в поиске в полноценного ассистента — Canvas режим для сценариев образования (make a study plan) и работа с файлами. Пока запущено в US и частично, неожиданно, в Индии.

Ну и другие интеграции в блоге
Forwarded from Intermission