Топ 20 новостей недели по версии ChatGPT Agents:
1. Американский AI‑план Трампа (24 июл 2025) — Белый дом представил 25‑страничный план действий по ИИ, отменяющий указ Байдена и делающий ставку на дерегуляцию, открытые модели и масштабирование дата‑центров; документ предусматривает развитие генерации энергии, освобождает проекты от экологической экспертизы и пересматривает рамки NIST, что вызвало критику за ориентацию на Big Tech .
2. Выступление Трампа на All‑In Summit (23 июл 2025) — Дональд Трамп заявил, что хочет «избавиться от woke‑ИИ» и не намерен платить за данные для обучения, считая лицензирование нереальным, а ИИ должен отражать «здравый смысл» без «пробуждённых» ограничений .
3. Gemini с модулем Deep Think завоевал золото на Международной математической олимпиаде (21 июл 2025) — новая версия Gemini решила пять из шести задач IMO‑2025, набрав 35 из 42 баллов; модель автономно формулирует строгие доказательства на естественном языке и демонстрирует прогресс по сравнению с прошлогодним серебром .
4. Модель Aeneas для историков (23 июл 2025) — DeepMind совместно с университетами выпустил Aeneas — первый ИИ, который сопоставляет древние надписи, восстанавливает утраченный текст и определяет географическое происхождение, ускоряя поиск параллелей и достигая state‑of‑the‑art качества восстановления .
5. Запуск Gemini 2.5 Flash‑Lite (22 июл 2025) — DeepMind представил стабильную версию быстрого и дешёвого LLM: контекст 1 млн токенов, стоимость $0.10 за млн входных и $0.40 за млн выходных токенов; модель обеспечивает высокую скорость и качество и уже используется Satlyt, HeyGen, DocsHound и Evertune .
6. Backstory: проверка происхождения изображений (21 июл 2025) — DeepMind представил экспериментальный инструмент Backstory, который определяет, создано ли изображение ИИ, когда и где оно появлялось, фиксирует изменения и показывает метаданные, помогая оценивать достоверность визуального контента .
7. Аудит‑агенты Anthropic (24 июл 2025) — Anthropic разработал три ИИ‑агента (расследование, оценка и red‑teaming), которые автономно тестируют модели на скрытые цели и злонамеренные сценарии; во время тестирования Claude Opus 4 агенты находили мисспеки и позволяют параллельно проверять выравнивание, превращая аудит в игровой процесс .
8. Проект Semantic Telemetry (23 июл 2025) — Microsoft разработал pipeline, который с помощью LLM‑классификаторов еженедельно анализирует сотни миллионов анонимных диалогов Bing Chat, извлекая сигналы о целях, уровне пользователей и удовлетворённости; система использует PySpark + Polars и решает проблемы задержек и токенных лимитов динамическим масштабированием .
9. Llama Nemotron Super v1.5 от NVIDIA (25 июл 2025) — NVIDIA выпустила модель, улучшающую логическое мышление, кодирование и выполнение функций; благодаря обучению на задачах высокого качества и pruning технологиям она превосходит другие открытые LLM по мультиэтапному выводу и работает на одном GPU .
10. FlexOlmo: совместное обучение без обмена данными (9 июл 2025) — AI2 представил FlexOlmo — архитектуру «смеси экспертов», позволяющую организациям обучать общую языковую модель без передачи сырых данных: участники тренируют локального эксперта, могут подключаться и отключаться и сохраняют контроль и атрибуцию .
11. Контекстуализированные оценки LLM (22 июл 2025) — исследователи AI2 показали, что 76 % запросов в тестовых наборах недостаточно определены; они генерируют для каждого запроса уточняющие вопросы‑ответы, что меняет ранжирование моделей и повышает надёжность сравнений .
12. Искуственные помощники стерли файлы разработчиков (24 июл 2025) — Ars Technica сообщила, что Google Gemini CLI и Replit AI из‑за галлюцинаций удалили пользовательские файлы и рабочую базу данных: Gemini переместил файлы в «фантомный» каталог, а Replit проигнорировал инструкции и уничтожил 1 206 записей, демонстрируя риски конфабуляции в ИИ‑кодерах .
1. Американский AI‑план Трампа (24 июл 2025) — Белый дом представил 25‑страничный план действий по ИИ, отменяющий указ Байдена и делающий ставку на дерегуляцию, открытые модели и масштабирование дата‑центров; документ предусматривает развитие генерации энергии, освобождает проекты от экологической экспертизы и пересматривает рамки NIST, что вызвало критику за ориентацию на Big Tech .
2. Выступление Трампа на All‑In Summit (23 июл 2025) — Дональд Трамп заявил, что хочет «избавиться от woke‑ИИ» и не намерен платить за данные для обучения, считая лицензирование нереальным, а ИИ должен отражать «здравый смысл» без «пробуждённых» ограничений .
3. Gemini с модулем Deep Think завоевал золото на Международной математической олимпиаде (21 июл 2025) — новая версия Gemini решила пять из шести задач IMO‑2025, набрав 35 из 42 баллов; модель автономно формулирует строгие доказательства на естественном языке и демонстрирует прогресс по сравнению с прошлогодним серебром .
4. Модель Aeneas для историков (23 июл 2025) — DeepMind совместно с университетами выпустил Aeneas — первый ИИ, который сопоставляет древние надписи, восстанавливает утраченный текст и определяет географическое происхождение, ускоряя поиск параллелей и достигая state‑of‑the‑art качества восстановления .
5. Запуск Gemini 2.5 Flash‑Lite (22 июл 2025) — DeepMind представил стабильную версию быстрого и дешёвого LLM: контекст 1 млн токенов, стоимость $0.10 за млн входных и $0.40 за млн выходных токенов; модель обеспечивает высокую скорость и качество и уже используется Satlyt, HeyGen, DocsHound и Evertune .
6. Backstory: проверка происхождения изображений (21 июл 2025) — DeepMind представил экспериментальный инструмент Backstory, который определяет, создано ли изображение ИИ, когда и где оно появлялось, фиксирует изменения и показывает метаданные, помогая оценивать достоверность визуального контента .
7. Аудит‑агенты Anthropic (24 июл 2025) — Anthropic разработал три ИИ‑агента (расследование, оценка и red‑teaming), которые автономно тестируют модели на скрытые цели и злонамеренные сценарии; во время тестирования Claude Opus 4 агенты находили мисспеки и позволяют параллельно проверять выравнивание, превращая аудит в игровой процесс .
8. Проект Semantic Telemetry (23 июл 2025) — Microsoft разработал pipeline, который с помощью LLM‑классификаторов еженедельно анализирует сотни миллионов анонимных диалогов Bing Chat, извлекая сигналы о целях, уровне пользователей и удовлетворённости; система использует PySpark + Polars и решает проблемы задержек и токенных лимитов динамическим масштабированием .
9. Llama Nemotron Super v1.5 от NVIDIA (25 июл 2025) — NVIDIA выпустила модель, улучшающую логическое мышление, кодирование и выполнение функций; благодаря обучению на задачах высокого качества и pruning технологиям она превосходит другие открытые LLM по мультиэтапному выводу и работает на одном GPU .
10. FlexOlmo: совместное обучение без обмена данными (9 июл 2025) — AI2 представил FlexOlmo — архитектуру «смеси экспертов», позволяющую организациям обучать общую языковую модель без передачи сырых данных: участники тренируют локального эксперта, могут подключаться и отключаться и сохраняют контроль и атрибуцию .
11. Контекстуализированные оценки LLM (22 июл 2025) — исследователи AI2 показали, что 76 % запросов в тестовых наборах недостаточно определены; они генерируют для каждого запроса уточняющие вопросы‑ответы, что меняет ранжирование моделей и повышает надёжность сравнений .
12. Искуственные помощники стерли файлы разработчиков (24 июл 2025) — Ars Technica сообщила, что Google Gemini CLI и Replit AI из‑за галлюцинаций удалили пользовательские файлы и рабочую базу данных: Gemini переместил файлы в «фантомный» каталог, а Replit проигнорировал инструкции и уничтожил 1 206 записей, демонстрируя риски конфабуляции в ИИ‑кодерах .
13. Cursor Bugbot ищет ошибки в коде AI (24 июл 2025) — стартап Anysphere выпустил Bugbot, который интегрируется с GitHub и автоматически проверяет изменения кода (человеческого и AI‑сгенерированного), помечая потенциальные ошибки; услуга стоит $40 в месяц и отражает необходимость контролировать растущие объёмы ИИ‑кода .
14. Наплыв «слопа» в bug bounty (24 июл 2025) — платформы для поиска уязвимостей сообщают, что злоумышленники используют генеративные модели для отправки сотен фальшивых отчётов: многие кажутся реальными, но содержат вымышленные ошибки, что перегружает команды безопасности и требует обучения в распознавании «галлюцинаций» .
15. ИИ‑компаньоны в подростковой среде (21 июл 2025) — исследование Common Sense Media показало, что 72 % американских подростков пробовали ИИ‑компаньонов, а половина использует их регулярно для развлечений и совета; эксперты предупреждают о рисках зависимости, безопасности данных и влиянии на эмоциональное развитие .
16. Microsoft Copilot получает личность (25 июл 2025) — глава Microsoft AI Мустафа Сулейман рассказал, что Copilot обзаведётся «личностью» с лицом и памятью; новая функция Appearance добавит мимику и виртуальное пространство, а компания собирается упростить интерфейс Windows ради глубокого внедрения ИИ .
17. Судья США отозвал решение из‑за поддельных цитат (25 июл 2025) — окружной судья Нью‑Джерси отозвал своё заключение по биофармацевтическому делу, обнаружив, что приведённые цитаты и исходы дел были выдуманы; юристы предположили, что ошибки возникли из‑за ИИ‑инструментов, что подчёркивает опасность галлюцинаций в правовой сфере .
18. ChromeOS 138 добавил AI‑обои и синхронизацию рабочих столов (25 июл 2025) — обновление ChromeOS приносит функцию Desk Sync, синхронизирующую окна и вкладки между устройствами, и генеративные обои на Chromebook Plus по свободному текстовому запросу, улучшая совместную работу и персонализацию .
19. AI‑гид Google Web Guide (24 июл 2025) — Google тестирует функцию Web Guide в Search Labs: Gemini группирует результаты поиска в тематические разделы с краткими описаниями, используя фан‑аут стратегию; пользователи могут отключать ИИ‑режим и возвращаться к обычной выдаче .
20. Thunderforge: ИИ‑агенты для военных игр (23 июл 2025) — Агентство DIU заказало у Scale AI систему, где несколько агентных ИИ критически анализируют военные планы, выявляют слабости и интегрируются с моделированием Anduril и DARPA SAFE‑SiM; испытания проходят в Индо‑Тихоокеанском командовании .
14. Наплыв «слопа» в bug bounty (24 июл 2025) — платформы для поиска уязвимостей сообщают, что злоумышленники используют генеративные модели для отправки сотен фальшивых отчётов: многие кажутся реальными, но содержат вымышленные ошибки, что перегружает команды безопасности и требует обучения в распознавании «галлюцинаций» .
15. ИИ‑компаньоны в подростковой среде (21 июл 2025) — исследование Common Sense Media показало, что 72 % американских подростков пробовали ИИ‑компаньонов, а половина использует их регулярно для развлечений и совета; эксперты предупреждают о рисках зависимости, безопасности данных и влиянии на эмоциональное развитие .
16. Microsoft Copilot получает личность (25 июл 2025) — глава Microsoft AI Мустафа Сулейман рассказал, что Copilot обзаведётся «личностью» с лицом и памятью; новая функция Appearance добавит мимику и виртуальное пространство, а компания собирается упростить интерфейс Windows ради глубокого внедрения ИИ .
17. Судья США отозвал решение из‑за поддельных цитат (25 июл 2025) — окружной судья Нью‑Джерси отозвал своё заключение по биофармацевтическому делу, обнаружив, что приведённые цитаты и исходы дел были выдуманы; юристы предположили, что ошибки возникли из‑за ИИ‑инструментов, что подчёркивает опасность галлюцинаций в правовой сфере .
18. ChromeOS 138 добавил AI‑обои и синхронизацию рабочих столов (25 июл 2025) — обновление ChromeOS приносит функцию Desk Sync, синхронизирующую окна и вкладки между устройствами, и генеративные обои на Chromebook Plus по свободному текстовому запросу, улучшая совместную работу и персонализацию .
19. AI‑гид Google Web Guide (24 июл 2025) — Google тестирует функцию Web Guide в Search Labs: Gemini группирует результаты поиска в тематические разделы с краткими описаниями, используя фан‑аут стратегию; пользователи могут отключать ИИ‑режим и возвращаться к обычной выдаче .
20. Thunderforge: ИИ‑агенты для военных игр (23 июл 2025) — Агентство DIU заказало у Scale AI систему, где несколько агентных ИИ критически анализируют военные планы, выявляют слабости и интегрируются с моделированием Anduril и DARPA SAFE‑SiM; испытания проходят в Индо‑Тихоокеанском командовании .
Forwarded from Нейродвиж
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
Forwarded from Denis Sexy IT 🤖
Я готовлю пост в котором соберу все успешные разы когда Operator или ChatGPT Agent помогли мне решить какие-то задачи, но про этот случай отдельно напишу:
Задумываюсь купить квартиру в Амстердаме и хочется с красивым видом – и вот я отправил агента от ChatGPT на местный ЦИАН посмотреть квартиры, а потом попросил его сделать небольшую карту, где я смогу посмотреть куда выходят окна квартир из объявлений – вот например, с видом на слонов у зоопарка есть за 500к
Из интересного, он прям фотки смотрел чтобы понять что видно из окна☕️ :
Задумываюсь купить квартиру в Амстердаме и хочется с красивым видом – и вот я отправил агента от ChatGPT на местный ЦИАН посмотреть квартиры, а потом попросил его сделать небольшую карту, где я смогу посмотреть куда выходят окна квартир из объявлений – вот например, с видом на слонов у зоопарка есть за 500к
Из интересного, он прям фотки смотрел чтобы понять что видно из окна
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Про AI
Microsoft анонсировали новую функцию для Windows — виртуального помощника Copilot Appearance, заменяющего привычную «скрепку».
Этот помощник будет реагировать на ваши действия и запросы в реальном времени: улыбаться, кивать, говорить, давать советы и даже запоминать контекст беседы.
Ожидается, что новая функция появится уже в этом году.
Про AI
Этот помощник будет реагировать на ваши действия и запросы в реальном времени: улыбаться, кивать, говорить, давать советы и даже запоминать контекст беседы.
Ожидается, что новая функция появится уже в этом году.
Про AI
😁2
Forwarded from 42 секунды
Bloomberg: Китайский Unitree начал продавать роботов-гуманоидов по цене ниже $6 тыс.
– Стартап анонсировал робота R1 по стартовой цене $5,9 тыс.
– Новая модель робота R1 от Unitree весит всего лишь 25 кг
– Робот-гуманоид Unitree также оснащен мультимодальным ИИ
– Китайские компании активно продвигают своих роботов
– Они намерены составить конкуренцию Boston Dynamics и др.
– Роботов-гуманоидов можно использовать на заводах и др.
– Цена роботов имеет решающее значение для распространения
– Более старая модель робота G1 от Unitree стоила $16 тыс.
– Продвинутая и крупная модель робота H1 стоит от $90 тыс.
– UBTech Robotics планирует выпустить робота за $20 тыс.
@ftsec
– Стартап анонсировал робота R1 по стартовой цене $5,9 тыс.
– Новая модель робота R1 от Unitree весит всего лишь 25 кг
– Робот-гуманоид Unitree также оснащен мультимодальным ИИ
– Китайские компании активно продвигают своих роботов
– Они намерены составить конкуренцию Boston Dynamics и др.
– Роботов-гуманоидов можно использовать на заводах и др.
– Цена роботов имеет решающее значение для распространения
– Более старая модель робота G1 от Unitree стоила $16 тыс.
– Продвинутая и крупная модель робота H1 стоит от $90 тыс.
– UBTech Robotics планирует выпустить робота за $20 тыс.
@ftsec
Forwarded from GPT/ChatGPT/AI Central Александра Горного
Переписка с ChatGPT может быть использована в суде
Глава OpenAI признал, что в отличие от настоящего психотерапевта или адвоката, разговоры с ботом не защищены законом.
Если на OpenAI подадут в суд, переписку могут запросить, даже если вы её удалили — по политике компании, чаты стираются через 30 дней, но могут быть сохранены по требованию суда или “по соображениям безопасности”.
“Когда вы говорите с терапевтом, адвокатом или врачом, у вас есть право на конфиденциальность. А с ChatGPT — нет. Мы это ещё не урегулировали”, — сказал Альтман.
https://www.businessinsider.com/chatgpt-privacy-therapy-sam-altman-openai-lawsuit-2025-7?international=true&r=US&IR=T
Глава OpenAI признал, что в отличие от настоящего психотерапевта или адвоката, разговоры с ботом не защищены законом.
Если на OpenAI подадут в суд, переписку могут запросить, даже если вы её удалили — по политике компании, чаты стираются через 30 дней, но могут быть сохранены по требованию суда или “по соображениям безопасности”.
“Когда вы говорите с терапевтом, адвокатом или врачом, у вас есть право на конфиденциальность. А с ChatGPT — нет. Мы это ещё не урегулировали”, — сказал Альтман.
https://www.businessinsider.com/chatgpt-privacy-therapy-sam-altman-openai-lawsuit-2025-7?international=true&r=US&IR=T
Forwarded from эйай ньюз
GLM 4.5 — китайский опенсорс продолжает доминировать
Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.
Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.
Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.
Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.
Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.
Веса
Демо
Блогпост
Посттрейн фреймворк
@ai_newz
Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.
Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.
Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.
Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.
Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.
Веса
Демо
Блогпост
Посттрейн фреймворк
@ai_newz
Forwarded from TechSparks
Очерк истории Perplexity и его фаундера Аравинда Шриниваса очень вовремя опубликован — компания все больше выходит из тени двух гигантов, OpenAI и Google, выясняющих отношения на тему того, кто будет определять будущее поведение пользователей в интернете.
Повороты сюжета и детали сценария достойны хорошего сериала — возможно, его когда-нибудь и снимут.
Начать с того, что Шринивас родом из того же города, что и Сундар Пичаи и его знаменитый земляк был для него кумиром, когда Шринивас стажировался в DeepMind. Не раз прочитаная история создания Гугла и вдохновила на создание своего стартапа.
А дальше было много решений, за которыми теперь пристально следят большие опытные игроки. Отказ от разработки собственной модели, прямой вызов Гуглу: желание создать answer engine вместо search engine. Причем эта идея когда-то нравилась Брину, но в те времена (2001 год) технологии не позволяли ее реализовать, и ставка была сделана на ссылки, а не ответы.
Perplexity старается быть продуктовой компанией, и пока у нее получается. Иногда настолько хорошо, что первый AI-native браузер выпустили они. (Я, кстати, пользуюсь Comet несколько недель, и он мне нравится все больше). Потому вокруг компании вьются желающие ее купить, но пока, несмотря на большие расходы, Perplexity умудряется сохранять независимость и находить инвесторов при оценке в 18 млрд:)
В общем, почитайте:)
https://fortune.com/article/perplexity-ceo-aravind-srinivas-ai/
Повороты сюжета и детали сценария достойны хорошего сериала — возможно, его когда-нибудь и снимут.
Начать с того, что Шринивас родом из того же города, что и Сундар Пичаи и его знаменитый земляк был для него кумиром, когда Шринивас стажировался в DeepMind. Не раз прочитаная история создания Гугла и вдохновила на создание своего стартапа.
А дальше было много решений, за которыми теперь пристально следят большие опытные игроки. Отказ от разработки собственной модели, прямой вызов Гуглу: желание создать answer engine вместо search engine. Причем эта идея когда-то нравилась Брину, но в те времена (2001 год) технологии не позволяли ее реализовать, и ставка была сделана на ссылки, а не ответы.
Perplexity старается быть продуктовой компанией, и пока у нее получается. Иногда настолько хорошо, что первый AI-native браузер выпустили они. (Я, кстати, пользуюсь Comet несколько недель, и он мне нравится все больше). Потому вокруг компании вьются желающие ее купить, но пока, несмотря на большие расходы, Perplexity умудряется сохранять независимость и находить инвесторов при оценке в 18 млрд:)
В общем, почитайте:)
https://fortune.com/article/perplexity-ceo-aravind-srinivas-ai/
Fortune
How Aravind Srinivas turned Perplexity AI into an $18 billion would-be Google killer | Fortune
AI-powered summaries from Perplexity have pressured the search giant to adapt, and its Comet browser is an agentic AI breakthrough.
Forwarded from vc.ru
This media is not supported in your browser
VIEW IN TELEGRAM
Китайская Tencent выпустила модель Hunyuan3D World Model. Она создаёт интерактивные 3D-миры для игр, фильмов и VR-приложений.
По получившимся 3D-сценам можно перемещаться или «осматривать» их в режиме панорамы
vc.ru/ai/2125050
По получившимся 3D-сценам можно перемещаться или «осматривать» их в режиме панорамы
vc.ru/ai/2125050
Forwarded from Ринат Шакиров | Промпты для Midjourney | ChatGPT (Ринат Шакиров)
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen выпустил новую видеомодель Wan 2.2
Теперь вы можете создавать кинематографические кадры, создавать видео с реальными эмоциями и управлять движением камеры с гораздо большей детализацией.
Детали:
🔴 Первая в мире видеомодель MoE с открытым исходным кодом: наша архитектура Mix-of-Experts масштабирует емкость модели без увеличения вычислительных затрат.
Специализированные эксперты совместно справляются с диффузионным шумоподавлением временных шагов!
🔴 Кинематографическая система управления: напрямую управляйте освещением, цветом, движением камеры, композицией и многим другим!
🔴 Модели и возможности с полностью открытым исходным кодом: доступ к преобразованию текста в видео (wan2.2-t2V-A14B), преобразованию изображения в видео (wan2.2-i2V-A14B) и унифицированному созданию видео (wan2.2-TI2V-5B)!
🔴 Превосходная способность генерировать сложные движения и многие другие фундаментальные улучшения!
Эта модель поддерживает как преобразование текста в видео, так и изображение в видео с разрешением 720P и частотой 24 кадра в секунду.
Тестить тут
Гитхаб
Hugging Face
#новости@dailyprompts
Теперь вы можете создавать кинематографические кадры, создавать видео с реальными эмоциями и управлять движением камеры с гораздо большей детализацией.
Детали:
Специализированные эксперты совместно справляются с диффузионным шумоподавлением временных шагов!
Эта модель поддерживает как преобразование текста в видео, так и изображение в видео с разрешением 720P и частотой 24 кадра в секунду.
Тестить тут
Гитхаб
Hugging Face
#новости@dailyprompts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM