Пупырка AI – Telegram
Пупырка AI
117 subscribers
733 photos
373 videos
1 file
707 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Forwarded from Denis Sexy IT 🤖
Я готовлю пост в котором соберу все успешные разы когда Operator или ChatGPT Agent помогли мне решить какие-то задачи, но про этот случай отдельно напишу:

Задумываюсь купить квартиру в Амстердаме и хочется с красивым видом – и вот я отправил агента от ChatGPT на местный ЦИАН посмотреть квартиры, а потом попросил его сделать небольшую карту, где я смогу посмотреть куда выходят окна квартир из объявлений – вот например, с видом на слонов у зоопарка есть за 500к 

Из интересного, он прям фотки смотрел чтобы понять что видно из окна ☕️:
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Про AI
Microsoft анонсировали новую функцию для Windows — виртуального помощника Copilot Appearance, заменяющего привычную «скрепку».

Этот помощник будет реагировать на ваши действия и запросы в реальном времени: улыбаться, кивать, говорить, давать советы и даже запоминать контекст беседы.

Ожидается, что новая функция появится уже в этом году.

Про AI
😁2
Forwarded from 42 секунды
Bloomberg: Китайский Unitree начал продавать роботов-гуманоидов по цене ниже $6 тыс.

– Стартап анонсировал робота R1 по стартовой цене $5,9 тыс.
– Новая модель робота R1 от Unitree весит всего лишь 25 кг
– Робот-гуманоид Unitree также оснащен мультимодальным ИИ
– Китайские компании активно продвигают своих роботов
– Они намерены составить конкуренцию Boston Dynamics и др.
– Роботов-гуманоидов можно использовать на заводах и др.
– Цена роботов имеет решающее значение для распространения
– Более старая модель робота G1 от Unitree стоила $16 тыс.
– Продвинутая и крупная модель робота H1 стоит от $90 тыс.
– UBTech Robotics планирует выпустить робота за $20 тыс.

@ftsec
Переписка с ChatGPT может быть использована в суде

Глава OpenAI признал, что в отличие от настоящего психотерапевта или адвоката, разговоры с ботом не защищены законом.

Если на OpenAI подадут в суд, переписку могут запросить, даже если вы её удалили — по политике компании, чаты стираются через 30 дней, но могут быть сохранены по требованию суда или “по соображениям безопасности”.

“Когда вы говорите с терапевтом, адвокатом или врачом, у вас есть право на конфиденциальность. А с ChatGPT — нет. Мы это ещё не урегулировали”, — сказал Альтман.

https://www.businessinsider.com/chatgpt-privacy-therapy-sam-altman-openai-lawsuit-2025-7?international=true&r=US&IR=T
Forwarded from эйай ньюз
GLM 4.5 — китайский опенсорс продолжает доминировать

Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.

Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.

Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.

Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.

Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.

Веса

Демо
Блогпост
Посттрейн фреймворк

@ai_newz
Forwarded from TechSparks
Очерк истории Perplexity и его фаундера Аравинда Шриниваса очень вовремя опубликован — компания все больше выходит из тени двух гигантов, OpenAI и Google, выясняющих отношения на тему того, кто будет определять будущее поведение пользователей в интернете.
Повороты сюжета и детали сценария достойны хорошего сериала — возможно, его когда-нибудь и снимут.
Начать с того, что Шринивас родом из того же города, что и Сундар Пичаи и его знаменитый земляк был для него кумиром, когда Шринивас стажировался в DeepMind. Не раз прочитаная история создания Гугла и вдохновила на создание своего стартапа.
А дальше было много решений, за которыми теперь пристально следят большие опытные игроки. Отказ от разработки собственной модели, прямой вызов Гуглу: желание создать answer engine вместо search engine. Причем эта идея когда-то нравилась Брину, но в те времена (2001 год) технологии не позволяли ее реализовать, и ставка была сделана на ссылки, а не ответы.
Perplexity старается быть продуктовой компанией, и пока у нее получается. Иногда настолько хорошо, что первый AI-native браузер выпустили они. (Я, кстати, пользуюсь Comet несколько недель, и он мне нравится все больше). Потому вокруг компании вьются желающие ее купить, но пока, несмотря на большие расходы, Perplexity умудряется сохранять независимость и находить инвесторов при оценке в 18 млрд:)
В общем, почитайте:)
https://fortune.com/article/perplexity-ceo-aravind-srinivas-ai/
Forwarded from vc.ru
This media is not supported in your browser
VIEW IN TELEGRAM
Китайская Tencent выпустила модель Hunyuan3D World Model. Она создаёт интерактивные 3D-миры для игр, фильмов и VR-приложений.

По получившимся 3D-сценам можно перемещаться или «осматривать» их в режиме панорамы

vc.ru/ai/2125050
Qwen выпустил новую видеомодель Wan 2.2

Теперь вы можете создавать кинематографические кадры, создавать видео с реальными эмоциями и управлять движением камеры с гораздо большей детализацией.

Детали:

🔴Первая в мире видеомодель MoE с открытым исходным кодом: наша архитектура Mix-of-Experts масштабирует емкость модели без увеличения вычислительных затрат.

Специализированные эксперты совместно справляются с диффузионным шумоподавлением временных шагов!

🔴Кинематографическая система управления: напрямую управляйте освещением, цветом, движением камеры, композицией и многим другим!

🔴Модели и возможности с полностью открытым исходным кодом: доступ к преобразованию текста в видео (wan2.2-t2V-A14B), преобразованию изображения в видео (wan2.2-i2V-A14B) и унифицированному созданию видео (wan2.2-TI2V-5B)!

🔴Превосходная способность генерировать сложные движения и многие другие фундаментальные улучшения!

Эта модель поддерживает как преобразование текста в видео, так и изображение в видео с разрешением 720P и частотой 24 кадра в секунду.

Тестить тут
Гитхаб
Hugging Face

#новости@dailyprompts
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM