Пупырка AI – Telegram
Пупырка AI
116 subscribers
726 photos
371 videos
1 file
700 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Forwarded from Сиолошная
2 дня назад xAI представили Grok 4 Fast — меньшую версию своей модели, которая а) быстрее б) существенно дешевле в) поддерживает 2 миллиона токенов контекста. Модель доступна в двух версиях, с рассуждениями и без.

По традиции, я не доверяю бенчмаркам от xAI, указанным на лендинге, и интересно посмотреть на независимые замеры попозже. Хотя вот Long Context Reasoning Benchmark от Artificial Analysis достаточно свежий, на нём модель слегка выше 2.5 Flash и чуть ниже Claude 4 Sonnet. И IFBench тоже вышел недавно, и модель примерно там же по уровню. Зато на других чуть ли не на равных с Grok 4 / Claude 4 Opus / GPT-5.

По данным OpenRouter, средняя скорость генерации сейчас примерно 150 токенов/сек, что много (Gemini 2.5 Flash сейчас держится на уровне 75-90). И цена в 2.5-5 раз ниже! В общем, почти уверен, что модель найдёт свою нишу.

На лендинге модели большой упор делается на бенчмарки, требующей работы с инструментами и конкретно поиском информации. Как раз на них модель превосходит Grok 4 — на 6 бенчмарках из 6! А на других 4 бенчмарках на математику показывают, что цепочки рассуждений для получения ответа стали короче.

И тут я как раз хотел поговорить про то, почему так может быть, почему это естественно и какой из этого вывод. Если модель кратно меньше фронтир-модели, то с ней можно сделать гораздо больше итераций RL-дообучения, или как раз обучения рассуждениям и вызовам инструментов/поиску.

Чем более задача требовательна к рассуждениям и чем меньше знаний для неё нужно (а это как раз базовые математика/программирование) — тем больше модель разгонится. Банально потому, что за X вычислительных мощностей можно сделать условно Y проходов по корпусу задач для фронтир-модели, и 10 * Y — для маленькой. За счёт большего количества попыток рассуждать LLM может и научиться это делать более эффективно (короткие цепочки рассуждений), и формировать длинные цепочки вызовов и вычислений.

То же наблюдалось у OpenAI — до сих пор есть несколько бенчмарков, где o4-mini в топе и/или совсем слегка уступает свежим моделям. За'RL'или по самое не могу 😂

Вообще, я верю в маленькие специализированные рассуждающие модели, и интересно, где они окажутся года через 2.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Для подписки за €200 Perlexity выпустили Email агента.

https://www.perplexity.ai/assistant/

Пользуюсь обычным агентом в ChatGPT иногда, удобно. У ребят анонсировано больше функций, но кажется, что ради почты покупать Макс подписку это довольно узкий сегмент ЦА у них будет. Зато просто плюс фича в набор
Media is too big
VIEW IN TELEGRAM
Genspark добавили голосовое управление AI-редактором фото
Forwarded from TechSparks
Мустафа Сулейман (CEO Microsoft AI, сооснователь Google DeepMind) давно в своих выступлениях подчеркивает, что ИИ уже становится, а местами даже стал, чем-то гораздо большим, чем пресловутый “инструмент”. Мне лично его мнение ценно не столько тем, что я его очень разделяю, сколько тем, что это не мнение стороннего эксперта, сколь угодно эрудированного, а мнение человека давно и глубоко погруженного а разработку и продуктовые воплощения фундаментальных новинок в ИИ.
Год назад он использовал выражение “digital species”, но сам же был недоволен, теперь он пытается подобрать другие слова: при описании принципиально нового со словарем всегда проблемы.
Выработка нового словаря и вообще способа описания — штука важная, поэтому приведу длинную его цитату в переводе:
«Сложность момента, в который мы входим с новой эрой ИИ-агентов, в том, что эти системы становятся не просто механизмами распознавания, а полноценными агентами, с поведением которых нам всё чаще придётся взаимодействовать, как если бы это были своего рода цифровые личности. И это — пороговая трансформация в истории нашего вида: они уже не инструменты, они явно не люди, не часть природы. Это как бы четвёртое отношение, новый эмерджентный тип… Я не знаю, как иначе это назвать, кроме как “четвёртое отношение”.»
Под тремя предыдущими, привычными отношениями он подразумевает
• отношения с другими людьми (human to human),
• отношения с природой (human to nature),
• отношения с инструментами/технологиями (human to tools or objects)
Это важная и пока что редкая мысль: сейчас большая часть дискуссий сводится к спорам, куда приписать взаимодействие с ИИ в рамках как раз этих трех привычных отношений, и сторонники отношений с инструментом не на шутку рубятся со сторонниками отношений как с личностью, обсуждая угрозы или плюсы антропоморфизации.
Трудно признавать, что столкнулись с чем-то по-настоящему новым.
Да и в целом больше чем полтора часа разговора по ссылке интересны и вполне оптимистичны, удовольствие слушать. Но если нет полутора часов, сейчас всегда можно и перевод и краткий пересказ нажатием пары кнопок получить:) Очень рекомендую!
https://youtu.be/tQ5wO1lznCQ?si=DY1XXBS_kZglAvFh
👍1
Вышла Qwen3-Omni — модель, с которой можно общаться в видеочате

Qwen3-Omni принимает на вход текст, изображения, аудио и видео, а также отвечает текстом и голосом в режиме реального времени. Поддерживается русский язык.

Попробовать можно тут: https://chat.qwen.ai/?models=qwen3-omni-flash
Forwarded from Сиолошная
Вместе с этим Sama выпустил эссе «Изобилие интеллекта», оригинал тут, а перевод — ниже:

Рост использования AI-сервисов был поразительным; мы ожидаем, что в будущем он будет ещё более впечатляющим.

По мере того как AI становится умнее, доступ к AI станет ключевым двигателем экономики, а возможно, в конечном итоге мы будем рассматривать его как одно из фундаментальных прав человека. Почти каждый захочет, чтобы AI работал в его интересах.

Чтобы обеспечить то, что нужно миру — вычислительные мощности, чтобы запускать эти модели, и для обучения, чтобы делать их всё лучше и лучше — мы закладываем основу, позволяющую существенно расширить наши амбиции по созданию инфраструктуры для AI.

Если AI продолжит развиваться по тому пути, который мы предполагаем, то станут возможны удивительные вещи. Может быть, с 10 гигаваттами вычислительных мощностей AI сможет найти лекарство от рака. Или, может быть, с 10 гигаваттами вычислений AI сможет обеспечить индивидуальное обучение каждому ученику на планете. Если же нас ограничат вычислительные мощности, нам придётся выбирать, что приоритетнее; никто не хочет делать такой выбор, поэтому давайте займёмся делом.

Наше видение простое: мы хотим создать фабрику, способную производить гигаватт новой AI-инфраструктуры каждую неделю. Реализация этого проекта будет чрезвычайно сложной: нам понадобятся годы, чтобы достичь этой цели, и инновации на каждом уровне, от чипов и электроэнергии до строительства и робототехники. Но мы уже активно работаем над этим и уверены, что это возможно. На наш взгляд, это будет самый крутой и важный инфраструктурный проект в истории. Особенно здорово, что значительную часть этого мы планируем построить в США; сейчас другие страны строят производства микросхем и новые источники энергии намного быстрее, чем мы, и мы хотим помочь изменить эту ситуацию.

В течение ближайших нескольких месяцев мы расскажем подробнее о наших планах и партнёрах, с которыми работаем для реализации задуманного. Позже в этом году мы поделимся информацией о том, как будем финансировать проект; учитывая, что увеличение вычислительных мощностей буквально означает увеличение доходов, у нас есть несколько интересных новых идей.
🤔1
Forwarded from Сиолошная
АМОГУС, но вместо игроков — LLM'ки: так выглядит новый интерактивный бенчмарк от 4wallai.

Among AIs оценивает мышление и дедукцию, навыки обмана и убеждения, и Theory of Mind (как одна модель может подумать о том, о чём думает другая). Авторы провели 60 игр и считали количество побед за мирных и за импосторов (предателей).

Наибольшее количество побед там и там — у GPT-5; Opus'а нет :( на втором месте Sonnet 4, дальше Kimi K2.

Видео-запись одной игры: https://youtu.be/1dxJaEyPUYw

Блогпост: https://www.4wallai.com/amongais , там можно почитать транскрипты игр, посмотреть, как модели «оправдываются» и выкручиваются, пытаясь обмануть других и доказать, что они — мирные. Плюс авторы проанализировали результаты голосований за выкидывание игрока, и получили инсайты в духе «GPT-5 причиняет меньше всех вреда команде» и «GPT-5 не говорит подозрительно, и потому не подвергается обвинениям».
Meta* запустила AI-ассистента для сервиса знакомств

В Facebook* Dating появился AI-ассистент, который будет подбирать для пользователей партнеров и помогать им улучшать свой профиль.

Можно будет, например, попросить найти «девушку из Бруклина, работающую в tech». Раз в неделю пользователь будет получать мэтч, выбранный алгоритмом.

*Facebook принадлежит запрещенной и признанной экстремистской в РФ Meta

https://techcrunch.com/2025/09/22/facebook-is-getting-an-ai-dating-assistant/
Forwarded from эйай ньюз
Kling 2.5 Turbo бросает вызов Veo 3

Вышла новая версия китайской модельки под скромным номером 2.5, что как бы намекает — это ещё не революция, и нам стоит ждать большего.

На деле же мы получаем физику и prompt understanding на уровне, очень близком к SOTA от гугл. Черипики, как всегда, топовые, но это не показатель — с этим справилась даже Luma на своей сомнительной Ray 3. Дополнительных данных нет — ни бенчмарков, ни даже официального блогпоста.

Пока вышла только Turbo-версия. Pro или Standard скорее всего существуют в недрах компании, но не факт что их релизнут. А если они и появятся, выигрыш в качестве не гарантирован — так же, как с Veo и Veo Fast, которые хоть и отличаются в стоимости в 5 раз, но на деле дистиллированная версия выдаёт почти неотличимый от полноценной Veo 3 результат.

Потестить уже сейчас можно на самом klingai.com, а также у независимых провайдеров вроде Fal, Freepik и Higgsfield. Последние, кстати, прикрутили удобный промпт-энхансер, который переводит подсказку в JSON. Там же сейчас можно крутить модельку безлимитно по подписке Creator и выше.

@ai_newz
Думаю в последнее время думаю о том, как может выглядеть мир после AGI

Если человечество уцелеет.

AGI — это Artificial General Intelligence, то есть AI, который будет превосходить людей в большинстве задач и будет способен их полностью целиком выполнять.

Такой AI сможет заменить сегодняшних удалённых сотрудников. Будет точно так же присутствовать на созвонах и в мессенджере, и выполнять задачи.

И сможет заменить физический труд — роботами будет всё делать дешевле и производительнее.

Ожидается это всё по разным оценкам не в таком уж и далёком будущем.

И тогда экономического смысла в труде людей будет мало. Ну то есть кто-то будет, конечно, платить за возможность получить услугу, оказанную именно живым человеком. Но это будет как сегодня музыка на виниле или плёночная фотография — скорее эстетический смысл, чем практический.

Предположим ещё, что экономика повсеместно вырастет настолько, что будет хватать и на безусловный базовый доход.

И тогда, кажется, большинство людей будут жить в реальности, похожей на Burning man.

Можно будет создавать что-то просто ради творчества и чтобы делиться с другими.

Можно проводить время с интересными тебе людьми. Просто так, нетранзакционно.

А можно уйти из своего кемпа и присоединиться к другому.

Можно исследовать себя и окружающих разными способами.

Можно просто рассветы встречать.


Интересное будет время.
ChatGPT экспериментирует с онбординагми кажется. Найдено на просторах Х
Google запустил lab эксперимент с мудбоодами собираемыми с AI. На первый взгляд без восторга, какой-то не совсем Pinterest. Доступно только в US

https://blog.google/technology/google-labs/mixboard/
Alibaba выпустила флагманскую модель Qwen3-Max с триллионом параметров

В рейтинге LMArena она сразу заняла третье место, показав результат на уровне GPT-5.

В тестах базовая версия без «рассуждений» местами в полтора раза быстрее прошлой модели компании, особенно в коде и агентных задачах. Она также превосходит Claude Opus 4 и DeepSeek-V3.1.

Полная версия Qwen3-Max-Thinking с поддержкой рассуждений и Python по качеству приближается к GPT-5 Pro и Grok 4 Heavy, но её запустят позже.

Qwen3-Max можно пользоваться бесплатно тут: https://chat.qwen.ai/