Пупырка AI – Telegram
Пупырка AI
115 subscribers
725 photos
369 videos
1 file
696 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
А вот какую необычную компанию только что приобрела OpenAI. Sky позицинирует себя как естественно-языковой интерфейс для Mac. И за этим аппом стоят непростые ребята.

Эти же разработчики ранее делали приложение Workflow, которое купила Apple и превратила в Shortcuts. Два года назад команда покинула яблочную корпорацию и занялась секретным AI-проектом, этим самым, тизер которого можно увидеть в приложенном видео.

Предполагаю, что OpenAI не просто хочет сделать очередную аппку для мака, а забрала тиму Software Applications inc., чтобы разработать собственную операционную систему.

Жалко, конечно, что Sky не выйдет.
This media is not supported in your browser
VIEW IN TELEGRAM
Не так давно в Replika Евгения Куйда ушла с поста CEO, чтобы запустить новый проект — Wabi.

Это платформа, где пользователи смогут создавать свои мини-приложения без программирования — для повседневных задач, с возможностью открытого обмена и ремиксов.

Сегодня они заявили о запуске закрытой беты. Waitlist — Wabi.ai
2
Forwarded from Denis Sexy IT 🤖
Попробовал решить проблему с ChatGPT Atlas браузером и доволен:

Есть у меня такой сервис на сайте, позволяет парсить интернет статьи в формате удобном для LLM:
https://shir-man.com/strip-html/#url

Сервис бесплатный и без регистрации, какой-то чел этим воспользовался и спарсил кучу фигни прикинувшись моим сайтом, потратив $50 баланса – я его не виню, я сознательно забил на защиту в свое время

Понятно стало, что ленится больше не получится и нужно прикрутить в сервису капчу:

1. Сначала я запромтил хорошую модель в чатгпт сделать план-инструкцию, «как в Cloudflare добавляется капча на страницы» (в моем случае была GPT 5 Thinking High)

2. Потом, открыл этот же чат в браузере Atlas и попросил агента пойти в админку Cloudflare настроить мне все что нужно для капчи - секреты, какие-то виджеты: админка выглядит как админка роутера и желания в ней разбираться у меня нет вообще

3. Братишка Atlas, в режиме агента, за пару минут справился – и что-то там завел

4. Дальше я попросил этого же агента, в этом же чате, сделать мне промпт для кодинг агента «Напиши что осталось допрограммировать, чтобы добавить капчу на сайт»

5. Codex кодинг агент (тоже часть ChatGPT) поработал по этому промпту и сделал Pull Request на гитхабе

6. Ссылку на этот Pull Request, с сгенерированным кодом, я принес агенту в Atlas и попросил проверить норм ли все и можно ли вливать, он сказал все оки, поехали

В итоге на странице теперь есть капча
¯\_(ツ)_/¯

Агент буксует иногда и пока плохо видит, но я уже однажды отправил его на час работать и он справился - какие-то задачки он уже сейчас решает нормально
Alibaba выпустила умные очки с Qwen

В Quark AI Glasses встроен новый голосовой ассистент базе Qwen. Очки отвечают на ваши вопросы, переводят речь собеседника в реальном времени, принимают звонки и переключают музыку.

Цена — от 4699 юаней (около $660). Похожие по функционалу очки от Цукерберга и Ray Ban продаются по 800 долларов.

https://www.cnbc.com/2025/10/23/alibaba-prices-ai-glasses-at-660-and-launches-chatgpt-rival.html
Forwarded from Сиолошная
Прошло полгода с выхода AI-2027, работе с предсказаниями о том, как ситуация будет развиваться дальше. Вчера выделил пару часов на то, чтобы постараться понять, идём ли мы по сценарию, опережаем или отстаём.

Согласно тексту, ничего из ряда вон выходящего пока не происходит. Большая часть вещей, предсказанных на 2025-начало 2026-го и на релизе выглядели адекватно, и в целом они и случились: компании делают ставки на агентов, агенты пока ненадёжны, их продают под соусом персональных ассистентов.

По метрикам агентов на август 2025-го авторы предсказывали, что:
— на OSWorld наберут 65% (сейчас топ-1 решение с одним прогоном, GTA1 с августовской GPT-5, набирает 63.4%, Sonnet 4.5 61.4%)
— на SWEBench-Verified наберут 85% (сейчас топ-1 82% у Sonnet 4.5)

Так что отставание если и есть, то совсем маленькое. Следующие конкретные предсказания по метрикам стоят на апрель 2026-го (80% на OSWorld, 85% на Cybench, 1.3 на REBench), но последние два бенчмарка не очень часто обновляются, и по последнему даже вот не ясно, какой сейчас результат у GPT-5 / Sonnet 4.5. Надежда на то, что для подведения итогов AI 2025 Forecast от AI Digest бенчмарки пересчитают с лучшими доступными на тот момент моделями.

Прогресс к апрелю 2026-го, согласно работе, обоснован тем, что OpenBrain обучат Agent-1. Согласно их прогнозам, обучение будет происходить с июля 2025-го по февраль 2026-го и суммарно потребует 4e27 FLOP вычислений. Это в 20 раз больше, чем, по оценкам, потратили на GPT-4.5, и в 8 раз больше Grok-4.

Вместе с GPT-5-Pro я попробовал оценить, есть ли такие мощности у OpenAI, и если нет, то с каким опозданием они идут? GPT-5-Pro делала расчёты и пришла к выводу, что да, в сентябре-октябре они могли начать такую тренировку, но я посмотрел в цифры и мне кажется, что нет. Такая тренировка даже при условии, что длится 7-8 месяцев (это абсолютный максимум, который можно брать в рамках разумного), потребует около 500 тысяч видеокарт H100.

Sam Altman говорил, что к концу 2025-го у них будет всего миллион карт. То есть под эту тренировку должны выделить около половины всего железа, что повлияет на все остальные эксперименты.

Одна из альтернатив — это использовать новые карты GB200; в Stargate I в Техасе как раз ставят их. Но на данный момент сдано всего 2 здания из 8 (~112 тысяч видеокарт из 450 тысяч запланированных), и сдача произошла в начале октября. Обычно после сдачи ещё какое-то время идет нагрузочное тестирование, сгоревшие видеокарты меняют итд, так что самое лучшее, когда смогут начтаь тренировку — ноябрь. Но в целом 112 тысяч карт GB200 действительно позволяют на горизонте от полугода выйти на Agent-1.

Agent-0, который должны были учить с октября 2024-го по май 2025-го, всего в 5 раз больше GPT-4.5 и в 2 раза больше Grok-4 (релиз состоялся в июне 2025-го, так что окончание тренировки в мае +- ок) — в целом у OpenAI были такие мощности, и если они хотели, то могли обучить гигантскую модель с учётом уроков GPT-4.5. Возможно, именно эта экспериментальная система выиграла золото на олимпиадах по информатике/математике летом, а может быть и нет.

TLDR: чуть-чуть отстаём от прогнозов, но есть шанс нагнать, так как выглядит, что в 2026-м году мощностей станет больше, чем было предсказано в работе (я сделал быструю оценку по размеру капитала, она может быть неточной).
Forwarded from 42 секунды
TechCrunch: VSCO получил возможности редактирования при помощи ИИ и поддержку RAW-файлов

– Сервис для редактирования фото получил обновление
– VSCO добавил ИИ-инструменты для редактирования
– Сервис также научился поддерживать RAW-файлы и др.
– ИИ-инструменты доступны на новой вкладке AI Labs
– Инструменты могут удалить объекты с фотографии и др.
– VSCO утверждает, что решение отличается точностью
– Инструмент более точен, сохраняет важные детали и др.
– Скоро VSCO также запустит новый инструмент Upscale
– Upscale сможет повысить разрешение изображений и др.
– VSCO использует модель FLUX.1 Kontext от Black Forest Labs
– Функции AI Labs доступны на уровне Pro ($12,99/мес.)
– Ограничений по количеству использований функций нет

@ftsec
Grok запустил нового персонажа Мику. Вроде как теперь компаньоны могут быть вашими учителями разных языков.

Ещё в Grok добавили Kids mode, тоже вероятно шаг в сторону сценариев образования.
Samsung делают Galaxy XR

Как Apple Vision, но на базе Android XR.

В блоге Google больше видео
Forwarded from эйай ньюз
Алекс Ванг увольняет 600 человек из Meta Superintelligence Lab - пример непревзойденного лидерства от молодого человека. У Меты уже входит в привычку делать по 2 раунда увольнений каждый год, за мое время там я пережил минимум 3 волны лейофов. Оптимальность решений лидершипа в последнее время под большим вопросом. Многие толковые речерчеры, предвидя это, не соглашались даже на огромные офферы ($10M+) лично от Марка - знаю таких людей. Некоторые другие, кто все же перешёл, ливнули через 1-2 месяца.

А ризонинг модели от Меты как не было так и нет. Визуальные модели, кажется тоже стагнируют и не было видных обновлений после моего ухода (не то чтобы все только на мне держалось, но все же)), вот вместо этого заключили партнерство с Black Forest Labs. Такими темпами очередь дойдет и уволить старичка ЛеКуна, заменив его 25-летним отчисленцем из универа.

Сейчас в Мете, как и в других Фаангах, в приоритете команды, которые шипят каждый месяц, а не делают долгосрочный речерч. Их если и чикают, то очень ограниченно. А вот для классических ресерчеров, которые работают над долгосрочными проектами (FAIR-style), сейчас не самый лучший климат в индустрии.

Чтобы я посоветовал, тем кто сейчас работает в BigTech, чтобы избежать увольнения? Стройте стартап свой публичной бренд внутри компании, работайте только над проектами, которые имеют максимальную видимость, фокусируйтесь на бизнес импакте. Ваши модели, которые вы тренируете должны приность +xx% user engagement, +yy% revenue, -zz% latency and costs.

В постах о ваших проектах всегда должно читаться "This guy has shipped fast and delivered measurable business impact". Как бы грустно это не звучало, индустрии сейчас нужны люди, которые умеют строить решения, приносящие деньги сейчас, а не те, кто будет потеть полгода-год над одной публикацией, которая в итоге в прод так и не попадет. #imho

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
usekodo.ai

Агент рисующий в Фигме от 13 летнего разработчика. Пишет, что делал в Cursor.

Пока выглядит не впечатляюще, но с генерацией видео год назад было также. На сайте вроде уже можно попробовать даже.

Причем, он уже не первый молодой разработчик, который копает в эту тему, недавно уже видел очень похожее.
🔥2
Forwarded from Denis Sexy IT 🤖
Очень мне нравится наружная реклама ChatGPT в США, простая и понятная, умнички
👍1
Воскресное чтиво:
за 22 дня ботом для получения инвайтов в Sora 2 воспользовались 37000+ раз, несколько раз уронили, попытались украсть, засыпали инвайтами вроде EBUMAM и несколько раз парализовали очередь.

в критический момент очередь дошла до 6000 человек, и мне пришлось придумать, откуда взять для них пачку кодов, чтобы запустить цепную реакцию заново. мне пришлось несколько раз переписать бот полностью заново прямо на проде, роняя его и теряя пользователей.

ко мне пришли с рекламой впн, но в тот момент в боте была та самая очередь 3 дня на получение инвайта, поэтому рекламу я не взял. зато подключил API Sora через несколько часов, после того как его опубликовали, и сделал платный доступ в том числе к самым желанным функциям: HD генерации и генерации без вотермарки — функции, либо вовсе недоступные из приложения, либо стоящие в нём 100 евро в месяц.

это открыло мне прекрасный мир коммерции. я прикрутил оплату звёздами, систему рефандов, систему автоматического улучшения промптов и прогнозирования, что сора откажется генерировать такое видео (а поверьте, большинство видео, которые через бота пытались сгенерировать, сора генерировать не стала бы).

когда мне удалось поправить все проблемы с очередью и выдачей инвайтов (сейчас время ожидания где-то 3-5 минут), я вспомнил о рекламе VPN. за это время контакт удалил диалог, мне было лень искать кого ещё порекламировать, и тут я подумал — зачем рекламировать VPN (тем более это вроде как не очень легально сейчас в России), если можно просто арендовать несколько серверов в штатах, и продавать ключи к аутлайн по цене пиццы из школьной столовой.

вчера ночью я встроил его в пайплайн бота (а это максимально нативный флоу — ведь американский vpn необходим, чтобы пользоваться сорой), ещё день тестировал всякие эджкейсы, которых накопилось немало, и добавил в сам бот. ключи генерируются и отключаются автоматически, можно купить хоть доступ на неделю, хоть помесячную подписку, скорость гигабитная, а цены начинаются от 150 рублей. как по цене чашки кофе, только с учётом специфики моей аудитории — кофейного напитка из чана в школьной столовой.

за это время роскомнадзор успел объявить о начале блокировке телеграма, так что я написал анонс, что в боте можно купить ВПН, сгенерировал рекламу в соре, и сейчас пишу этот текст. смотря, как уведомение о новых функциях неторопливо рассылается 37042 пользователм бота...

(справедливости ради, пока вся авантюра принесла мне примерно 150 долларов, что существенно меньше, чем я затратил на вайбкодинг и API. но сколько удовольствия!)
Google записал несколько видосов призывающих и обучающих вайб-кодить в AI Studio

youtube.com/playlist
👍1
Forwarded from Whistles and Papers
This media is not supported in your browser
VIEW IN TELEGRAM
Мог ли я три года назад представить, что смогу в Wallet в Telegram купить Nvidia, и даже скинуть друзьям акций на ДР? А теперь и представлять не надо.