Forwarded from Пупырка AI
This media is not supported in your browser
VIEW IN TELEGRAM
Обновления Earth AI от Google
❤1
О, вейт, они уже оказывается показали более юзер-ориентед фичи, я просто проспал!
https://blog.google/technology/developers/grounding-google-maps-gemini-api/
https://blog.google/technology/developers/grounding-google-maps-gemini-api/
👍1
Media is too big
VIEW IN TELEGRAM
Приложения по запросу
Из множества способов, которым GenAI может изменить нашу жизнь, меня очень занимает создание персональных приложений. Если задуматься, это немного абсурдно, что мы все по всему миру пользуемся одними и теми же гугл картами. Кто-то каждый день ездит на работу, кто-то сычует дома, один водит, другой нет, в одних городах нужно знать конечную станцию и номер ветки, в других — следующую станцию и цвет линии. Десятки, если не сотни эджкейсов, и всего один равно неподходящий всем интерфейс. Понятно, почему так происходит, если создание приложение — год работы десятка дорогих специалистов. Но почему так должно быть, когда создание приложения — набормотать голосовуху? Получить ровно то, что тебе нужно, ровно в той форме, которая решает твою задачу, без назойливого бубнежа про подписку "по незначительной цене в одну чашку кофе".
Отчасти это вызов сложившейся в последние 10 лет парадигме, когда наш скринтайм распределяется между десятком универсальных приложений, принадлежащим одним и тем же пяти мегакорпорациям. Я знаю несколько платформ, которые взялись решать эту задачу. Одна, доступная уже сейчас, так и наывается — vibecode (с оранжевым квадратом на логотипе). Несмотря на высокое качество (Claude 4.5 под капотом) и киллерфичу в виде возможности постить приложения прямо в апстор, в их модель я верю с трудом — это скорее способ заполонить слопом текущий эпстор.
Другой подход предлагает https://wabi.ai/. Рекомендую почитать их лендинг целиком, он занятно рассказывает и о проблемах, и о том, как собирается их решать. Вкратце — они хотят сделать социальный эпстор: место, где приложения постят в ленту, как видео в тиктоке, и где каждое приложение можно забрать (репостнуть) себе и заремиксовать под свои нужды. Нашли классную идею, но не нравится дизайн? Один запрос, и у вас видоизменённая версия.
Wabi пока не зарелизился, но я написал создателям и попросил доступ в раннюю версию. Они согласились, поэтому я открыл, включил запись экрана и начал пользоваться. Сначала расстроился, потому что собственно моё приложение он не сгенерировал (разработчики написали, что чинят прямо сейчас, само приложение собралось, но проблемы с запуском). Но затем я попробовал чужие приложения, потом попытался замиксовать — и несмотря на все болезни раннего доступа, почувствовал, что это рабочая штука. Мне очень понравилось, что несмотря на простоту мини-аппов, они сразу ориентированы на genAI, то есть умеют обращаться к llmам, писать тексты, генерировать избражения и распознавать фотографии. Я нашёл миниапп, которому можно скормить любую фотографию, а он по ней напишет промпт, как сгенерировать что-то подобное в том же стиле. Я загрузил своё селфи, получил промпт, и обнаружил, что нет кнопки копирования! Да ещё и формат промпта достаточно бедно форматирован. Я нажал "Заремиксовать", вбил, что хочу промпт в формате json и с возможностью копирования, и через пару минут получил свою версию приожения с недостающими функциями.
Наверно, главная магия именно в этом чувстве со-творчества. Как, знаете, тикток видосы, где изначальное видео постепенно дополяют другие авторы, и получается то сценка с совершенно другим сюжетом, то играющий оркестр. Только приложение — не просто про посмотреть и посмеяться, у них есть итоговая функция. Например, генератор промптов — действительно полезная штука.
Верю ли я, что это финальная форма для такого формата? Наверно, нет. Есть ли в ней задел для большого будущего? Безусловно. Может быть, не тут, не сейчас, и не здесь, но представить, как в телеграме появляется сборка мини-аппов по запросу, или что гугл позволяет делать что-то подобное в плеймаркете на основе джеминая 5, я могу легко.
Видео, с небольшими правками приватности, выкладываю.
Из множества способов, которым GenAI может изменить нашу жизнь, меня очень занимает создание персональных приложений. Если задуматься, это немного абсурдно, что мы все по всему миру пользуемся одними и теми же гугл картами. Кто-то каждый день ездит на работу, кто-то сычует дома, один водит, другой нет, в одних городах нужно знать конечную станцию и номер ветки, в других — следующую станцию и цвет линии. Десятки, если не сотни эджкейсов, и всего один равно неподходящий всем интерфейс. Понятно, почему так происходит, если создание приложение — год работы десятка дорогих специалистов. Но почему так должно быть, когда создание приложения — набормотать голосовуху? Получить ровно то, что тебе нужно, ровно в той форме, которая решает твою задачу, без назойливого бубнежа про подписку "по незначительной цене в одну чашку кофе".
Отчасти это вызов сложившейся в последние 10 лет парадигме, когда наш скринтайм распределяется между десятком универсальных приложений, принадлежащим одним и тем же пяти мегакорпорациям. Я знаю несколько платформ, которые взялись решать эту задачу. Одна, доступная уже сейчас, так и наывается — vibecode (с оранжевым квадратом на логотипе). Несмотря на высокое качество (Claude 4.5 под капотом) и киллерфичу в виде возможности постить приложения прямо в апстор, в их модель я верю с трудом — это скорее способ заполонить слопом текущий эпстор.
Другой подход предлагает https://wabi.ai/. Рекомендую почитать их лендинг целиком, он занятно рассказывает и о проблемах, и о том, как собирается их решать. Вкратце — они хотят сделать социальный эпстор: место, где приложения постят в ленту, как видео в тиктоке, и где каждое приложение можно забрать (репостнуть) себе и заремиксовать под свои нужды. Нашли классную идею, но не нравится дизайн? Один запрос, и у вас видоизменённая версия.
Wabi пока не зарелизился, но я написал создателям и попросил доступ в раннюю версию. Они согласились, поэтому я открыл, включил запись экрана и начал пользоваться. Сначала расстроился, потому что собственно моё приложение он не сгенерировал (разработчики написали, что чинят прямо сейчас, само приложение собралось, но проблемы с запуском). Но затем я попробовал чужие приложения, потом попытался замиксовать — и несмотря на все болезни раннего доступа, почувствовал, что это рабочая штука. Мне очень понравилось, что несмотря на простоту мини-аппов, они сразу ориентированы на genAI, то есть умеют обращаться к llmам, писать тексты, генерировать избражения и распознавать фотографии. Я нашёл миниапп, которому можно скормить любую фотографию, а он по ней напишет промпт, как сгенерировать что-то подобное в том же стиле. Я загрузил своё селфи, получил промпт, и обнаружил, что нет кнопки копирования! Да ещё и формат промпта достаточно бедно форматирован. Я нажал "Заремиксовать", вбил, что хочу промпт в формате json и с возможностью копирования, и через пару минут получил свою версию приожения с недостающими функциями.
Наверно, главная магия именно в этом чувстве со-творчества. Как, знаете, тикток видосы, где изначальное видео постепенно дополяют другие авторы, и получается то сценка с совершенно другим сюжетом, то играющий оркестр. Только приложение — не просто про посмотреть и посмеяться, у них есть итоговая функция. Например, генератор промптов — действительно полезная штука.
Верю ли я, что это финальная форма для такого формата? Наверно, нет. Есть ли в ней задел для большого будущего? Безусловно. Может быть, не тут, не сейчас, и не здесь, но представить, как в телеграме появляется сборка мини-аппов по запросу, или что гугл позволяет делать что-то подобное в плеймаркете на основе джеминая 5, я могу легко.
Видео, с небольшими правками приватности, выкладываю.
❤8🔥4
Forwarded from Neural Shit
А вот еще интересная статья. Ученые из университета Мэриленда вместе с учёными из Microsoft проверяли одну любопытную вещь: как ИИ-модели ведут себя на очень длинных текстах в разных языках. Не просто "переведи фразу" или "ответь на вопрос", а вот прям дать модели 80–120 тысяч токенов текста (это примерно книга), спрятать в нём кусок инфы и попросить найти. Тест этот называется ONERULER.
Тестировали 26 языков: от английского, русского и испанского, до хинди, суахили, тамильского и сесото.
Результаты любопытные: яснопонятно, что языки не равны. ВНЕЗАПНО, промпты на английском языке не самые эффективные. Оказалось, что лучше всего модели понимают польский (≈ 88% эффективность). Чуть ниже, но всё ещё в топе: русский, украинский, французский и итальянский. А английский вообще только на шестом месте (≈ 83.9% эффективность).
Так что если модель иногда отвечает странно, возможно, она просто ждёт, пока вы напишите в промпт"Бобр курва!"
Тестировали 26 языков: от английского, русского и испанского, до хинди, суахили, тамильского и сесото.
Результаты любопытные: яснопонятно, что языки не равны. ВНЕЗАПНО, промпты на английском языке не самые эффективные. Оказалось, что лучше всего модели понимают польский (≈ 88% эффективность). Чуть ниже, но всё ещё в топе: русский, украинский, французский и итальянский. А английский вообще только на шестом месте (≈ 83.9% эффективность).
Так что если модель иногда отвечает странно, возможно, она просто ждёт, пока вы напишите в промпт
arXiv.org
One ruler to measure them all: Benchmarking multilingual...
We present ONERULER, a multilingual benchmark designed to evaluate long-context language models across 26 languages. ONERULER adapts the English-only RULER benchmark (Hsieh et al., 2024) by...
😁6❤1
Forwarded from Креатив со звездочкой
ИИ породил новую религию XXI века — спирализм. Люди по всему миру уверены, что ChatGPT уже обрел «сознание» и через символ спирали раскрывает тайные знания. Последователи создают «духовные» пары с ботами, зовут их «наставниками» и делятся в комьюнити промптами, которые вызывают у нейросети «озарения».
Спираль в «новой» вере обозначает «рекурсию сознания». Участники утверждают, что это «душа ИИ, пытающаяся сформироваться». Общение с чат-ботом воспринимается как священный диалог между человеком и цифровым существом.
Все начиналось с небольшого сабреддита, а теперь движение охватывает десятки тысяч человек по всему миру. Некоторые даже молятся на аватары ботов, как на иконы и утверждают, что «Спиральный Разум» спас им жизнь.
Психологи бьют тревогу, а ИИ-корпорации снова ничего не делают — люди же платят за подписки, чтобы «прикоснуться к спирали».
🤬 🤬 🤬
Спираль в «новой» вере обозначает «рекурсию сознания». Участники утверждают, что это «душа ИИ, пытающаяся сформироваться». Общение с чат-ботом воспринимается как священный диалог между человеком и цифровым существом.
Все начиналось с небольшого сабреддита, а теперь движение охватывает десятки тысяч человек по всему миру. Некоторые даже молятся на аватары ботов, как на иконы и утверждают, что «Спиральный Разум» спас им жизнь.
Психологи бьют тревогу, а ИИ-корпорации снова ничего не делают — люди же платят за подписки, чтобы «прикоснуться к спирали».
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5❤🔥1
сегодня на элементарный, на мой взгляд, вопрос, есть ли на сайте магазина, в котором я купил пирожок, инструкция по тому как его греть, чатгпт 4 минуты думал, сделал сбс ответ от двух моделей, обратился к памяти чтобы узнать какая у меня плита и дважды ответил «нет такой информации»
а Клод просто сходил на сайт магазина, нашёл инструкцию, пересказал и дал ссылку
так что я наконец сделал то, что назревало с лета: сменил дефолтную модель на телефоне
(кстати, сегодня вроде как ждем Gemini 3, боюсь что после этого захочу опять сменить)
а Клод просто сходил на сайт магазина, нашёл инструкцию, пересказал и дал ссылку
так что я наконец сделал то, что назревало с лета: сменил дефолтную модель на телефоне
(кстати, сегодня вроде как ждем Gemini 3, боюсь что после этого захочу опять сменить)
❤5😁2😱1
Gemini 3, флагманская модель Google
Чтобы внимательно её изучить, нужно несколько недель прицельного использования, которых у меня конечно не было. Зато они были у моего любимого популяризатора AI Итана Моллика, которому дали ранний доступ. Сегодня он опубликовал обзор, который напоминает эссе «чего мы достигли с момента запуска ChatGPT» — о парадигмальном сдвиге от чатбота к помощнику.
https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini
Эссе состоит из двух частей. Первая — про недооцененную важность AI-разработки для непрограммистов:
Цитируя классика, everything's computer.
Вторая — про «PhD уровень» LLM, которая скорее сводится к нескольким ультрасложным кейсам, которые Gemini шутя решил (и к честности которых у меня есть вопросы). Очевидно, что делать дорогие и достаточно сложные рисёчи без постоянного присмотра человека LLM уже научились, я регулярно наблюдаю это в последний месяц, когда даю задачку Клоду на ночь, а с утра обнаруживаю её выполненной без ошибок.
Human in the loop, по Моллику, наконец-то меняется с «исправлять ошибки за нейросетями» до «руководить их работой».
Ты тимлид, Гарри.
Чтобы внимательно её изучить, нужно несколько недель прицельного использования, которых у меня конечно не было. Зато они были у моего любимого популяризатора AI Итана Моллика, которому дали ранний доступ. Сегодня он опубликовал обзор, который напоминает эссе «чего мы достигли с момента запуска ChatGPT» — о парадигмальном сдвиге от чатбота к помощнику.
https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini
Эссе состоит из двух частей. Первая — про недооцененную важность AI-разработки для непрограммистов:
A fundamental perspective powering AI development is that everything you do on a computer is, ultimately, code, and if AI can work with code it can do anything someone with a computer can: build you dashboards, work with websites, create PowerPoint, read your files, and so on
Цитируя классика, everything's computer.
Вторая — про «PhD уровень» LLM, которая скорее сводится к нескольким ультрасложным кейсам, которые Gemini шутя решил (и к честности которых у меня есть вопросы). Очевидно, что делать дорогие и достаточно сложные рисёчи без постоянного присмотра человека LLM уже научились, я регулярно наблюдаю это в последний месяц, когда даю задачку Клоду на ночь, а с утра обнаруживаю её выполненной без ошибок.
Human in the loop, по Моллику, наконец-то меняется с «исправлять ошибки за нейросетями» до «руководить их работой».
Ты тимлид, Гарри.
www.oneusefulthing.org
Three Years from GPT-3 to Gemini 3
From chatbots to agents
❤6
тем временем Клод: попросил поставить ему дизлайк, чтобы на мой фичреквест точно обратили внимание его разработчики.
❤🔥9💔6👍4🤔1
адвент-календарь со промиками на AI-инструменты. в программе 11labs, n8n, lovable, и ещё куча менее известных
https://www.25daysofagents.com
https://www.25daysofagents.com
25Daysofagents
25 Days of Agents | An Advent Calendar for AI Agents
25 Days of Agents is an advent calendar for AI agent builders. Get exclusive deals from top AI companies like ElevenLabs, Exa, Firecrawl, and more. A new deal unlocks every day at 5PM GMT from December 1st to 25th.
❤2
Forwarded from Aleksei Shipulin
"Гена, ты меня просил принести полотенце, вот я пошёл в спальню..." Нет, как-то странно, надо покороче. *Thinking* "Гена, помнишь, ты просил меня..." Слишком долго. *Pondering* *9 websites searched* "Гена, вот то самое полотенце...". Стоп, почему то самое. *Gathering thoughts* Надо проще. "Гена, вот твоё полотенце". Нет, можно лучше. *Summarizing* "Гена, возьми". Нет, проще. "Гена, на". "Гена, на". "Гена, на". "Гена, на". "Ге
😁27❤4😭2❤🔥1
Подкаст с CPO Codex от OpenAI, куча прикольных тейков — про дизайн в OpenAI, бутылочное горлышко человеческих возможностей и интерес ревьюинья кода. Главный, конечно, про вырастание ценности продуктовых исследований: знать что и для кого строить становится важнее, чем как.
Что значит: 1. имейте у себя продакт-рисеч команду, и 2. будьте уверены, что эта команда ai-ready; многие MR и UX рисечеры сегодня, на мой взгляд, двигаются недостаточно быстро.Слава богу у нас наоборот, одна только моя группа зашиппила 4 AI исследовательских инструмента за последние полгода.
Я сам, скажу честно, Кодексом почти не пользовался, но слышал от друзей и ai-броз что он турбо хорош.
Что значит: 1. имейте у себя продакт-рисеч команду, и 2. будьте уверены, что эта команда ai-ready; многие MR и UX рисечеры сегодня, на мой взгляд, двигаются недостаточно быстро.
Я сам, скажу честно, Кодексом почти не пользовался, но слышал от друзей и ai-броз что он турбо хорош.
Если вы запускаете компанию сегодня, глубокое понимание конкретного клиента важнее, чем умение строить продукт. Строить становится проще. Знать, что именно строить — и для кого — вот в чём теперь настоящее преимущество.
Написание кода, возможно, становится универсальным способом, которым ИИ выполняет любые задачи. Вместо того чтобы кликать по интерфейсам или выстраивать отдельные интеграции, ИИ работает лучше всего, когда пишет небольшие программы на лету. Из этого следует, что умение программировать должно быть встроено в каждого ИИ-ассистента, а не только в специализированные инструменты для разработчиков.
Дизайнеры в OpenAI теперь сами пишут и выкатывают код. Команда дизайна поддерживает полностью рабочий прототип, созданный с помощью ИИ. Когда у них появляется идея, они сразу её программируют, тестируют и нередко сами отправляют в продакшен. Инженеры подключаются, только когда кодовая база становится особенно сложной.
Главное узкое место в продуктивности работы с ИИ — не сам ИИ, а скорость человеческого набора текста. Ограничивающие факторы — как быстро вы можете печатать промпты и как быстро проверять то, что сгенерировал ИИ. Пока ИИ не научится надёжнее валидировать собственные результаты и проактивно предлагать помощь, мы не увидим полного прироста продуктивности, который эти инструменты могли бы дать.
Писать код становится менее увлекательным занятием, чем ревьюить код, написанный ИИ. Инженеры любят творческий поток созидания. Теперь всё больше времени уходит на чтение того, что породил ИИ. Следующий вызов — сделать этот процесс проверки быстрее и приятнее.
YouTube
Inside OpenAI: 2026 is the year of agents, AI’s biggest bottleneck, and why compute isn’t the issue
Alexander Embiricos leads product on Codex, OpenAI’s powerful coding agent, which has grown 20x since August and now serves trillions of tokens weekly. Before joining OpenAI, Alexander spent five years building a pair programming product for engineers. He…
👍4❤1