🚨 Google апгрейднули свою модель для генерации изображения Gemini 2.5 Flash
Модель расходится везде под кодовым названием nano-banana 🍌 (нано - фокус на точности и гранулярности), и теперь в Gemini можно легко и быстро:
- менять фон и одежду на снимках без изменения всего изображения,
- объединять несколько изображений,
- сохранять узнаваемость людей и объектов
Буду много тестировать на практических примерах и делиться - а пока посмотрите как отработала комбинация двух изображений и его трансформация дальше: сделала из своих музыкальных промо фото и рандомного изображения в Pinterest.
Изображение довольно сложное для генерации, у меня одна реакция:НАКОНЕЦ ТО! 🎹
Осталось только чтобы Gemini себе интегрировали тул селектор, как у GPT, чтобы можно было выделить модели, что именно нужно перегенерить, а не описывать это текстом☹️
Модель расходится везде под кодовым названием nano-banana 🍌 (нано - фокус на точности и гранулярности), и теперь в Gemini можно легко и быстро:
- менять фон и одежду на снимках без изменения всего изображения,
- объединять несколько изображений,
- сохранять узнаваемость людей и объектов
Буду много тестировать на практических примерах и делиться - а пока посмотрите как отработала комбинация двух изображений и его трансформация дальше: сделала из своих музыкальных промо фото и рандомного изображения в Pinterest.
Изображение довольно сложное для генерации, у меня одна реакция:
Осталось только чтобы Gemini себе интегрировали тул селектор, как у GPT, чтобы можно было выделить модели, что именно нужно перегенерить, а не описывать это текстом
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3😱1
Интересно, что как и у других моделей, все таки пока тяжело дается nano-banana сохранять черты лица при последующих генерациях - потестировала еще один кадр (минус приложение для подбора одежды 😁)
Исходник - первая генерация - вторая - дальше полет фантазии🌸
Исходник - первая генерация - вторая - дальше полет фантазии
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😱2
Теперь можно переслать любой свой мейл Манусу, и он сам превратит его в задачу 🙂 (и файлы в приложении тоже сможет посмотреть)
Как настроить?
1. Переходите в настройки и находите свой имейл, на который теперь можно пересылать сообщения
2. Добавляете аккаунты, с которых можно будет ставить задачи (по умолчанию ваш аккаунт регистрации уже будет работать)
Классная фича, теперь ждем другие коннекторы 🦆
Как настроить?
1. Переходите в настройки и находите свой имейл, на который теперь можно пересылать сообщения
2. Добавляете аккаунты, с которых можно будет ставить задачи (по умолчанию ваш аккаунт регистрации уже будет работать)
Классная фича, теперь ждем другие коннекторы 🦆
🔥4
Новость дня 🚀 OpenAI выпустили GPT-Realtime (еще одно обновление, которое меняет возможности голосовых AI агентов)
Ключевое:
1️⃣ Раньше агенты взаимодействовали с речью так: голос пользователя транскрибировался (speech-to-text), после LLM генерировала текстовый ответ, который финально озвучивался третьей моделью TTS (text-to-speech).
Из-за этого в речи были задержки.
Realtime это одна модель, которая распознает именно речь и сразу генерит ответ пользователю голосом 😱
2️⃣ GPT-Realtime может не только общаться голосом, но и работать с изображениями, совершать телефонные звонки (SIP интеграция) и использовать другие внешние интеграции через MCP (например, подключаться к календарю, базам данных, онлайн-сервисам).
3️⃣ GPT-Realtime примерно на 20% дешевле предыдущих версий.
Больше можно почитать тут 🫶
Ключевое:
1️⃣ Раньше агенты взаимодействовали с речью так: голос пользователя транскрибировался (speech-to-text), после LLM генерировала текстовый ответ, который финально озвучивался третьей моделью TTS (text-to-speech).
Из-за этого в речи были задержки.
Realtime это одна модель, которая распознает именно речь и сразу генерит ответ пользователю голосом 😱
2️⃣ GPT-Realtime может не только общаться голосом, но и работать с изображениями, совершать телефонные звонки (SIP интеграция) и использовать другие внешние интеграции через MCP (например, подключаться к календарю, базам данных, онлайн-сервисам).
3️⃣ GPT-Realtime примерно на 20% дешевле предыдущих версий.
Больше можно почитать тут 🫶
🔥2
Новые пользователи могут попробовать Flow (платформу Google для генерации видео с Veo) бесплатно!
Хорошая возможность потестировать Veo3 (100 кредитов хватит на одно видео Veo3 quality и 5 видео Veo3 fast)
Если недоступно, нужно попробовать подключиться с впн другой страны
Хорошая возможность потестировать Veo3 (100 кредитов хватит на одно видео Veo3 quality и 5 видео Veo3 fast)
Если недоступно, нужно попробовать подключиться с впн другой страны
🔥3
В OpenAI уже работают над запуском своей платформы по поиску работы и найму сотрудников, и над сертификацией, которая станет способом подтвердить свои навыки на этой платформе 😱
Целятся в то, чтобы обучить и сертифицировать до 10 млн американцев к 2030 году, новость тут
Целятся в то, чтобы обучить и сертифицировать до 10 млн американцев к 2030 году, новость тут
🔥2
Как AI помогает мне учить и поддерживать языки - ч1
У меня довольно богатый опыт изучения языков. Я говорю на 4х (на разном уровне): английский (свободный), китайский (был продвинутый, сейчас стал средненький потому что не поддерживаю), немецкий (начальный), и теперь учу сербский. Я успела поработать в студии озвучки сериалов переводчиком и почти 4 года преподавала языки🙂
За это время у меня сложилась своя система изучения и поддержания языков, где я сейчас активно использую AI.
Мой главный принцип: самый эффективный способ продвинуться в иностранном языке с начального уровня - контент. Имхо чтобы понимать другого человека и свободно общаться, один из главных скиллов - это не научиться правильно переводить фразу или правило, а понять значение по контексту и отвечать другому человеку в уместном для языка контексте.
Этот навык формируется через взаимодействие с контентом, совмещённое с практикой речи. Контент - это сериалы, подкасты, книги, статьи и т.д. Главное условие - чтобы он был вам интересен сам по себе из-за своего содержания, это будет драйвить вашу языковую интуицию и поможет лучше угадывать контекст.
На старте это всегда энергозатратно, особенно если вы так не привыкли или мало взаимодействуете с другими языками. Будет много незнакомых слов и выражений, придётся концентрироваться и бороться с желанием сдаться.
Поэтому я помогаю себе правильным подбором контента под свой уровень - есть принцип comprehensible input(i + 1), когда контент должен быть понятен на 75–90%, а остальное угадывается по контексту. Если вы понимаете меньше - будет слишком тяжело, если почти всё - прогресса мало.
В следующей части расскажу про то, как использую AI для подбора и генерации такого контента, поставьте реакцию если вам актуально!
У меня довольно богатый опыт изучения языков. Я говорю на 4х (на разном уровне): английский (свободный), китайский (был продвинутый, сейчас стал средненький потому что не поддерживаю), немецкий (начальный), и теперь учу сербский. Я успела поработать в студии озвучки сериалов переводчиком и почти 4 года преподавала языки
За это время у меня сложилась своя система изучения и поддержания языков, где я сейчас активно использую AI.
Мой главный принцип: самый эффективный способ продвинуться в иностранном языке с начального уровня - контент. Имхо чтобы понимать другого человека и свободно общаться, один из главных скиллов - это не научиться правильно переводить фразу или правило, а понять значение по контексту и отвечать другому человеку в уместном для языка контексте.
Этот навык формируется через взаимодействие с контентом, совмещённое с практикой речи. Контент - это сериалы, подкасты, книги, статьи и т.д. Главное условие - чтобы он был вам интересен сам по себе из-за своего содержания, это будет драйвить вашу языковую интуицию и поможет лучше угадывать контекст.
На старте это всегда энергозатратно, особенно если вы так не привыкли или мало взаимодействуете с другими языками. Будет много незнакомых слов и выражений, придётся концентрироваться и бороться с желанием сдаться.
Поэтому я помогаю себе правильным подбором контента под свой уровень - есть принцип comprehensible input(i + 1), когда контент должен быть понятен на 75–90%, а остальное угадывается по контексту. Если вы понимаете меньше - будет слишком тяжело, если почти всё - прогресса мало.
В следующей части расскажу про то, как использую AI для подбора и генерации такого контента, поставьте реакцию если вам актуально!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍2🤯1
Media is too big
VIEW IN TELEGRAM
Как AI помогает мне учить и поддерживать языки - ч2
Возьму сербский, потому что это мой актуальный кейс.
Сначала я пару месяцев позанималась с преподавателем, чтобы освоить базу: как язык звучит, как строятся предложения, и поддерживать простые диалоги.
Потом пошла в книжный за первой книгой. Нашла перевод Рика Рубина, которого давно хотела прочитать, радостно купила, пришла домой и внезапно поняла,что книга на хорватском, а не на сербском 😅 (да, языки близкие, но лексика и написание разные).
Тогда я сделала кастомного GPT, который умеет:
- подбирать книгу под мой уровень и цель (по принципу i+1).
- озвучивать текст, чтобы я тренировала восприятие речи на слух
- разбирать новые слова, приводя примеры из живой речи (и может сказать мне, если слово нет смысла запоминать потому что оно не используется)
- проверять, насколько я поняла кусок текста, и делать карточки-квизы для закрепления
- помогать мне тренировать диалоги в голосовом режиме
С сербским есть нюанс: в OpenAI голоса звучат так, будто американец старается читать на сербском, то есть плохо 🥲
Интонацию отследить можно, но произношение особо не потренируешь. Поэтому когда хочу потренировать произношение, иду в ElevenLabs, загружаю туда нужный текст, и читаю за диктором вслух (работает шикарно).
Мой флоу работы с ботом выглядит так:
- кидаю фото страницы книги в бота;
- слушаю озвучку и слежу глазами по бумаге;
- отмечаю только те слова, которые мешают понять сюжет (остальное игнорю);
- обсуждаю с ботом слова, которые не понимаю;
- тренирую произношение в ElevenLabs;
- читаю несколько страниц/глав и прошу бота проверить понимание + сгенерить карточки.
Не всегда прохожу все шаги. Иногда просто гоняю слова через бота, иногда иду по полной схеме.
Вот моя версия такого бота, которую можно кастомизировать под свой язык - тык.
👉 На выходных планирую превратить бота в полноценного AI-агента, встроить туда ElevenLabs напрямую и навайбкодить интерфейс. Поделюсь процессом 💃
Возьму сербский, потому что это мой актуальный кейс.
Сначала я пару месяцев позанималась с преподавателем, чтобы освоить базу: как язык звучит, как строятся предложения, и поддерживать простые диалоги.
Потом пошла в книжный за первой книгой. Нашла перевод Рика Рубина, которого давно хотела прочитать, радостно купила, пришла домой и внезапно поняла,
Тогда я сделала кастомного GPT, который умеет:
- подбирать книгу под мой уровень и цель (по принципу i+1).
- озвучивать текст, чтобы я тренировала восприятие речи на слух
- разбирать новые слова, приводя примеры из живой речи (и может сказать мне, если слово нет смысла запоминать потому что оно не используется)
- проверять, насколько я поняла кусок текста, и делать карточки-квизы для закрепления
- помогать мне тренировать диалоги в голосовом режиме
С сербским есть нюанс: в OpenAI голоса звучат так, будто американец старается читать на сербском, то есть плохо 🥲
Интонацию отследить можно, но произношение особо не потренируешь. Поэтому когда хочу потренировать произношение, иду в ElevenLabs, загружаю туда нужный текст, и читаю за диктором вслух (работает шикарно).
Мой флоу работы с ботом выглядит так:
- кидаю фото страницы книги в бота;
- слушаю озвучку и слежу глазами по бумаге;
- отмечаю только те слова, которые мешают понять сюжет (остальное игнорю);
- обсуждаю с ботом слова, которые не понимаю;
- тренирую произношение в ElevenLabs;
- читаю несколько страниц/глав и прошу бота проверить понимание + сгенерить карточки.
Не всегда прохожу все шаги. Иногда просто гоняю слова через бота, иногда иду по полной схеме.
Вот моя версия такого бота, которую можно кастомизировать под свой язык - тык.
👉 На выходных планирую превратить бота в полноценного AI-агента, встроить туда ElevenLabs напрямую и навайбкодить интерфейс. Поделюсь процессом 💃
🔥5
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Media is too big
VIEW IN TELEGRAM
AirPods Pro 3 будут переводить речь в режиме реального времени с помощью Apple Intelligence - звучит круто, надо тестить на практике 😁
А вообще очень жду, когда появится классный физический продукт с ИИ по типу humane pin
А вообще очень жду, когда появится классный физический продукт с ИИ по типу humane pin
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь Veo3 работает и в вертикальном формате 9:16 🏄
🔥4
Я буду рассказывать и показывать кейсы использования AI агентов в маркетинге, а также расскажу про то, как их можно внедрять без знания кода 🏄
На рынке все еще мало ребят, кто использует AI на постоянной основе. У всех есть FOMO, но никто не понимает: что реально работает и растит бизнес.
╰┈➤ Мы решили провести пачку лайвов, где ребята из топовых компаний поделятся своими наработками, которые сразу забрать и применить на пратике
• Дима Зборовский, AI & Science director @ Deliveroo. Forbes 30 Under 30 in AI
• Ваня Купцов, СPTO @ Yango. Cтал CPO Яндекс.Лавки в 25 лет
• Настя Рябова, AI product lead @ TripleTen. Внедряет AI во все процессы Tripleten
• Michael Browk, Head of Design в Yango Play. Использует только AI в дизайне и креативе
• Сева Устинов, Founder Elly Analytics. Сева использует Cursor (AI Editor) и автоматизирует с помощью него кучу процессов
• Ilya Berdysh, кофаундер AI-стартапа Mymeet.ai. MRR $15k+, running to $20k, valuation $1.2M.
• Dmitrii Ive Sergeev, Ex CEO Carrot quest & Dashly.io. Дима вайбкодит и использует GPT на 100%
• Kostya Gorsky, Founder hirehire.ai. «Без AI не найти топовую работу и нанять сильнейших»
С 17 по 22 сентября.
╰┈➤ это не просто вебинары, а живые встречи с ребятами: включаем камеры, задаем вопросы, делимся.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤1
Media is too big
VIEW IN TELEGRAM
Оплатила себе несколько подписок, и активно инвестирую время в работу с генерацией видео и изображений - для примера визуал, который собирала к своему последнему треку
Собрала для себя несколько лайфхаков, поставьте реакцию если будет полезен гайд про это! 🏄
Собрала для себя несколько лайфхаков, поставьте реакцию если будет полезен гайд про это! 🏄
🔥11👍2
OpenAI выпустили самое крупное исследование использования ChatGPT so far
📊 У сервиса уже ~700 млн пользователей (это почти 10% взрослого населения), каждую неделю через ChatGPT проходит 18 млрд сообщений.
🧘♀️Чат всё больше используют для личного, а не только для рабочих задач. За последний год год доля нерабочих запросов выросла с 53% до 73%.
При этом, почти 80% использования чата приходится на:
🧙♂️Практические советы и обучение ("собери мне план тренировок", "объясни тему к экзамену").
🔎 Поиск фактов, событий, рецептов, товаров.
✍️ Письмо - работа с документами, переводами и правками. Интересно, что это самая часто решаемая рабочая задача (40% всех рабочих запросов), а вот на программирование приходится всего 4,2% (vs 33% у Claude) 😳
Еще интересное:
- Почти половина всех запросов приходится на аудиторию 18–25 лет;
- Быстрее всего ChatGPT растёт в странах с низким и средним доходом;
- Чем выше уровень образования у пользователя, тем чаще GPT используется для рабочих задач
- В 2022 около 80% аудитории - мужчины, но к июню 2025 года доля женщин выросла примерно до 50%;
📊 У сервиса уже ~700 млн пользователей (это почти 10% взрослого населения), каждую неделю через ChatGPT проходит 18 млрд сообщений.
🧘♀️Чат всё больше используют для личного, а не только для рабочих задач. За последний год год доля нерабочих запросов выросла с 53% до 73%.
При этом, почти 80% использования чата приходится на:
🧙♂️Практические советы и обучение ("собери мне план тренировок", "объясни тему к экзамену").
🔎 Поиск фактов, событий, рецептов, товаров.
Еще интересное:
- Почти половина всех запросов приходится на аудиторию 18–25 лет;
- Быстрее всего ChatGPT растёт в странах с низким и средним доходом;
- Чем выше уровень образования у пользователя, тем чаще GPT используется для рабочих задач
- В 2022 около 80% аудитории - мужчины, но к июню 2025 года доля женщин выросла примерно до 50%;
Please open Telegram to view this post
VIEW IN TELEGRAM
Openai
How people are using ChatGPT
Largest study to date of consumer ChatGPT usage shows demographic gaps shrinking, economic value being created through both personal and professional use.
🔥4