Gemini 2.0 Flash стала поистине мультимодальной.
Эту фичу нам анонсировали еще OpenAI в GPT-4o. Правда до продакшена она так и не дошла.
Гугл в этот раз опередили конкурентов.
При помощи текстового запроса вы можете изменить участок изображения, добавить текст или сгенерирвоать картинку с нуля.
Все это делает сама Gemini 2.0 Flash – запрос не уходит в отдельную text2image модель.
Попробовать уже можно бесплатно в https://aistudio.google.com
Делитесь вашими юзкейсами и идеями в комментах)
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20👍16⚡8😁1
Думаю, новый Gemini 2.0 – очередной поворотный момент для ии-тусовки. Ну и вскоре для человечества.
Инструмент доступный, понятный, быстрый. И способный на многое:
– фото 1 и 2 – развлекаюсь
– фото 2 и 3 – создать 3д игру стало проще
– фото 4 – раскрасить чб
– фото 5 – коропоративная постправда
#дядя_д @how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥9❤3
В недавнем ролике грозился провести эфир по работе с опенсорсным манусом.
Сегодня в 19:00 мск заглядывайте на огонек. Ссылка в шапке.
Эфир в первую очередь для новичков. Разберемся в основах работы с GitHub для клонирования и запуска опенсорсных проектов. Узнаем, где взять API ключи и как настроить проект на вашем пк.
Если буквы выше вселяют страх и ужас - приходите. Будет полезно)
Ну и конечно, потестируем owl и поотвечаем на ваши вопросы!
🌸😁 А вся эта затея с эфиром – в честь весны, прекрасной жизни и скидок на наши курсы, которые закончатся совсем скоро. Узнать подробнее про курсы тут – @how2ai_bot
Сегодня в 19:00 мск заглядывайте на огонек. Ссылка в шапке.
Эфир в первую очередь для новичков. Разберемся в основах работы с GitHub для клонирования и запуска опенсорсных проектов. Узнаем, где взять API ключи и как настроить проект на вашем пк.
Если буквы выше вселяют страх и ужас - приходите. Будет полезно)
Ну и конечно, потестируем owl и поотвечаем на ваши вопросы!
🌸
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👎5👏4👍3❤2
🦉 Вчера на эфире тестировал OWL
Вот результат того, что агент наклепал по промпту:
Уверен, что качество таких систем будет расти с каждым годом, если не месяцем, но пока не торт. OWL сумел составить план исследования, открыть ряд сайтов с ценами, вытащить данные и составить график. К сожалению, не вся информация оказалась актуальной и не все удалось найти. Хотя общее навправление верное.
Запись эфира можете найти в нашем сообществе или курсе "Промптграмминг". Можно приобрести эти продукты по отдельности или в рамках весенних скидочных пакетов. Кстати, до конца скидок осталось 3 дня. Успевайте🧨
Все подробности в боте – @how2ai_bot
Вот результат того, что агент наклепал по промпту:
Проведи анализ цен на API различных передовых LLM моделей. Предоставь данные ввиде графика с ценами и названиями компаний. Бери во внимание модели выпущенные после 01.01.24
Уверен, что качество таких систем будет расти с каждым годом, если не месяцем, но пока не торт. OWL сумел составить план исследования, открыть ряд сайтов с ценами, вытащить данные и составить график. К сожалению, не вся информация оказалась актуальной и не все удалось найти. Хотя общее навправление верное.
Запись эфира можете найти в нашем сообществе или курсе "Промптграмминг". Можно приобрести эти продукты по отдельности или в рамках весенних скидочных пакетов. Кстати, до конца скидок осталось 3 дня. Успевайте
Все подробности в боте – @how2ai_bot
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤3👍1💯1
привет cursor_ai, мне нужно, чтобы курсор издавал звук колокольчика, когда он заканчивает собирать код для меня, чтобы я мог перестать смотреть youtube и проверить, что было сделано. это бы намного улучшило вайб.
Решение найдено. Можно настроить MCP сервер, чтобы агент отправлял вам имейл по завершении работы – https://github.com/resend/mcp-send-email
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
😁45👍6❤1
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥6❤5👏1
Провел сравнение исследовательских способностей Google (1), Grok(2) и Peplexity(3).
Все компании предлагают ф-цию DeepResearch бесплатно. Вот, что у нас вышло.
➕ Gemini единственный предложил план исследования с возможностью дать правки перед стартом.
➖ Grok добавил странные компании и сделал необоснованные предположения. Не добавил ссылки в таблицу. Компаний и моделей мало.
👌 Perplexity добавил много моделей от каждой компании, но использовал неофициальную документацию – значит инфа может быть неактуальной.
– Grok размышлял 3м 13с и использовал 139 источников!!
– Perplexity думал примерно столько же, но 22 источника
– Gemini потратил около 10 мин и изучил около 60 источников.
Результаты:
Gemini победил. С большим отрывом. Репорт вышел самый объемный, таблица самая подробная и инфа самая верная. По крайней мере не вижу ошибок при первом прсомотре.
Очень, очень, очень удивил гугл. Этот агент сорвенуется с дипресерчем OpenAI и, вероятно, превосходит его. Хуже всех справился Grok. Самая унылая и неверная информация в его таблице.
Такие дела. Выбирайте свой дипресерч, но я голосую за Gemini.
@how2ai #дядя_д
Все компании предлагают ф-цию DeepResearch бесплатно. Вот, что у нас вышло.
Промпт: Проведи анализ цен на API различных передовых LLM моделей. Предоставь данные в виде таблицы с ценами и названиями компаний и моделей и источниками. Бери во внимание модели выпущенные после 01.01.24
– Grok размышлял 3м 13с и использовал 139 источников!!
– Perplexity думал примерно столько же, но 22 источника
– Gemini потратил около 10 мин и изучил около 60 источников.
Результаты:
Gemini победил. С большим отрывом. Репорт вышел самый объемный, таблица самая подробная и инфа самая верная. По крайней мере не вижу ошибок при первом прсомотре.
Очень, очень, очень удивил гугл. Этот агент сорвенуется с дипресерчем OpenAI и, вероятно, превосходит его. Хуже всех справился Grok. Самая унылая и неверная информация в его таблице.
Такие дела. Выбирайте свой дипресерч, но я голосую за Gemini.
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57🔥8❤7👎2🏆2
Свершилось, твиттерские собрали MCbench (MineCraft Bench) – теперь мы точно узнаем, какая модель пилит лучшие интерьеры
Кажется, датасет не очень больщой и голосов пока не много, но выглядит многообщающе. И увлекательно.
https://mcbench.ai
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤3🔥1👏1🤣1
Не понятно, в каком сервисе такую цену вы сможете окупить. Или есть идеи? Поделитесь в комментариях.
Вот сравнение цен с другими моделям (инпут/аутпут)
o1 pro – $150.00/ $600.00
GPT-4.5 Preview – $75.00/ $150.00
GPT-4o $2.50/ $10.00
o3 mini – $1.10/ $4.40
GPT-4o mini – $0.15/ $0.60
Кстати, OpenAI прикольно обновили сайт с карточками моделей. Глаз радуется.
📘 o1 pro – та самая модель, за которую OpenAI просит $200 в месяц. API (application programming interface) – возможность использовать LLM не через интерфейс ChatGPT, а обращаясь к ним из других интерфейсов, приложений, использовать в разработке собственных сервисов.
@how2ai #дядя_д
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣12🤔8👍7❤4😱1
Поговорили с основателем Метранпаж об их проекте. Метранпаж – сервис для создания обложек, оформления и верстки книг при помощи ИИ.
🔹 Можно ли научить алгоритм думать, как дизайнер?
🔹 Заменит ли это людей или откроет новые возможности?
🔹 Где взять деньги на развитие проекта?
Как всегда, запись доступна всем подписчикам сообщества продсовет
А еще выцепили промокод для нашей аудитории на скидку 80% на оплату люого тарифа. Действует до конца пятницы
@how2ai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1🔥1