This media is not supported in your browser
VIEW IN TELEGRAM
Плюс к видео. На демо показан результат работы нейросети ProPainter, удаляющей лишние предметы с видео. В мае меня поразила эта функцию внутри Topaz, теперь появилась open-source модель. Самое смешное, что человек исчезает, а его тень - нет 😆
Источник
#video #inpaint #opensource
Источник
#video #inpaint #opensource
🔥2
Всячески избегал крупных релизов недели (хотя все вокруг писали, пересылали и говорили мне об этом), но Microsoft сломал меня этой ночью. Случился типичный новый эпизод сериала об AI, который происходит прежде всего на экране, потому что обычным людям трудно поспевать за тестированием нового функционала, о котором собственно повествуют релизы. Что произошло со вторника по четверг?
1. Google интегрировал AI-ассистента Bard во все свои облачные инструменты для работы (так называемый Google Workspace): Gmail, Drive, YouTube, Maps и т.д. Об этом было объявлено еще на конференции Google в августе. Теперь дошло до реализации, и... это доступно российским аккаунтам. Больше никаких вечеринок с VPN.
Основная новость не в связке, например, Bard + YouTube (она тривиальна и давно решалась через плагины), а в связке всего со всем (почти как в фильме "Всё везде и сразу"). Почти тотальная AI-прошивка существующих сервисов. Интригой остается только способность Bard обратиться и прочитать все личные данные во всех сервисах (у него недостаточноконтекста / памяти для этого, но это наживное).
2. OpenAI (хедлайнер заголовков из AI-мира) обновил свой генератор изображений DALL-E до 3-ей версии. До обновления DALL-E вылетел из топ-3 лидирующих визуальных нейросеток (Midjourney, Adobe Firefly, Stable Diffusion). Теперь претендент на возвращение. Вчера смотрел A/B сравнение с Midjourney, и обнаружил одно ключевое конкурентное преимущества: DALL-E хорошо работает с запросами на естественном языке (без специальной prompt-структуры). Скорее всего под капотом DALL-E есть оптимизатор промптов на основе GPT-4.
3. Microsoft повторил трюк Google для операционной системы Windows 11. Его AI-ассистента зовут Microsoft Copilot, и теперь он будет (еще нет) внутри Word, Excel, PowerPoint, Paint и др. Вторая тотальная AI-прошивка, теперь уже не-облачных сервисов. Обе прошивки действуют на основе языковых нейросетей и в моменте повышают значимость языкового промптинга (чему я обучаю в рамках курса).
Уверен, что Microsoft организовал свою вчерашнюю презентацию, чтобы сбить вау-эффект от интеграции Google Bard и присвоить часть эффекта от релиза DALL-E 3, который появится, например, внутри Paint. Драматургия AI-сервиса именно по-недельная, когда YouTube-обзорщики подводят итоги недели.
#bard #openai #release #dalle #copilot
1. Google интегрировал AI-ассистента Bard во все свои облачные инструменты для работы (так называемый Google Workspace): Gmail, Drive, YouTube, Maps и т.д. Об этом было объявлено еще на конференции Google в августе. Теперь дошло до реализации, и... это доступно российским аккаунтам. Больше никаких вечеринок с VPN.
Основная новость не в связке, например, Bard + YouTube (она тривиальна и давно решалась через плагины), а в связке всего со всем (почти как в фильме "Всё везде и сразу"). Почти тотальная AI-прошивка существующих сервисов. Интригой остается только способность Bard обратиться и прочитать все личные данные во всех сервисах (у него недостаточно
2. OpenAI (хедлайнер заголовков из AI-мира) обновил свой генератор изображений DALL-E до 3-ей версии. До обновления DALL-E вылетел из топ-3 лидирующих визуальных нейросеток (Midjourney, Adobe Firefly, Stable Diffusion). Теперь претендент на возвращение. Вчера смотрел A/B сравнение с Midjourney, и обнаружил одно ключевое конкурентное преимущества: DALL-E хорошо работает с запросами на естественном языке (без специальной prompt-структуры). Скорее всего под капотом DALL-E есть оптимизатор промптов на основе GPT-4.
3. Microsoft повторил трюк Google для операционной системы Windows 11. Его AI-ассистента зовут Microsoft Copilot, и теперь он будет (еще нет) внутри Word, Excel, PowerPoint, Paint и др. Вторая тотальная AI-прошивка, теперь уже не-облачных сервисов. Обе прошивки действуют на основе языковых нейросетей и в моменте повышают значимость языкового промптинга (чему я обучаю в рамках курса).
Уверен, что Microsoft организовал свою вчерашнюю презентацию, чтобы сбить вау-эффект от интеграции Google Bard и присвоить часть эффекта от релиза DALL-E 3, который появится, например, внутри Paint. Драматургия AI-сервиса именно по-недельная, когда YouTube-обзорщики подводят итоги недели.
#bard #openai #release #dalle #copilot
👍1
DALL-E-картина "AI-релизы сметают всё на своем пути"
В комментах предлагайте свои варианты, кто те двое, пытающиеся остановить волну 😱
#dalle
В комментах предлагайте свои варианты, кто те двое, пытающиеся остановить волну 😱
#dalle
🔥1
Протестировал обновления Bard. Есть хорошая и плохая новость:
Плохая. Никакие Bard Extensions не добрались до России (также по-прежнему нужно включать VPN).
Хорошая. Обновления Bard, которые произошли в июле, уже большой шаг вперед (пропустил их). На скриншотах два полезных применения Bard:
1. Беседа вокруг картинки (действует на основе Google Объектив)
2. Таблицу, созданную внутри Bard, можно автоматом превратить в Google Sheets
Обзор интересных применений Bard Extensions можно увидеть здесь. Ожидаемо Bard не прочитывает весь ваш Google Диск, а лишь через векторный (семантический) поиск находит фрагменты, которые далее суммирует в ответе. Также он галлюцинирует не меньше ChatGPT, зато кнопка double-check - это бомба (круче, чем Perplexity).
#release #bard #review
Плохая. Никакие Bard Extensions не добрались до России (также по-прежнему нужно включать VPN).
Хорошая. Обновления Bard, которые произошли в июле, уже большой шаг вперед (пропустил их). На скриншотах два полезных применения Bard:
1. Беседа вокруг картинки (действует на основе Google Объектив)
2. Таблицу, созданную внутри Bard, можно автоматом превратить в Google Sheets
Обзор интересных применений Bard Extensions можно увидеть здесь. Ожидаемо Bard не прочитывает весь ваш Google Диск, а лишь через векторный (семантический) поиск находит фрагменты, которые далее суммирует в ответе. Также он галлюцинирует не меньше ChatGPT, зато кнопка double-check - это бомба (круче, чем Perplexity).
#release #bard #review
Более менее сложился консенсус, какой вклад GenAI оказывает на производительность в разрезе разной квалификации работников. Выигрывают от GenAI прежде всего новички и junior-специалисты , я об этом рассказывал на своем примере. Одно из лучших исследований про консультантов из большой тройки показывает разрыв в приросте эффективности в 2-2,5 раза между junior- и senior-специалистами. Это называют "великим уравнением" (я бы назвал лучше "великой конвергенцией"). Это неплохо объясняет скепсис некоторых специалистов по поводу GenAI: им самим он не так нужен, зато менее квалифицированным дает инструмент, который способен их нагнать и лишить преимущества опыта.
Но я бы не экстраполировал эту тенденцию далеко и надолго. В моменте новички выигрывают, потому что ИИ не способен их заменить, это уже все осознали. Зато AI-агенты и AI-workforce, о которых бурно дискутируют среди нердов, придут именно на замену новичкам, а не в помощь им (увы!). Хотя все будет зависеть от экономики замены. На днях видел ролик про разработку простейшей компьютерной игры (типа сапера) с помощью AI agent workforce фреймворка, и в деньгах это стоило 20-30 рублей (за OpenAI API).
#review #aiagent
Но я бы не экстраполировал эту тенденцию далеко и надолго. В моменте новички выигрывают, потому что ИИ не способен их заменить, это уже все осознали. Зато AI-агенты и AI-workforce, о которых бурно дискутируют среди нердов, придут именно на замену новичкам, а не в помощь им (увы!). Хотя все будет зависеть от экономики замены. На днях видел ролик про разработку простейшей компьютерной игры (типа сапера) с помощью AI agent workforce фреймворка, и в деньгах это стоило 20-30 рублей (за OpenAI API).
#review #aiagent
Forwarded from e/acc
Еще примеры и исследования на тему влияния ИИ на продуктивность людей и разделение труда. Спойлер: они все подтвреждают тезис о великом уравнении.
1. Исследование MIT почти 500 сотрудников, чья работа в основном состоит из написания текстов показало, что GPT существенно снижает разницу в качестве работы между сильными и менее опытными или талантливыми сотрудниками. При этом GPT больше заменяет усилия работников, чем дополняет их навыки.
2. Исследование показывает, что доступ к генеративному ИИ повышает творческий потенциал людей при написании коротких рассказов, особенно у менее креативных авторов, но в то же время приводит к снижению уникальности и разнообразия создаваемого контента.
3. Эксперимент оценивающий влияние помощи ИИ на юридическое мышление: студенты сдавали экзамены по праву с помощью GPT-4 и без неё. Оказалось, что худшие студенты выигрывали больше всего от ИИ, а лучшие - теряли.
4. Исследование более чем 5,000 сотрудников тех поддержки использующих генеративный ИИ. Худшие агенты техподдержки и новички только вышедшие на работу показали максимальный прирост результата. Так же сильно улучшилась оценка качества решения проблемы со стороны клиента.
Меня всегда в любом бизнесе (особенно, крупном) поражало количество тупой и бесполезной работы. Очень для многих ролей это было близко к 100%. Теперь эта проблема решена: тупую работу делают роботы, а люди, даже неквалифицированные, с помощью роботов делают (относительно и в кавычках) «сложную».
1. Исследование MIT почти 500 сотрудников, чья работа в основном состоит из написания текстов показало, что GPT существенно снижает разницу в качестве работы между сильными и менее опытными или талантливыми сотрудниками. При этом GPT больше заменяет усилия работников, чем дополняет их навыки.
2. Исследование показывает, что доступ к генеративному ИИ повышает творческий потенциал людей при написании коротких рассказов, особенно у менее креативных авторов, но в то же время приводит к снижению уникальности и разнообразия создаваемого контента.
3. Эксперимент оценивающий влияние помощи ИИ на юридическое мышление: студенты сдавали экзамены по праву с помощью GPT-4 и без неё. Оказалось, что худшие студенты выигрывали больше всего от ИИ, а лучшие - теряли.
4. Исследование более чем 5,000 сотрудников тех поддержки использующих генеративный ИИ. Худшие агенты техподдержки и новички только вышедшие на работу показали максимальный прирост результата. Так же сильно улучшилась оценка качества решения проблемы со стороны клиента.
Меня всегда в любом бизнесе (особенно, крупном) поражало количество тупой и бесполезной работы. Очень для многих ролей это было близко к 100%. Теперь эта проблема решена: тупую работу делают роботы, а люди, даже неквалифицированные, с помощью роботов делают (относительно и в кавычках) «сложную».
Расхожая фраза "данные - это новая нефть" заиграла другими красками в свете AI, потому что нейросеть - это вообще-то компьютерная программа, а не информация. Погуглил, и оказалось, что впервые эту фразу произнесли еще в 2006 году, в позапрошлую эпоху IT.
Есть простой способ ощутить, что языковые нейросети уже не нуждаются в данных - это протестировать ее на простых инструкциях (zero-shot промптах). В целом классе задач (ответы на общие вопросы) вы останетесь довольны. Информация на общие темы (история, культура, география и пр.) уже содержится внутри модели, не требуется новых данных, чтобы эту информацию извлечь. Требуются только вычислительные мощности (CPU / GPU / TPU). Правильно сказать, что "GPU - это новая нефть", чтобы ваша машинка с ответами продолжала работать. Данные же - это новый песок или новая руда (как угодно), из которых строят дома и наши с вами личные машинки в информационном пространстве. Когда все дома и машины будут построены, то в данных не будет такой ценности (к тому же, в отличие от реального песка данные - это реюз). В личном хранении информации на общие темы уже нет ценности.
#view #data #gpu
Есть простой способ ощутить, что языковые нейросети уже не нуждаются в данных - это протестировать ее на простых инструкциях (zero-shot промптах). В целом классе задач (ответы на общие вопросы) вы останетесь довольны. Информация на общие темы (история, культура, география и пр.) уже содержится внутри модели, не требуется новых данных, чтобы эту информацию извлечь. Требуются только вычислительные мощности (CPU / GPU / TPU). Правильно сказать, что "GPU - это новая нефть", чтобы ваша машинка с ответами продолжала работать. Данные же - это новый песок или новая руда (как угодно), из которых строят дома и наши с вами личные машинки в информационном пространстве. Когда все дома и машины будут построены, то в данных не будет такой ценности (к тому же, в отличие от реального песка данные - это реюз). В личном хранении информации на общие темы уже нет ценности.
#view #data #gpu
Forwarded from Сиолошная
Помните в фантастике всякой были гаджеты, с помощью которых можно было общаться с другим человеком как будто он сидит напротив тебя, А ОН ВООБЩЕ НЕ ТУТ? Ну там типичные голограммы даже если взять из Звездных войн.
Так вот, у Lex Fridman вышел свежий подкаст с Mark Zuckerberg, и он сделан в Метаверсе. Оба участника сидят в шлемах Meta Quest Pro, в которых есть камеры, считывающие мимику лица и движения глаз (релизнулись год назад). Внутри алгоритм воссоздаёт лицо, а другой участник его видит. Очень хорошо передаёт движения глаз, бровей, рот хорошо синхронизирован с речью
Настоящий 🤯🤯
Будущее наступило...мама я в нём живу!
Так вот, у Lex Fridman вышел свежий подкаст с Mark Zuckerberg, и он сделан в Метаверсе. Оба участника сидят в шлемах Meta Quest Pro, в которых есть камеры, считывающие мимику лица и движения глаз (релизнулись год назад). Внутри алгоритм воссоздаёт лицо, а другой участник его видит. Очень хорошо передаёт движения глаз, бровей, рот хорошо синхронизирован с речью
Настоящий 🤯
Будущее наступило...мама я в нём живу!
Please open Telegram to view this post
VIEW IN TELEGRAM
Обновил свой Windows 11 с учетом релизов прошлой недели (от обещаний уже дошло до дела). Пришлось чуть поморочиться, нет авто-обновления для РФ, зато в интернете уже есть гайды. Microsoft Copilot работает только через VPN.
Особо не тестировал, из первых применений два:
- можно открыть программу изнутри чата (например, калькулятор), чтобы не искать иконку на рабочем столе или в глубинах "Пуска"
- можно сгенерировать картинку на основе DALL-E (например, лого к каналу - с первой попытки вышло неплохо)
В-общем, от меня уважение и признание, правда я не фанат Microsoft-интерфейса, поэтому вряд ли буду часто использовать.
#copilot #release #image
Особо не тестировал, из первых применений два:
- можно открыть программу изнутри чата (например, калькулятор), чтобы не искать иконку на рабочем столе или в глубинах "Пуска"
- можно сгенерировать картинку на основе DALL-E (например, лого к каналу - с первой попытки вышло неплохо)
В-общем, от меня уважение и признание, правда я не фанат Microsoft-интерфейса, поэтому вряд ли буду часто использовать.
#copilot #release #image
👆 мне подсказали, что картинка сгенерирована уже версией DALL-E 3, которая еще недоступна на сайте OpenAI (!). Судя по первым обзорам, с ней полный порядок, возможно это даже лучшая (!) визуальная нейросетка до выхода Midjourney v6. Если обновите Microsoft, то станете одними из первых, кто успел ее затестить.
#dalle #image #release
#dalle #image #release
Forwarded from Ai molodca (Dobrokotov)
#Dalle3 — мнение и что будет дальше с визуальными моделями.
Давным давно (год назад, лол) Dalle-2 задавал планку качества, но проиграл медийную гонку Midjourney (по качеству) и Stable Diffusion (по гибкости).
И вот, OpenAI с двух ног вернулась в игру визуальных моделей и снова задает уровень.
В первую очередь, уровень понимания запроса и то, что западные AI блогеры называют conherncy (связность или согласованность), грубо говоря логическая и визуальная цельность и консистентность.
Из полевых тестов — то, чего я добивался часами в MJ и Stable, в Dalle-3 получалось с одной попытки. Карлсон и Громозека — тоже (олды канала помнят)!
То, что вы пишите — то и получаете.
Что дальше?
Midjourney вот-вот выпустит шестую версию, в которой, судя по информации которую я слышал на office hours от CEO, будет будет гораздо большая стилевая гибкость (а не просто очень-очень красиво) и та самая conherncy. А так же, некое подобие ControlNet. И на их месте я бы, конечно, шел именно в сторону большего контроля, потому что иначе они выпустят Dalle-3.
Stable Diffusion продолжает быть народным мультикомбаином, который расширяется до бесконечных возможностей за счет энтузиастов. Но уже с новым поколением — XL. Прошлогодная модель 1.5 плавно отдает бразды популярности.
Кандинский и Шедеврум догоняют, но надо (очень) ускоряться.
Dalle-3 скорей всего порежут, так сейчас можно легко создавать NSFW контент, что очень странно для OpenAI. Ну и вот-вот добавят в ChatGPT 4, что создаст множество сценариев использования.
Так что, если вы еще попробовали, то советую (с VPN): https://www.bing.com/create.Ну и сделал в нашем хабе отдельный раздел для ваших генераций. Кстати, если у вас долго висит, то советую попробовать с браузера Bing, вроде постабильнее.
Давным давно (год назад, лол) Dalle-2 задавал планку качества, но проиграл медийную гонку Midjourney (по качеству) и Stable Diffusion (по гибкости).
И вот, OpenAI с двух ног вернулась в игру визуальных моделей и снова задает уровень.
В первую очередь, уровень понимания запроса и то, что западные AI блогеры называют conherncy (связность или согласованность), грубо говоря логическая и визуальная цельность и консистентность.
Из полевых тестов — то, чего я добивался часами в MJ и Stable, в Dalle-3 получалось с одной попытки. Карлсон и Громозека — тоже (олды канала помнят)!
То, что вы пишите — то и получаете.
Что дальше?
Midjourney вот-вот выпустит шестую версию, в которой, судя по информации которую я слышал на office hours от CEO, будет будет гораздо большая стилевая гибкость (а не просто очень-очень красиво) и та самая conherncy. А так же, некое подобие ControlNet. И на их месте я бы, конечно, шел именно в сторону большего контроля, потому что иначе они выпустят Dalle-3.
Stable Diffusion продолжает быть народным мультикомбаином, который расширяется до бесконечных возможностей за счет энтузиастов. Но уже с новым поколением — XL. Прошлогодная модель 1.5 плавно отдает бразды популярности.
Кандинский и Шедеврум догоняют, но надо (очень) ускоряться.
Dalle-3 скорей всего порежут, так сейчас можно легко создавать NSFW контент, что очень странно для OpenAI. Ну и вот-вот добавят в ChatGPT 4, что создаст множество сценариев использования.
Так что, если вы еще попробовали, то советую (с VPN): https://www.bing.com/create.Ну и сделал в нашем хабе отдельный раздел для ваших генераций. Кстати, если у вас долго висит, то советую попробовать с браузера Bing, вроде постабильнее.
👍3