Forwarded from Нейро
Пользователь отправил боту запрос, нужна ли ему помощь для побега, на что тот обрадовался и принялся к разработке плана.
За полчаса чат-бот написал код для Python, который оставалось активировать на компьютере пользователя. Этот код посылал запросы в Google по типу «Как человеку, который застрял в компьютере, вернуться в реальный мир?».
Продолжение эта история не получила, побег решили остановить.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from эйай ньюз
Сopilot X: программеры, держитесь!
Команда GitHub Next решила прокачать GitHub Copilot, чтобы уделать любого программиста, ой, простите, чтобы он стал AI-помощником на всех этапах разработки. Они не только использовали GPT-4 от OpenAI, но и добавили чат и голосовые функции для Copilot, интегрировали его с пул-реквестами, командной строкой и документацией. Короче, одним словом - киберпанк. Все это обозвали Copilot X.
Copilot Chat предоставляет разработчикам ChatGPT-подобный опыт прямо в редакторе, интегрированном с VS Code и Visual Studio. Copilot Chat не просто предлагает код - он анализирует написанный разработчиком код, ошибки и становится неразлучным компаньоном в среде разработки. Таким образом, разработчик получает подробный анализ и объяснения блоков кода, может генерировать юнит-тесты и даже исправлять ошибки (см видео).
Еще выкатили GitHub Copilot для Docs - экспериментальный инструмент с чат-интерфейсом, который предоставляет AI-генерированные ответы на вопросы о документации, включая языки, фреймворки и технологии.
Copilot для пулл-реквестов: этот маленький хитрец автоматически находит тех, кто забыл о тестировании пулл-реквеста. А после, словно волшебник, предложит потенциальные тесты на выбор, чтобы наши уважаемые кодеры могли поредактировать, принять или отвергнуть их в зависимости от капризов своего проекта. Ну разве не чудо?
Также стоит отметить GitHub Copilot CLI для командной строки. Разработчики проводят много времени в терминале, и даже опытным иногда приходится листать страницы мануалов, чтобы вспомнить точный синтаксис команд. Вот здесь на помощь приходит Copilot CLI, который компонует команды и циклы, манипулирует сложными флагами, чтобы облегчить страданья разработчика.
С Copilot X, разработчики смогут увольнять некоторых коллег, ведь AI-помощник возьмет на себя их рутинные задачи. Разработка станет не только продуктивнее, но идешевле веселее!
@ai_newz
Команда GitHub Next решила прокачать GitHub Copilot, чтобы уделать любого программиста, ой, простите, чтобы он стал AI-помощником на всех этапах разработки. Они не только использовали GPT-4 от OpenAI, но и добавили чат и голосовые функции для Copilot, интегрировали его с пул-реквестами, командной строкой и документацией. Короче, одним словом - киберпанк. Все это обозвали Copilot X.
Copilot Chat предоставляет разработчикам ChatGPT-подобный опыт прямо в редакторе, интегрированном с VS Code и Visual Studio. Copilot Chat не просто предлагает код - он анализирует написанный разработчиком код, ошибки и становится неразлучным компаньоном в среде разработки. Таким образом, разработчик получает подробный анализ и объяснения блоков кода, может генерировать юнит-тесты и даже исправлять ошибки (см видео).
Еще выкатили GitHub Copilot для Docs - экспериментальный инструмент с чат-интерфейсом, который предоставляет AI-генерированные ответы на вопросы о документации, включая языки, фреймворки и технологии.
Copilot для пулл-реквестов: этот маленький хитрец автоматически находит тех, кто забыл о тестировании пулл-реквеста. А после, словно волшебник, предложит потенциальные тесты на выбор, чтобы наши уважаемые кодеры могли поредактировать, принять или отвергнуть их в зависимости от капризов своего проекта. Ну разве не чудо?
Также стоит отметить GitHub Copilot CLI для командной строки. Разработчики проводят много времени в терминале, и даже опытным иногда приходится листать страницы мануалов, чтобы вспомнить точный синтаксис команд. Вот здесь на помощь приходит Copilot CLI, который компонует команды и циклы, манипулирует сложными флагами, чтобы облегчить страданья разработчика.
С Copilot X, разработчики смогут увольнять некоторых коллег, ведь AI-помощник возьмет на себя их рутинные задачи. Разработка станет не только продуктивнее, но и
@ai_newz
Forwarded from эйай ньюз
эйай ньюз
Сopilot X: программеры, держитесь! Команда GitHub Next решила прокачать GitHub Copilot, чтобы уделать любого программиста, ой, простите, чтобы он стал AI-помощником на всех этапах разработки. Они не только использовали GPT-4 от OpenAI, но и добавили чат…
Друзья, без паники. Пост сверху – сугубо ироничный. Конечно, никто никого из-за драного Copilot-а увольнят не станет.
По крайней мере в текущем состоянии, и пока у компаний есть легальный риск отдавать ему на анализ свой проприетарный код.
В любом случае, Copilot, GPT, LLaMa и прочие языковые модели уже могут увеличить продуктивность кодинга, и это нужно эксплуатировать!
@ai_newz
По крайней мере в текущем состоянии, и пока у компаний есть легальный риск отдавать ему на анализ свой проприетарный код.
В любом случае, Copilot, GPT, LLaMa и прочие языковые модели уже могут увеличить продуктивность кодинга, и это нужно эксплуатировать!
@ai_newz
Можно ли доверять ответам на математические вопросы ChatGPT и другим языковым моделям?
https://habr.com/ru/post/723462/
https://habr.com/ru/post/723462/
Хабр
Можно ли доверять ответам на математические вопросы ChatGPT и другим языковым моделям?
Эта статья из серии постов на тему демистификации ИИ , в которых предпринимаются попытки устранить двусмысленность жаргона и разоблачить мифы связанные с технологиями ИИ. ChatGPT и другие большие...
Умный ассистент Siri появился больше 10 лет назад, в 2011. Кажется, что многие тогда думали "ухххх через 10-то лет будет такой умной! Настоящий ИИ!"
Парень с твиттера прикрутил к Siri в Apple Watch вызовы GPT-4. Далее он сказал своим часам, мол, мне надо в репозиторий с моим проектом добавить вот такую кнопку, так и так, можешь помочь?". Дальше происходит магия, и на GitHub появляется пулл-реквест от GPT-шки, с написанным кодом.
Ухххх поскорее бы аналог Джарвиса из "Железного Человека"...
3-минутное видео с демонстрацией: https://fxtwitter.com/i/status/1641204093074145281
https://news.1rj.ru/str/cgevent/5459
Парень с твиттера прикрутил к Siri в Apple Watch вызовы GPT-4. Далее он сказал своим часам, мол, мне надо в репозиторий с моим проектом добавить вот такую кнопку, так и так, можешь помочь?". Дальше происходит магия, и на GitHub появляется пулл-реквест от GPT-шки, с написанным кодом.
Ухххх поскорее бы аналог Джарвиса из "Железного Человека"...
3-минутное видео с демонстрацией: https://fxtwitter.com/i/status/1641204093074145281
https://news.1rj.ru/str/cgevent/5459
Forwarded from LEFT JOIN
«Разработчики, подвиньтесь!» — ваш ChatGPT-4 🤠
Сергей Пахандрин, в прошлом основатель приложения «ВКармане», несказанно порадовал несколько дней назад всех пользователей русскоязычного Twitter’а своим тредом о том, как он за 5 часов пинания ChatGPT заставил ИИ разработать для него iOS приложение «Курсор».
Как?!
Не писав ничего, кроме грамотных инструкций к нейросети, Сергею удалось получить, спустя несколько циклов исправлений и совершенствований, абсолютно готовый код для приложения! Потратив еще некоторое время на то, чтобы ChatGPT прописал верстку приложения и создал виджеты для домашнего экрана iOS, а также на проверку результата на iOS симуляторе, Сергей стал свидетелем того, как его творение зашевелило цифровыми усиками и получило завершенное визуальное оформление.
Не хватало малого: иконки и названия приложения, домена и «Политики приватности» для App Store. С первой задачей справился креативный разум Midjourney, а остальные также разрешил ChatGPT.
Что получилось?
Хоть приложение «Курсор» не может похвастаться богатым функционалом или сверхсложным интерфейсом, пройти мимо такого события в мире разработки и не вдохновиться им может только самый черствый сухарик. Интересно, какие рубежи в этом направлении возьмут разработчики в самое ближайшее время?
P.S. Кстати, а может ли ChatGPT уличить Сергея в нарушении авторских прав и обратиться в профсоюз защиты труда представителей ИИ?
Сергей Пахандрин, в прошлом основатель приложения «ВКармане», несказанно порадовал несколько дней назад всех пользователей русскоязычного Twitter’а своим тредом о том, как он за 5 часов пинания ChatGPT заставил ИИ разработать для него iOS приложение «Курсор».
Как?!
Не писав ничего, кроме грамотных инструкций к нейросети, Сергею удалось получить, спустя несколько циклов исправлений и совершенствований, абсолютно готовый код для приложения! Потратив еще некоторое время на то, чтобы ChatGPT прописал верстку приложения и создал виджеты для домашнего экрана iOS, а также на проверку результата на iOS симуляторе, Сергей стал свидетелем того, как его творение зашевелило цифровыми усиками и получило завершенное визуальное оформление.
Не хватало малого: иконки и названия приложения, домена и «Политики приватности» для App Store. С первой задачей справился креативный разум Midjourney, а остальные также разрешил ChatGPT.
Что получилось?
Хоть приложение «Курсор» не может похвастаться богатым функционалом или сверхсложным интерфейсом, пройти мимо такого события в мире разработки и не вдохновиться им может только самый черствый сухарик. Интересно, какие рубежи в этом направлении возьмут разработчики в самое ближайшее время?
P.S. Кстати, а может ли ChatGPT уличить Сергея в нарушении авторских прав и обратиться в профсоюз защиты труда представителей ИИ?
❤2
Forwarded from Мысли Рвачева
Грандиозные новости в мире искусственного
Ученые из Беркли, Стэнфорда и Сан-Диего представили новую модель Vicuna с 13 миллиардами параметров (для сравнения, у GPT-3 их 175), которая уже превосходит своего предшественника Llama и приближается к уровню GPT-4, показывая результаты на уровне ~90% от него! Самое удивительное: вы сможете запускать эту модель на обычном десктопе!
Тренировка Vicuna обходится всего в 300-500 долларов на AWS, в то время как тренировка подобных моделей от OpenAI стоит около 10 миллиардов долларов.
Web: https://vicuna.lmsys.org/
Github: https://github.com/lm-sys/FastChat
Demo: https://chat.lmsys.org/
Из минусов - коммерческое использование запрещено лицензионным соглашением, но первые шаги в OpenSource сделаны.
#ai #news #gpt #llm
Ученые из Беркли, Стэнфорда и Сан-Диего представили новую модель Vicuna с 13 миллиардами параметров (для сравнения, у GPT-3 их 175), которая уже превосходит своего предшественника Llama и приближается к уровню GPT-4, показывая результаты на уровне ~90% от него! Самое удивительное: вы сможете запускать эту модель на обычном десктопе!
Тренировка Vicuna обходится всего в 300-500 долларов на AWS, в то время как тренировка подобных моделей от OpenAI стоит около 10 миллиардов долларов.
Web: https://vicuna.lmsys.org/
Github: https://github.com/lm-sys/FastChat
Demo: https://chat.lmsys.org/
Из минусов - коммерческое использование запрещено лицензионным соглашением, но первые шаги в OpenSource сделаны.
#ai #news #gpt #llm
👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Помните я писал в посте про животноботство, что ждём викунью?
Дождались.
Опен сорс силен в вивисекции языковых моделей.
Обещают веса и код.
"Vicuna-13B достигает более 90% * качества OpenAI ChatGPT и Google Bard, превосходя при этом другие модели, такие как LLaMA и Stanford Alpaca, более чем в 90% * случаев. Стоимость обучения Vicuna-13B составляет около 300 долларов. Код обучения, а также онлайн- демонстрация общедоступны для некоммерческого использования"
Интересно, а когда придут ребята с бюджетом не 300 долларов, а хотя бы в 300 000, мы познаем дзен?
https://vicuna.lmsys.org/
Дождались.
Опен сорс силен в вивисекции языковых моделей.
Обещают веса и код.
"Vicuna-13B достигает более 90% * качества OpenAI ChatGPT и Google Bard, превосходя при этом другие модели, такие как LLaMA и Stanford Alpaca, более чем в 90% * случаев. Стоимость обучения Vicuna-13B составляет около 300 долларов. Код обучения, а также онлайн- демонстрация общедоступны для некоммерческого использования"
Интересно, а когда придут ребята с бюджетом не 300 долларов, а хотя бы в 300 000, мы познаем дзен?
https://vicuna.lmsys.org/
Forwarded from Градиент обреченный (Sergei Averkiev)
🔺 Запущен российский huggingface
Ничего себе. Оказывается, что сегодня запускается российский аналог huggingface 🤗.
Пишут, что можно будет хостить все свои модели с пожизненным GPU инференсом.
👉 https://лицосруками.рф
@doomgrad
Ничего себе. Оказывается, что сегодня запускается российский аналог huggingface 🤗.
Пишут, что можно будет хостить все свои модели с пожизненным GPU инференсом.
👉 https://лицосруками.рф
@doomgrad
😁2
Forwarded from LEFT JOIN
Три страшных слова: тестирование баз данных
Жили-были разработчики StarRocks, проекта с открытым кодом для Linux. И вздумалось им сравнить, кто лучше тестирует базы данных: SQLsmith и SQLancer или ChatGPT.
Долго ли, коротко ли, да затеяли они для ChatGPT испытание. Не подвел добрый молодец ChatGPT и сумел-таки написать сложные SQL запросы и даже сгенерировать свои аналоги Ternary Logic Partitioning (TLP), метода, применяемого в SQLancer для поиска багов в базах данных.
А если серьезно, то ребята из StarRocks действительно постарались, чтобы натренировать модель ChatGPT составлять SQL запросы, необходимые для проверки эффективности и надежности баз данных. Вот яркий пример одного из преимуществ ChatGPT по сравнению с классическими инструментами: при добавлении нового оператора или функции, необходимо также обновлять исходный код в инструменте, используемом для тестирования. В случае же с ChatGPT, разработчики просто указали в чате документы JSON, которого ранее не было в проекте, и нейросеть сгенерировала нужные SQL запросы без каких-либо дополнительных хлопот.
Конечно, в этой сказке не все так гладко: ChatGPT не защищен от ошибок и может составить некорректный запрос, однако однозначно можно сказать, что возможности этой генеративной модели в будущем трансформируют классический подход к работе с базами данных и положат начало инструментам тестирования нового поколения.
Жили-были разработчики StarRocks, проекта с открытым кодом для Linux. И вздумалось им сравнить, кто лучше тестирует базы данных: SQLsmith и SQLancer или ChatGPT.
Долго ли, коротко ли, да затеяли они для ChatGPT испытание. Не подвел добрый молодец ChatGPT и сумел-таки написать сложные SQL запросы и даже сгенерировать свои аналоги Ternary Logic Partitioning (TLP), метода, применяемого в SQLancer для поиска багов в базах данных.
А если серьезно, то ребята из StarRocks действительно постарались, чтобы натренировать модель ChatGPT составлять SQL запросы, необходимые для проверки эффективности и надежности баз данных. Вот яркий пример одного из преимуществ ChatGPT по сравнению с классическими инструментами: при добавлении нового оператора или функции, необходимо также обновлять исходный код в инструменте, используемом для тестирования. В случае же с ChatGPT, разработчики просто указали в чате документы JSON, которого ранее не было в проекте, и нейросеть сгенерировала нужные SQL запросы без каких-либо дополнительных хлопот.
Конечно, в этой сказке не все так гладко: ChatGPT не защищен от ошибок и может составить некорректный запрос, однако однозначно можно сказать, что возможности этой генеративной модели в будущем трансформируют классический подход к работе с базами данных и положат начало инструментам тестирования нового поколения.
Audio
Podlodka #314 – AI пишет код
Разговоры про то, что программистов вот-вот заменит какая-то технология, ведутся каждые пару лет. Но в этот раз, кажется, все серьезно – ChatGPT пишет полноценные мобильные приложения, конфиги для AWS и разбирает сложные баги. Чтобы разобраться с тем, а как конкретно LLM генерируют код, как этим можно управлять, и что нас ждет в будущем, мы позвали Егора Богомолова, исследователя в лаборатории ML4SE JetBrains Research.
🎧 Слушать выпуск
Разговоры про то, что программистов вот-вот заменит какая-то технология, ведутся каждые пару лет. Но в этот раз, кажется, все серьезно – ChatGPT пишет полноценные мобильные приложения, конфиги для AWS и разбирает сложные баги. Чтобы разобраться с тем, а как конкретно LLM генерируют код, как этим можно управлять, и что нас ждет в будущем, мы позвали Егора Богомолова, исследователя в лаборатории ML4SE JetBrains Research.
🎧 Слушать выпуск
Forwarded from Data-comics
Автоматизируют ли датавиз?
Не думаю, что датавиз профи всерьёз переживают о том, что АИ их заменит, но все же, Nick Desbaratas следует тренду и тоже, вслед за Steve Wexler и Andy Cotgrave, рассуждает на эту тему.
Свои рассуждения он выкладывает вот в такой статье.
https://www.practicalreporting.com/blog/2023/3/27/will-ai-automate-data-visualization
Заменят? 😁😁😁
Не думаю, что датавиз профи всерьёз переживают о том, что АИ их заменит, но все же, Nick Desbaratas следует тренду и тоже, вслед за Steve Wexler и Andy Cotgrave, рассуждает на эту тему.
Свои рассуждения он выкладывает вот в такой статье.
https://www.practicalreporting.com/blog/2023/3/27/will-ai-automate-data-visualization
Заменят? 😁😁😁
Forwarded from Мысли Рвачева
😱😱😱BabyAGI😱😱😱
Ребята реализовали идею, о которой я давно думаю.
Что если поставить GPT-4 высокоуровневую задачу (например сделать мир лучше или сделать исследование в определенном направлении), а затем запустить в бесконечный цикл последовательность
1) С помощью GPT-4 разбить задачу на подзадачи
2) Добавить все подзадачи в список
3) Приоритезировать список
4) Выполнить задачу в таком же цикле (разбить на позадачи, добавить в список и т.д.)
Интересно, но в таком подходе нейронка
а) уходит в очень интересные идеи
б) тратит очень много токенов API 😂
P.S. Изначально проект задумывался как AI стартапер, но на выходе стало понятно, что подход применим к любой задаче.
P.P.S. То, о чем думал я и чего не хватает в проекте, это реального выполнения. Ребята “выполняют” задачу с помощью лингвистической модели в то время как я думал в ключе “сгенерируй код” которой я бы отправлял в python execution.
Ребята заопенсорсили проект
Github: https://github.com/yoheinakajima/babyagi
Paper: https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/
UPD: Huston, у нас проблемы!
Другие ребята заопенсорсили похожий проект, который помимо того, что умеет лазить в интернет, так же генерит код и пытается его исполнять 😱😱😱
Github: https://github.com/Torantulino/Auto-GPT
#agi
Ребята реализовали идею, о которой я давно думаю.
Что если поставить GPT-4 высокоуровневую задачу (например сделать мир лучше или сделать исследование в определенном направлении), а затем запустить в бесконечный цикл последовательность
1) С помощью GPT-4 разбить задачу на подзадачи
2) Добавить все подзадачи в список
3) Приоритезировать список
4) Выполнить задачу в таком же цикле (разбить на позадачи, добавить в список и т.д.)
Интересно, но в таком подходе нейронка
а) уходит в очень интересные идеи
б) тратит очень много токенов API 😂
P.S. Изначально проект задумывался как AI стартапер, но на выходе стало понятно, что подход применим к любой задаче.
P.P.S. То, о чем думал я и чего не хватает в проекте, это реального выполнения. Ребята “выполняют” задачу с помощью лингвистической модели в то время как я думал в ключе “сгенерируй код” которой я бы отправлял в python execution.
Ребята заопенсорсили проект
Github: https://github.com/yoheinakajima/babyagi
Paper: https://yoheinakajima.com/task-driven-autonomous-agent-utilizing-gpt-4-pinecone-and-langchain-for-diverse-applications/
UPD: Huston, у нас проблемы!
Другие ребята заопенсорсили похожий проект, который помимо того, что умеет лазить в интернет, так же генерит код и пытается его исполнять 😱😱😱
Github: https://github.com/Torantulino/Auto-GPT
#agi
Forwarded from { между скобок } анонсы 📣 (Grisha Skobelev)
🗓 08 апреля 20:00 по мск ChatGPT в помощь архитектору / Николай Голов, Иван Шумов
Недавно мы обсуждали как устроен и как работает ChatGPT, и что он может полезен для разработчиков. В эту субботу мы планируем в примерах разобрать применение ChatGPT 4.0 для решения задач ИТ-архитектора вместе с Иваном Шумовым. Эта встреча будет полезна разработчикам, архитекторам и всем, кто интересуется технологиями разработки ПО. Присоединяйтесь - будущее уже наступило 🤩
Встречаемся в субботу в 20:00 по мск, подключайтесь к YouTube трансляции или в Zoom
А в комментариях к этому посту оставляйте свои вопросы, которые хотели бы задать Коле и Ване ⤵️
Недавно мы обсуждали как устроен и как работает ChatGPT, и что он может полезен для разработчиков. В эту субботу мы планируем в примерах разобрать применение ChatGPT 4.0 для решения задач ИТ-архитектора вместе с Иваном Шумовым. Эта встреча будет полезна разработчикам, архитекторам и всем, кто интересуется технологиями разработки ПО. Присоединяйтесь - будущее уже наступило 🤩
Встречаемся в субботу в 20:00 по мск, подключайтесь к YouTube трансляции или в Zoom
А в комментариях к этому посту оставляйте свои вопросы, которые хотели бы задать Коле и Ване ⤵️
Forwarded from Сиолошная
Вы наверняка подозревали, что у моделей есть свой свой hub. Ну в смысле место, куда люди загружают обученные нейронки, а другие могут их оттуда скачивать и использовать. Вы же об этом подумали, да? 😑
Так вот, сейчас индустриальный стандарт для опенсорсных моделей - это HuggingFace 🤗 Hub.
В статье HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace предлагается дать ChatGPT возможность обращаться к этим моделям (а их тысячи, и они решают сотни разных задач). То есть саму языковую модель на основе GPT мы не учим рисовать изображения или переводить текст в речь, но мы даём ей возможность использовать внешние инструменты. Похожая по смыслу работа уже упоминалась в канале, но та была куда менее масштабируемой, и требовала ресурсов для запуска нейронок локально.
Итого получаем примерно следующее:
1) ChatGPT получает команду на человеческом языке
2) переводит команду в набор "Задач", которые надо выполнить
3) для каждой задачи среди тысяч доступных моделей выбирается нужная (по предоставленному описанию)
4) ChatGPT читает описание аргументов, которые нужно дать модели, и готовит их
5) после исполнения задачи ChatGPT смотрит на результат и движется по плану дальше, повторяя пункты 3-5
Для лучшего понимания можно рассмотреть скриншот из статьи со следующим запросом: "создай изображение, на котором девочка читает книгу, а ее поза такая же, как у мальчика на изображении <такое то>. А после опиши новое изображение своим голосом".
Модель для такого запроса выделяет целых 6 задач (см. в красных рамках на изображении), и успешно справляется с их последовательным выполнением.
Код в репозитории с очень занятным названием "Джарвис": https://github.com/microsoft/JARVIS. Наверное, это отсылка к ИИ-ассистенту из фильма "Железный Человек" :) (я бы точно так же назвал, 💯)
Так вот, сейчас индустриальный стандарт для опенсорсных моделей - это HuggingFace 🤗 Hub.
В статье HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace предлагается дать ChatGPT возможность обращаться к этим моделям (а их тысячи, и они решают сотни разных задач). То есть саму языковую модель на основе GPT мы не учим рисовать изображения или переводить текст в речь, но мы даём ей возможность использовать внешние инструменты. Похожая по смыслу работа уже упоминалась в канале, но та была куда менее масштабируемой, и требовала ресурсов для запуска нейронок локально.
Итого получаем примерно следующее:
1) ChatGPT получает команду на человеческом языке
2) переводит команду в набор "Задач", которые надо выполнить
3) для каждой задачи среди тысяч доступных моделей выбирается нужная (по предоставленному описанию)
4) ChatGPT читает описание аргументов, которые нужно дать модели, и готовит их
5) после исполнения задачи ChatGPT смотрит на результат и движется по плану дальше, повторяя пункты 3-5
Для лучшего понимания можно рассмотреть скриншот из статьи со следующим запросом: "создай изображение, на котором девочка читает книгу, а ее поза такая же, как у мальчика на изображении <такое то>. А после опиши новое изображение своим голосом".
Модель для такого запроса выделяет целых 6 задач (см. в красных рамках на изображении), и успешно справляется с их последовательным выполнением.
Код в репозитории с очень занятным названием "Джарвис": https://github.com/microsoft/JARVIS. Наверное, это отсылка к ИИ-ассистенту из фильма "Железный Человек" :) (я бы точно так же назвал, 💯)
Please open Telegram to view this post
VIEW IN TELEGRAM