Сегодня прошел вебинар AI Coding Assistants: Как программисту эффективно использовать AI
Огромное спасибо всем за участие, вопросы и обсуждения!
В комментариях к этому посту - конспекты того, что участники семинара вынесли из него для себя: новые вдохновляющие идеи и практические приемы. И это очень круто! 🤗
Основной недостаток - не хватило времени на вторую практическую часть. Поэтому в декабре я проведу этот вебинар бесплатно еще раз, в расширенном формате. Прочитать про вебинар и записаться можно по старой форме.
Кстати, старые записи - действительны. Тем, кто участвовал, но хочет пройти еще раз - можно записаться заново. Отбирать, как обычно, будет ChatGPT.
Ваш, @llm_under_hood 🤗
Огромное спасибо всем за участие, вопросы и обсуждения!
В комментариях к этому посту - конспекты того, что участники семинара вынесли из него для себя: новые вдохновляющие идеи и практические приемы. И это очень круто! 🤗
Основной недостаток - не хватило времени на вторую практическую часть. Поэтому в декабре я проведу этот вебинар бесплатно еще раз, в расширенном формате. Прочитать про вебинар и записаться можно по старой форме.
Кстати, старые записи - действительны. Тем, кто участвовал, но хочет пройти еще раз - можно записаться заново. Отбирать, как обычно, будет ChatGPT.
Ваш, @llm_under_hood 🤗
❤14👍1👎1
#клиентспросил Кейс про агента, который программирует себя.
У меня есть три любимых клиента, которые упорно хотят делать агентов и умные продукты. А я все сопротивляюсь и говорю, что "ну не будет эта фигня со свободой воли стабильно работать". 🤪
Но вода камень точит. В последних версиях продуктов c LLM под капотом задачи практически целиком формулируются самой моделью. Просто у нее написание больших промптов получается лучше.
На картинке в комментариях изображена упрощенная схема системы по генерации лидов, в последней версии. Той самой, про которую клиент в понедельник оставил отзыв c пятью восклицательными знаками и смайликом.
Вот как она работает.
На самых первых этапах работы система “знакомится” с содержанием базы знаний (тысячи PDF файлов размера от 10 до 200 мегабайт) и сочиняет пояснения и инструкции для дальнейших промптов - про специфику запроса и про специфику языка документов.
На втором этапе система составляет запрос к поисковому движку. Она отталкивается от запроса человека, но транслирует его в язык документов и разворачивает на основе ранее написанных инструкций. А потом просматривает результаты и тюнит поисковый запрос, чтобы там было меньше мусора.
На финальных этапах система собирает в кучку найденные куски текста и формулирует ответ, стараясь по возможности цитировать релевантные фрагменты. При этом все еще используются ранее написанные инструкции.
После того, как я стал доверять моделям сочинять инструкции и пояснения для себя - работать стало проще, а продукты стали гибче реагировать на хотелки клиентов. Но первая пара предложений в каждом промпте всегда составлена мной. Чтобы не забывали, кто тут главный!
Ваш, @llm_under_hood 🤗
PS: Другие посты из серии #клиентспросил:
- зачем нужно распознавание картинок в ChatGPT?
- Ринат, клиент хочет работать с AI продуктом конкурента. Что делать?
- словарик с краткими описаниями самых важных терминов (labs)
У меня есть три любимых клиента, которые упорно хотят делать агентов и умные продукты. А я все сопротивляюсь и говорю, что "ну не будет эта фигня со свободой воли стабильно работать". 🤪
Но вода камень точит. В последних версиях продуктов c LLM под капотом задачи практически целиком формулируются самой моделью. Просто у нее написание больших промптов получается лучше.
На картинке в комментариях изображена упрощенная схема системы по генерации лидов, в последней версии. Той самой, про которую клиент в понедельник оставил отзыв c пятью восклицательными знаками и смайликом.
Вот как она работает.
На самых первых этапах работы система “знакомится” с содержанием базы знаний (тысячи PDF файлов размера от 10 до 200 мегабайт) и сочиняет пояснения и инструкции для дальнейших промптов - про специфику запроса и про специфику языка документов.
На втором этапе система составляет запрос к поисковому движку. Она отталкивается от запроса человека, но транслирует его в язык документов и разворачивает на основе ранее написанных инструкций. А потом просматривает результаты и тюнит поисковый запрос, чтобы там было меньше мусора.
На финальных этапах система собирает в кучку найденные куски текста и формулирует ответ, стараясь по возможности цитировать релевантные фрагменты. При этом все еще используются ранее написанные инструкции.
После того, как я стал доверять моделям сочинять инструкции и пояснения для себя - работать стало проще, а продукты стали гибче реагировать на хотелки клиентов. Но первая пара предложений в каждом промпте всегда составлена мной. Чтобы не забывали, кто тут главный!
Ваш, @llm_under_hood 🤗
PS: Другие посты из серии #клиентспросил:
- зачем нужно распознавание картинок в ChatGPT?
- Ринат, клиент хочет работать с AI продуктом конкурента. Что делать?
- словарик с краткими описаниями самых важных терминов (labs)
🔥20❤3😁2👍1
#weekend пост про кулинарию, multi-hop и fine-tuning
Надо было мне найти видео на YouTube. Про брутальных Норвежских парней, которые готовят еду. Запрос звучал так:
ChatGPT полез в интернет с запросом и нашел вариант совпадающий буквально: шведский канал Brutal Kokk - Brutal Cooking). Это было то, что я просил, но не то, что я хотел.
Поэтому я переключил его с retrieval режима на ассоциативный поиск:
И ChatGPT сразу же попал в точку! Это был норвежский канал "Regular Ordinary Swedish Meal Time". Не Норвегия, а Швеция. Про брутальность в названии канала ни слова. Но как они готовят морковный пирог!
Подход удобен в ежедневной работе с ChatGPT, но его можно и абстрагировать на продукты с LLM под капотом в целом.
Если нужно оперировать данными на уровне ассоциаций, тогда имеет смысл смотреть в fine-tuning моделей по вашим данным. Буквально тексты цитировать модель не сможет (для этого нужен retrieval), но у нее может появиться возможность работать со смыслами и ассоциациями. Такой вот дополнительный движок для multi-hop поиска и reasoning.
Ваш, @llm_under_hood 🤗
Надо было мне найти видео на YouTube. Про брутальных Норвежских парней, которые готовят еду. Запрос звучал так:
Help me to find name of YouTube series where cook makes meals in a brutal Norwegian style. With a lot of smashing
ChatGPT полез в интернет с запросом и нашел вариант совпадающий буквально: шведский канал Brutal Kokk - Brutal Cooking). Это было то, что я просил, но не то, что я хотел.
Поэтому я переключил его с retrieval режима на ассоциативный поиск:
Wrong. Don’t browse, just make your own guess
И ChatGPT сразу же попал в точку! Это был норвежский канал "Regular Ordinary Swedish Meal Time". Не Норвегия, а Швеция. Про брутальность в названии канала ни слова. Но как они готовят морковный пирог!
Подход удобен в ежедневной работе с ChatGPT, но его можно и абстрагировать на продукты с LLM под капотом в целом.
Если нужно оперировать данными на уровне ассоциаций, тогда имеет смысл смотреть в fine-tuning моделей по вашим данным. Буквально тексты цитировать модель не сможет (для этого нужен retrieval), но у нее может появиться возможность работать со смыслами и ассоциациями. Такой вот дополнительный движок для multi-hop поиска и reasoning.
Ваш, @llm_under_hood 🤗
🔥11❤2👏2😁1
Какие сложные проблемы вам помог решить ChatGPT?
Не просто для удобства, но вещи, которые невозможно было бы сделать самостоятельно?
Пишите в комменты!
А вот примеры кейсов, которые люди пишут в этой вдохновляющей ветке OpenAI в Reddit:
- Написать письмо директору школы, где ребенка буллят
- Выторговать скидку на авто, хотя торговаться совсем не нравится
- Продолжать общаться с бывшим мужем/бывшей женой после сложного развода
- Выучить C++ достаточно, чтобы написать сложный продукт
- Выучить Python, чтобы сделать дашборд для отслеживания лечения диабета у ребенка
- Помочь ребенку с трудной задачей по иностранному языку
- Создать software startup с нуля без опыта программирования
- Морально подготовиться к общению с отцом любимой девушки. Отец говорит на другом языке, и голосовой ChatGPT-4 играет его роль.
Ваш, @llm_under_hood 🤗
Не просто для удобства, но вещи, которые невозможно было бы сделать самостоятельно?
Пишите в комменты!
А вот примеры кейсов, которые люди пишут в этой вдохновляющей ветке OpenAI в Reddit:
- Написать письмо директору школы, где ребенка буллят
- Выторговать скидку на авто, хотя торговаться совсем не нравится
- Продолжать общаться с бывшим мужем/бывшей женой после сложного развода
- Выучить C++ достаточно, чтобы написать сложный продукт
- Выучить Python, чтобы сделать дашборд для отслеживания лечения диабета у ребенка
- Помочь ребенку с трудной задачей по иностранному языку
- Создать software startup с нуля без опыта программирования
- Морально подготовиться к общению с отцом любимой девушки. Отец говорит на другом языке, и голосовой ChatGPT-4 играет его роль.
Ваш, @llm_under_hood 🤗
❤12🔥5
Amazon повышает цены в два раза на Claude (Amazon Bedrock Edition).
Они повышают цены на "Provisioned Throughput Hourly Price" (Часовая cтоимость предоставляемой пропускной способности). Похоже, что Сlaude пользуется хорошей такой популярностью при пережевывании больших объемов информации 👍
Интересно, не было ли это вызвано массовым переездом компаний с OpenAI на что-то более политически стабильное в свете недавних событий? 😆
Source: только что пришел email от aws.
Ваш, @llm_under_hood 🤗
Они повышают цены на "Provisioned Throughput Hourly Price" (Часовая cтоимость предоставляемой пропускной способности). Похоже, что Сlaude пользуется хорошей такой популярностью при пережевывании больших объемов информации 👍
Интересно, не было ли это вызвано массовым переездом компаний с OpenAI на что-то более политически стабильное в свете недавних событий? 😆
Source: только что пришел email от aws.
Ваш, @llm_under_hood 🤗
😢4💯1
#клиентспросил Кейс про агента-писателя, которого научил ChatGPT
Сегодня я зарелизил вторую версию ассистента для маркетолога (описание изначального кейса тут). Теперь хочу кратко рассказать про реализацию технологических новинок под капотом.
Вторая версия отличается от первой:
- может писать на любые темы о продуктах компании (а не только про один продукт применительно к одной области)
- сама умеет выбирать релевантные тексты из базы знаний, мусор не тащит.
- пользователь может контроллировать процесс написания статьи на любом шаге (а может и клацкать Next)
- Базу знаний можно пополнять хоть как, главное следовать общим инструкциям по организации.
Это все фишки. Самое интересное - улучшения под капотом. А там я выкинул почти весь код и абсолютно все промпты. Вместо этого осталась дюжина квантов информации - эссе, конспектов и должностных инструкций на разные темы:
- как устроена база знаний, в какие папки и каким образом складываются тексты
- как правильно искать в базе знаний
- какие методы пробовать при написании плана статей, на какие вопросы отвечать?
- как правильно упоминать продукты компании в статьях
- как по шагам разворачивать план статьи в черновик
Все эти конспекты писал сам ChatGPT-4 с большим контекстом! 🚀
Я просто брал самый мощный ChatGPT, скармливал ему весь контекст, не жалея tokens. И просил ужать всю информацию в очень компактное эссе на заданную тему или должностную инструкцию.
Например, скармливал всю структуру базы знаний с выжимками и просил сформировать инструкции для "младшего ассистента", который будет искать там материалы на какие-то темы.
Либо брал пачку примерных запросов, просил классифицировать их с точки зрения разных подходов к поиску информации. А потом - написать эссе для "младшего ассистента".
Когда у нас есть такие конспекты, промпты превращаются в очень простую цепочку в формате:
Четыре промпта в таком духе и получается рабочий API. Остальные шаги:
- Шаг 2: набросай мне план статьи на тему X. См гайды и релевантные выдержки из базы знаний ниже
- Шаг 3: разверни мне этот план в черновик. Все те же выдержки, а так же статьи про красивое написание статей - ниже
- Шаг 4: вычитай вот этот черновик. Гайды по стилю компании и примеры красиво написанных статей на схожую тему - ниже.
Вот я вам и рассказал все секреты реализации 😊
Кстати, тут получается забавно. На первом и втором шаге LLM планирует свою работу на третьем шаге. Но при этом отталкивается от человеческого запроса и заранее написанных гайдов про выполнение этих запросов. А те планы-то писались все той же ChatGPT. Немножко похоже на агентов? 🤪
В общем, оказывается, не нужно мучаться, писать сложные промпты, городить большие шаблоны и retrieval-логику. Можно просто сесть с мощной GPT-4 и заранее подготовить конспекты, эссе и должностные инструкции, ужав в них всю релевантную информацию.
Вся эта информация и будет основным кодом работающего приложения с LLM под капотом.
А если появятся новые нюансы и моменты, всегда можно поднять старый промпт и попросить переписать эссе с учетом новой информации.
Кто еще использует ChatGPT для компрессии информации и написания промптов для агентов?
Ваш, @llm_under_hood 🤗
PS: В комментариях выложу пример черновика статьи, которую написала эта система, и отзыв клиента.
PPS: Другие посты из серии #клиентспросил:
- Автоматическое исправление ошибок в каталогах продуктов
- Кейс про товары, которые невозможно найти
- Персональный ассистент в компании
Сегодня я зарелизил вторую версию ассистента для маркетолога (описание изначального кейса тут). Теперь хочу кратко рассказать про реализацию технологических новинок под капотом.
Вторая версия отличается от первой:
- может писать на любые темы о продуктах компании (а не только про один продукт применительно к одной области)
- сама умеет выбирать релевантные тексты из базы знаний, мусор не тащит.
- пользователь может контроллировать процесс написания статьи на любом шаге (а может и клацкать Next)
- Базу знаний можно пополнять хоть как, главное следовать общим инструкциям по организации.
Это все фишки. Самое интересное - улучшения под капотом. А там я выкинул почти весь код и абсолютно все промпты. Вместо этого осталась дюжина квантов информации - эссе, конспектов и должностных инструкций на разные темы:
- как устроена база знаний, в какие папки и каким образом складываются тексты
- как правильно искать в базе знаний
- какие методы пробовать при написании плана статей, на какие вопросы отвечать?
- как правильно упоминать продукты компании в статьях
- как по шагам разворачивать план статьи в черновик
Все эти конспекты писал сам ChatGPT-4 с большим контекстом! 🚀
Я просто брал самый мощный ChatGPT, скармливал ему весь контекст, не жалея tokens. И просил ужать всю информацию в очень компактное эссе на заданную тему или должностную инструкцию.
Например, скармливал всю структуру базы знаний с выжимками и просил сформировать инструкции для "младшего ассистента", который будет искать там материалы на какие-то темы.
Либо брал пачку примерных запросов, просил классифицировать их с точки зрения разных подходов к поиску информации. А потом - написать эссе для "младшего ассистента".
Когда у нас есть такие конспекты, промпты превращаются в очень простую цепочку в формате:
Эй, младший ассистент. Дай мне названия файлов из базы знаний для написания статьи на тему X. Мы сейчас на первом шаге процесса написания статьи. См ниже должностные инструкции и гайды на эту тему.
- общее описание всего процесса написания статьи
- гайд про структуру базы знаний
- гайд про поиску в базе знаний на тему
- эссе про компанию и чем она вообще занимается
- краткий каталог продуктов и сервисов компании
Четыре промпта в таком духе и получается рабочий API. Остальные шаги:
- Шаг 2: набросай мне план статьи на тему X. См гайды и релевантные выдержки из базы знаний ниже
- Шаг 3: разверни мне этот план в черновик. Все те же выдержки, а так же статьи про красивое написание статей - ниже
- Шаг 4: вычитай вот этот черновик. Гайды по стилю компании и примеры красиво написанных статей на схожую тему - ниже.
Вот я вам и рассказал все секреты реализации 😊
Кстати, тут получается забавно. На первом и втором шаге LLM планирует свою работу на третьем шаге. Но при этом отталкивается от человеческого запроса и заранее написанных гайдов про выполнение этих запросов. А те планы-то писались все той же ChatGPT. Немножко похоже на агентов? 🤪
В общем, оказывается, не нужно мучаться, писать сложные промпты, городить большие шаблоны и retrieval-логику. Можно просто сесть с мощной GPT-4 и заранее подготовить конспекты, эссе и должностные инструкции, ужав в них всю релевантную информацию.
Вся эта информация и будет основным кодом работающего приложения с LLM под капотом.
А если появятся новые нюансы и моменты, всегда можно поднять старый промпт и попросить переписать эссе с учетом новой информации.
Кто еще использует ChatGPT для компрессии информации и написания промптов для агентов?
Ваш, @llm_under_hood 🤗
PS: В комментариях выложу пример черновика статьи, которую написала эта система, и отзыв клиента.
PPS: Другие посты из серии #клиентспросил:
- Автоматическое исправление ошибок в каталогах продуктов
- Кейс про товары, которые невозможно найти
- Персональный ассистент в компании
🔥22👍8❤5👏2
Как хорошо ChatGPT-4 Turbo говорит по-русски? А GPT-3.5?
Вот черновая версия языкового бенчмарка для GPT/LLM! Спасибо всем, кто прислал свои языки!
Еще не все формы с языками обработаны, я буду добавлять их по мере возможности. Но можно продолжать присылать новые языки, которых тут нет! Присылайте их в группу "Языки разные - код один".
Локальные open-source модели тоже позже добавлю в бенчмарк.
Ваш, @llm_under_hood 🤗
PS: Ноябрьский бенчмарк LLM моделей на продуктовых задачах (включая GPT-4 Turbo)
Вот черновая версия языкового бенчмарка для GPT/LLM! Спасибо всем, кто прислал свои языки!
Еще не все формы с языками обработаны, я буду добавлять их по мере возможности. Но можно продолжать присылать новые языки, которых тут нет! Присылайте их в группу "Языки разные - код один".
Локальные open-source модели тоже позже добавлю в бенчмарк.
Ваш, @llm_under_hood 🤗
PS: Ноябрьский бенчмарк LLM моделей на продуктовых задачах (включая GPT-4 Turbo)
🔥16🤗1
Вторая версия языкового бенчмарка LLM моделей включает не только OpenAI ChatGPT. Теперь тут можно посмотреть, как хорошо понимают тот или иной язык локальные модели - те, которые можно скачать и запустить самостоятельно.
Чем лучше понимает язык модель, тем качественней будут ее ответы, и тем меньше будет "галлюцинаций" в них.
Бенчмарк - часть тестов LLM моделей от Trustbit.
Финальная версия и все обновления появятся в первую очередь в этом канале!
Ваш, @llm_under_hood 🤗
Чем лучше понимает язык модель, тем качественней будут ее ответы, и тем меньше будет "галлюцинаций" в них.
Бенчмарк - часть тестов LLM моделей от Trustbit.
Финальная версия и все обновления появятся в первую очередь в этом канале!
Ваш, @llm_under_hood 🤗
🔥17👏3
Как "завалить" ChatGPT 4 на простейших вопросах?
Достаточно задать вопросы, которые очевидны для человека, но не для текстовой модели. Например, вопросы про рифму или ударения.
Задним числом это очевидно - словарей и букварей с фонетикой не так много в текстовых данных для обучения. Текстовая модель будет тут плавать. А вот голосовые модели будут "знать" это гораздо лучше.
Именно поэтому вопрос про рифму, который изначально был в языковом бенчмарке для LLM, мы оттуда убрали.
Ваш, @llm_under_hood 🤗
Достаточно задать вопросы, которые очевидны для человека, но не для текстовой модели. Например, вопросы про рифму или ударения.
Задним числом это очевидно - словарей и букварей с фонетикой не так много в текстовых данных для обучения. Текстовая модель будет тут плавать. А вот голосовые модели будут "знать" это гораздо лучше.
Именно поэтому вопрос про рифму, который изначально был в языковом бенчмарке для LLM, мы оттуда убрали.
Ваш, @llm_under_hood 🤗
🔥5
#клиентпорадовал Кто внедряет AI системы в бизнес? Давайте делиться приятными отзывами клиентов!
И радостью поделимся, и потенциальные клиенты могут увидеть наши результаты 👍
Для анонимизации можно просить ChatGPT пересказать и перевести. Но при этом исходный текст должен быть именно написан клиентом.
Ваш, @llm_under_hood 🤗
И радостью поделимся, и потенциальные клиенты могут увидеть наши результаты 👍
Для анонимизации можно просить ChatGPT пересказать и перевести. Но при этом исходный текст должен быть именно написан клиентом.
Ваш, @llm_under_hood 🤗
🔥6
Multilingual LLM Benchmark December-2023.png
420.4 KB
Бенчмарк ChatGPT и прочих LLM моделей за Декабрь!
- Тут есть наш первый мультиязычный бенчмарк, который сделали вместе с лингвистами из Код Один. Нам прислали 17 языков, каждый из которых был заполнен носителем языка.
- В продуктовый бенчмарк добавили Orca 2, Starling и Mistral 7B Notus-v1. Чудес не произошло.
- Все модели пересчитаны заново. Это - 12150 запросов всего. А если вспомнить про включенный везде
- Ссылка на этот пост: https://news.1rj.ru/str/llm_under_hood/217
- FAQ по декабрьскому бенчмарку
Ваш, @llm_under_hood 🤗
- Тут есть наш первый мультиязычный бенчмарк, который сделали вместе с лингвистами из Код Один. Нам прислали 17 языков, каждый из которых был заполнен носителем языка.
- В продуктовый бенчмарк добавили Orca 2, Starling и Mistral 7B Notus-v1. Чудес не произошло.
- Все модели пересчитаны заново. Это - 12150 запросов всего. А если вспомнить про включенный везде
beam-search=4 то и того больше.- Ссылка на этот пост: https://news.1rj.ru/str/llm_under_hood/217
- FAQ по декабрьскому бенчмарку
Ваш, @llm_under_hood 🤗
❤13🤩4🤔2🤗1
Новости про конкурента ChatGPT от Google - Gemini, в сухом остатке.
- Заявлено три модели - Ultra, Pro & Nano.
- Pro & Nano будут доступны в Google Cloud в этом месяце.
- Pro по их бенчмаркам лучше, чем ChatGPT 3.5.
- Ultra, которая по оценкам лучше ChatGPT 4, выйдет когда-то в следующем году.
Имхо, если бы у Google было что-то стоящее, они бы выкатили сразу (как это делают OpenAI или Apple), а не кормили обещаниями.
Ваш, @llm_under_hood 🤗
- Заявлено три модели - Ultra, Pro & Nano.
- Pro & Nano будут доступны в Google Cloud в этом месяце.
- Pro по их бенчмаркам лучше, чем ChatGPT 3.5.
- Ultra, которая по оценкам лучше ChatGPT 4, выйдет когда-то в следующем году.
Имхо, если бы у Google было что-то стоящее, они бы выкатили сразу (как это делают OpenAI или Apple), а не кормили обещаниями.
Ваш, @llm_under_hood 🤗
❤14
Нас внезапно стало больше 1000 человек в канале. Давайте знакомиться и обрастать связями!
Networking всегда полезен, а во времена перемен - особенно. 🤝 Вдруг кому пригодится новая интересная работа или нужен будет человек в проект?
Три простых шага:
1. Вот мой linkedIn профиль: https://www.linkedin.com/in/abdullin/. Добавляйтесь - я добавлю всех!
2. Пишите свой профиль и два слова о себе в комментарии к этому посту. Добавляйте остальных, кто уже отписал выше
3. Время от времени поглядывайте в LinkedIn и отвечайте на заявки
Ваш, @llm_under_hood 🤗
Networking всегда полезен, а во времена перемен - особенно. 🤝 Вдруг кому пригодится новая интересная работа или нужен будет человек в проект?
Три простых шага:
1. Вот мой linkedIn профиль: https://www.linkedin.com/in/abdullin/. Добавляйтесь - я добавлю всех!
2. Пишите свой профиль и два слова о себе в комментарии к этому посту. Добавляйте остальных, кто уже отписал выше
3. Время от времени поглядывайте в LinkedIn и отвечайте на заявки
Ваш, @llm_under_hood 🤗
🤝11🔥5🤡1
Хотите первыми узнать про модель, о которой будут писать в крупных каналах только на следующей неделе? 😎
Знакомьтесь - к трансформерам пришел милый пушистый зверек по имени StripedHyena-7B.
По цифрам - ничего выдающегося. Чуть хуже, чем Mistral 7B на задачах с маленьким контекстом, немного лучше на задачах суммаризации с большим контекстом.
Но это не трансформер! Ребята из Together.AI заменили convolutions на слой state-space model (SMM), что позволило ускорить работу модели. Да и требования к памяти стали еще лучше.
Потенциально это революция.
Blog | HuggingFace | базовая модель | Github
Вторая интересная модель - это просто ссылка на torrent от Mistral 7B. Там что-то новенькое в виде 8 экспертов на базе 7B моделей (MoE). Никто точно не знает, как это запускать, но все с нетерпением ждут NeurIPS - крупнейшую конференцию по deep learning на следующей неделе!
Andrej Karpathy удивляется, что выложили torrent, без профессионально смонтированного видео про революцию в AI 🤣
Ваш, @llm_under_hood 🤗
Знакомьтесь - к трансформерам пришел милый пушистый зверек по имени StripedHyena-7B.
По цифрам - ничего выдающегося. Чуть хуже, чем Mistral 7B на задачах с маленьким контекстом, немного лучше на задачах суммаризации с большим контекстом.
Но это не трансформер! Ребята из Together.AI заменили convolutions на слой state-space model (SMM), что позволило ускорить работу модели. Да и требования к памяти стали еще лучше.
Потенциально это революция.
Blog | HuggingFace | базовая модель | Github
Вторая интересная модель - это просто ссылка на torrent от Mistral 7B. Там что-то новенькое в виде 8 экспертов на базе 7B моделей (MoE). Никто точно не знает, как это запускать, но все с нетерпением ждут NeurIPS - крупнейшую конференцию по deep learning на следующей неделе!
Andrej Karpathy удивляется, что выложили torrent, без профессионально смонтированного видео про революцию в AI 🤣
Ваш, @llm_under_hood 🤗
🔥27❤3🤩3👍2🤔1
Вам не нужен RAG! И fine-tuning тоже не нужен!
Простите, это крик души после сегодняшнего воркшопа для европейской компании 😤
Если вы автоматизируете бизнес процессы при помощи AI/LLM/GPT, то не обязательно начинать проект с использования "тяжелой артиллерии": RAG, fine-tuning, RLHF и векторных БД. На использование и разворачивание подобных вещей могут уйти недели. А ведь можно показать бизнесу готовый к использованию прототип за считанные дни.
Для начала стоит выжать все возможное из обычного prompt engineering с дистилляцией знаний. Например:
1. Начать собирать входы и выходы на шагах процесса, который мы автоматизируем (Capture Feedback). Разметить вручную пару десятков кейсов
2. Сесть с экспертом и сгрести в кучу все релевантные документы на тему.
3. Сесть с ChatGPT и синтезировать краткие методички про то, как данный кейс автоматизируется.
4. Посмотреть, как ChatGPT (или локальная модель) справляются с известными кейсами на базе методичек. Собрать feedback и оценки
5. Попросить ChatGPT проверить оценки, категоризовать их и дополнить методичку.
6. Выкатить первую версию
7. Повторять шаги со сбором фидбэка и обновлением методичек.
Такое подходит к разнообразным кейсам от написания статьей по продуктам (да, там нет embeddings!), экспорта типовых запросов из email переписки, написания ключевых слов для продуктов, или создания отчетов по работе международного customer support за день.
Да, если речь идет про генерацию лидов из тысяч годовых отчетов по 20-200MB каждый, то там без RAG уже будет тяжело. Но ведь и мы начинаем не с таких сложных кейсов?
Пар выпустил))
Ваш, @llm_under_hood 🤗
Простите, это крик души после сегодняшнего воркшопа для европейской компании 😤
Если вы автоматизируете бизнес процессы при помощи AI/LLM/GPT, то не обязательно начинать проект с использования "тяжелой артиллерии": RAG, fine-tuning, RLHF и векторных БД. На использование и разворачивание подобных вещей могут уйти недели. А ведь можно показать бизнесу готовый к использованию прототип за считанные дни.
Для начала стоит выжать все возможное из обычного prompt engineering с дистилляцией знаний. Например:
1. Начать собирать входы и выходы на шагах процесса, который мы автоматизируем (Capture Feedback). Разметить вручную пару десятков кейсов
2. Сесть с экспертом и сгрести в кучу все релевантные документы на тему.
3. Сесть с ChatGPT и синтезировать краткие методички про то, как данный кейс автоматизируется.
4. Посмотреть, как ChatGPT (или локальная модель) справляются с известными кейсами на базе методичек. Собрать feedback и оценки
5. Попросить ChatGPT проверить оценки, категоризовать их и дополнить методичку.
6. Выкатить первую версию
7. Повторять шаги со сбором фидбэка и обновлением методичек.
Такое подходит к разнообразным кейсам от написания статьей по продуктам (да, там нет embeddings!), экспорта типовых запросов из email переписки, написания ключевых слов для продуктов, или создания отчетов по работе международного customer support за день.
Да, если речь идет про генерацию лидов из тысяч годовых отчетов по 20-200MB каждый, то там без RAG уже будет тяжело. Но ведь и мы начинаем не с таких сложных кейсов?
Пар выпустил))
Ваш, @llm_under_hood 🤗
👍50❤15🤔4
Как насчет видео про применение LLM в бизнесе?
Lokad выложил эпизод про Large Language Models in Supply Chain. Мы разговариваем про внедрение LLM не только в Supply Chain, но и в организациях в целом. Проблемы, перспективы и всякие кейсы.
00:00:00: Introduction to the interview
00:01:00: Rinat's Lokad journey and supply chain challenges
00:03:59: Lokad's evolution and simulation insights
00:07:07: Simulation complexities and agent-based decisions
00:09:15: Introducing LLMS and simulation optimizations
00:11:18: ChatGPT's impact and model categories
00:14:14: LLMs as cognitive tools in enterprises
00:17:10: LLMs enhancing customer interactions and listings
00:20:30: LLMs' limited role in supply chain calculations
00:23:07: LLMs improving communication in supply chains
00:27:49: ChatGPT's role in data analytics and insights
00:32:39: LLMs' text processing and quantitative data challenges
00:38:37: Refining enterprise search and closing AI insights
Ваш, @llm_under_hood 🤗
Lokad выложил эпизод про Large Language Models in Supply Chain. Мы разговариваем про внедрение LLM не только в Supply Chain, но и в организациях в целом. Проблемы, перспективы и всякие кейсы.
00:00:00: Introduction to the interview
00:01:00: Rinat's Lokad journey and supply chain challenges
00:03:59: Lokad's evolution and simulation insights
00:07:07: Simulation complexities and agent-based decisions
00:09:15: Introducing LLMS and simulation optimizations
00:11:18: ChatGPT's impact and model categories
00:14:14: LLMs as cognitive tools in enterprises
00:17:10: LLMs enhancing customer interactions and listings
00:20:30: LLMs' limited role in supply chain calculations
00:23:07: LLMs improving communication in supply chains
00:27:49: ChatGPT's role in data analytics and insights
00:32:39: LLMs' text processing and quantitative data challenges
00:38:37: Refining enterprise search and closing AI insights
Ваш, @llm_under_hood 🤗
YouTube
Large Language Models in Supply Chain (with Rinat Abdullin) - Ep 152
Full trannoscript available: https://www.lokad.com/tv/2023/12/13/large-language-models-in-supply-chain
In a recent dialogue, Conor Doherty of Lokad conversed with Joannes Vermorel and Rinat Abdullin about generative AI's impact on supply chains. Vermorel,…
In a recent dialogue, Conor Doherty of Lokad conversed with Joannes Vermorel and Rinat Abdullin about generative AI's impact on supply chains. Vermorel,…
🔥24👍4👏3
#клиентспросил А покажи пример использования ChatGPT для написания промпта?
Теория звучит красиво - выкинь RAG на простых случаях и дистиллируй знания, но как-то оно абстрактно и непонятно, верно? 🤔
Поэтому вот пример из сегодняшнего проекта (текст ниже, скриншот - в комментах). Я прямо сейчас работаю над улучшением текущей версии нишевого поисковика клиентов. Это там, где у нас выкачано много гигабайтов годовых отчетов компаний.
Мне нужно улучшить механизм поиска релевантной информации о потенциальных лидах, к которым можно найти хороший подход. Существующая система ищет хорошо, но клиенту хочется еще больше лидов! А кому их не хочется? 😁
Для этого нужно копаться в информации глубже, выискивать красивые зацепки для контакта. Думать и расписывать промпт для всего этого не хочется. 21 век на дворе! Поэтому я прошу ChatGPT набросать план поиска информации о компании "для ассистента" 😉
Причем весь контекст якорится к общей задаче (чтобы была перспектива и общее понимание ситуации) и конкретному клиенту. Методичка получается заточенная под конкретную задачу. При этом ее можно проглядеть глазами и отредактировать.
Потом по этой методичке будет работать не какой-то "ассистент", а сам ChatGPT.
Ваш, @llm_under_hood 🤗
PS: Другие посты из серии #клиентспросил:
- Кейс про агента, который программирует себя.
- Ринат, клиент хочет работать с AI продуктом конкурента. Что делать?
- словарик с краткими описаниями самых важных терминов (labs)
Теория звучит красиво - выкинь RAG на простых случаях и дистиллируй знания, но как-то оно абстрактно и непонятно, верно? 🤔
Поэтому вот пример из сегодняшнего проекта (текст ниже, скриншот - в комментах). Я прямо сейчас работаю над улучшением текущей версии нишевого поисковика клиентов. Это там, где у нас выкачано много гигабайтов годовых отчетов компаний.
Мне нужно улучшить механизм поиска релевантной информации о потенциальных лидах, к которым можно найти хороший подход. Существующая система ищет хорошо, но клиенту хочется еще больше лидов! А кому их не хочется? 😁
Для этого нужно копаться в информации глубже, выискивать красивые зацепки для контакта. Думать и расписывать промпт для всего этого не хочется. 21 век на дворе! Поэтому я прошу ChatGPT набросать план поиска информации о компании "для ассистента" 😉
I want to analyse companies that could be good customers for COMPANY (the %%%% company). Denoscription of CUSTOMER and its business model is included below, for reference.
Analysis process works like this:
1. Pick an promising lead company
2. Learn more about the company by researching it on the internet.
3. Summarise the findings and look for potential cases where the company would benefit from working with CUSTOMER (partnership, customer or something else).
I want you to write a list of bullet-points (questions/ideas) for the second step. My assistant will use it to research the company.
If possible, steer the findings towards the recent events, current problems and the other things that could help to understand the current state of the company (a la JTBD)
# Findings about COMPANY products and services
(skipped)
Причем весь контекст якорится к общей задаче (чтобы была перспектива и общее понимание ситуации) и конкретному клиенту. Методичка получается заточенная под конкретную задачу. При этом ее можно проглядеть глазами и отредактировать.
Потом по этой методичке будет работать не какой-то "ассистент", а сам ChatGPT.
Ваш, @llm_under_hood 🤗
PS: Другие посты из серии #клиентспросил:
- Кейс про агента, который программирует себя.
- Ринат, клиент хочет работать с AI продуктом конкурента. Что делать?
- словарик с краткими описаниями самых важных терминов (labs)
👍15❤8
This media is not supported in your browser
VIEW IN TELEGRAM
Решил я потестировать Gemini Pro от Google, и вот что из этого вышло.
Модель пока бесплатная. При этом вежливая и скромная. Трезво оценивает свои возможности.
На примитивные запросы отвечает, а что-то чуть более сложное - сразу отказывается отвечать.
Ваш, @llm_under_hood 🤗
Модель пока бесплатная. При этом вежливая и скромная. Трезво оценивает свои возможности.
На примитивные запросы отвечает, а что-то чуть более сложное - сразу отказывается отвечать.
Ваш, @llm_under_hood 🤗
🔥10😁8🙏1
Во всех моих последних созвонах повторяется одна тема - LLM/AI встраивается в существующие человеческие процессы, радикально меняет и улучшает их.
Например, RAG системы могут частично заменять экспертов и кучу документации. В специфических отраслях вроде авиастроения тут просто нет альтернатив. Топовые эксперты уходят на пенсию в ближайшие годы. А без них, встает все.
NVidia и та бросилась оцифровывать документы, строить RAG, и файн-тюнить на них модели.
Аналогичные проблемы есть и в более "скучных" компаниях. И они решаются теми же "скучными" инструментами - AI/LLM встраиваются в человеческие процессы. Они помогают там, где не хватает людей, либо люди лезут на стенку от глупых и повторяющихся вопросов.
А насколько далеко может зайти такая интеграция?
Channel 1 выложила подборку новостей, которая полностью рассказана с помощью аватаров. И это крышесносно! Смотреть тут: https://www.channel1.ai
Ваш, @llm_under_hood 🤗
Например, RAG системы могут частично заменять экспертов и кучу документации. В специфических отраслях вроде авиастроения тут просто нет альтернатив. Топовые эксперты уходят на пенсию в ближайшие годы. А без них, встает все.
NVidia и та бросилась оцифровывать документы, строить RAG, и файн-тюнить на них модели.
Аналогичные проблемы есть и в более "скучных" компаниях. И они решаются теми же "скучными" инструментами - AI/LLM встраиваются в человеческие процессы. Они помогают там, где не хватает людей, либо люди лезут на стенку от глупых и повторяющихся вопросов.
А насколько далеко может зайти такая интеграция?
Channel 1 выложила подборку новостей, которая полностью рассказана с помощью аватаров. И это крышесносно! Смотреть тут: https://www.channel1.ai
Ваш, @llm_under_hood 🤗
🤯10👍3🤩2
Вебинар про применение LLM в маркетинге и бизнесе!
Его организует ESSCA School of Management (французский вариант Ivy League университетов).
Мероприятие будет 19 декабря с 10:00 до 12:00 CET (12:00 - 14:00 по Москве). Изначально планировалось только для студентов, но я выпросил ссылку для раздачи 🤗
Подключиться в Teams.
Joannes Vermorel (Lokad.com, CEO) и я - будем обсуждать разные кейсы (агенда в комментариях). Но зуб даю, что нас будет заносить в разные интересные дебри. Особенно, если будут вопросы из аудитории.
Приходите, будет здорово!
Ваш, @llm_under_hood 🤗
PS: Предыдущее видео-обсуждение LLM в бизнесе.
Его организует ESSCA School of Management (французский вариант Ivy League университетов).
Мероприятие будет 19 декабря с 10:00 до 12:00 CET (12:00 - 14:00 по Москве). Изначально планировалось только для студентов, но я выпросил ссылку для раздачи 🤗
Подключиться в Teams.
Joannes Vermorel (Lokad.com, CEO) и я - будем обсуждать разные кейсы (агенда в комментариях). Но зуб даю, что нас будет заносить в разные интересные дебри. Особенно, если будут вопросы из аудитории.
Приходите, будет здорово!
Ваш, @llm_under_hood 🤗
PS: Предыдущее видео-обсуждение LLM в бизнесе.
🔥16🤔1