А еще вышло мое большое интервью для Kept
Рассказываю про наш подход к AI и объясню зачем мы опенсорсим модели. Получилось классно, доволен ) заходите почитать или послушать, есть и видео
Рассказываю про наш подход к AI и объясню зачем мы опенсорсим модели. Получилось классно, доволен ) заходите почитать или послушать, есть и видео
2❤🔥39💅3🤔2🥱1
Наши ребята записали интересный подкаст про LLM-приложения, агенты и инструменты вокруг LLM.
Если хотите понять как создавать решения на базе LLM и как на наших глазах строится новая инженерия которой раньше не было, идите смотреть.
Я считаю что это будущая инженерия почти любых инженерных решений. Новая база. Хотите оставаться актуальными - идите смотреть.
Если хотите понять как создавать решения на базе LLM и как на наших глазах строится новая инженерия которой раньше не было, идите смотреть.
Я считаю что это будущая инженерия почти любых инженерных решений. Новая база. Хотите оставаться актуальными - идите смотреть.
YouTube
Желтый Club Talks — Что происходит в мире LLM-приложений и тулинга?
А у нас – новый выпуск! Даня Гаврилов встретился с Артуром Самигуллиным. В этой серии разговоры про практическое применение LLM (и не только): как появилось направление LLM-тулинга, что происходит в тулинге и какие проблемы существуют, что происходит в точки…
❤🔥29💅9
Смотрите, Lex Fridman и Vitalik Buterin говорят по-русски )
Точнее, Лёша Фридман и Виталик Бутерин
Обложка для видео 💀
https://www.youtube.com/watch?v=4XkFY9IsACk
Точнее, Лёша Фридман и Виталик Бутерин
Обложка для видео 💀
https://www.youtube.com/watch?v=4XkFY9IsACk
YouTube
Lex Fridman and Vitalik Buterin speak Russian
Lex Fridman Podcast full episode: https://www.youtube.com/watch?v=XW0QZmtbjvs
Please support this podcast by checking out our sponsors:
- Athletic Greens: https://athleticgreens.com/lex and use code LEX to get 1 month of fish oil
- Magic Spoon: https://m…
Please support this podcast by checking out our sponsors:
- Athletic Greens: https://athleticgreens.com/lex and use code LEX to get 1 month of fish oil
- Magic Spoon: https://m…
❤🔥7🤔2
Большие модели нужны редко. На продакшне не нужны почти никогда.
Мы изначально взяли подход "SLM + допретрен + файнтюн": небольшие модели, делаем допретрен на русский и наш домен, и потом делаем файнтюны на задачи. Это быстрее, дешевле и эффективней.
Это слайд с рабочей встречи - на очередном новом кейсе выигрыш нашего файнтюна маленькой модели против GPT-4. С первого раза такой результат.
В данном случае файнтюн gemma9b, допретрен на русском языке + бизнес домене, с большим запасом перебивает gpt4. gpt4o на конкретно этой задаче работает ещё хуже, так бывает.
Мы изначально взяли подход "SLM + допретрен + файнтюн": небольшие модели, делаем допретрен на русский и наш домен, и потом делаем файнтюны на задачи. Это быстрее, дешевле и эффективней.
Это слайд с рабочей встречи - на очередном новом кейсе выигрыш нашего файнтюна маленькой модели против GPT-4. С первого раза такой результат.
В данном случае файнтюн gemma9b, допретрен на русском языке + бизнес домене, с большим запасом перебивает gpt4. gpt4o на конкретно этой задаче работает ещё хуже, так бывает.
❤🔥25💅5🤔1
For an LLM of equivalent performance, the cost is decreasing by 10x every year
Фонд a16z выпустил короткую заметку в которой раскрывают простую идею: если смотреть в прошлое, то для фиксированной сложности модели стоимость инференса (одного вызова модели) падает примерно в 10 раз каждый год.
Это верно и для тех уровней сложности, которые тогда казались "невероятными". То есть можно сделать предположение, что сегодняшние "невероятные" уровни сложности моделей (e.g. 4o) так же будут дешеветь со скоростью в 10 раз в год.
Тут есть много оговорок: используют они MMLU (так себе мерило), график строят примерно по трём точкам, и вообще "всё слишком меняется".
Но я считаю пойнт вполне верным. И будущее в бизнесах и технологиях нужно планировать исходя из этого. Сегодняшние и завтрашние топовые модели будут стремительно дешеветь.
Фонд a16z выпустил короткую заметку в которой раскрывают простую идею: если смотреть в прошлое, то для фиксированной сложности модели стоимость инференса (одного вызова модели) падает примерно в 10 раз каждый год.
Это верно и для тех уровней сложности, которые тогда казались "невероятными". То есть можно сделать предположение, что сегодняшние "невероятные" уровни сложности моделей (e.g. 4o) так же будут дешеветь со скоростью в 10 раз в год.
Тут есть много оговорок: используют они MMLU (так себе мерило), график строят примерно по трём точкам, и вообще "всё слишком меняется".
Но я считаю пойнт вполне верным. И будущее в бизнесах и технологиях нужно планировать исходя из этого. Сегодняшние и завтрашние топовые модели будут стремительно дешеветь.
Andreessen Horowitz
Welcome to LLMflation - LLM inference cost is going down fast ⬇️ | Andreessen Horowitz
For LLM of equivalent performance, the inference cost is decreasing by 10x every year. What cost $60/million tokens in 2021 costs $.06/million tokens today.
❤🔥5💅3
This media is not supported in your browser
VIEW IN TELEGRAM
❤🔥11💅8
Продукты 24!!! Большая продуктовая конференция от Т
В АРМЕ 😉, следующий четверг
Днём расскажу про AI и его влияние на все продукты
Вечером играю диджей-сет
Записывайтесь https://producty24conf.tbank.ru/
В АРМЕ 😉, следующий четверг
Днём расскажу про AI и его влияние на все продукты
Вечером играю диджей-сет
Записывайтесь https://producty24conf.tbank.ru/
producty24-ffdd2d.ru
FFDD2D – Продукты 24
Конференция от Т-Банка для дизайнеров, продактов и аналитиков. Подробности скоро.
❤🔥23💅12🤔3
[31/100] Витя Тарнавский
Продукты 24!!! Большая продуктовая конференция от Т В АРМЕ 😉, следующий четверг Днём расскажу про AI и его влияние на все продукты Вечером играю диджей-сет Записывайтесь https://producty24conf.tbank.ru/
Регистрация на физическое присутствие закончилась, но у меня есть немного билетов для вас )
Первым пяти кто напишет в комменты «хочу билет» выдам!
Только чур потом дойти!
upd: билеты улетели за минуту
Первым пяти кто напишет в комменты «хочу билет» выдам!
Только чур потом дойти!
upd: билеты улетели за минуту
❤🔥1
Perplexity запускает первые эксперименты с рекламой
Самый яркий new age альтернативный поиск запускает рекламную модель рядом с подписочной. В блоге ребята объясняют это через создание robust and self-sustaining business.
К сожалению, для информационных сервисов подписка не является устойчивой бизнес-моделью. Причина проста: люди привыкли что информация бесплатна. И это действительно так: Google бесплатный, Youtube открыт, и так далее. Хочешь построить большой бизнес на информации - делай рекламу или будешь бутиковым бизнесом для избранных и без денег на технологии.
Рекламу обещают делать явной (с пометками) и не передавать personal data рекламодателям. Это стандартные принципы хорошего тона.
Тестовый формат - первая позиция в доспрашиваниях. В сам ответ вставлять на текущий момент не хотят. Я видел у Bing эксперименты когда в первый кусочек текстового ответа вставляется sponsored кусок текста - это тоже вариант. Ещё бывают sponsored "карусельки" офферов в основном ответе.
Посмотрим, что придумает Яндекс.
Самый яркий new age альтернативный поиск запускает рекламную модель рядом с подписочной. В блоге ребята объясняют это через создание robust and self-sustaining business.
К сожалению, для информационных сервисов подписка не является устойчивой бизнес-моделью. Причина проста: люди привыкли что информация бесплатна. И это действительно так: Google бесплатный, Youtube открыт, и так далее. Хочешь построить большой бизнес на информации - делай рекламу или будешь бутиковым бизнесом для избранных и без денег на технологии.
Рекламу обещают делать явной (с пометками) и не передавать personal data рекламодателям. Это стандартные принципы хорошего тона.
Тестовый формат - первая позиция в доспрашиваниях. В сам ответ вставлять на текущий момент не хотят. Я видел у Bing эксперименты когда в первый кусочек текстового ответа вставляется sponsored кусок текста - это тоже вариант. Ещё бывают sponsored "карусельки" офферов в основном ответе.
Посмотрим, что придумает Яндекс.
🤔9🤡4❤🔥2
Экосистемы и китайский сценарий
Все крупные игроки в РФ отстраивают свою экосистему. Строят от якорного продукта: Яндекс это поиск, Сбер и Т это банк, Озон это маркетплейс и так далее. Но дальше все строят всё остальное: банки, рекламу, маркетплейсы, самокаты и так далее. Дорамы 😅
Это рынок экосистем, или китайский сценарий.
Связано это, прежде всего, с маркетингом. Разница в стоимости привлечения на независимый апп и на приложение в супераппе - в разы. Даже если это отдельное приложение продукта экосистемы, все равно работает общий бренд, большие экосистемные бюджеты на привлечение и сквозная программа лояльности.
Влияет сильно помятый рекламный рынок: игроки ушли, новые не пришли. Гугла нет (вместе с YouTube).
Интересно, что долгосрочно проигрывает в таком сценарии именно поиск. В какой-то момент экосистемы перестают позволять по себе искат снаружи, да и людям это уже не нужно, проще внутри поискать. В Китае это уже наблюдается.
Следим за развитием событий, ваш @singularityfm
Все крупные игроки в РФ отстраивают свою экосистему. Строят от якорного продукта: Яндекс это поиск, Сбер и Т это банк, Озон это маркетплейс и так далее. Но дальше все строят всё остальное: банки, рекламу, маркетплейсы, самокаты и так далее. Дорамы 😅
Это рынок экосистем, или китайский сценарий.
Связано это, прежде всего, с маркетингом. Разница в стоимости привлечения на независимый апп и на приложение в супераппе - в разы. Даже если это отдельное приложение продукта экосистемы, все равно работает общий бренд, большие экосистемные бюджеты на привлечение и сквозная программа лояльности.
Влияет сильно помятый рекламный рынок: игроки ушли, новые не пришли. Гугла нет (вместе с YouTube).
Интересно, что долгосрочно проигрывает в таком сценарии именно поиск. В какой-то момент экосистемы перестают позволять по себе искат снаружи, да и людям это уже не нужно, проще внутри поискать. В Китае это уже наблюдается.
Следим за развитием событий, ваш @singularityfm
🤔22❤🔥9
Всё ещё не верится что мы делаем нашу большую продуктовую конференцию в мутаборе 😅
Готовим лучшие доклады на день и флешки с музыкой на вечер
На онлайн ещё можно записаться! https://producty24conf.tbank.ru/
Готовим лучшие доклады на день и флешки с музыкой на вечер
На онлайн ещё можно записаться! https://producty24conf.tbank.ru/
1❤🔥37💅3
LLM Agent Toolkits - SDK из мира LLM
Агентам надо взаимодействовать с внешним миром, а компаниям и сервисам - встраивать свои вызовы в агентов. Давайте разберем на свежем примере.
Stripe выпустил Agent Toolkit - библиотеку для подключения своих платежных API к LLM-агентам. По-простому это набор API-методов с текстовым описанием для LLM что этот метод делает и какие параметры возвращает, в формате langchain и vercel.
Например, для метода создания инвойса у них вот такое несложное описание для LLM:
Это классный пример такого “LLM API” подхода для новой LLM Apps инженерии.
Что-то подобное стоит применять если вы внутри компании делаете платформу для LLM приложений и вам нужно все API "обтулить" или если вы делаете внешний API сервис который в перспективе полезен в агентских сервисах.
Ждем что через 5 лет примерно у каждого сервиса который будет куда-то интегрироваться будет и такая версия API. Название, как в случае RAG, может еще поменяться десять раз.
Агентам надо взаимодействовать с внешним миром, а компаниям и сервисам - встраивать свои вызовы в агентов. Давайте разберем на свежем примере.
Stripe выпустил Agent Toolkit - библиотеку для подключения своих платежных API к LLM-агентам. По-простому это набор API-методов с текстовым описанием для LLM что этот метод делает и какие параметры возвращает, в формате langchain и vercel.
Например, для метода создания инвойса у них вот такое несложное описание для LLM:
This tool will create an invoice in Stripe.
It takes one argument:
- customer (str): The ID of the customer to create the invoice for.
Это классный пример такого “LLM API” подхода для новой LLM Apps инженерии.
Что-то подобное стоит применять если вы внутри компании делаете платформу для LLM приложений и вам нужно все API "обтулить" или если вы делаете внешний API сервис который в перспективе полезен в агентских сервисах.
Ждем что через 5 лет примерно у каждого сервиса который будет куда-то интегрироваться будет и такая версия API. Название, как в случае RAG, может еще поменяться десять раз.
Stripe
Add Stripe to your agentic workflows
Learn how to integrate Stripe financial services into your agentic workflows using function calling and AI frameworks.
❤🔥6🤔2
А вот и открытый протокол для интеграции от Antrophic подъехал. Надеюсь, будет один стандарт, а не три.
Forwarded from addmeto (Grigory Bakunov)
Anthropic анонсирует Model Context Protocol, стандарт с открытым исходным кодом для подключения ИИ-помощников к источникам данных. На самом деле давно пора было — мы все так или иначе писали свои решения для таких подключений. Если его сейчас поддержит кто-то кроме Claude — это будет без преувеличений великое дело.
https://techcrunch.com/2024/11/25/anthropic-proposes-a-way-to-connect-data-to-ai-chatbots/
https://techcrunch.com/2024/11/25/anthropic-proposes-a-way-to-connect-data-to-ai-chatbots/
TechCrunch
Anthropic proposes a new way to connect data to AI chatbots | TechCrunch
Anthropic is proposing a new standard for connecting AI assistants to the systems where data lives, called Model Context Protocol (MCP).
❤🔥8💅1
Рассказ про LLM-based продукты с конфы Продукты 24
Рассказываю куда двигаются продукты под воздействием LLM. Получилось очень круто, как мне кажется, я супер доволен )
Вы узнаете:
- Почему Telegram не ищет по мемам;
- Какой самый популярный продукт для создания контента;
- Почему Нейро от Яндекса это не продукт а фича и почему это правильно;
- Какие продуктовые задачи стоит решать с помощью LLM;
- Почему OpenAI начинали с ботов для Dota-2🧊
И ещё много советов и трендов про мир LLM-продуктов. Welcome!
https://www.youtube.com/live/laFhO99IHz0?t=6512s
Рассказываю куда двигаются продукты под воздействием LLM. Получилось очень круто, как мне кажется, я супер доволен )
Вы узнаете:
- Почему Telegram не ищет по мемам;
- Какой самый популярный продукт для создания контента;
- Почему Нейро от Яндекса это не продукт а фича и почему это правильно;
- Какие продуктовые задачи стоит решать с помощью LLM;
- Почему OpenAI начинали с ботов для Dota-2
И ещё много советов и трендов про мир LLM-продуктов. Welcome!
https://www.youtube.com/live/laFhO99IHz0?t=6512s
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤🔥34💅11
Пару недель хожу с PLAUD Note - физическим GPT-рекордером с расшифровкой и суммаризацией
Красивый очень тонкий девайс, который цепляется сзади к телефону. Нажимаешь на кнопку - и запись пошла.
В приложение прилетает аудио, расшифровка по ролям, саммари и ещё mind map разговора. Спикеров можно обозначить и он эти голоса запоминает. При этом устройство с собственной памятью, можно и без телефона носить.
Пока что скорее игрушка. Распознает в шуме плохо, много ошибок, автоматических писем нет, привыкание не приходит.
Возникает справедливый вопрос - а зачем вообще устройство? Можно же всё в телефоне сделать!
Если честно - не нужно оно. Но если пытаться защитить устройство, ответы будут такие:
- Apple/Google оч тормозят с интеграцией на уровне ОС, отдельные приложения не интегрированы с звонками;
- Запись звонков у Apple уже есть в Apple Intelligence, но не работает в куче стран (во всей Европе, например);
- Удобно включать - просто нажал на кнопку;
- Внешний микрофон у этого девайса лучше.
Очень жду всё это новое поколение LLM-powered девайсов. Кто уже сделает гарнитуру на одно ухо с ChatGPT, ну?
Красивый очень тонкий девайс, который цепляется сзади к телефону. Нажимаешь на кнопку - и запись пошла.
В приложение прилетает аудио, расшифровка по ролям, саммари и ещё mind map разговора. Спикеров можно обозначить и он эти голоса запоминает. При этом устройство с собственной памятью, можно и без телефона носить.
Пока что скорее игрушка. Распознает в шуме плохо, много ошибок, автоматических писем нет, привыкание не приходит.
Возникает справедливый вопрос - а зачем вообще устройство? Можно же всё в телефоне сделать!
Если честно - не нужно оно. Но если пытаться защитить устройство, ответы будут такие:
- Apple/Google оч тормозят с интеграцией на уровне ОС, отдельные приложения не интегрированы с звонками;
- Запись звонков у Apple уже есть в Apple Intelligence, но не работает в куче стран (во всей Европе, например);
- Удобно включать - просто нажал на кнопку;
- Внешний микрофон у этого девайса лучше.
Очень жду всё это новое поколение LLM-powered девайсов. Кто уже сделает гарнитуру на одно ухо с ChatGPT, ну?
❤🔥23💅8🥱1