Forwarded from Пых.конф’25 — главное PHP-событие этого года!
Кодим с ИИ (круглый стол)
Хватит философских споров о том, заменят ли нас роботы, поговорим о практике! Ваш AI-ассистент всё ещё генерирует ерунду? Вы тратите больше времени на исправление его кода, чем на написание своего?
19 сентября на Пых.конф’25 Пётр Мязин, Алексей Гагарин, Евгений Колесников и Иван Поддубный не будут рассуждать о будущем. Они разберутся, как заставить ИИ-инструменты работать уже сегодня и поделятся реальными кейсами, полезными инструментами и техниками, которые позволят вам писать код быстрее и качественнее.
Приходи, чтобы ИИ стал твоим вторым пилотом, а не источником головной боли!
https://conf.phpyh.ru/program/ide
⸻
Сегодня ночью поднимем цену — успей купить билет или запросить счёт на 5к дешевле!
Хватит философских споров о том, заменят ли нас роботы, поговорим о практике! Ваш AI-ассистент всё ещё генерирует ерунду? Вы тратите больше времени на исправление его кода, чем на написание своего?
19 сентября на Пых.конф’25 Пётр Мязин, Алексей Гагарин, Евгений Колесников и Иван Поддубный не будут рассуждать о будущем. Они разберутся, как заставить ИИ-инструменты работать уже сегодня и поделятся реальными кейсами, полезными инструментами и техниками, которые позволят вам писать код быстрее и качественнее.
Приходи, чтобы ИИ стал твоим вторым пилотом, а не источником головной боли!
https://conf.phpyh.ru/program/ide
⸻
Сегодня ночью поднимем цену — успей купить билет или запросить счёт на 5к дешевле!
Пых.конф’25 — главное PHP-событие этого года!
Кодим с ИИ (круглый стол) Хватит философских споров о том, заменят ли нас роботы, поговорим о практике! Ваш AI-ассистент всё ещё генерирует ерунду? Вы тратите больше времени на исправление его кода, чем на написание своего? 19 сентября на Пых.конф’25 Пётр…
На ПыхКонф буду модерировать стол по применению AI непосредственно разработчиками.
На круглом столу будет не только 2 довольно активных адепта-практика использования AI в работе, но и Евгений, руководитель из Яндекса который разрабатывает SourceCraft - публичный доступный AI инструмент автокомплита для IDE от российской корпорации.
На круглом столу будет не только 2 довольно активных адепта-практика использования AI в работе, но и Евгений, руководитель из Яндекса который разрабатывает SourceCraft - публичный доступный AI инструмент автокомплита для IDE от российской корпорации.
👍9
ИИ против Open Source: что реально поменялось и где проходит граница https://habr.com/p/943670/
Интересное размышление что сейчас порой проще и выгоднее сгенерировать чем брать готовое.
Интересное размышление что сейчас порой проще и выгоднее сгенерировать чем брать готовое.
Habr
ИИ против Open Source: что реально поменялось и где проходит граница
Последние годы у нас был рефлекс: нужна мелочь - ставим библиотеку; нужен каркас - берём шаблон; надо что-то «на лету» - подключаем генератор кода. С появлением рабочих моделей кода появился более...
👍7
Forwarded from Интересная Точка Зрения|Анастасия Андронова
Media is too big
VIEW IN TELEGRAM
Сегодня уже 14 лет как родился бренд Вебпрактик
Когда мне было 14, я считала людей сумасшедшими, которые работают по 15-20-30 лет на одном месте, а теперь я одна из таких) но мне нравится! Бывало разное, но не было дня, где я ощущала стагнацию.
Люблю наше дело, коллег и проекты, с которыми мы работаем. А еще мелочи быта - пить кофе по утрам, собираться на 15 минут решить простой вопрос и просидеть пару часов, обсуждая кейсы и решения, люблю когда ситуация кажется безвыходной, но потом мы как то из нее выходим и очень даже хорошо)
Смотрю на эти 14 лет с благодарностью❤️
А вы - посмотрите этот смешной ролик, который мы сняли к празднику)
Когда мне было 14, я считала людей сумасшедшими, которые работают по 15-20-30 лет на одном месте, а теперь я одна из таких) но мне нравится! Бывало разное, но не было дня, где я ощущала стагнацию.
Люблю наше дело, коллег и проекты, с которыми мы работаем. А еще мелочи быта - пить кофе по утрам, собираться на 15 минут решить простой вопрос и просидеть пару часов, обсуждая кейсы и решения, люблю когда ситуация кажется безвыходной, но потом мы как то из нее выходим и очень даже хорошо)
Смотрю на эти 14 лет с благодарностью
А вы - посмотрите этот смешной ролик, который мы сняли к празднику)
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👏2🤡1
Заметил что из поезда можно порой работать весьма продуктивно.
Периодически отключающийся интернет иногда только помогает. Сообщения задерживаются, меньше дергают и ты успеваешь чуть больше продумать и сделать того, на что часто не хватает времени. А именно более глубоко обдумать и проработать какие то решения.
Да и по факту это день без встреч, что не всегда мы можем себе позволить при прочих обстоятельствах)
Ограничения:
1. Нужна нижняя полка, т.к. в полулежащем положении с ноутом имхо продуктивность прилично падает, затекает тело.
В кафешке в поезде часто могут "попросить" т.к. мест реально не хватает для всех желающих, ну и просто не прилично со своей стороны занимать на пол дня место понимая что это ограничивает и продажи и других пассажиров.
2. На скорых поездах меньше остановок и меньше интернета. Там чуть сложнее. Сейчас еду на более медленном и остановок больше, с большими перерывами.
Периодически отключающийся интернет иногда только помогает. Сообщения задерживаются, меньше дергают и ты успеваешь чуть больше продумать и сделать того, на что часто не хватает времени. А именно более глубоко обдумать и проработать какие то решения.
Да и по факту это день без встреч, что не всегда мы можем себе позволить при прочих обстоятельствах)
Ограничения:
1. Нужна нижняя полка, т.к. в полулежащем положении с ноутом имхо продуктивность прилично падает, затекает тело.
В кафешке в поезде часто могут "попросить" т.к. мест реально не хватает для всех желающих, ну и просто не прилично со своей стороны занимать на пол дня место понимая что это ограничивает и продажи и других пассажиров.
2. На скорых поездах меньше остановок и меньше интернета. Там чуть сложнее. Сейчас еду на более медленном и остановок больше, с большими перерывами.
👍7❤5
Переход CMS с PHP на Nodejs
Я никогда ранее не был знаком с CMS Directus.
Наткнулся на нее первый раз примерно год назад и для меня это была новая современная CMS на nodejs с большим количеством возможностей.
Сегодня узнал о ней интересный факт: это CMS которая перешла с PHP на Nodejs.
И вот интересный пост о том почему они совершили эту трансформацию.
Я никогда ранее не был знаком с CMS Directus.
Наткнулся на нее первый раз примерно год назад и для меня это была новая современная CMS на nodejs с большим количеством возможностей.
Сегодня узнал о ней интересный факт: это CMS которая перешла с PHP на Nodejs.
И вот интересный пост о том почему они совершили эту трансформацию.
directus.io
Introducing Directus 9: Release Candidate
Directus 9 is finally here, and it’s the biggest update we’ve released in the past 15 years. This article will describe what changed in this new version, and give some insight into the reasoning behind our more far-reaching decisions.
👍5
React-монополист: как мы сами убиваем развитие фронтенда https://habr.com/p/948072/
Как бы я не любил react и nextjs, написанное правда. Мы давно уперлись в его возможности, и с какой то точки зрения - react это стабильный enterprise, но legacy framework. Особенно когда говорим про производительность.
Однако в то же время у самого react я считаю есть возможность пусть и со сломом частичной обратной совместимости, оставив dx, изменить часть устаревших концепций которые во многом находятся под капотом. Это был бы более безболезненный для бизнеса переход чем миграция на совершенно новый стек.
Забавно что я до сих пор слышу от многих бекендеров что у фронтов постоянно новые фреймворки. Хотя реальный ландшафт у фронтов давно засахарился, и у беков порой сейчас куда больше разнообразия и инноваций чем у фронтов, где правит бал один доминирующий фреймворк, которому уже 12 лет.
Как бы я не любил react и nextjs, написанное правда. Мы давно уперлись в его возможности, и с какой то точки зрения - react это стабильный enterprise, но legacy framework. Особенно когда говорим про производительность.
Однако в то же время у самого react я считаю есть возможность пусть и со сломом частичной обратной совместимости, оставив dx, изменить часть устаревших концепций которые во многом находятся под капотом. Это был бы более безболезненный для бизнеса переход чем миграция на совершенно новый стек.
Забавно что я до сих пор слышу от многих бекендеров что у фронтов постоянно новые фреймворки. Хотя реальный ландшафт у фронтов давно засахарился, и у беков порой сейчас куда больше разнообразия и инноваций чем у фронтов, где правит бал один доминирующий фреймворк, которому уже 12 лет.
Habr
React-монополист: как мы сами убиваем развитие фронтенда
Команда JavaScript for Devs подготовила перевод статьи о том, как доминирование React сдерживает развитие фронтенда. Автор утверждает: выбор React «по умолчанию» тормозит инновации, мешает развитию...
👍7🔥5
Поделюсь мыслями после пары докладов с AI Conf про использование AI в SDLC.
Были интересные выступления от Тбанка и Яндекс SourceCraft.
# Что делают компании
— Крупные игроки (Тбанк, Яндекс, Сбер, МТС) активно пилят собственные инструменты.
— Остальные чаще всего опираются на open-source решения вроде roo-code или cline.
— Малые компании особо не заморачиваются и используют Cursor, Windsurf и т.п. У крупных так не выйдет — вопросы безопасности.
# AI-ассистенты в IDE: два уровня
— CodeCompletion (подсказки при наборе кода)
— Агентский режим (написание кода «по задаче»)
В ассистенте Тбанка есть в т.ч. команды: чат с RAG, ревью и пр. На слайде как раз показано, как у них разделяются команды ассистента.
# Цифры из Яндекса
— ~70% разработчиков пользуются ассистентом
— 45% применяют автогенерацию описаний PR
— 30% используют нейроревью кода
# Про привычки
Евгений рассказывал, как однажды у них сломался CodeCompletion при релизе.
Разработчики были фрустрированы и завалили обратной связью: настолько привыкли, что отключение подсказок буквально выбивало из колеи.
Поимерная цитата эмоции: «Нет ничего более дизморалящего, чем ждать подсказку... ждёшь, ждёшь — а она так и не появляется». К хорошему быстро привыкаешь =)
# Про метрики
В Тбанк сделали метрику True Completion. Она отслеживает, как живёт строчка кода, написанная AI: если она остаётся в проекте хотя бы месяц — значит, это реальная польза.
У Яндекса есть похожий подход, пока внутри не в SourceCraft, но обещают релизнуть. Инструменты Тбанка пока закрыты вовсе.
Минус в том, что такая метрика очень дорогая: нужна глубокая интеграция в инфраструктуру. Большинство готовых инструментов (купленных или open-source) меряют максимум до коммита — и то не всегда.
— Бизнес хочет цифры по дельте роста производительности разработчика от AI.
Но тут всё сложно: за десятки лет мы так и не научились точно мерить сам перфоманс разработчика, а кодинг — это только часть цикла разработки. Поэтому точные цифры дать почти нереально.
— Зато есть наблюдения: коллега рассказал, что они видят рост перфоманса QA в 2–3 раза за счёт AI.
⚙️ Про размеры моделей и инфраструктуру
CodeCompletion
Для автодополнения кода хватает относительно небольших моделей на 8B.
На 4B качество уже заметно проседает.
В Тбанке сейчас используют SeedCoder (Bytedance, июнь 2025) — выбрали её после серии A/B-экспериментов.
Чат
Для чата нужна модель покрупнее.
Но у неё заметно ниже RPS, поэтому даже A100 (по словам коллег из X5) вполне может справляться с инференсом.
Агентский режим
Если использовать агента для нескольких десятков разработчиков, придётся держать кластер из 4+ A100.
Яндекс использует кучу моделей сразу для оптимизации инференса. Например определяет сложность запроса и подсовывает нужную модель. Примерно как курсор, я так понимаю.
💰 Стоимость
Серверы с A100 начинаются примерно от 150K до 500K ₽/мес.
Зависит в первую очередь от того, какую CPU-мощность туда ставить (пример: Immer Cloud).
Были интересные выступления от Тбанка и Яндекс SourceCraft.
# Что делают компании
— Крупные игроки (Тбанк, Яндекс, Сбер, МТС) активно пилят собственные инструменты.
— Остальные чаще всего опираются на open-source решения вроде roo-code или cline.
— Малые компании особо не заморачиваются и используют Cursor, Windsurf и т.п. У крупных так не выйдет — вопросы безопасности.
# AI-ассистенты в IDE: два уровня
— CodeCompletion (подсказки при наборе кода)
— Агентский режим (написание кода «по задаче»)
В ассистенте Тбанка есть в т.ч. команды: чат с RAG, ревью и пр. На слайде как раз показано, как у них разделяются команды ассистента.
# Цифры из Яндекса
— ~70% разработчиков пользуются ассистентом
— 45% применяют автогенерацию описаний PR
— 30% используют нейроревью кода
# Про привычки
Евгений рассказывал, как однажды у них сломался CodeCompletion при релизе.
Разработчики были фрустрированы и завалили обратной связью: настолько привыкли, что отключение подсказок буквально выбивало из колеи.
Поимерная цитата эмоции: «Нет ничего более дизморалящего, чем ждать подсказку... ждёшь, ждёшь — а она так и не появляется». К хорошему быстро привыкаешь =)
# Про метрики
В Тбанк сделали метрику True Completion. Она отслеживает, как живёт строчка кода, написанная AI: если она остаётся в проекте хотя бы месяц — значит, это реальная польза.
У Яндекса есть похожий подход, пока внутри не в SourceCraft, но обещают релизнуть. Инструменты Тбанка пока закрыты вовсе.
Минус в том, что такая метрика очень дорогая: нужна глубокая интеграция в инфраструктуру. Большинство готовых инструментов (купленных или open-source) меряют максимум до коммита — и то не всегда.
— Бизнес хочет цифры по дельте роста производительности разработчика от AI.
Но тут всё сложно: за десятки лет мы так и не научились точно мерить сам перфоманс разработчика, а кодинг — это только часть цикла разработки. Поэтому точные цифры дать почти нереально.
— Зато есть наблюдения: коллега рассказал, что они видят рост перфоманса QA в 2–3 раза за счёт AI.
⚙️ Про размеры моделей и инфраструктуру
CodeCompletion
Для автодополнения кода хватает относительно небольших моделей на 8B.
На 4B качество уже заметно проседает.
В Тбанке сейчас используют SeedCoder (Bytedance, июнь 2025) — выбрали её после серии A/B-экспериментов.
Чат
Для чата нужна модель покрупнее.
Но у неё заметно ниже RPS, поэтому даже A100 (по словам коллег из X5) вполне может справляться с инференсом.
Агентский режим
Если использовать агента для нескольких десятков разработчиков, придётся держать кластер из 4+ A100.
Яндекс использует кучу моделей сразу для оптимизации инференса. Например определяет сложность запроса и подсовывает нужную модель. Примерно как курсор, я так понимаю.
💰 Стоимость
Серверы с A100 начинаются примерно от 150K до 500K ₽/мес.
Зависит в первую очередь от того, какую CPU-мощность туда ставить (пример: Immer Cloud).
👍10🔥6
https://habr.com/ru/companies/technokratos/articles/947152/
Также стоит отметить 3 эпохи AI в кодинге
1. Completion
2. Вайбкодинг с агентами
3. Agent Swarm
И вот сейчас, в пару последних месяцев все больше говорят о том, что agent swarm возможно уже наступил. И у некоторых хорошие прототипы и эксперименты с ними.
Будем наблюдать 🫣
С другой стороны на BoostConf или ПыхКонф я вижу огромное количество компаний которые не юзают инструменты даже первой эпохи, либо по незнанию либо осознанно отрицая как нео-луддиты.
Также стоит отметить 3 эпохи AI в кодинге
1. Completion
2. Вайбкодинг с агентами
3. Agent Swarm
И вот сейчас, в пару последних месяцев все больше говорят о том, что agent swarm возможно уже наступил. И у некоторых хорошие прототипы и эксперименты с ними.
Будем наблюдать 🫣
С другой стороны на BoostConf или ПыхКонф я вижу огромное количество компаний которые не юзают инструменты даже первой эпохи, либо по незнанию либо осознанно отрицая как нео-луддиты.
Хабр
Вайбкодинг мертв. На смену пришло агентное роевое программирование
Во время недавнего трансатлантического перелёта Марк Раддок, предприниматель-резидент в GALLOS Technologies, решил задействовать свою команду ИИ-агентов. На высоте 34 тысяч футов над Атлантикой у него...
👍7
Habr
JetBrains и Zed объединяются: единый язык для ИИ-агентов в IDE (ACP от мира LSP)
JetBrains и Zed создают открытый протокол для ИИ-агентов , который сможет работать в любых редакторах и IDE. Теперь ИИ-агенты смогут понимать IDE напрямую — через Agent Client Protocol...
JetBrains и Zed объединяются: единый язык для ИИ-агентов в IDE (ACP от мира LSP) https://habr.com/p/954010/
Отличная новость: со временем открытый протокол позволит нивелировать профит от клонов vscode.
Сам JB проиграл как минимум старт гонки за ai. В итоге курсор и клоны отжали часть рынка. Но разрабам которые понимают всю мощь IDE с рефакторингом и кучей других плюх было больно от dx во всех клонах vscode. Тебе как будто часть пальцев отрезают.
Многие сторонние агенты, внедряемые в интерфейс JB (взять тот же windsurf) - выглядят отвратительно по сравнению с нативным ux от ai механизмами самого JB.
Новый протокол, я надеюсь, позволит JB с одной стороны дать более крутой (нативный) ux для всех других агентов (хотя и нивелировав преимущество нативного ai самого jb), с другой стороны отвоевать себе назад кусок рынка как лучшая ide для всего.
Ну и их колоборация с zed, достаточно крутым молодым редактором греет глаз)
Отличная новость: со временем открытый протокол позволит нивелировать профит от клонов vscode.
Сам JB проиграл как минимум старт гонки за ai. В итоге курсор и клоны отжали часть рынка. Но разрабам которые понимают всю мощь IDE с рефакторингом и кучей других плюх было больно от dx во всех клонах vscode. Тебе как будто часть пальцев отрезают.
Многие сторонние агенты, внедряемые в интерфейс JB (взять тот же windsurf) - выглядят отвратительно по сравнению с нативным ux от ai механизмами самого JB.
Новый протокол, я надеюсь, позволит JB с одной стороны дать более крутой (нативный) ux для всех других агентов (хотя и нивелировав преимущество нативного ai самого jb), с другой стороны отвоевать себе назад кусок рынка как лучшая ide для всего.
Ну и их колоборация с zed, достаточно крутым молодым редактором греет глаз)
👍12🔥5❤2🥰2
Forwarded from Букуров, почини мир!
Коллеги из «Вебпрактик. Маркетинг» продолжают делиться пользой и инструментами для диджитал-маркетологов.
В октябре стартует новая серия открытых вебинаров по SEO, SMM и дизайну. Участие бесплатное, нужна только регистрация в боте @wplecturebot
8 октября в 15:00 по Мск
SMM без хаоса. Как выстроить эффективную систему работы инхаус или с агентством
🎁 Бонус при регистрации: чек-лист для брифа агентства перед сотрудничеством
15 октября в 17:00 по Мск
Автоматизация дизайна для маркетолога - Как работать с дизайнером в 2 раза быстрее
🎁 Бонус при регистрации: 30 готовых промтов для создания баннеров
22 октября в 17:00 по Мск
Новая реальность поиска: как не потерять клиентов из-за Алисы и Google AI
🎁 Бонус при регистрации: чек-лист по оптимизации сайта под ИИ-поиск
Не пропустите концентрат практики и свежих инструментов для вашей работы!
В октябре стартует новая серия открытых вебинаров по SEO, SMM и дизайну. Участие бесплатное, нужна только регистрация в боте @wplecturebot
8 октября в 15:00 по Мск
SMM без хаоса. Как выстроить эффективную систему работы инхаус или с агентством
15 октября в 17:00 по Мск
Автоматизация дизайна для маркетолога - Как работать с дизайнером в 2 раза быстрее
22 октября в 17:00 по Мск
Новая реальность поиска: как не потерять клиентов из-за Алисы и Google AI
Не пропустите концентрат практики и свежих инструментов для вашей работы!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3🤝3
Ивреа: борьба с текучкой кадров, ставшая наследием ЮНЕСКО https://habr.com/p/956818/
Легкая статья про производственный урбанизм в одном из городов Италии прошлого века.
Легкая статья про производственный урбанизм в одном из городов Италии прошлого века.
Habr
Ивреа: борьба с текучкой кадров, ставшая наследием ЮНЕСКО
Нет, это не модный офис ИТ-компании, а фасад фабрики, где думали о комфорте рабочих Ивреа — небольшой город-коммуна в северной Италии, который волей судьбы, а точнее, одного выдающегося...
👍5
Промпт-инжиниринг мёртв? Почему «как спросить» больше не важно, и что приходит на смену https://habr.com/p/958374/
Habr
Промпт-инжиниринг мёртв? Почему «как спросить» больше не важно, и что приходит на смену
Новое исследование от Anthropic, создателей Claude, ставит крест на классическом промпт-инжиниринге. Их вывод: эффективность ИИ-агентов теперь определяется не тем, как вы спросите, а...
👍4
Forwarded from AI for Devs
Как же я устал от тех, кто ссылается на ChatGPT
Вот реально, кажется, наступил новый уровень профессиональной лени. Ставишь задачу, человек уходит, потом приносит результат… а там мешанина из слов и/или кода. Спрашиваешь: “Ты сам то это читал?” — и получаешь в ответ: “Ааа, так это ChatGPT херню нагенерил…”
Ёпта. Я вижу, что это херня. Вопрос не в том, что сделал ChatGPT. Вопрос в том, почему ты решил, что это можно мне отправить не глядя? Неужели ты рельно думаешь, что я не знаю что такое ChatGPT и не в состоянии самостоятельно отправить в него запрос? Если бы мне нужен был ответ от ChatGPT, я бы не обращался к тебе.
Использовать ChatGPT — норм. Но проверять, понимать и фильтровать что он там нагенерил – долг того, кто обратился к ChatGPT. А если к тебе обратился человек, то и проверять он хочет результат от человека, а не от ChatGPT, иначе зачем ему обращаться к тебе?
Вот реально, кажется, наступил новый уровень профессиональной лени. Ставишь задачу, человек уходит, потом приносит результат… а там мешанина из слов и/или кода. Спрашиваешь: “Ты сам то это читал?” — и получаешь в ответ: “Ааа, так это ChatGPT херню нагенерил…”
Ёпта. Я вижу, что это херня. Вопрос не в том, что сделал ChatGPT. Вопрос в том, почему ты решил, что это можно мне отправить не глядя? Неужели ты рельно думаешь, что я не знаю что такое ChatGPT и не в состоянии самостоятельно отправить в него запрос? Если бы мне нужен был ответ от ChatGPT, я бы не обращался к тебе.
Использовать ChatGPT — норм. Но проверять, понимать и фильтровать что он там нагенерил – долг того, кто обратился к ChatGPT. А если к тебе обратился человек, то и проверять он хочет результат от человека, а не от ChatGPT, иначе зачем ему обращаться к тебе?
👍16😁4🤯4
Поддержка Nginx Unit прекратилась https://habr.com/p/960488/
Имхо недооцененный проект. Не хватило технического маркетинга?
UPD: в комментах пишут что Angie работает над своим вариантом.
Имхо недооцененный проект. Не хватило технического маркетинга?
UPD: в комментах пишут что Angie работает над своим вариантом.
Habr
Поддержка Nginx Unit прекратилась
8 октября 2025 года была окончательно прекращена поддержка полиглота сервера веб-приложений NGINX Unit , разработанного в компании F5. Компания не предоставила официальной причины закрытия, однако...
😢4
Распространенные эффекты у LLM с контекстом:
«Lost in the middle» — это эффект позиционного смещения в LLM: модели хуже извлекают и используют информацию, расположенную в середине длинного контекста, демонстрируя U‑образную зависимость качества от позиции фактов (лучше в начале и в конце, хуже в середине).
Больше проявляется при наполнении до 50% от объема контекста.
Практические рекомендации:
— Размещать ключевые инструкции и факты в начале или в конце промпта; дублировать критичные детали ближе к концу.
«Lost in the distance» — это эффект, при котором LLM хуже извлекает и связывает факты, если релевантные куски контекста находятся далеко друг от друга, даже если каждый по отдельности хорошо виден модели.
Практические рекомендации:
— Старайтесь группировать взаимосвязанные факты ближе друг к другу в одном чанке или соседних чанках, минимизируя вставки нерелевантного текста между ними.
— Разбивайте сложные запросы на подзадачи, каждая из которых опирается на компактный локальный контекст, а «слияние» результатов делайте поэтапно, уменьшая требуемую дальнюю зависимость в одном проходе.
Эффекты стоит изучать применительно к каждой модели. С первым в 2025 старались в некоторых реализациях бороться.
«Lost in the middle» — это эффект позиционного смещения в LLM: модели хуже извлекают и используют информацию, расположенную в середине длинного контекста, демонстрируя U‑образную зависимость качества от позиции фактов (лучше в начале и в конце, хуже в середине).
Больше проявляется при наполнении до 50% от объема контекста.
Практические рекомендации:
— Размещать ключевые инструкции и факты в начале или в конце промпта; дублировать критичные детали ближе к концу.
«Lost in the distance» — это эффект, при котором LLM хуже извлекает и связывает факты, если релевантные куски контекста находятся далеко друг от друга, даже если каждый по отдельности хорошо виден модели.
Практические рекомендации:
— Старайтесь группировать взаимосвязанные факты ближе друг к другу в одном чанке или соседних чанках, минимизируя вставки нерелевантного текста между ними.
— Разбивайте сложные запросы на подзадачи, каждая из которых опирается на компактный локальный контекст, а «слияние» результатов делайте поэтапно, уменьшая требуемую дальнюю зависимость в одном проходе.
Эффекты стоит изучать применительно к каждой модели. С первым в 2025 старались в некоторых реализациях бороться.
👍11
Forwarded from Вебпрактик
10 ноября на TechLead Conf Иван Поддубный поделится тем, что проверено на практике в «Вебпрактик»
🎙 В докладе «RAG для лидов: архитектура и практика внедрения в реальные проекты» Иван расскажет, как работает Retrieval-Augmented Generation — один из ключевых подходов в мире LLM. RAG помогает обогащать модели реальными и актуальными данными, снижая вероятность галлюцинаций и повышая точность ответов.
Иван поделится архитектурными решениями и практическим опытом внедрения RAG: от поиска по проектным данным до интеграции с корпоративными LLM и чат-ботами.
🤝 Вместе с экспертами из Yandex B2B Tech, Т-Банка и Fun&Sun Иван примет участие в круглом столе «Как изменяется performance команды после внедрения AI», на котором обсудят:
🔴 какие AI-инструменты реально используют команды;
🔴 как они влияют на скорость и качество разработки;
🔴 что можно измерить, а что — нет;
🔴 как проходит адаптация специалистов к новым форматам работы.
👌 TechLead Conf — площадка, где говорят о технологиях, которые уже работают, люди, которые их создают.
🤩 #Вебпрактик_эксперты #TechLeadConf #AI #LLM #RAG
Иван поделится архитектурными решениями и практическим опытом внедрения RAG: от поиска по проектным данным до интеграции с корпоративными LLM и чат-ботами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍7