Embedika | ИТ-решения для бизнеса – Telegram
Embedika | ИТ-решения для бизнеса
421 subscribers
766 photos
4 files
388 links
Научно-ориентированная ИТ-компания, разработчик корпоративных систем на основе технологий обработки естественного языка и машинного обучения. Data science, LegalTech, AI https://embedika.ru
Download Telegram
Как происходит внедрение корпоративного ИИ в крупных компаниях? Рассказываем на примере реального кейса Embedika

Для крупных компаний с распределенной структурой и большим объемом внутренней документации поддержание актуального и согласованного информационного поля — критическая задача. Несвоевременный доступ к актуальным документам, дублирования и противоречия между документами напрямую влияют на скорость принятия решений и операционные издержки.

Сегодня на примере нашего реализованного проекта для лидера российской добывающей отрасли мы расскажем, как ИИ-решения начинают интегрироваться в корпоративный ландшафт крупных компаний.

Главная задача этого проекта — заложить основу для цифровой трансформации системы управления нормативно-методической документацией для десятков тысяч сотрудников. Первые результаты показывают значительное ускорение поиска информации (с 10,5 минут до 1,2 минуты) и повышение её доступности.

📍 В карточках кратко про детали реализации и этапы проекта.
🔥5💯31👍1👏1
Как оптимизировать работу с нормативно-методической документацией: обзор функционала Cursor

Работа с внутренними регламентами, приказами и методическими указаниями часто требует значительных временных затрат на поиск актуальных версий документации, отслеживание взаимосвязей и контроль изменений. В крупных компаниях — это не редкая проблема, а ежедневная рутина. Объем нормативно-методической документации измеряется терабайтами, а ее актуальность и доступность важны для работы всей компании и принятия взвешенных решений.

Одно из наших ключевых решений, платформа Cursor, помогает бизнесу структурировать корпоративные знания и обеспечивает эффективный поиск и анализ документов.

Рассказываем о ключевых возможностях Cursor, которые помогут превратить систему НМД в управляемую и осмысленную среду знаний всей компании:

Умный поиск по документам: функция семантического поиска позволяет находить документы в нормативной базе по смыслу и неточным формулировкам, предлагает дополнительные термины и варианты поиска для более точного результата, ускоряя время обработки НМД.

Платформа автоматически выявляет связи между документами, формирует взаимные ссылки, показывает документы, которые схожи по тексту или имеют такую же смысловую нагрузку, что позволяет находить дублирующиеся НМД.

Гибкая система фильтрации позволяет ограничивать поиск по типу документа, дате, статусу и другим атрибутам, что ускоряет доступ к нужным материалам.

Возможность отслеживать версионность НМД позволяет видеть актуальные и предыдущие версии документации, сравнивать их и всегда быть в курсе изменений без обращения к тексту документа, а также получать уведомления об их изменениях напрямую заинтересованным сотрудникам.

Инструмент сбора и анализа обратной связи: при планировании работ по разработке и актуализации документации методологи могут опираться на аналитический срез, чтобы знать, какие документы брать в работу в первую очередь.

Платформа позволяет создавать пакеты документов для ознакомления — например, пакет «Новому сотруднику» с необходимыми НМД для новых членов команды.

Визуальный конструктор как инструмент администрирования позволяет методологам и администраторам настраивать модели данных, формы, правила индексации и поиска без глубокого погружения в код для ускорения адаптации системы под конкретные бизнес-процессы.

Платформа эффективно работает в крупных корпорациях, холдингах, государственных ведомствах и научно-образовательных учреждениях, где критически важна скорость и точность работы с внутренней документацией.

Такой подход помогает:
👉 Линейным сотрудникам — быстро находить информацию для повседневных задач;
👉 Новым сотрудникам — быстрее погружаться в рабочие процессы и ориентироваться во внутренних регламентах;
👉 Экспертам и методологам — анализировать большие массивы данных и поддерживать актуальность базы знаний;
👉 Аналитикам — гибко настраивать систему под меняющиеся требования.

📌 Хотите увидеть, как это работает?
Напишите «+» в комментариях — проведем демонстрацию решения, покажем реализованные кейсы и расскажем, с чего начать внедрение в вашей компании.
👍41🤔1💯1
Как устроена бизнес-платформа для работы с корпоративными данными

При первом касании может показаться, что Cursor — только поисковая строка и выдача результатов. На самом деле, за современным корпоративным поиском стоит сложная архитектура, которая обеспечивает скорость, точность и масштабируемость.

Микросервисная архитектура: почему это ключевое преимущество?
В основе Cursor и других наших решений лежит принцип модульности. Это - набор независимых сервисов, которые взаимодействуют друг с другом. Такой подход позволяет масштабировать систему под задачи любого объема — от отдельного департамента до крупного холдинга, внедрять и обновлять функционал без остановки всей системы, а также интегрироваться с существующей ИТ-инфраструктурой компании.

Подробнее о том, из каких модулей состоит Cursor:

1️⃣ Агрегатор данных собирает и унифицирует информацию из разнородных источников, включая неструктурированные данные (docx, pdf). Извлекает текст, выделяет ключевые сущности, сегментирует документы.

2️⃣ Движок индексации позволяет настраивать правила индексации по типам сущностей и атрибутам, обеспечивая точность и актуальность поисковой выдачи, а также дает администраторам инструмент контроля качества базы знаний.

3️⃣ Нормализация текста приводит слова к базовой форме (лемматизация), исправляет опечатки и учитывает морфологию языка — это основа для точного поиска.

4️⃣ Модуль семантики и пересечений находит семантически близкие документы, выявляет содержательные пересечения и строит граф связей между документами.

5️⃣ Поисковый модуль обеспечивает полнотекстовый, контекстный и атрибутивный поиск с поддержкой кросс-языковых запросов и фасетной фильтрации.

6️⃣ Модуль AI-ассистент позволяет получать готовые ответы на вопросы сотрудников в диалоговом режиме, без необходимости вручную искать и анализировать документы

7️⃣ Консоль администрирования позволяет методологам и администраторам гибко настраивать модель данных (типы объектов, атрибуты, связи), права доступа, конструктор карточек, форм и реестров.

8️⃣ Модуль аналитики отслеживает динамику пополнения базы, активность пользователей и предоставляет готовые отчеты для руководителей.

Данные в Cursor проходят строгую цепочку обработки: индексация → нормализация → агрегация → семантический анализ. Такой подход позволяет системе находить не просто слова, а смысловые связи между документами, а вместе с тем делает Cursor гибким инструментом для работы с корпоративными знаниями.

Подробнее о технической реализации готовы рассказать на демонстрации решения. Для её проведения напишите «+» в комментариях 👉
👍42🔥2💯1
Разумный подход: как спланировать бюджет на внедрение ML-проекта

В IT World вышла свежая статья — о том, как заложить реалистичный бюджет на ML-проект и избежать скрытых затрат.

Из чего складывается стоимость ML-проектов, почему изначальные оценки бюджета часто оказываются заниженными, как контролировать бюджет на каждом из этапов проекта - своим опытом поделилась Айканыш Орозбаева, директор по развитию бизнеса в Embedika.


Делимся ключевыми мыслями из колонки:
👉 Итоговая стоимость ML-проекта складывается не только из разработки модели. Значительная часть уходит на работу “за кадром”: очистку и разметку данных, интеграцию решения в ИТ-ландшафт компании, регулярное переобучение моделей. Также, ресурсы уходят на разработку бизнес-логики, которая связывает ML-модель с реальными задачами компании.
👉 Этап подготовки данных (очистка, разметка, формирование обучающих выборок) и непосредственно обучение моделей - самый трудоемкий и затратный из-за необходимости мощных вычислительных ресурсов и времени.
👉 Затраты на поддержку иногда сопоставимы с этапом разработки, особенно из-за необходимости контроля качества, адаптации моделей к изменяющейся среде и соблюдения регуляторных требований.
👉 Способы оптимизировать проект без ущерба качества есть на каждом этапе: запуск MVP для проверки гипотез, использование предобученных моделей вместо разработки с нуля, автоматизация разметки данных, грамотное комбинирование облачных сервисов и edge-вычислений.

🔗 Полную версию статьи читайте на сайте IT World.
👍52🔥2🤔2
Дайджест событий в области искусственного интеллекта

Сентябрь подтвердил тренд: ИИ становится коллегой, помощником и стратегическим активом — от научных лабораторий и офисов до школ и клиник. Делимся главными новостями месяца, которые вы могли пропустить.

В России:
🧠 Минобрнауки России и Университет Иннополис разрабатывают ИИ-ассистента для генерации научных гипотез, а также — LLM для анализа научно-технической информации совместно с НИУ ВШЭ.
🤖 Санкт-Петербургский госуниверситет промышленных технологий и дизайна представил прототип диалогового робота для персонализированных экскурсий с распознаванием речи и синтезом голоса.
🏥 Медицинский университет им. Сеченова запустил пилот ИИ-ассистента DocAI для поиска и анализа медицинских данных.
📊 ИТ-холдинг Т1 создал ИИ-агентов данных для автоматической работы с корпоративными хранилищами и BI-инструментами.
🎓 Во Владивостоке изучают возможность введения в школах уроков по работе с ИИ.

В мире:
🎬 YouTube представил набор ИИ-инструментов для авторов, включая чат-бота Ask Studio для аналитики канала и генерации идей.
💼 Microsoft добавила в приложения Office чат-бота Microsoft 365 Copilot Chat, ИИ-агентов и другие инструменты на основе ИИ.
📈 Anthropic научила чат-бот Claude создавать и редактировать таблицы и презентации.
🗣️ Alibaba выпустила модель распознавания речи Qwen3 ASR с поддержкой русского языка.
🔍 OpenAI разрабатывает платформу для найма на базе ИИ (OpenAI Jobs Platform) и открыла бесплатный доступ к функции Projects в ChatGPT.

Аналитика:
📊 По данным «Русской школы управления», 11% компаний уже внедрили ИИ в ключевые управленческие процессы, а 29% используют его для аналитики и HR.
🚀 DCLogic подтверждает: ИТ- и бизнес-руководство России видит главными драйверами цифровой трансформации именно ИИ (27,8%) и информационную безопасность (25,3%).
📈 «Сбер» выяснил, что крупный бизнес в будущем планирует активнее внедрять предиктивную аналитику (19%), облака (18%), сервисы принятия решений на основе данных (14%) и ГенИИ (13%).

#дайджест
👍3🔥2👏21
Уровни зрелости подхода к работе с корпоративной документацией: от базового до AI-driven

Массивы корпоративной документации — это стратегический актив, потенциал которого большинство компаний недооценивает. Неэффективная работа с документами напрямую ведет к повторяющимся ошибкам, срыву сроков, неконтролируемым рискам и колоссальным затратам ресурсов. Сегодня ИИ технологии позволяют менять парадигму: документация становится ключевым элементом цифровой трансформации и фундаментом для внедрения интеллектуальных систем.

Вот почему для многих компаний становится актуальным вопрос, как оценить их уровень зрелости в управлении корпоративной документацией.
Мы выделяем три стадии:

🛡 Базовый уровень — защита интересов организации
Главная цель на этом этапе — порядок и безопасность, выполнение внешних требований регуляторов и защита интересов юрлица. Документация создается для закрепления порядка и распределения зон ответственности, а также для аудитов, проверок и потенциальных судебных разбирательств. Ее практическая польза для сотрудников и эффективности процессов вторична. Критерий успеха — формальное наличие полного комплекта актуальных документов, независимо от их объема и удобства.

📊 Уровень операционной эффективности — помощь сотруднику при выполнении своих рабочих задач
Фокус смещается на повышение эффективности бизнес-процессов. Документы используются для снижения трудоемкости, увеличения скорости работы, минимизации ошибок и управления рисками. Критерий успеха — измеримое улучшение операционных показателей: скорость, качество, стоимость, количество инцидентов.

🧠 Уровень данных — фундамент для AI
Документация перестает быть текстом для человека и превращается в структурированный набор данных, граф знаний. Это качественный датасет для обучения и работы AI-ассистентов, которые способны анализировать информацию, давать эффективные рекомендации и автоматизировать принятие локальных решений. Критерий успеха — возможность эффективно использовать массив документов для обучения и работы интеллектуальных систем.

А на какой из стадий находится ваша компания и с какими вызовами в работе с документацией вы сталкиваетесь? Поделитесь с нами в комментариях 👇
🔥6💯32👍1
Как превратить документы в инструмент управления бизнес-процессами

Регламенты, инструкции и положения в крупных компаниях часто устаревают и не соответствуют реальным бизнес-процессам. Этот разрыв между формальными предписаниями и практикой — прямая причина финансовых потерь и стратегических рисков.

Проблема в фундаментальной связи: бизнес-процессы закреплены в документах, и расхождения в массиве документации неизбежно приводят к издержкам.

👉 Цифровизация, реализуемая по принципу «сверху вниз», оптимизирует управленческие процедуры, но часто не доходит до основных производственных ресурсов, создавая двойную нагрузку для линейного персонала без роста общей эффективности.
👉 Компании годами тратят ресурсы на разработку и поддержку документов, которые не используются для принятия решений, не предотвращают ошибки и не помогают извлекать уроки из прошлых неудач.
👉 Один процесс дробится между разными департаментами, что приводит к длительным согласованиям, тормозит преобразования и увеличивает транзакционные издержки.

Решение — не в тотальном переписывании инструкций, а в изменении роли документации. С помощью технологий ИИ и NLP документация превращается в структурированные данные. Это открывает три ключевые возможности:

Документы становятся машиночитаемыми. Нейросеть анализирует тысячи страниц, выявляя противоречия и актуализируя информацию во всех системах.

Появляется новый «потребитель» данных — цифровой сотрудник. Теперь документацию можно использовать для обучения ИИ-ассистентов, которые консультируют сотрудников, помогают в автоматизации и поддерживают базу знаний в актуальном состоянии.

Фокус смещается на бизнес-результат. Такой подход позволяет решать конкретные задачи: от оптимизации бюджета на обучение до управления производственными рисками и снижения нагрузки на техподдержку ИТ-систем.

Важно, чтобы документы приносили пользу для бизнеса. Современные технологии позволяют превратить документы в эффективный инструмент управления процессами, который обеспечивает скорость, снижает затраты и минимизирует риски.

А вы уже используете ИИ для работы с документацией? Расскажите в комментариях! 👇
👍7🔥42👏1
Делимся анонсом от Платформы сорегулирования!
С октября платформа пополнится функцией ИИ-анализа законопроектов. Теперь система не просто пересказывает текст, а формирует полноценную дорожную карту адаптации бизнес-процессов. Это наглядный пример того, как технологии выводят анализ нормативно-правовых документов на новый уровень.

Коллеги уже протестировали функционал ИИ-помощника и поделились результатами у себя в канале 👉
👍5🔥52
ИИ-анализ законопроектов уже в октябре!

Мы протестировали новый функционал Платформы сорегулирования, который скоро станет доступен всем пользователям. 🧠

Искусственный интеллект Платформы только что подготовил полноценную справку по одному из самых обсуждаемых законопроектов — изменениям в Налоговый кодекс (№ 1026190-8), который может вступить в силу уже с 1 января 2026 года.

Что умеет ИИ-помощник:
Анализирует текст законопроекта и выделяет ключевые изменения
Оценивает риски для бизнеса по каждому блоку
Формирует дорожную карту адаптации
Даёт рекомендации по верификации и мониторингу
Следит за сроками и индикаторами

Сразу скажу, что мы не редактировали получившиеся выводы и рекомендации.

Важно:
ИИ не заменяет эксперта или юриста, а снимает с него первую часть обзорной аналитики, предоставляя возможность копать в глубину, а также дает идеи и направления для развития замечаний;
ИИ не просто пересказывает текст, а структурирует его, оценивает последствия и предлагает конкретные шаги для бизнеса — от пересмотра договоров до стресс-тестирования финансовых моделей;

Функционал появится во второй декаде октября.

Пример справки — лишь первый шаг. В будущем ИИ сможет помогать с анализом правок, сравнением версий и даже прогнозированием правоприменительной практики.

Буду благодарен за обратную связь и предложения.

#ПлатформаСорегулирования #ИИ #Налоги #НДС #МСП
🔥7👍31💯1
AI-ассистенты, которые окупаются: где запускать и как считать выгоду

AI-ассистент (или AI-чат-бот) — это «умный сотрудник», который берёт на себя повторяющиеся задачи. Он выгоден там, где много однотипной работы и нужно отвечать быстро.

1️⃣ Поддержка клиентов — отвечает на типовые вопросы и восстанавливает доступ, снижая нагрузку на операторов на 50–70% и отвечая клиентам 24/7.
2️⃣ Продажи — обрабатывает заявки, задавая уточняющие вопросы и записывая на звонок, что дает рост конверсии на 15–30%.
3️⃣ Документы и договоры —находит ключевые пункты в договорах и заполняет шаблоны, сокращая время на рутину в 2 раза и минимизируя риски.
4️⃣ Операционные задачи — принимает заявки, сверяет накладные и формирует отчеты, ускоряя процессы на 30–50%.
5️⃣ Внутренние запросы и HR — отвечает сотрудникам и ищет информацию в базе знаний, разгружая HR и ускоряя онбординг.

Быстрый тест «окупится / не окупится»:
Задача повторяется сотни раз в месяц?
Время сотрудника стоит заметных денег?
Процесс можно описать правилами/шаблонами?
Результат видно по цифрам уже через неделю?

👉 Если «да» хотя бы на 3 из 4 — проект, скорее всего, окупится.

Считаем выгоду «на пальцах»:
Экономия/мес = обращения × минуты × доля, которую возьмёт ассистент × ставка часа.

Пример: 3000 обращений × 10 мин × 50% = 300 часов/мес.
При ставке 1000 ₽/час → экономия 300 000 ₽/мес.
За вычетом расходов (AI ~25к/мес + внедрение 2,5 млн) чистая прибыль ~275 000 ₽/мес. Окупаемость — около 10 месяцев. И это без учета снижения ошибок и роста скорости.

Как запускать без «боли»:
🔹 Выберите 1–2 простых сценария и зафиксируйте «как есть» без ИИ.
🔹 Запустите пилот с ИИ-ассистентом на ограниченной аудитории. Подведите итоги пилота
🔹 Расширяем охват, подключаем новых пользователей и источники данных следим за качеством, максимизируем эффекты.

Отказаться от внедрения рекомендуется, если у вас: мало запросов, хаос в процессах, уникальные кейсы или нет доступа к данным.

Больше кейсов и примеров — в телеграм-канале: @apesenko
Вопросы и разбор вашей ситуации —
@pesenko
4👍4🔥3💯2
Внедрение процессного подхода к управлению документами приносит измеримую выгоду: с платформой Standart трудозатраты на разработку и анализ документации сокращаются на 35%, а время на согласование и выработку единой позиции — на 40%. Это становится возможным за счет выстраивания полного цикла работы с документами в единой среде.

#цифрадня
🔥6👍4👏21
СЭД и Standart от Embedika: в чем различия между двумя системами

Классические Системы электронного документооборота (СЭД) — фундамент для цифровизации компаний на базовом уровне. Они фиксируют все необходимые формальные шаги и людей: участников процесса, маршруты по регламенту, согласования, подписи, смену статусов, хранение и архив. По сути, это «протокольные» процессы, цифровой скелет документооборота — необходимый минимум.

Standart развивает эту концепцию, выходя за рамки архива и маршрутов и добавляя к надежности СЭД удобства для повседневной работы. Это - платформа для управления полным жизненным циклом документации, глубоко интегрированная в операционную деятельность. Вы не просто видите файлы для согласования, а получаете полный контекст и инструменты для работы: версионность, сравнение, уведомления, подписки, совместные обсуждения и рекомендации системы. Платформа показывает аналитику — связи между документами, пересечения и всё, что известно по конкретному вопросу, а также возможности промониторить отдельные этапы работы и увидеть, на каком из них возникла просрочка и по какой причине.

Подробнее о ключевых технологических отличиях 👇

СЭД работает с документом как с файлом. Основные операции — регистрация, хранение, перемещение между согласующими. Фокус смещен на фиксацию результата.
✔️ Standart же управляет документом как элементом бизнес-процесса. Платформа обеспечивает не просто согласование, а весь цикл: от анализа существующей базы и выявления противоречий до совместной разработки, ревизии и актуализации на основе данных.

Аналитика в СЭД чаще всего отвечает на базовые вопросы: «Кто согласовал документ?» и «Какой текущий статус?».
✔️ Аналитика в Standart дает понимание состояния всей системы документации: метрики актуальности, пересечения требований, нагрузка на сотрудников, соответствие регламентов реальным бизнес-процессам.

Таким образом, СЭД автоматизирует поток документов, а Standart — интеллектуальную работу с содержащейся в них нормативной и методической базой. Результат — не просто порядок в архиве, а повышение скорости внедрения изменений, снижение трудозатрат на анализ и исключение регуляторных рисков.

Остались вопросы о различиях между СЭД и платформой Standart? Задайте их в комментариях, и мы разберем их детально в одном из следующих постов.
🔥84👍3👏3
Как Standart находит противоречия в документах: семантический граф и анализ связей

Одна из ключевых проблем управления документацией — скрытые противоречия и дублирования. Разные отделы создают документы, которые могут конфликтовать по требованиям, использовать разночтения в терминах или дублировать друг друга. При этом классические СЭД не способны выявить такие связи.

Standart решает эту задачу с помощью семантического анализа и построения графа связей. Рассмотрим, как это работает:

1️⃣ Извлечение сущностей и терминов — система автоматически выделяет из текста ключевые сущности: термины, определения, названия процессов, ответственных лиц и нормативные требования. За это отвечают алгоритмы обработки естественного языка (NLP).
2️⃣ Семантический анализ — Standart анализирует не просто слова, а их смысл. Алгоритмы определяют контекст использования терминов и выявляют логические связи между документами.
3️⃣ Построение графа связей — на основе проанализированных данных система строит семантический граф. Он представляет собой визуальную модель, где узлы — это документы, термины или требования, а связи — отношения между ними.

Пример работы системы на практике:

Допустим, в компании действуют: документ А — «технический регламент Х», который требует проведения ежеквартального контроля определенных параметров. Документ Б — «инструкция по эксплуатации Y», который предписывает ежегодный контроль этих же параметров.

Что сделает Standart:
Система выделит ключевые термины «контроль параметров», «технический регламент» и «инструкция по эксплуатации». В процессе семантического анализа алгоритмы обнаруживают прямое противоречие в периодичности контроля одного и того же процесса. Визуально в графе связей будет показана четкая взаимосвязь между документами А и Б, а сам узел связи будет помечен системой как конфликтующий. Методолог получит автоматическое уведомление о выявленном противоречии с точным указанием мест в документах, где требования не совпадают.

👉 На практике это означает сокращение времени на выявление конфликтов с недель до минут, автоматизацию ревизии документов при их создании и изменении, повышение качества нормативной базы компании и снижение рисков от выполнения противоречивых указаний.

Для методологов и архитекторов процессов это переход от ручного сравнения документов к управлению на основе данных.

А какие инструменты для анализа документов используете в настоящее время и с какими сложностями при согласовании документов сталкиваетесь чаще всего?
🔥6👍5👏3💯1
Подборка полезных и интересных материалов

ИИ продолжает менять подходы в бизнесе, образовании и разработке. Как всегда, делимся свежими статьями, исследованиями и мнениями экспертов, которые стоит изучить, чтобы быть в теме.

Статьи:
📎 Колонка ректора РТУ МИРЭА Станислава Куджа в «Ведомостях» о том, почему владение ИИ становится такой же базовой компетенцией выпускника, как и знание иностранного языка.
📎 Интервью с руководителем направления ИИ холдинга Т1 Сергея Голицына для ICT.Moscow о практических способах ускорить внедрение искусственного интеллекта в компаниях.
📎 Разбор от команды «СберТеха» в TAdviser с кейсами, в которых применение ИИ помогает компаниям повышать эффективность бизнес-процессов.
📎 Анализ растущего рынка Machine Learning as a Service (MLaaS) от «Ведомостей» — кому и зачем нужны сторонние ML-мощности.
📎 Колонка директора по развитию бизнеса Just AI Светланы Захаровой и юриста Кирилла Тимченко в Forbes о том, как новая концепция госрегулирования может повлиять на сценарии развития ИИ в России.

Заметки в блогах:
✍️ Эксперты VK на «Хабре» делятся опытом сборки русского мультимодального датасета для оценки моделей VLM (Vision-Language Models).
✍️ Специалисты MTS AI рассказывают, как нейросети помогают автоматизировать рутину и анализировать документы в юриспруденции.
✍️ Заметка на «Хабре» по мотивам докладов из конференций Олега Бунина: кто владеет правами на код, сгенерированный нейросетью.

Книги:
📚 Speech and Language Processing от Дэниела Джурафски и Джеймса Х. Мартина — книга для тех, кто работает с NLP.
📚 «Нейросетевые методы в обработке естественного языка» Йоава Голдберга — классическое пособие по основам ML и NLP.

Подкасты:

🎤 Выпуск подкаста «Короче» от Сбера — как эффективно работать с ИИ уже сегодня и какие навыки для этого нужны.
🎤 Эпизод подкаста «ИИнсайт» о том, как технологии искусственного интеллекта интегрируются в такие традиционные сферы, как библиотечное дело.
🎤 ML-специалист Максим Шапошников в Machine Learning Podcast о том, кто такие «мыслящие агенты» на основе ИИ и каков их реальный потенциал.
🔥5👍32💯2
Разбираем платформы LAMP и Verdi — технологическое ядро решений Embedika

Решения Embedika — Cursor, Standart, Contract — работают на основе двух собственных технологических платформ: LAMP и Verdi. Это наши разработки, которые обеспечивают интеллектуальную обработку данных и выстраивание бизнес-логики.

LAMP (Language & Machine Processing Platform) — это программная платформа для обработки и интеллектуального поиска текстовых данных, а также для обучения ML-моделей.
Verdi — платформа для создания бизнес-логики внутренних процессов и администрирования.

Рассказываем подробнее о том, как работают эти платформы!

👉 LAMP отвечает за семантический поиск, поиск прямых текстовых заимствований и контекстное расширение запросов. Именно эта платформа позволяет находить информацию по смыслу, а не только по ключевым словам, и строит RAG-ответы с цитированием источников.

👉 Verdi реализует базовую функциональность систем: управление уведомлениями, пользователями, аутентификацию, авторизацию, работу со справочниками, журналирование и аудит. Это каркас, который обеспечивает стабильность и управляемость всех процессов.

На основе LAMP и Verdi мы создали набор встраиваемых ML-сервисов. В их числе сервис по определению токсичной лексики, выявление ошибок разного рода, рекомендательная система по заполнению ключевой информации, сервис по выделению необходимых данных из документов и диалоговая система на базе LLM.

Микросервисная архитектура позволяет реализовывать проекты любой сложности из готовых компонентов. Это дает возможность быстрого и гибкого внедрения продуктов, которые решают конкретные бизнес-задачи. Все решения разработаны нами с нуля, платформа LAMP зарегистрирована в реестре отечественного ПО.

💬 Хотите узнать больше? Пишите в комментарии и мы расскажем подробнее о каждой системе.
👍8🔥62💯1