Embedika | ИТ-решения для бизнеса – Telegram
Embedika | ИТ-решения для бизнеса
421 subscribers
766 photos
4 files
388 links
Научно-ориентированная ИТ-компания, разработчик корпоративных систем на основе технологий обработки естественного языка и машинного обучения. Data science, LegalTech, AI https://embedika.ru
Download Telegram
Подборка полезных и интересных материалов

ИИ продолжает менять подходы в бизнесе, образовании и разработке. Как всегда, делимся свежими статьями, исследованиями и мнениями экспертов, которые стоит изучить, чтобы быть в теме.

Статьи:
📎 Колонка ректора РТУ МИРЭА Станислава Куджа в «Ведомостях» о том, почему владение ИИ становится такой же базовой компетенцией выпускника, как и знание иностранного языка.
📎 Интервью с руководителем направления ИИ холдинга Т1 Сергея Голицына для ICT.Moscow о практических способах ускорить внедрение искусственного интеллекта в компаниях.
📎 Разбор от команды «СберТеха» в TAdviser с кейсами, в которых применение ИИ помогает компаниям повышать эффективность бизнес-процессов.
📎 Анализ растущего рынка Machine Learning as a Service (MLaaS) от «Ведомостей» — кому и зачем нужны сторонние ML-мощности.
📎 Колонка директора по развитию бизнеса Just AI Светланы Захаровой и юриста Кирилла Тимченко в Forbes о том, как новая концепция госрегулирования может повлиять на сценарии развития ИИ в России.

Заметки в блогах:
✍️ Эксперты VK на «Хабре» делятся опытом сборки русского мультимодального датасета для оценки моделей VLM (Vision-Language Models).
✍️ Специалисты MTS AI рассказывают, как нейросети помогают автоматизировать рутину и анализировать документы в юриспруденции.
✍️ Заметка на «Хабре» по мотивам докладов из конференций Олега Бунина: кто владеет правами на код, сгенерированный нейросетью.

Книги:
📚 Speech and Language Processing от Дэниела Джурафски и Джеймса Х. Мартина — книга для тех, кто работает с NLP.
📚 «Нейросетевые методы в обработке естественного языка» Йоава Голдберга — классическое пособие по основам ML и NLP.

Подкасты:

🎤 Выпуск подкаста «Короче» от Сбера — как эффективно работать с ИИ уже сегодня и какие навыки для этого нужны.
🎤 Эпизод подкаста «ИИнсайт» о том, как технологии искусственного интеллекта интегрируются в такие традиционные сферы, как библиотечное дело.
🎤 ML-специалист Максим Шапошников в Machine Learning Podcast о том, кто такие «мыслящие агенты» на основе ИИ и каков их реальный потенциал.
🔥5👍32💯2
Разбираем платформы LAMP и Verdi — технологическое ядро решений Embedika

Решения Embedika — Cursor, Standart, Contract — работают на основе двух собственных технологических платформ: LAMP и Verdi. Это наши разработки, которые обеспечивают интеллектуальную обработку данных и выстраивание бизнес-логики.

LAMP (Language & Machine Processing Platform) — это программная платформа для обработки и интеллектуального поиска текстовых данных, а также для обучения ML-моделей.
Verdi — платформа для создания бизнес-логики внутренних процессов и администрирования.

Рассказываем подробнее о том, как работают эти платформы!

👉 LAMP отвечает за семантический поиск, поиск прямых текстовых заимствований и контекстное расширение запросов. Именно эта платформа позволяет находить информацию по смыслу, а не только по ключевым словам, и строит RAG-ответы с цитированием источников.

👉 Verdi реализует базовую функциональность систем: управление уведомлениями, пользователями, аутентификацию, авторизацию, работу со справочниками, журналирование и аудит. Это каркас, который обеспечивает стабильность и управляемость всех процессов.

На основе LAMP и Verdi мы создали набор встраиваемых ML-сервисов. В их числе сервис по определению токсичной лексики, выявление ошибок разного рода, рекомендательная система по заполнению ключевой информации, сервис по выделению необходимых данных из документов и диалоговая система на базе LLM.

Микросервисная архитектура позволяет реализовывать проекты любой сложности из готовых компонентов. Это дает возможность быстрого и гибкого внедрения продуктов, которые решают конкретные бизнес-задачи. Все решения разработаны нами с нуля, платформа LAMP зарегистрирована в реестре отечественного ПО.

💬 Хотите узнать больше? Пишите в комментарии и мы расскажем подробнее о каждой системе.
👍8🔥62💯1
Интеллектуальные платформы на практике: как мы сократили время разработки документов с 30 до 5 часов

Процесс проектирования услуг и разработки административного регламента предоставления госуслуг сложный и трудозатратный, требующий значительных компетенций как в области регулирования, так в области юриспруденции. Многие из государственных и муниципальных услуг имеют существенные отличия, в том числе из-за особенностей регионального законодательства, что не позволяет полностью типизировать процесс их проектирования. Именно с такой проблемой столкнулась система, содержащая эталонные данные обо всех государственных и муниципальных услугах до реализации нашего проекта по разработке и развитию ФГИС «Федеральный реестр государственных и муниципальных услуг (ФРГУ)».

Ключевой задачей было создание единой системы, которая стала бы эталонным источником данных для полного жизненного цикла услуг — от проектирования услуги до закрепления порядка предоставления услуги в тексте нормативного правового акта — цифрового административного регламента. ФРГУ — это не портал для граждан и организаций, а сложная система, в которой федеральные и региональные органы власти, а также органы местного самоуправления создают услуги и разрабатывают цифровые административные регламенты их предоставления, обеспечивающая стандартизацию и централизованное управление процессами в масштабах всей страны.

Сегодня рассказываем, как мы построили такую платформу и каких результатов удалось достичь.

📍 В карточках — детали реализации и ключевые эффекты.
👏8🔥3💯21👍1
От пет-проектов до промышленного кода: как вайб-кодинг меняет индустрию

Делимся интересными рассуждениями на тему вайб-кодинга с канала @TheDigitalCTO — Будничные вопросы ИТ в Еком и Маркетплейсах, клиентский путь и UX, digital tech, microservices.

Какое-то время я относился к вайб кодингу, как к какой-то игрушке, которую можно использовать только для домашнего программирования и пет-проектов. Потом я начал замечать, что многие крупные компании стали экспериментировать с вайб-кодингом уже с прицелом на промышленную разработку. Посетил недавно конференцию, где представители не самых маленьких компаний рассказывали, как они начали применять вайб кодинг в разработке.

Оставим сейчас в стороне рассуждения на тему домашних поделок типа: «напиши мне сервис на GoLang, который будет считывать настроение кота по фото». С этим все понятно. Ниша для тех, кто, не умея разрабатывать, тем не менее хочет что-то создать в достаточно короткие сроки, не разбираясь в языке программирования. А вот что для профессионалов и компаний означает использование вайб-кодинга?

Начну с того, что компании могут забыть про «свой» код. Код, который получается в результате вайб-кодинга — это чужой код, который разработчик видит только в момент появления в панели. Этот код может соответствовать вашим представлениям об архитектуре приложения, а может частично или полностью противоречить ему. Опять же, качество кода может быть разным. Все зависит от того, насколько правильно выбрана модель и как правильно построен промпт. При такой разработке фокус уходит с самой разработки на код-ревью и тестирование.

В различных дискуссиях проскакивает мысль, что вайб-кодинг может убить джунов, т. к. те задачи, на которых они учились, теперь выполняет ИИ. А если не будет джунов, то через какое-то время не будет и мидлов и сеньоров. А я бы посмотрел на это с другой стороны — если вайб-кодинг приживется, то это изменит полностью всю отрасль разработки. Разработчики, в их нынешнем состоянии, станут вообще не нужны. Потребуются другие специалисты. Вайб-кодинг — это тоже навык, и хотя в нем есть слово кодинг, но этот навык с классическим программированием не пересекается совсем или пересекается, но не сильно.

И вот тут начинается интересное. Пока непонятно (по крайней мере мне), мы стоим на пороге революционного изменения профессии или это всего лишь очередной хайп, который через год радостно будет заменен на что-то еще? Я пока не вижу, как эта технология может выйти за пределы «написать кусок кода» и прийти к «написать решение» с внятной архитектурой, оптимальное и поддерживаемое. Но еще год назад про вайб кодинг не было особо слышно, а сейчас мы это обсуждаем на конфах. Поэтому ждем.


Больше интересных новостей об ИИ, рителе, екоме и маркетплейсах 👉 Подписаться на канал
#AI #ChatGPT #новости #цифроваятранформация #мнения #разработка
👍5🔥4💯2
Разрозненность данных как системная проблема бизнеса

В среднем сотрудники компаний тратят до 35% рабочего времени на поиск для сбора единой картины из разрозненных источников. Документы и знания зачастую распределены среди множества систем. Например, они могут фиксироваться в локальных и сетевых хранилищах, облачных сервисах, корпоративных порталах и специализированных базах знаний.

Отсутствие единой точки доступа приводит к прямым потерям: замедляются ключевые процессы, растут временные затраты, дублируются задачи.

Поделитесь, насколько эта проблема актуальна для вас?

Для этого проголосуйте в опросе, сколько систем приходится использовать ежедневно для поиска корпоративной информации в вашей компании?
👍6🔥2💯2
Как оценить реальную пользу корпоративных документов: показываем на примере работы Cursor и Standart

Внедрение процессного подхода к управлению документацией — это лишь первый шаг. Второй, не менее важный — оценка того, насколько созданные документы востребованы и полезны в повседневной работе сотрудников. Без этого руководитель лишается объективных данных для принятия решений об оптимизации нормативной базы.

Наши платформы Standart и Cursor спроектированы так, чтобы бизнес мог сформировать единый контур управления жизненным циклом документов. Standart предоставляет данные о процессе разработки и согласования, а Cursor — аналитику о практическом использовании. Их интеграция дает полную картину ценности каждого документа.

Так, Standart помогает фиксировать метрики создания документа:
Контроль процесса согласования: отслеживание участников, ролей, этапов и соблюдения плановых сроков. Система уведомляет о смене статусов, исключая ручной мониторинг;
Организация совместной работы: все участники процесса работают с одной версией документа и видят правки друг друга в реальном времени, что исключает необходимость ручной сверки разных версий;
Выявление «узких мест»: система фиксирует этапы, на которых происходят задержки относительно плановых сроков, и показывает, на каких этапах и с чем они связаны;
Аналитику по обратной связи: выявляет документы с наибольшим количеством вопросов, замечаний или запросов на актуализацию и отмену.

Cursor же предоставляет бизнесу данные о применении документа:
Частота и динамика поисковых запросов к документу;
Ключевые темы и контексты, в которых он востребован (через анализ запросов);
Связи с другими документами и материалами в корпоративной базе знаний.

Используя эти сервисы в синергии, руководитель получает более комплексную аналитическую картину. Низкая вовлеченность при высокой трудоемкости согласования может говорить о нерелевантности или избыточной сложности документа. Высокая востребованность при оптимизированном процессе подтверждает его эффективность, а разнородные запросы к одному документу часто указывают на недостаточную ясность контента или пробелы в регламентации.

Такой анализ позволяет не просто констатировать факт создания документа, а оценивать его реальную пользу для бизнеса и принимать обоснованные решения о доработке, упрощении или выводе из оборота.
🔥6👍32💯2
Дайджест событий в области искусственного интеллекта

Искусственный интеллект начинает переходить от экспериментального формата к системной работе — в HR, финансах, образовании и даже в такси. Рассказываем о ключевых событиях месяца в области ИИ-технологий.

В России:
🧠 Системный интегратор «Мобиус Технологии» разработал ИИ-бота для оценки универсальных компетенций сотрудников и измерения роста их навыков.
🤖 Билайн Big Data & AI открыл бесплатный демо-доступ к мультиагентной платформе. На старте доступны три агента: «Ассистент-секретарь», «Помощник продавца» и «Оператор контакт-центра».
📊 Ассоциация ФинТех создала методологию оценки экономического эффекта от внедрения ИИ.
🎓 Компания «Антиплагиат» представила обновление, которое показывает места в студенческих работах, написанные с помощью ИИ.
🔬 В России ввели новый норматив технологической грамотности ТехноГТО «Искусственный интеллект» для подтверждения базовых знаний в области ИИ.

В мире:
🧠 Alibaba добавила в чат-бота Qwen функцию долговременной памяти (Qwen Chat Memory) для запоминания контекста диалогов и повышения персонализации.
🚗 Uber будет платить водителям и курьерам за обучение ИИ-моделей (запись голоса, поиск и загрузку изображений. предоставление документов на определенных языках) в перерывах между заказами.
💼 Amazon представила агентный ИИ Quick Suite — корпоративное приложение для поиска информации, визуализации данных и автоматизации рутинных задач.
🏫 В Техасе (США) открыли частную школу Alpha School, где детей обучают с помощью ИИ и без учителей.

Аналитика:
📈 По данным HeadHunter, 23% управленцев и HR-специалистов в ближайшее время планируют разработать или внедрить стратегию широкого использования ИИ.
💡 Опрос от МИРБИС и «Сбер Бизнес Софт»: среди предпринимателей, уже внедривших ИИ, 6,9% готовы инвестировать в цифровизацию более 10% от оборота. Это говорит о высокой степени доверия к технологиям как к драйверу роста.

#дайджест
👍4🔥21👏1🤯1
Почему ваши документы — это ваш цифровой актив?

В прошлом месяце мы уже разбирали, как ИИ и человек работают в гибридной модели, а сегодня хотим углубиться в этот тренд. Речь пойдет не просто об ассистентах, а о новом виде «цифрового труда», где главный актив — ваша собственная корпоративная документация.

Почему пора перестать оптимизировать офис и начать смотреть на процессы снизу вверх — объясняем подробнее в карточках.
💯7👍4🔥2👏1
Платформа Cursor для руководителя проектов: разбор реального сценария работы

Запуск новых проектов в крупных компаниях зачастую связан с длительной подготовкой: руководителю предстоит погрузиться в тему и изучить контекст, найти заделы и наработки, специалистов под выполнение задачи, разработать ТЗ и договора. Сегодня мы покажем на реальном сценарии работы, как платформа Cursor позволяет руководителю проекта системно пройти весь путь от инициации до реализации проекта, используя единое информационное пространство.

👉 На этапе анализа предметной области руководитель по ключевым терминам может быстро найти статьи и материалы из корпоративных библиотек и систем обучения. Использование поиска по смыслу и фасетных фильтров в Cursor позволяет сразу найти не только целевые документы, но и все существующие в холдинге наработки по схожей тематике, что дает возможность погрузиться в тему в разы быстрее, вместо долгого самостоятельного поиска в разрозненных источниках.

👉 Для формирования команды поможет поиск по специалистам с применением фильтров по конкретным компетенциям сотрудников. Cursor может агрегировать данные из HR-систем, предоставляя доступ к карточкам сотрудников с резюме, контактами и историей проектов. Это позволит быстро идентифицировать подходящего специалиста внутри холдинга и выйти на него, минуя длительный поиск.

👉 При разработке технического задания специалист загружает файл с требованиями в Cursor для поиска по семантическим пересечениям. Система находит и ранжирует по степени схожести технические задания из управления проектной документацией, предоставляя готовый релевантный образец для ускоренной подготовки собственного ТЗ.

👉 Для подготовки договорной документации руководитель использует то же ТЗ, но активирует поиск по содержательным пересечениям. Cursor находит типовые договоры на оказание услуг из системы документооборота, которые можно сразу скачать и адаптировать под конкретные условия проекта, обеспечивая юридическую корректность и соблюдение внутренних стандартов.

👉 На этапе поиска подрядчика и анализа рисков руководитель через карточки реализованных проектов может выйти на карточки договоров. Это дает ему прямые контакты организаций-исполнителей по релевантным тематикам, а также возможность связаться с коллегами для консультации по технологиям и подходам. Дополнительно скачивается эксплуатационная документация на внедренную систему для детального изучения перед переговорами.

Cursor — это не просто поисковик, а единое информационное пространство, которое связывает между собой людей, знания, документы и обеспечивает сквозную работу с корпоративными данными. Руководитель проекта получает доступ к структурированной информации о сотрудниках, документах, проектах и продуктах, что значительно сокращает цикл подготовки и принятия решений.

💬 А сколько времени в среднем у вашей команды уходит на подготовку и запуск нового проекта? Расскажите нам в комментариях.
🔥53👍3👏1
Сценарий работы Cursor: как платформа упорядочивает НМД в добывающей отрасли

Компании нефтегазового сектора ежедневно сталкиваются с задачами по поиску и анализу документации. При этом 35% рабочего времени уходит только на поиск нужной информации, а сами документы могут относиться к различным подразделениям ГК, где суммарно обрабатывается более 60 000 НМД и работает 30+ тысяч сотрудников. Вчера мы рассказывали о том, как Cursor помогает в управлении проектами, а сегодня покажем сценарий оптимизации работы с корпоративными знаниями в добывающей отрасли.

Основная сложность — информация разрознена между множеством систем, до 90% контента не структурировано, пользователи ищут материалы в 4 и более корпоративных системах, а в 33% случаев отсутствует доступ к актуальным версиям документов. В итоге документы застревают на этапе согласования или теряются в процессе обмена. Это приводит к использованию устаревших версий, дублированию работы и замедлению ключевых процессов всей компании.

Внедрение интеллектуального поиска позволяет создать комплексное решение для работы с документами:
Единый портал НМД — объединение систем хранения корпоративного контента и создали единую модель данных;
Продвинутый поиск и анализ — семантический поиск по смыслу и «граф связей» между документами, что резко сократило время на анализ информации;
Оповещения и рекомендации — новые документы индексируются автоматически. Система сама рекомендует релевантные материалы сотрудникам и оповещает их о важных изменениях;
Контроль версионности — функционал сравнения версий документов между собой и визуальное отображение всех различий между версиями.

Что это в итоге дает компании?
Сокращение времени и затрат на поиск документов до 50% (с 3:34 минут до 1:14 минуты);
Устранение дублирований и противоречий, оптимизация нормативной базы;
Сокращение времени внесения изменений в документы с месяцев до дней;
Снижение сроков подготовки новых документов за счет переиспользования базы знаний.

Для нефтегазовой компании каждое из этих улучшений означает фундаментальное повышение качества управления нормативной базой и снижение операционных рисков.
🔥43👍3💯3
System Design, AdTech и оптимизация RAG: подборка экспертных постов от ML-инженера

Коллеги, сегодня делимся с вами подборкой полезных материалов от канала ML Advertising (@dsinsights). Его ведет Евгений, Senior ML Engineer в рекламных технологиях. В своем канале он разбирает сложные высоконагруженные системы, рассказывает о рекламных биржах и делает «боевые» заметки с полей онлайн-рекламы.

Если вы хотите прокачаться в архитектуре систем, понять, как ML работает в реальном продакшене, и узнать, что творится «под капотом» у крупных платформ — вам будет полезно заглянуть в этот канал.

Что вы найдете на канале?

🔹 Разборы вопросов с собеседований по System Design:
Почему Apache Kafka быстрая?
Как Uber оценивает время поездки?

🔹 Как устроена инфраструктура и бэкенд платформ рекламных ставок:
Реализация платформ ставок на инфре Amazon
Как работают ставки в реальном времени?

🔹 Как применяется AI в онлайн-рекламе:
AI в AdTech
Динамическое ценообразование
Как ускорить ML модели на проде

🔹 Оптимизация RAG систем:
Как устроен RAG?
Векторные БД и бенчмарки
Тюним гипер-параметры RAG

Если вы интересуетесь тем, как устроена рекламная индустрия «под капотом», и как в ней работает ИИ присоединяйтесь и изучайте новое в ML Advertising!
🔥4👍3👏2💯1