Embedika | ИТ-решения для бизнеса – Telegram
Embedika | ИТ-решения для бизнеса
420 subscribers
765 photos
4 files
387 links
Научно-ориентированная ИТ-компания, разработчик корпоративных систем на основе технологий обработки естественного языка и машинного обучения. Data science, LegalTech, AI https://embedika.ru
Download Telegram
​​Друзья, поздравляем вас с наступающими праздниками! Спасибо, что были с нами, читали наш блог, следили за авторскими колонками и новостями.
В последние дни 2020-ого хотим подвести итог — рассказать, что интересного произошло в отрасли и чем нам запомнится этот год. Новогоднюю серию постов открывает продуктовая команда.

▶️Айканыш Орозбаева руководитель направления по работе с партнерами
«2020 год запомнится тем, как неожиданно быстро вырос интерес на интеллектуализацию даже у консервативной части ИТ-мира. Общаясь с крупными компаниями и интеграторами, я заметила, что их отношение к технологиям data science изменилось — если раньше их запросы касались больше области автоматизации, то теперь появился спрос на интеллектуализацию текущих ИТ-систем, а именно — практическое решение таких задач, как анализ текстов в договорах, интеллектуализация корпоративных СЭД и т.д.

Сегодня решения на основе big data не кажутся такими «экспериментальными» — в мире, где пиццу заказывает Алиса, а автомобилями управляет программное обеспечение, внедрение в бизнес современных технологий становится новой нормой.

Здорово, что функциональные заказчики все чаще вникают в процессы и участвуют в создании решений совместно с разработчиком — интересуются, какие существуют технологии, как подготовить данные и оценить их. Такая совместная проработка позволяет получить наилучший результат».

▶️Артем Низамов, руководитель продуктового направления
«Открытием этого года стало то, что удаленно можно полноценно работать не только разработчикам и дизайнерам, но и проджектам и продактам — в том числе генерировать новые идеи вместе с командой и партнерами, проводить мозговые штурмы онлайн и даже придумывать и запускать новые продукты.

Например, за этот год мы сделали 2 бесплатных онлайн-сервиса:
- Compare — сравнивает версии документа и показывает отличия между ними. За несколько месяцев сервисом воспользовались более 7,5 тысяч человек.
- Contract — проверяет договора на риски, выявляя в тексте документа условия об ответственности. Сейчас идет тестирование сервиса среди экспертного сообщества, и скоро он станет доступен всем».


▶️Диана Хакимова, аналитик и юрист
«Это был первый год работы нашей команды как продуктовой — мы упаковывали технологии в продукты, формировали гипотезы, проводили custdev. Ранее мы занимались в основном заказной разработкой, и пришлось учиться — проходить профильные курсы и много читать.

Отмечу несколько книг и курсов, которые будут полезны и тем, кто создаёт ИТ-решения, и тем, кто их внедряет:
- Go practice — симулятор работы в продуктовой компании, где учат развивать продукты, используя метрики и аналитику
- видеокурс Яндекса по управлению продуктом и проектами
- книга Inspired Марти Кагана — находка для тех, кто развивает B2B-решения
- книга Спринт от группы авторов из Google про тестирование гипотез. Эта книга вдохновила нас провести бизнес-ужин с экспертами отрасли, где мы всего за пару часов нашли более 5 новых применений нашим технологиям».
​​Продолжаем подводить итоги 2020-ого. На этот раз R&D-команда поделится исследованиями, экспериментами и статьями, которые запомнились им больше всего.

▶️ Антон Балтачев, NLP-инженер
Этот год еще раз доказал насколько правильное использование машинного обучения в сердце продукта может повлиять на его успех. Нельзя не вспомнить тикток, который в этом году рос стремительнее, чем любая соцсеть, сильно нашумел и задал тренд для других компаний (а еще завлек меня в свои лапы). А ведь ничего бы не было без крутой рекомендательной системы, которая чутко учитывает интересы пользователя и выдает идеальный дофаминовый коктейль.

▶️ Полина Казакова, data scientist
В этом году хайп вокруг больших языковых моделей (large language models), таких как BERT и GPT-2/3, повлек за собой бурное обсуждение того, могут ли языковые модели «действительно понимать» язык. Авторы этой очень резонансной статьи показывают, что модели, обученные только на текстовых данных и не имеющие никакой иной информации о мире, не могут обладать настоящим знанием языка. Мысленный эксперимент с осьминогом, Витгенштейн и краткая инструкция по защите от медведя палками – если интересно, к чему это все, советую почитать саму статью. Так же как и этот пост, автор которого провел ее критический разбор и утверждает, что в действительности у нас пока нет оснований отвергать идею о том, что модели понимают язык, а кроме того, мы и сами на самом деле не знаем, что такое «действительно понимать».

▶️ Иван Меньших, ведущий разработчик МО
Этот год нашей команде запомнится развитием культуры разработки и реализацией смелых технологий, одной из самых запоминающихся стал «Македонский».
«Македонский» — универсальный способ проекции разнородных векторных представлений в единое пространство. В 2021 году это позволит нам получать не только качественные мультиязычные вектора для слов и целых текстов, но и мультимодальные представления, обогащенные метаданными, основываясь лишь на небольшом количестве связей.

▶️ Игорь Ляхов, старший разработчик МО
Со времени появления Трансформера (ключевой state-of-the-art нейросетевой архитектуры для задач NLP), стоит вопрос оптимизации данной архитектуры с точки зрения вычислительных ресурсов. Из-за прожорливости его довольно проблематично использовать небольшим лабораториям и компаниям для обучения больших моделей, таких как BERT. Так же пока Трансформер не особо применим к длинным последовательностям. В этом году вышла очень интересная статья «Reformer: The Efficient Transformer», которая предлагает довольно любопытную технику по оптимизации механизма attention'а в трансформере. Предложенный Locality-Sensitive Hashing Attention — оригинальный и очень элегантный способ снизить вычислительные затраты с O(N^2) до O(NlogN), что играет существенную роль на больших коллекциях длинных документов. Подобные идеи вдохновляют другие R'n'D команды на изобретения своих attention для трансформеров под свои задачи.
​​В третьем, заключительном посте об итогах этого года своими впечатлениями делится команда разработки. Ребята живут и работают в Екатеринбурге, и их команда постоянно растет, — вы можете следить за актуальными вакансиями на нашей странице hh.

▶️ Павел Худышкин, ведущий инженер-программист

Мы с фронтендерами организовали еженедельные встречи-созвоны, чтобы каждый мог поделиться интересными задачами, кейсами, проблемами, рассказать как их решал и обменяться опытом. Так как разработчики задействованы в разных проектах, такие созвоны помогают узнавать, что происходит в других рабочих командах и какие технологии они используют. И, конечно, это полезно для новичков — обсуждения помогают им лучше разобраться в технологиях, которые мы используем, и попросить совета у старших коллег.

Общение команды — важная составляющая, особенно в это непростое время, когда все мы работаем из дома и фактически остаемся один на один с задачами, которые не всегда бывает просто решить без поддержки команды.

▶️ Алексей Пантин, руководитель направления разработки и внедрения

В этом году я открыл для себя книгу «Несовершенная случайность. Как случай управляет нашей жизнью» Леонарда Млодинова. С помощью базовых методов статистики и теории вероятности книга научит распознавать «псевдо-последовательности» — последовательности, которые только кажутся нам реальными.

Книга не имеет прямого отношения к ИТ, но будет полезна многим и поможет сэкономить ваши силы и время.

▶️ Полную версию итогов года от трёх команд — продуктовой, RnD и разработки — можно почитать на нашем сайте. До встречи в новом году!
​​Наше решение — система интеллектуального кросс-языкового анализа текстовых данных, — опубликовано в Библиотеке эффективных кейсов AI Russia Works.

AI Russia — проект Альянса по развитию искусственного интеллекта, в который входят крупнейшие технологические компании России. Задача проекта — представить российские решения с доказанной эффективностью, в которых используется AI.

Подробнее о том, как работает наше решение и его бизнес-эффектах, читайте на карточке проекта в Библиотеке AI Russia Works.
Диана Хакимова, юрист-аналитик в нашей компании, рассказала изданию rusbase, как технология ML помогает в анализе юридических документов и какие барьеры ограничивают ее повсеместное внедрение.

Ищите в статье ссылку на наш новый онлайн-сервис, который мы разрабатываем вместе с юридическим департаментом компании «Сименс»: https://rb.ru/opinion/ml-for-document-analysis/
​​Онлайн-сервис проверки договоров на риски

Рады представить новый сервис, который мы разработали совместно с юридическим департаментом компании Siemens, — Embedika Contract!

Contract выявляет в тексте документа условия, на которые стоит обратить внимание перед заключением договора, и дает рекомендации по изменению нежелательных формулировок. Поддерживает форматы DOC, DOCX и PDF, сохраняет исходное форматирование и подсвечивает найденные риски. Работает без регистрации и полностью конфиденциальный.

Сервис будет полезен юристам и предпринимателям, представителям малого и среднего бизнеса и всем, для кого актуальна задача проверки договоров.

Скорее пробуйте, оставляйте отзывы и не забудьте поделиться с коллегами:)
​​Внедрение ИИ-решений — сложный и дорогостоящий процесс: помимо расходов на специалистов, инфраструктуру и ПО, необходимо учесть целый ряд неочевидных трат, о которых знают, как правило, только сами разработчики.

Мы написали большой аналитический материал о скрытой стоимости ИИ-решений и способах снижения издержек, — его уже можно почитать на TAdviser. Статья будет полезна всем, кто готовится к внедрению таких решений и поможет избежать массу распространенных ошибок.

Материал, дополненный комментариями экспертов из Сибур и LegIT, читайте в нашем блоге.
​​7 полезных сервисов для работы с договорами

Специалист по legaltech-продуктам Диана Хакимова делится на vc.ru сервисами для работы с договорами. Многие из этих инструментов бесплатны, работают прямо из браузера и неоднократно проверены нами — мы пользуемся ими в работе, а два из них разработали сами.

Знаете полезный сервис для работы с договорами? Пишите в комментарии к статье — мы проверим функциональность, условия использования и добавим в подборку.
​​Разработчики Екатеринбурга, завтра состоится Tinkoff Scala Meetup!

Ведущий инженер-программист в Embedika Владислав Филатов расскажет про опыт использования ZIO — стремительно набирающей популярность Scala-библиотеке. Наша команда разработки использует ZIO уже больше года и теперь готова поделиться полученным опытом: рассказать об особенностях этой библиотеки, проблемах и преимуществах.

Регистрация на митап по ссылке: https://meetup.tinkoff.ru/event/tinkoff-scala-meetup/
​​9 новых вакансий в Embedika

Наша команда быстро растет, и сейчас мы ищем сразу 9 специалистов в 2 наших офиса — в Москве и Екатеринбурге: Scala- и Angular-разработчиков, DevOps-инженера, QA-специалиста, руководителя проектов, IT-рекрутеров и стажёра-аналитика.

Успешным кандидатам предстоит работать над корпоративными системами для крупного бизнеса и погружаться в сферу data science. Вас ждет работа в сильной команде под руководством опытного наставника, офис в центре города, ДМС после испытательного срока, возможность участвовать в конференциях и вести авторские колонки в СМИ.

Все вакансии смотрите в нашем профиле на HH: https://hh.ru/employer/4598746
​​Бесплатные онлайн-сервисы от Embedika

Нашими сервисами для работы с документами Compare и Contract воспользовались более 20 тысяч человек! Спасибо за доверие, мы рады создавать полезные инструменты для вас.

Напомним, что сервисы абсолютно бесплатны, работают прямо из браузера, не требуют регистрации и полностью конфиденциальны — загружаемые документы нигде не хранятся.

Мы собрали сервисы на одной странице, чтобы вам было удобнее работать: https://embedika.ru/services. Поделиться фидбэком, задать вопрос или предложить идею нового сервиса всегда можно по почте info@embedika.ru.
​​Embedika — партнер новой магистратуры НИТУ «МИСиС»

НИТУ «МИСиС» запускает новую магистерскую программу «Интеллектуальные программные решения для бизнеса», разработанную совместно с представителями крупного бизнеса. Программа готовит специалистов по двум направлениям: Data Science и Software Engineering. Embedika стала технологическим партнером магистратуры.

Cтуденты получат практические навыки по созданию ИИ-решений: от разработки и внедрения до оценки рисков и эффективности ИТ-систем. Среди преподавателей — российские и зарубежные исследователи из НИТУ «МИСиС», НИУ ВШЭ, МФТИ и практикующие ИТ-эксперты. Это отличный шанс для начинающих специалистов получить актуальные знания напрямую от ведущих разработчиков и дата сайентистов.

Обучение на программе бесплатное, ведется ограниченный набор — всего 10 мест. Подробная информация — на сайте программы.
​​Embedika — участник акселератора «Сибур»

Мы стали участниками цифрового акселератора «Сибур» — наше решение для автоматической проверки и анализа договоров Contract успешно прошло отбор, и теперь наша команда создаёт пилот проекта для юридического департамента компании «Сибур».

Contract сокращает затраты на проверку и согласование документов, минимизирует правовые риски и предлагает исправления. С внедрением Contract на комплексную проверку одного договора нужно не более 5 минут, а время, необходимое на экспертизу и согласование контрактов, сокращается на 70%.

В рамках акселерации мы доработаем решение под документы и процессы «Сибур», обучим модели находить нестандартные формулировки разных типов и категорий. Читайте подробнее в нашем блоге: https://embedika.ru/blog/akselerator-sibur
​​Embedika — победитель цифрового акселератора СИБУР

В июле мы стали участниками акселератора — наше решение Contract прошло отбор в направлении «Анализатор договоров». За 4 месяца акселерации мы разработали и протестировали прототип решения и успешно представили свою работу на Демо-дне. Теперь мы продолжим развивать продукт с целью его дальнейшего масштабирования в компании.

Подробнее о том, как это было, читайте у нас в блоге: https://embedika.ru/blog/itogi-akselerator-sibur
​​Embedika финалист Retail Innovation Tech Alliance (RITA)

X5 Retail Group, Билайн, М.Видео-Эльдорадо, Hoff и Magnum создали альянс, который занимается поиском новых технологических решений. Эксперты выбрали наше из 118 проектов из 13 стран.

Впереди питч-сессии, наша цель — продемонстрировать, как data science-инструменты, основанные на технологиях обработки текста, могут помочь ритейлу в работе с неструктурированными документами.

Подробнее в нашем блоге: embedika.ru/blog/embedika-final-rita
Через считанные минуты начнётся онлайн-конференция Data Start. Программа разделена на 2 потока — технический и бизнес. Второй поток, как и в прошлом году, ведёт специалист по legaltech-продуктам в нашей компании Диана Хакимова.

Задавайте вопросы спикерам в чат и зовите коллег!
​​С наступающим Новым Годом и Рождеством!

Как тепло звучат эти слова — напоминают о детстве, семейном застолье, просмотре «Иронии судьбы», радостном предвкушении обмена подарками с родными и близкими, звонках ровно в полночь тем, кто далеко… Радость этого праздника не в новых цифрах календаря, а в возможности быть рядом с любимыми и сказать «спасибо» тем, кто провёл уходящий год с нами.

И мы хотим поблагодарить вас за эти «365»! Это был особенный, насыщенный и вдохновляющий для нас год: мы запустили первый в России бесплатный онлайн-сервис для проверки договоров совместно с Siemens, стали победителями цифрового акселератора СИБУР, запустили совместную магистерскую программу по data science с НИТУ «МИСиС», писали статьи, участвовали и модерировали конференции по data science, а одно из наших решений вошло в библиотеку эффективных кейсов AI Russia Works. Дальше — больше! До скорой встречи в новом 2022 году💜
​​Кейс Embedika стал номинантом премии RB Awards 2022

Премия RB Digital Awards выбирает лучшие кейсы в области цифровой трансформации. В этом году RB получил более 400 заявок, наш кейс «Решение для проверки и анализа договоров Contract by Embedika», реализованный в рамках первого цифрового акселератора СИБУР, вошёл в Short List в номинации «Корпоративный пилот».

По итогам тайного голосования жюри, в которое входят представители Альфа-банка, М.Видео-Эльдорадо, X5 Group, МТС, Мегафон и другие, будут определены лауреаты премии.

Церемония объявления и награждения Премии пройдет 10 февраля.
Short List можно посмотреть здесь.
​​Мы стали резидентами «Сколково»🎉

Наше решение для автоматической проверки и анализа договоров Contract получило статус резидента инновационного центра «Сколково» в кластере информационных технологий.

Оценка проекта осуществлялась независимыми экспертами анонимно по нескольким критериям, среди которых — конкурентное преимущество проекта перед мировыми аналогами, технологическая и научная составляющая, потенциал коммерциализации и опыт команды.

Воспользоваться первой версией Contract уже сегодня может каждый — решение запущено в виде публичного онлайн-сервиса и умеет выявлять риски — условия, регулирующие гражданско-правовую ответственность, на которые стоит обратить внимание перед заключением договора.
​​Master Data: должны ли хорошие руководители ИИ-проектов быть экспертами в сфере обработки данных?

Написали большую статью для Tproger о том, какими навыками должен обладать руководитель ИИ-проектов, чем отличается управление на стороне заказчика и на стороне разработки, и поделились подборкой проверенных ресурсов для развития необходимых навыков на позиции руководителя/менеджера ИИ-продукта.

Своими советами в статье делятся Эмели Драль (Evidently AI), Егор Трубников (ООО «Сибур») и менеджер ИИ-продуктов в нашей компании Диана Хакимова. Читать статью.