NEW BOT Телеграм, страница

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Почему нейросети становятся угрозой для природы и что с этим сделать

• Контролируемое и неконтролируемое машинное обучение — в чём разница?

• Агрегация данных для аналитики продаж с помощью DataSphere Jobs и Airflow SDK

2.49K views17:07

Data Science | Machinelearning [ru]

📹Новая версия YandexART (Vi) — как она устроена?

В статье на Хабре Яндекс рассказывает о процессе обучения нейросети, которая при генерации видео учитывает связь между кадрами и воссоздаёт реалистичные движения объектов.

Читать...

2.47K views08:37

Data Science | Machinelearning [ru]

🤔«А можно быстрее?»: разбираем методы ускорения обучения нейронных сетей

В этой статье рассмотрим различные теоретические аспекты от аппаратного ускорения до правильной организации самого обучения.

Читать...

❤1

2.46K views12:07

Data Science | Machinelearning [ru]

😎Как наука о данных трансформирует здравоохранение

В этой статье рассматривается роль Data Science в медицинской сфере, её основные применения, преимущества, проблемы, а также будущие тенденции.

Читать...

2.47K views17:07

Data Science | Machinelearning [ru]

💽 Как мы построили модель прогнозирования выхода жестких дисков из строя

В этой статье я расскажу, что нам удалось сделать, что стало основой прототипа нашей прогнозной модели и какие результаты она показала в применении для дисков в серверах YADRO.

Читать...

Хабр

Как мы построили модель прогнозирования выхода жестких дисков из строя

Неожиданный выход HDD из строя — неприятная для сервера ситуация. Выяснение причин и замена жесткого диска (не всегда это можно сделать «горячим» способом) почти всегда означают даунтайм работы...

2.49K views12:07

Data Science | Machinelearning [ru]

😎CDM: надежная метрика для справедливой и точной оценки распознавания формул

Character Detection Matching (CDM), обеспечивает объективность оценки путем разработки метрической оценки на уровне изображения, а не на уровне LaTex.

В частности, CDM преобразует как предсказанные моделью формулы LaTeX, так и наземные формулы LaTeX в формулы, отформатированные в виде изображения, затем использует визуальные методы извлечения признаков и локализации для точного сопоставления на уровне символов, включая информацию о пространственном положении.

Такой пространственно-ориентированный и сопоставленный с символами метод предлагает более точную и справедливую оценку по сравнению с предыдущими метриками BLEU и Edit Distance, которые полагаются исключительно на сопоставление символов на основе текста.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

huggingface.co

Paper page - CDM: A Reliable Metric for Fair and Accurate Formula Recognition
Evaluation

Join the discussion on this paper page

2.4K views17:08

Data Science | Machinelearning [ru]

👤Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.

Читать...

Хабр

Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В контексте разговоров о больших языковых моделях (LLM) все чаще возникает аббревиатура RAG – Retrieval-Augmented Generation, или если переводить на русский язык, то «поисковая дополненная генерация»....

2.41K views12:07

Data Science | Machinelearning [ru]

👍SolriXML: Лучи света в темном лесу XML-данных

В этой статье я расскажу, как SolriXML автоматизирует обработку XML-файлов, трансформируя сложные структуры данных в удобные для использования форматы.

Читать...

2.45K views17:07

Data Science | Machinelearning [ru]

👀Компьютерное зрение в автотестах. Поиск элемента по фото

В этой статье вы узнаете о применении компьютерного зрения для автоматизации тестирования веб-приложений.

Читать...

Хабр

Компьютерное зрение в автотестах. Поиск элемента по фото

Меня зовут Ахетов Даниил и уже более 5 лет я занимаюсь автоматизацией тестирования web-приложений на JavaScript. За это время я успел попробовать все самые популярные фреймворки для автоматизации...

2.48K views12:07

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

• Как мы построили модель прогнозирования выхода жестких дисков из строя

• Как наука о данных трансформирует здравоохранение

Data Science | Machinelearning [ru]

👤Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.

Читать...

2.46K views17:07

Data Science | Machinelearning [ru]

🧐Обзор бенчмарков для тестирования LLM (больших языковых моделей)

В этой статье мы рассмотрим подробный список самых популярных бенчмарков для оценки LLM.

Читать...

Хабр

Обзор бенчмарков для тестирования LLM (больших языковых моделей)

Ирина Барская, Head Data Scientist в Яндексе, которая работала над голосовым ассистентом «Алиса» и Yasmina для рынка Саудовской Аравии, написала для портала Unite.ai обзор основных бенчмарков, которые...

2.39K views12:07

Data Science | Machinelearning [ru]

🫥Как найти иголку в стоге сена? Или обзор Retrieval Algorithms

В этой статье мы рассмотрим информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.

Читать...

Хабр

Как найти иголку в стоге сена? Или обозор Retrieval Algorithms

Появление трансформеров, а впоследствии LLM (Large Language Models) привело к активному распространению чат-ботов и различных ассистентов помогающих в получении информации или генерации контента. Но...

2.53K views17:07

Data Science | Machinelearning [ru]

Forwarded from Data Secrets

Розыгрыш Machine Learning футболок

В честь запуска сайта с ML-вакансиями команда Data Secrets запускает розыгрыш 10 футболок для истинных любителей глубокого обучения.

Это лимитированная линейка нашего бренда. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена

Для участия нужно всего лишь быть подписанным на два наших канала: @data_secrets и @data_secrets_career, – и нажать кнопку "Участвовать" под этим постом.

Итоги подведем 18 сентября в 18:00. Желаем удачи!

2.35K views08:08

Участвовать (1469)

Data Science | Machinelearning [ru]

🤔Как давать нейросети задания, чтобы она вас понимала

В этой статье поговорим о том, как взаимодействовать с искусственным интеллектом, чтобы он выдавал качественный результат.

Читать...

Хабр

Как давать нейросети задания, чтобы она вас понимала

Вы уже знаете, на что способна нейросеть (спойлер: это десятки задач!). Однако она не всесильна — и не понимает, что такое хорошо, а что такое плохо, если вы ей это не объясните. В статье...

2.42K views12:07

Data Science | Machinelearning [ru]

🤓OneGen: эффективная однопроходная унифицированная генерация и извлечение для LLM

Структура объединяет традиционно раздельные подходы к обучению для генерации и поиска, включая токены поиска, сгенерированные авторегрессионно.

Это позволяет одному LLM обрабатывать обе задачи одновременно в едином прямом проходе.

Мы проводим эксперименты с двумя различными типами составных задач, RAG и связыванием сущностей, чтобы проверить подключаемость, эффективность и результативность OneGen в обучении и выводе.

Кроме того, наши результаты показывают, что интеграция генерации и поиска в одном контексте сохраняет генеративные возможности LLM, одновременно улучшая производительность поиска.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

huggingface.co

Paper page - OneGen: Efficient One-Pass Unified Generation and Retrieval for LLMs

Join the discussion on this paper page

2.4K views17:07

Data Science | Machinelearning [ru]

МТС Web Services представила новое направление на форуме Kazan Digital Week — ИИ-облако.

Оно поможет компаниям ускорить внедрение искусственного интеллекта без инвестиций в собственное оборудование. В его основе находится инфраструктура с графическими ускорителями для обучения и работы с ИИ.

На основе GPU компании смогут самостоятельно развернуть необходимое для работы с ИИ программное обеспечение, либо использовать «из коробки» уже готовые решения, доступные в ИИ-облаке. Например, ML-платформу – специализированное ПО, позволяющее автоматизировать процесс обучения моделей искусственного интеллекта, а также упрощающее их внедрение в бизнес-процессы компаний и последующую работу с ними.

Также в рамках ИИ-облака будут доступны готовые к работе «из коробки» сервисы MTS AI. Такие как Cotype – большая языковая модель, созданная для работы с корпоративными данными, Audiogram - платформа синтеза и распознавания речи на основе нейронных сетей с возможностью управления интонацией, ударениями и другими параметрами и сервис речевой аналитики WordPulse.

2.59K views07:08

Data Science | Machinelearning [ru]

⚡️ML-подход к заблаговременному предотвращению оттока рекламодателей

В этой статье мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning).

Читать...

Хабр

ML-подход к заблаговременному предотвращению оттока рекламодателей

В этом материале мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning). Прототип системы создан...

2.5K views12:08

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Как давать нейросети задания, чтобы она вас понимала

• ML-подход к заблаговременному предотвращению оттока рекламодателей

• Как найти иголку в стоге сена? Или обзор Retrieval Algorithms

Data Science | Machinelearning [ru]

🤔Как давать нейросети задания, чтобы она вас понимала

В этой статье поговорим о том, как взаимодействовать с искусственным интеллектом, чтобы он выдавал качественный результат.

Читать...

2.48K views17:11

Data Science | Machinelearning [ru]

👤Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Читать...

Хабр

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем...

2.45K views17:07

Data Science | Machinelearning [ru]

😎Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.

Читать...

Хабр

Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

Привет, Хабр! Меня зовут Вадим Селютин, я старший исследователь в компании VisionLabs. Наши решения по распознаванию лиц можно встретить в офисных центрах, московском метро и кассах самообслуживания...

2.34K views12:07

Data Science | Machinelearning [ru]

👥Как мы строили сквозную аналитику и укрощали бизнес-требования

В этой статье расскажу, как и почему мы решили внедрить сквозную аналитику в компанию, с какими сложностями столкнулись и как побеждали бизнес-требования.

Читать...

Хабр

Как мы строили сквозную аналитику и укрощали бизнес-требования

Привет! На связи Даниил, дата-инженер компании iSpring. Уже 23 года мы создаём инструменты для корпоративного обучения. В статье расскажу, как и почему мы решили внедрить сквозную аналитику в...

2.42K views17:07

About

Blog

Apps

Platform