NEW BOT Телеграм, страница

Data Science | Machinelearning [ru]

⚡️Хайп вокруг аппаратного ускорения ИИ и реальная ситуация. Обучение модели на телефоне и результаты в миллисекундах

В этой статье мы запустим TensorFlow Lite на устройствах разного класса и года выпуска и посмотрим, что там с производительностью и ускорением.

Читать...

2.83K views17:07

Data Science | Machinelearning [ru]

😍Автоматизация Code Review с помощью LLM

В этой статье мы подробно рассмотрим жизненный цикл ревью и подход RAG, разработанный в Faire для выполнения различных контекстно-специфических автоматизированных ревью.

Читать...

2.75K views12:27

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Как мы обучали нейросеть распознавать юридические документы

• Топ-7 высокооплачиваемых профессий в сфере ИИ

• Создание искусственного датасета для обучения модели с использованием Paddle OCR

2.73K views17:07

Data Science | Machinelearning [ru]

👾Почему нейросети становятся угрозой для природы и что с этим сделать

В этой статье мы расскажем, как это влияет на работу и развитие дата-центров, и какие меры можно предпринять для увеличения энергоэффективности.

Читать...

2.57K views12:08

Data Science | Machinelearning [ru]

🗣InkubaLM: A small language model for low-resource African languages

InkubaLM, небольшая языковая модель с 0,4 миллиарда параметров, которая достигает производительности, сопоставимой с моделями со значительно большим количеством параметров и более обширными данными обучения для таких задач, как машинный перевод, вопросы и ответы, AfriMMLU и задача AfriXnli.

В частности, InkubaLM превосходит многие более крупные модели в анализе настроений и демонстрирует замечательную согласованность на нескольких языках.

Эта работа представляет собой решающий шаг в оспаривании общепринятой парадигмы, согласно которой эффективные языковые модели должны полагаться на значительные ресурсы.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.7K viewsedited 17:07

Data Science | Machinelearning [ru]

🤖Контролируемое и неконтролируемое машинное обучение — в чём разница?

В этой статье объясняются эти оба метода и различия между ними.

Читать...

2.48K views12:07

Data Science | Machinelearning [ru]

😎Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming

Сквозная разговорная модель на основе аудио, способная к речевому взаимодействию в реальном времени.

Метод также помогает сохранить языковые возможности исходной модели с минимальным ухудшением, что позволяет другим работам устанавливать возможности взаимодействия в реальном времени.

Mini-Omni — это первая полностью сквозная модель с открытым исходным кодом для речевого взаимодействия в реальном времени, предлагающая ценный потенциал для будущих исследований.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.73K viewsedited 17:07

Data Science | Machinelearning [ru]

📊Агрегация данных для аналитики продаж с помощью DataSphere Jobs и Airflow SDK

В этой статье покажем, как мы ускорили построение пайплайнов обработки данных с помощью связки DataSphere Jobs и Apache Airflow™.

Читать...

2.37K views12:11

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Почему нейросети становятся угрозой для природы и что с этим сделать

• Контролируемое и неконтролируемое машинное обучение — в чём разница?

• Агрегация данных для аналитики продаж с помощью DataSphere Jobs и Airflow SDK

2.49K views17:07

Data Science | Machinelearning [ru]

📹Новая версия YandexART (Vi) — как она устроена?

В статье на Хабре Яндекс рассказывает о процессе обучения нейросети, которая при генерации видео учитывает связь между кадрами и воссоздаёт реалистичные движения объектов.

Читать...

2.47K views08:37

Data Science | Machinelearning [ru]

🤔«А можно быстрее?»: разбираем методы ускорения обучения нейронных сетей

В этой статье рассмотрим различные теоретические аспекты от аппаратного ускорения до правильной организации самого обучения.

Читать...

❤1

2.46K views12:07

Data Science | Machinelearning [ru]

😎Как наука о данных трансформирует здравоохранение

В этой статье рассматривается роль Data Science в медицинской сфере, её основные применения, преимущества, проблемы, а также будущие тенденции.

Читать...

2.47K views17:07

Data Science | Machinelearning [ru]

💽 Как мы построили модель прогнозирования выхода жестких дисков из строя

В этой статье я расскажу, что нам удалось сделать, что стало основой прототипа нашей прогнозной модели и какие результаты она показала в применении для дисков в серверах YADRO.

Читать...

Хабр

Как мы построили модель прогнозирования выхода жестких дисков из строя

Неожиданный выход HDD из строя — неприятная для сервера ситуация. Выяснение причин и замена жесткого диска (не всегда это можно сделать «горячим» способом) почти всегда означают даунтайм работы...

2.49K views12:07

Data Science | Machinelearning [ru]

😎CDM: надежная метрика для справедливой и точной оценки распознавания формул

Character Detection Matching (CDM), обеспечивает объективность оценки путем разработки метрической оценки на уровне изображения, а не на уровне LaTex.

В частности, CDM преобразует как предсказанные моделью формулы LaTeX, так и наземные формулы LaTeX в формулы, отформатированные в виде изображения, затем использует визуальные методы извлечения признаков и локализации для точного сопоставления на уровне символов, включая информацию о пространственном положении.

Такой пространственно-ориентированный и сопоставленный с символами метод предлагает более точную и справедливую оценку по сравнению с предыдущими метриками BLEU и Edit Distance, которые полагаются исключительно на сопоставление символов на основе текста.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

huggingface.co

Paper page - CDM: A Reliable Metric for Fair and Accurate Formula Recognition
Evaluation

Join the discussion on this paper page

2.4K views17:08

Data Science | Machinelearning [ru]

👤Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.

Читать...

Хабр

Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В контексте разговоров о больших языковых моделях (LLM) все чаще возникает аббревиатура RAG – Retrieval-Augmented Generation, или если переводить на русский язык, то «поисковая дополненная генерация»....

2.41K views12:07

Data Science | Machinelearning [ru]

👍SolriXML: Лучи света в темном лесу XML-данных

В этой статье я расскажу, как SolriXML автоматизирует обработку XML-файлов, трансформируя сложные структуры данных в удобные для использования форматы.

Читать...

2.45K views17:07

Data Science | Machinelearning [ru]

👀Компьютерное зрение в автотестах. Поиск элемента по фото

В этой статье вы узнаете о применении компьютерного зрения для автоматизации тестирования веб-приложений.

Читать...

Хабр

Компьютерное зрение в автотестах. Поиск элемента по фото

Меня зовут Ахетов Даниил и уже более 5 лет я занимаюсь автоматизацией тестирования web-приложений на JavaScript. За это время я успел попробовать все самые популярные фреймворки для автоматизации...

2.48K views12:07

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

• Как мы построили модель прогнозирования выхода жестких дисков из строя

• Как наука о данных трансформирует здравоохранение

Data Science | Machinelearning [ru]

👤Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.

Читать...

2.46K views17:07

Data Science | Machinelearning [ru]

🧐Обзор бенчмарков для тестирования LLM (больших языковых моделей)

В этой статье мы рассмотрим подробный список самых популярных бенчмарков для оценки LLM.

Читать...

Хабр

Обзор бенчмарков для тестирования LLM (больших языковых моделей)

Ирина Барская, Head Data Scientist в Яндексе, которая работала над голосовым ассистентом «Алиса» и Yasmina для рынка Саудовской Аравии, написала для портала Unite.ai обзор основных бенчмарков, которые...

2.39K views12:07

Data Science | Machinelearning [ru]

🫥Как найти иголку в стоге сена? Или обзор Retrieval Algorithms

В этой статье мы рассмотрим информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.

Читать...

Хабр

Как найти иголку в стоге сена? Или обозор Retrieval Algorithms

Появление трансформеров, а впоследствии LLM (Large Language Models) привело к активному распространению чат-ботов и различных ассистентов помогающих в получении информации или генерации контента. Но...

2.53K views17:07

Data Science | Machinelearning [ru]

Forwarded from Data Secrets

Розыгрыш Machine Learning футболок

В честь запуска сайта с ML-вакансиями команда Data Secrets запускает розыгрыш 10 футболок для истинных любителей глубокого обучения.

Это лимитированная линейка нашего бренда. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена

Для участия нужно всего лишь быть подписанным на два наших канала: @data_secrets и @data_secrets_career, – и нажать кнопку "Участвовать" под этим постом.

Итоги подведем 18 сентября в 18:00. Желаем удачи!

2.35K views08:08

Участвовать (1469)

About

Blog

Apps

Platform