🖥 Самые интересные статьи за последние дни:
• Как мы обучали нейросеть распознавать юридические документы
• Топ-7 высокооплачиваемых профессий в сфере ИИ
• Создание искусственного датасета для обучения модели с использованием Paddle OCR
• Как мы обучали нейросеть распознавать юридические документы
• Топ-7 высокооплачиваемых профессий в сфере ИИ
• Создание искусственного датасета для обучения модели с использованием Paddle OCR
🗣InkubaLM: A small language model for low-resource African languages
InkubaLM, небольшая языковая модель с 0,4 миллиарда параметров, которая достигает производительности, сопоставимой с моделями со значительно большим количеством параметров и более обширными данными обучения для таких задач, как машинный перевод, вопросы и ответы, AfriMMLU и задача AfriXnli.
В частности, InkubaLM превосходит многие более крупные модели в анализе настроений и демонстрирует замечательную согласованность на нескольких языках.
Эта работа представляет собой решающий шаг в оспаривании общепринятой парадигмы, согласно которой эффективные языковые модели должны полагаться на значительные ресурсы.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
InkubaLM, небольшая языковая модель с 0,4 миллиарда параметров, которая достигает производительности, сопоставимой с моделями со значительно большим количеством параметров и более обширными данными обучения для таких задач, как машинный перевод, вопросы и ответы, AfriMMLU и задача AfriXnli.
В частности, InkubaLM превосходит многие более крупные модели в анализе настроений и демонстрирует замечательную согласованность на нескольких языках.
Эта работа представляет собой решающий шаг в оспаривании общепринятой парадигмы, согласно которой эффективные языковые модели должны полагаться на значительные ресурсы.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
😎Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
Сквозная разговорная модель на основе аудио, способная к речевому взаимодействию в реальном времени.
Метод также помогает сохранить языковые возможности исходной модели с минимальным ухудшением, что позволяет другим работам устанавливать возможности взаимодействия в реальном времени.
Mini-Omni — это первая полностью сквозная модель с открытым исходным кодом для речевого взаимодействия в реальном времени, предлагающая ценный потенциал для будущих исследований.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Сквозная разговорная модель на основе аудио, способная к речевому взаимодействию в реальном времени.
Метод также помогает сохранить языковые возможности исходной модели с минимальным ухудшением, что позволяет другим работам устанавливать возможности взаимодействия в реальном времени.
Mini-Omni — это первая полностью сквозная модель с открытым исходным кодом для речевого взаимодействия в реальном времени, предлагающая ценный потенциал для будущих исследований.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
📹Новая версия YandexART (Vi) — как она устроена?
В статье на Хабре Яндекс рассказывает о процессе обучения нейросети, которая при генерации видео учитывает связь между кадрами и воссоздаёт реалистичные движения объектов.
Читать...
В статье на Хабре Яндекс рассказывает о процессе обучения нейросети, которая при генерации видео учитывает связь между кадрами и воссоздаёт реалистичные движения объектов.
Читать...
💽 Как мы построили модель прогнозирования выхода жестких дисков из строя
В этой статье я расскажу, что нам удалось сделать, что стало основой прототипа нашей прогнозной модели и какие результаты она показала в применении для дисков в серверах YADRO.
Читать...
В этой статье я расскажу, что нам удалось сделать, что стало основой прототипа нашей прогнозной модели и какие результаты она показала в применении для дисков в серверах YADRO.
Читать...
Хабр
Как мы построили модель прогнозирования выхода жестких дисков из строя
Неожиданный выход HDD из строя — неприятная для сервера ситуация. Выяснение причин и замена жесткого диска (не всегда это можно сделать «горячим» способом) почти всегда означают даунтайм работы...
😎CDM: надежная метрика для справедливой и точной оценки распознавания формул
Character Detection Matching (CDM), обеспечивает объективность оценки путем разработки метрической оценки на уровне изображения, а не на уровне LaTex.
В частности, CDM преобразует как предсказанные моделью формулы LaTeX, так и наземные формулы LaTeX в формулы, отформатированные в виде изображения, затем использует визуальные методы извлечения признаков и локализации для точного сопоставления на уровне символов, включая информацию о пространственном положении.
Такой пространственно-ориентированный и сопоставленный с символами метод предлагает более точную и справедливую оценку по сравнению с предыдущими метриками BLEU и Edit Distance, которые полагаются исключительно на сопоставление символов на основе текста.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Character Detection Matching (CDM), обеспечивает объективность оценки путем разработки метрической оценки на уровне изображения, а не на уровне LaTex.
В частности, CDM преобразует как предсказанные моделью формулы LaTeX, так и наземные формулы LaTeX в формулы, отформатированные в виде изображения, затем использует визуальные методы извлечения признаков и локализации для точного сопоставления на уровне символов, включая информацию о пространственном положении.
Такой пространственно-ориентированный и сопоставленный с символами метод предлагает более точную и справедливую оценку по сравнению с предыдущими метриками BLEU и Edit Distance, которые полагаются исключительно на сопоставление символов на основе текста.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
huggingface.co
Paper page - CDM: A Reliable Metric for Fair and Accurate Formula Recognition
Evaluation
Evaluation
Join the discussion on this paper page
👤Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?
В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.
Читать...
В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.
Читать...
Хабр
Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?
В контексте разговоров о больших языковых моделях (LLM) все чаще возникает аббревиатура RAG – Retrieval-Augmented Generation, или если переводить на русский язык, то «поисковая дополненная генерация»....
👀Компьютерное зрение в автотестах. Поиск элемента по фото
В этой статье вы узнаете о применении компьютерного зрения для автоматизации тестирования веб-приложений.
Читать...
В этой статье вы узнаете о применении компьютерного зрения для автоматизации тестирования веб-приложений.
Читать...
Хабр
Компьютерное зрение в автотестах. Поиск элемента по фото
Меня зовут Ахетов Даниил и уже более 5 лет я занимаюсь автоматизацией тестирования web-приложений на JavaScript. За это время я успел попробовать все самые популярные фреймворки для автоматизации...
🖥 Самые интересные статьи за последние дни:
• Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?
• Как мы построили модель прогнозирования выхода жестких дисков из строя
• Как наука о данных трансформирует здравоохранение
• Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?
• Как мы построили модель прогнозирования выхода жестких дисков из строя
• Как наука о данных трансформирует здравоохранение
Telegram
Data Science | Machinelearning [ru]
👤Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?
В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.
Читать...
В этой статье попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.
Читать...
🧐Обзор бенчмарков для тестирования LLM (больших языковых моделей)
В этой статье мы рассмотрим подробный список самых популярных бенчмарков для оценки LLM.
Читать...
В этой статье мы рассмотрим подробный список самых популярных бенчмарков для оценки LLM.
Читать...
Хабр
Обзор бенчмарков для тестирования LLM (больших языковых моделей)
Ирина Барская, Head Data Scientist в Яндексе, которая работала над голосовым ассистентом «Алиса» и Yasmina для рынка Саудовской Аравии, написала для портала Unite.ai обзор основных бенчмарков, которые...
🫥Как найти иголку в стоге сена? Или обзор Retrieval Algorithms
В этой статье мы рассмотрим информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.
Читать...
В этой статье мы рассмотрим информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.
Читать...
Хабр
Как найти иголку в стоге сена? Или обозор Retrieval Algorithms
Появление трансформеров, а впоследствии LLM (Large Language Models) привело к активному распространению чат-ботов и различных ассистентов помогающих в получении информации или генерации контента. Но...
Forwarded from Data Secrets
Розыгрыш Machine Learning футболок
В честь запуска сайта с ML-вакансиями команда Data Secrets запускает розыгрыш 10 футболок для истинных любителей глубокого обучения.
Это лимитированная линейка нашего бренда. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена
Для участия нужно всего лишь быть подписанным на два наших канала: @data_secrets и @data_secrets_career, – и нажать кнопку "Участвовать" под этим постом.
Итоги подведем 18 сентября в 18:00. Желаем удачи!
В честь запуска сайта с ML-вакансиями команда Data Secrets запускает розыгрыш 10 футболок для истинных любителей глубокого обучения.
Это лимитированная линейка нашего бренда. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена
Для участия нужно всего лишь быть подписанным на два наших канала: @data_secrets и @data_secrets_career, – и нажать кнопку "Участвовать" под этим постом.
Итоги подведем 18 сентября в 18:00. Желаем удачи!