NEW BOT Телеграм, страница

Data Science | Machinelearning [ru]

😎Meltemi: первая открытая большая языковая модель для греческого языка

Модель имеет 7 миллиардов параметров и обучается на 40 миллиардах токенов греческого корпуса.

Она содержит актуальную информацию по состоянию на сентябрь 2023 года.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.68K views17:07

Data Science | Machinelearning [ru]

🤔Real AI Семантический Анализатор и решение задачи по извлечению поручений из распорядительных документов

В этой статье мы расскажем о практической задаче – автоматическом заполнении карточек поручений в системе электронного документооборота путем анализа распорядительных документов, а также о нашем подходе к ее решению.

Читать...

2.74K views12:07

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Наш опыт применения AI-технологий для классификации документов для подачи в суд

• ИИ LLama3 без ограничений: локальный запуск, GROQ и интеграция в Телеграм бота с помощью Python

• Агенты расширенного распространения: структура для эффективного исследования и передачи обучения

2.75K views17:07

Data Science | Machinelearning [ru]

📇Атрибутивное распознавание документов

В этой статье хочу обсудить подходы к решению задачи атрибутивного распознавания, а также проблемы с которыми я сталкивался за 10 лет практики в этой области.

Читать...

2.69K views12:07

Data Science | Machinelearning [ru]

🥳 TexGen: генерация 3D-текстур на основе текста с многоракурсной выборкой и повторной выборкой

Новая структура выборки и повторной выборки нескольких видов для генерации текстур, использующую предварительно обученную модель диффузии текста в изображение.

Благодаря обширному количеству качественных и количественных оценок метод обеспечивает значительно лучшее качество текстур для разнообразных 3D-объектов с высокой степенью согласованности вида и богатой детализацией внешнего вида, превосходя современные методы.

Кроме того, этот метод генерации текстур может также применяться для редактирования текстур с сохранением исходной идентичности.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.69K views17:07

Data Science | Machinelearning [ru]

✉️Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей

В этой статье я расскажу, как нам удалось преобразовать подход к обслуживанию ИT‑запросов поддержки пользователей через проект интеллектуальной классификации и маршрутизации.

Читать...

2.64K views12:07

Data Science | Machinelearning [ru]

😵Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

В этой статье автор расскажет про свой опыт решения рабочей задачи — анализ отзывов пользователей о компании, а также мы разберём возможные ошибки и посмотрим на пример кода и реальных данных.

Читать...

2.65K views17:08

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Атрибутивное распознавание документов

• Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей

• Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

2.48K views17:07

Data Science | Machinelearning [ru]

🗣Как мы сломали языковой барьер с помощью одной модели?

В этой статье я расскажу о реализации моего бесшовного модуля мультиязычности.

Читать...

2.4K views12:07

Data Science | Machinelearning [ru]

🚀LLaVA-OneVision: простая визуальная передача задач

LLaVA-OneVision — семейство открытых больших мультимодальных моделей (LMM), разработанных путем консолидации наших идей в области данных, моделей и визуальных представлений в серии блогов LLaVA-NeXT.

Модель, которая может одновременно раздвигать границы производительности открытых LMM в трех важных сценариях компьютерного зрения: сценарии с одним изображением, несколькими изображениями и видео.

Важно отметить, что конструкция LLaVA-OneVision допускает сильный перенос обучения между различными модальностями/сценариями, что дает новые появляющиеся возможности.

В частности, сильное понимание видео и возможности кросс-сценариев демонстрируются посредством переноса задач с изображений на видео.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.57K views17:07

Data Science | Machinelearning [ru]

🔍Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных

В этой статье мы расскажем, как мы использовали современные AI-технологии, чтобы сделать поиск видео быстрым и точным.

Читать...

2.38K views12:07

Data Science | Machinelearning [ru]

⚡️LLM-DetectAIve: инструмент для точного машинного обнаружения текста

Система, разработанная для детального обнаружения MGT.

Она способна классифицировать тексты по четырем категориям: написанные человеком, сгенерированные машиной, написанные машиной-очеловеченные и написанные машиной-отшлифованные.

В отличие от предыдущих детекторов MGT, которые выполняют бинарную классификацию, введение двух дополнительных категорий в LLM-DetectiAIve дает представление о различных степенях вмешательства LLM во время создания текста.

Это может быть полезно в некоторых областях, таких как образование, где любое вмешательство LLM обычно запрещено.

Эксперименты показывают, что LLM-DetectAIve может эффективно определять авторство текстового контента, доказывая его полезность для повышения целостности в образовании, академической среде и других областях.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.98K views17:08

Data Science | Machinelearning [ru]

👍Оценка LLM с большим окном контекста

В этой статье мы расскажем как получилось достичь уровня gpt-4 на собственном ограниченном датасете большого контекста.

Читать...

2.45K views12:07

Data Science | Machinelearning [ru]

🤖Transformer Explainer: Интерактивное обучение текстогенерирующим моделям

Этот инструмент помогает пользователям понять сложные концепции трансформеров, интегрируя обзор модели и обеспечивая плавные переходы между уровнями абстракции математических операций и структур моделей.

Он запускает живой экземпляр GPT-2 локально в браузере пользователя, позволяя пользователям экспериментировать с собственным вводом и наблюдать в реальном времени, как внутренние компоненты и параметры трансформера работают вместе, чтобы предсказывать следующие токены.

Инструмент не требует установки или специального оборудования, расширяя образовательный доступ общественности к современным генеративным методам ИИ.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.79K views17:08

Data Science | Machinelearning [ru]

🦙Опенсорс на арене: правда ли так хороша Llama 3.1 405B?

В этой статье мы проведем независимое расследование: сравним возможности Llama 3.1 405B с GPT-4o и Claude 3.5 Sonnet на ряду задач, от программирования до творческого письма, и попробуем понять, насколько она готова к практическому применению.

Читать...

2.49K views12:07

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Как мы построили сервис, который поможет сократить поиск видео контента в огромной базе данных

• Опенсорс на арене: правда ли так хороша Llama 3.1 405B?

• Оценка LLM с большим окном контекста

2.53K views17:07

Data Science | Machinelearning [ru]

👾Transfer learning: подробный гайд для начинающих

В этой статье мы расскажем, как работает TL, где оно используется, и разберем конкретные кейсы.

Читать...

2.47K views12:07

Data Science | Machinelearning [ru]

🔥VITA: Towards Open-Source Interactive Omni Multimodal LLM

Мультимодальная большая языковая модель (MLLM) с открытым исходным кодом, которая способна одновременно обрабатывать и анализировать модальности видео, изображений, текста и аудио, и в то же время обладает передовым мультимодальным интерактивным опытом.

Она демонстрирует надежные базовые возможности многоязычного, визуального и аудиопонимания, о чем свидетельствует ее высокая производительность в ряде как унимодальных, так и мультимодальных тестов.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.65K views17:07

Data Science | Machinelearning [ru]

🗣Fine-tuning больших языковых моделей в 2024 году

В этой статье мы рассмотрим жизненный цикл LLM, включая этапы концепции, выбора модели и оценки точности.

Читать...

2.37K views12:07

Data Science | Machinelearning [ru]

🦾ControlNeXt: Powerful and Efficient Control for Image and Video Generation

ControlNeXt — мощный и эффективный метод для контролируемой генерации изображений и видео.

Метод легко интегрируется с другими весами LoRA, позволяя изменять стиль без необходимости дополнительного обучения.

Были проведены различные эксперименты с различными базовыми моделями для изображений и видео, продемонстрировав надежность нашего метода.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

👍1

2.41K views17:07

Data Science | Machinelearning [ru]

😉Уроки, извлеченные из масштабирования до многотерабайтных датасетов

В этой статье я расскажу, с какими сложностями столкнулся при увеличении масштабов датасета и как их удалось решить.

Читать...

2.31K views12:08

About

Blog

Apps

Platform