NEW BOT Телеграм, страница

Data Science | Machinelearning [ru]

🗣Dallah: Мультимодальная большая языковая модель с учетом диалектов для арабского языка

Dallah демонстрирует свою способность обрабатывать сложные диалектные взаимодействия, включающие как текстовые, так и визуальные элементы.

Модель преуспевает в двух контрольных тестах: один оценивает ее производительность на современном стандартном арабском языке (MSA), а другой специально разработан для оценки диалектных ответов.

Помимо надежной работы в задачах мультимодального взаимодействия, Dallah обладает потенциалом проложить путь для дальнейшего развития арабских MLLM-систем, учитывающих диалекты.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.61K views17:07

Data Science | Machinelearning [ru]

🤖Как ИИ-компании переживают “нефтяной кризис”? Как медийные платформы зарабатывают, не делая почти ничего?

В этой статье авто расскажет о том, как ИИ компании переживают кризис данных, а платформы по распространению контента зарабатывают миллиарды долларов, не делая при этом ничего.

Читать...

2.42K views12:07

Data Science | Machinelearning [ru]

🚀MIBench: Оценка многомодульных больших языковых моделей на основе нескольких изображений

Метод комплексной оценки мелкозернистых возможностей MLLM в сценариях с несколькими изображениями.

В частности, MIBench классифицирует многообразные возможности по трем сценариям: многообразное обучение (MII), многомодальный поиск знаний (MKS) и многомодальное контекстное обучение (MIC) и создает 13 задач с общим количеством 13 тыс. аннотированных образцов.

Во время построения данных для MII и MKS модель извлекает правильные варианты из ручных аннотаций и создаем сложные отвлекающие факторы для получения вопросов с несколькими вариантами ответов.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.42K views17:07

Data Science | Machinelearning [ru]

🧠Генерация текстового контента с ИИ: обзор и сравнение моделей

В этой статье мы рассмотрим работу различных ИИ-моделей на примере четырех нестандартных промтов, анализируя их сильные стороны, слабости и потенциал для дальнейшего развития.

Читать...

2.41K views12:07

Data Science | Machinelearning [ru]

😍SeaLLMs 3: Open Foundation и чат-модели больших многоязычных языков для языков Юго-Восточной Азии

Модель отлично справляется с такими задачами, как знание мира, математическое обоснование, перевод и следование инструкциям, достигая самой высокой производительности среди моделей аналогичного размера.

Используя эффективные методы улучшения языка и специально созданный набор данных для настройки инструкций, SeaLLMs 3 значительно снижает затраты на обучение, сохраняя при этом высокую производительность и универсальность.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.51K views17:07

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Генерация текстового контента с ИИ: обзор и сравнение моделей

• Всё что нужно знать про DuckDB

• Какие задачи сегодня решаются с помощью транспортной видеоаналитики

2.42K views17:07

Data Science | Machinelearning [ru]

👤Диалекты, зумеры и боты: секреты тестирования NLU-систем

В этой статье обсуждаются проблемы, с которыми сталкиваются QA-инженеры при тестировании чат-ботов и голосовых помощников, а также методы, которые можно использовать для повышения эффективности этого процесса.

Читать...

2.46K views12:07

Data Science | Machinelearning [ru]

😇ThinK: более тонкий кэш ключей с помощью отсечения на основе запросов

Новый метод обрезки кэша KV, зависящий от запроса, разработанный для минимизации потери веса внимания при выборочной обрезке наименее значимых каналов.

Подход не только сохраняет или повышает точность модели, но и обеспечивает снижение затрат памяти более чем на 20% по сравнению с ванильными методами вытеснения кэша KV.

Расширенные оценки моделей LLaMA3 и Mistral в различных наборах данных с длинными последовательностями подтверждают эффективность ThinK, устанавливая новый прецедент для эффективного развертывания LLM без ущерба для производительности.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.46K views17:08

Data Science | Machinelearning [ru]

📸 YandexART теперь может реставрировать архивные видеозаписи и кинохронику

Этот навык будет полезен для кинокомпаний, музеев, историков и других специалистов, работающих с историческим наследием.

С помощью нейросетевых технологий и компьютерной графики, команды компьютерного зрения Яндекса, Yandex Research и Плюс Студии уже смогли улучшить качество старых видеоматериалов для сериала «Игры» про Олимпиаду-80.

Нейросеть научилась добавлять фактуру и недостающие детали на размытые и нечёткие кадры, такие как кирпичная кладка на стенах, узоры на женском платье, фары и поворотники у автомобилей.

Особое внимание было уделено проблеме галлюцинаций — тенденции генеративных моделей добавлять несуществующие детали. Для её решения применили метод поэтапного обучения на данных низкого качества, что позволило повысить точность реконструкции.

@Devsp — Подписаться

2.52K views08:11

Data Science | Machinelearning [ru]

📄Наш опыт применения AI-технологий для классификации документов для подачи в суд

В этой статье мы расскажем вам об опыте разработки этого решения для автоматизации труда юристов и взыскателей и трудностях, с которыми мы столкнулись.

Читать...

2.31K views12:07

Data Science | Machinelearning [ru]

🥷Агенты расширенного распространения: структура для эффективного исследования и передачи обучения

Diffusion Augmented Agents (DAAG), новую структуру, которая использует большие языковые модели, модели языка видения и модели диффузии для повышения эффективности выборки и переноса обучения в обучении с подкреплением для воплощенных агентов.

DAAG hindsight перемаркирует прошлый опыт агента, используя модели диффузии для преобразования видео временно и геометрически согласованным образом для согласования с целевыми инструкциями с помощью техники, которую мы называем Hindsight Experience Augmentation.

Большая языковая модель организует этот автономный процесс, не требуя человеческого надзора, что делает его хорошо подходящим для сценариев непрерывного обучения.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.69K views17:07

Data Science | Machinelearning [ru]

🦙ИИ LLama3 без ограничений: локальный запуск, GROQ и интеграция в Телеграм бота с помощью Python

В этой статье я расскажу, как использовать LLAMA3 ИИ в своих проектах. После небольшой подготовки мы приступим к созданию полноценного Telegram бота.

Читать...

2.65K views12:07

Data Science | Machinelearning [ru]

😎Meltemi: первая открытая большая языковая модель для греческого языка

Модель имеет 7 миллиардов параметров и обучается на 40 миллиардах токенов греческого корпуса.

Она содержит актуальную информацию по состоянию на сентябрь 2023 года.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.68K views17:07

Data Science | Machinelearning [ru]

🤔Real AI Семантический Анализатор и решение задачи по извлечению поручений из распорядительных документов

В этой статье мы расскажем о практической задаче – автоматическом заполнении карточек поручений в системе электронного документооборота путем анализа распорядительных документов, а также о нашем подходе к ее решению.

Читать...

2.74K views12:07

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Наш опыт применения AI-технологий для классификации документов для подачи в суд

• ИИ LLama3 без ограничений: локальный запуск, GROQ и интеграция в Телеграм бота с помощью Python

• Агенты расширенного распространения: структура для эффективного исследования и передачи обучения

2.75K views17:07

Data Science | Machinelearning [ru]

📇Атрибутивное распознавание документов

В этой статье хочу обсудить подходы к решению задачи атрибутивного распознавания, а также проблемы с которыми я сталкивался за 10 лет практики в этой области.

Читать...

2.69K views12:07

Data Science | Machinelearning [ru]

🥳 TexGen: генерация 3D-текстур на основе текста с многоракурсной выборкой и повторной выборкой

Новая структура выборки и повторной выборки нескольких видов для генерации текстур, использующую предварительно обученную модель диффузии текста в изображение.

Благодаря обширному количеству качественных и количественных оценок метод обеспечивает значительно лучшее качество текстур для разнообразных 3D-объектов с высокой степенью согласованности вида и богатой детализацией внешнего вида, превосходя современные методы.

Кроме того, этот метод генерации текстур может также применяться для редактирования текстур с сохранением исходной идентичности.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

2.69K views17:07

Data Science | Machinelearning [ru]

✉️Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей

В этой статье я расскажу, как нам удалось преобразовать подход к обслуживанию ИT‑запросов поддержки пользователей через проект интеллектуальной классификации и маршрутизации.

Читать...

2.64K views12:07

Data Science | Machinelearning [ru]

😵Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

В этой статье автор расскажет про свой опыт решения рабочей задачи — анализ отзывов пользователей о компании, а также мы разберём возможные ошибки и посмотрим на пример кода и реальных данных.

Читать...

2.65K views17:08

Data Science | Machinelearning [ru]

🖥 Самые интересные статьи за последние дни:

• Атрибутивное распознавание документов

• Маршрутизация обращений: автоматизация в ИТ-поддержке с помощью ИИ и языковых моделей

• Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных

2.48K views17:07

Data Science | Machinelearning [ru]

🗣Как мы сломали языковой барьер с помощью одной модели?

В этой статье я расскажу о реализации моего бесшовного модуля мультиязычности.

Читать...

2.4K views12:07

About

Blog

Apps

Platform