🗣Dolphin: длинный контекст как новая модальность для энергоэффективных языковых моделей на устройстве
Подход решает проблемы значительного потребления энергии и задержек, присущие моделям на устройстве.
Dolphin использует компактный декодер параметров 0,5B для извлечения обширной контекстной информации во встраивание памяти, существенно сокращая длину входных данных для первичной модели декодера параметров 7B.
Этот инновационный метод позволяет обрабатывать существенно более длинные контексты без типичных вычислительных затрат, связанных с расширенными последовательностями входных данных.
Эмпирические оценки демонстрируют 10-кратное улучшение энергоэффективности и 5-кратное сокращение задержек по сравнению с обычными методами обработки полноразмерного контекста без потери качества ответа.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Подход решает проблемы значительного потребления энергии и задержек, присущие моделям на устройстве.
Dolphin использует компактный декодер параметров 0,5B для извлечения обширной контекстной информации во встраивание памяти, существенно сокращая длину входных данных для первичной модели декодера параметров 7B.
Этот инновационный метод позволяет обрабатывать существенно более длинные контексты без типичных вычислительных затрат, связанных с расширенными последовательностями входных данных.
Эмпирические оценки демонстрируют 10-кратное улучшение энергоэффективности и 5-кратное сокращение задержек по сравнению с обычными методами обработки полноразмерного контекста без потери качества ответа.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
МТС Web Services запустила два новых кластера виртуальной инфраструктуры с графическими ускорителями, тем самым увеличив собственные GPU-мощности для обучения искусственного интеллекта на 40%. До конца года эта цифра увеличится еще в 3-4 раза.
Запуск новых сегментов позволит большему числу предприятий упростить и ускорить обучение и инференс собственных AI- и ML-моделей, за счет размещения их в облаке MWS. Инфраструктура подойдет для работы с любыми AI-моделями во всех отраслях экономики. А получить доступ к ней можно из любой точки страны.
Также до конца года на базе GPU-инфраструктуры будут развернуты: платформа для разработки, обучения и развертывания ML-моделей, уже готовые модели ИИ для разных индустрий и направлений, доступные по API и AI-сервисы по модели SaaS.
@Devsp — Подписаться
Запуск новых сегментов позволит большему числу предприятий упростить и ускорить обучение и инференс собственных AI- и ML-моделей, за счет размещения их в облаке MWS. Инфраструктура подойдет для работы с любыми AI-моделями во всех отраслях экономики. А получить доступ к ней можно из любой точки страны.
Также до конца года на базе GPU-инфраструктуры будут развернуты: платформа для разработки, обучения и развертывания ML-моделей, уже готовые модели ИИ для разных индустрий и направлений, доступные по API и AI-сервисы по модели SaaS.
@Devsp — Подписаться
Telegram
Data Science | Machinelearning [ru]
Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence)
По вопросам рекламы или разработки - @g_abashkin
РКН: https://vk.cc/cJPGXD
По вопросам рекламы или разработки - @g_abashkin
РКН: https://vk.cc/cJPGXD
🗣Яндекс анонсировал Practical ML Conf, которая пройдет 14 сентября и будет доступна для просмотра онлайн
Это мероприятие, на котором Яндекс ежегодно анонсирует свои крупные запуски и делится опытом.
Все подробности и регистрация тут
@Devsp — Подписаться
Это мероприятие, на котором Яндекс ежегодно анонсирует свои крупные запуски и делится опытом.
Все подробности и регистрация тут
@Devsp — Подписаться
🖥 Самые интересные статьи за последние дни:
• Как мы обучали нейросеть распознавать юридические документы
• Топ-7 высокооплачиваемых профессий в сфере ИИ
• Создание искусственного датасета для обучения модели с использованием Paddle OCR
• Как мы обучали нейросеть распознавать юридические документы
• Топ-7 высокооплачиваемых профессий в сфере ИИ
• Создание искусственного датасета для обучения модели с использованием Paddle OCR
🗣InkubaLM: A small language model for low-resource African languages
InkubaLM, небольшая языковая модель с 0,4 миллиарда параметров, которая достигает производительности, сопоставимой с моделями со значительно большим количеством параметров и более обширными данными обучения для таких задач, как машинный перевод, вопросы и ответы, AfriMMLU и задача AfriXnli.
В частности, InkubaLM превосходит многие более крупные модели в анализе настроений и демонстрирует замечательную согласованность на нескольких языках.
Эта работа представляет собой решающий шаг в оспаривании общепринятой парадигмы, согласно которой эффективные языковые модели должны полагаться на значительные ресурсы.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
InkubaLM, небольшая языковая модель с 0,4 миллиарда параметров, которая достигает производительности, сопоставимой с моделями со значительно большим количеством параметров и более обширными данными обучения для таких задач, как машинный перевод, вопросы и ответы, AfriMMLU и задача AfriXnli.
В частности, InkubaLM превосходит многие более крупные модели в анализе настроений и демонстрирует замечательную согласованность на нескольких языках.
Эта работа представляет собой решающий шаг в оспаривании общепринятой парадигмы, согласно которой эффективные языковые модели должны полагаться на значительные ресурсы.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
😎Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming
Сквозная разговорная модель на основе аудио, способная к речевому взаимодействию в реальном времени.
Метод также помогает сохранить языковые возможности исходной модели с минимальным ухудшением, что позволяет другим работам устанавливать возможности взаимодействия в реальном времени.
Mini-Omni — это первая полностью сквозная модель с открытым исходным кодом для речевого взаимодействия в реальном времени, предлагающая ценный потенциал для будущих исследований.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Сквозная разговорная модель на основе аудио, способная к речевому взаимодействию в реальном времени.
Метод также помогает сохранить языковые возможности исходной модели с минимальным ухудшением, что позволяет другим работам устанавливать возможности взаимодействия в реальном времени.
Mini-Omni — это первая полностью сквозная модель с открытым исходным кодом для речевого взаимодействия в реальном времени, предлагающая ценный потенциал для будущих исследований.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
📹Новая версия YandexART (Vi) — как она устроена?
В статье на Хабре Яндекс рассказывает о процессе обучения нейросети, которая при генерации видео учитывает связь между кадрами и воссоздаёт реалистичные движения объектов.
Читать...
В статье на Хабре Яндекс рассказывает о процессе обучения нейросети, которая при генерации видео учитывает связь между кадрами и воссоздаёт реалистичные движения объектов.
Читать...
💽 Как мы построили модель прогнозирования выхода жестких дисков из строя
В этой статье я расскажу, что нам удалось сделать, что стало основой прототипа нашей прогнозной модели и какие результаты она показала в применении для дисков в серверах YADRO.
Читать...
В этой статье я расскажу, что нам удалось сделать, что стало основой прототипа нашей прогнозной модели и какие результаты она показала в применении для дисков в серверах YADRO.
Читать...
Хабр
Как мы построили модель прогнозирования выхода жестких дисков из строя
Неожиданный выход HDD из строя — неприятная для сервера ситуация. Выяснение причин и замена жесткого диска (не всегда это можно сделать «горячим» способом) почти всегда означают даунтайм работы...