Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​👤Вызов функций с помощью LLM

В этой статье мы поговорим о вызове функций с помощью больших языковых моделей, рассмотрим некоторые проприетарные и открытые модели, связанные исследования, а затем проведем небольшой эксперимент с отправкой электронной почты при помощи LLM.

Читать...
​​⚡️MeshFormer: High-Quality Mesh Generation with 3D-Guided Reconstruction Model

Модель реконструкции с разреженным видом, использующая явную 3D-структуру, входное руководство и контроль обучения.

Вместо трипланового представления модель сохраняет признаки в 3D-вокселях, комбинируя трансформаторы и 3D-свертки для интеграции проективного смещения.

Она обрабатывает RGB-вход и генерирует карты нормалей, предсказываемые с помощью 2D-моделей диффузии, что улучшает обучение геометрии.

Кроме того, использование Signed Distance Function (SDF) с рендерингом поверхности позволяет напрямую создавать качественные сетки, избегая сложных алгоритмов.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
​​😍ML в маркетинге: как модели делают банк более чутким к негативу

В статье мы подробно рассмотрим общую концепцию response-модели, а также технические аспекты ее стратегии обучения, которая показала статистически значимое уменьшение негатива от маркетинга на боевом A/B-тесте.

Читать...
​​👌Практический кейс реализации AutoML в банке

В этой статье мы расскажем, как выстроен наш процесс, как мы к этому пришли, с какими проблемами столкнулись, как их решили и как в дальнейшем планируем тиражировать на другие продукты банка.

Читать...
​​🐈‍⬛️MLSecOps: почему, зачем и кому это нужно?

В этой статье я расскажу о сравнительно новой концепции, которая становится все более актуальной и использование которой совершенно точно необходимо в больших промышленных ML-проектах, — MLSecOps.

Читать...
​​👀Sapiens: Foundation for Human Vision Models

Семейство моделей для четырех основных задач, связанных с зрением человека: оценка позы в 2D, сегментация частей тела, оценка глубины и прогнозирование нормалей поверхности.

Модели изначально поддерживают вывод высокого разрешения 1K и чрезвычайно легко адаптируются для отдельных задач путем простой тонкой настройки моделей, предварительно обученных на более чем 300 миллионах изображений человека в дикой природе.

Простая конструкция модели также обеспечивает масштабируемость — производительность модели для разных задач улучшается по мере того, как мы масштабируем количество параметров с 0,3 до 2 миллиардов.

Sapiens постоянно превосходит существующие базовые показатели по различным бенчмаркам, связанным с зрением человека.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
​​🤖Нейросети для написания текстов: обзор и сравнение моделей

В этой статье мы рассмотрим работу различных ИИ-моделей на примере четырех нестандартных промтов, анализируя их сильные стороны, слабости и потенциал для дальнейшего развития.

Читать...
👍1
​​🧐Долой рандом, или ищем лучшие настройки для аугментации текстов

Расскажу о том, как мы оптимизировали параметры аугментаций для текстовых данных и что из этого получилось.

Читать...
​​🤗CustomCrafter: индивидуальная генерация видео с сохранением движения и возможностей концептуальной композиции

Новую структуру, которая сохраняет способность модели генерировать движение и концептуальные комбинированные способности без дополнительного видео и тонкой настройки для восстановления.

Для сохранения концептуальной комбинированной способности мы разрабатываем модуль plug-and-play для обновления нескольких параметров в VDM, улучшая способность модели захватывать детали внешнего вида и способность концептуальных комбинирований для новых субъектов.

Используя подключаемость наших модулей обучения объекта, мы уменьшаем влияние этого модуля на генерацию движения на ранней стадии шумоподавления, сохраняя возможность генерировать движение VDM.

На более поздней стадии шумоподавления мы восстанавливаем этот модуль, чтобы восстановить детали внешнего вида указанного объекта, тем самым обеспечивая точность внешнего вида объекта.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
​​⛅️Встречаем OmniCast — технологию, которая повысит точность прогноза температуры с помощью пользовательских метеостанций

В этой статье мы расскажем о том, как при помощи фильтра Калмана и комбинации двунаправленной и однонаправленной LSTM-нейросетей нам удалось улучшить качество прогноза температуры.

Читать...
​​🔥K-Sort Arena: Efficient and Reliable Benchmarking for Generative Models via K-wise Human Preferences

Эффективная и надежная платформа, основанная на ключевом понимании: изображения и видео обладают более высокой интуитивностью восприятия, чем тексты, что позволяет быстро оценивать несколько образцов одновременно.

K-Sort Arena использует сравнения K-wise, позволяя моделям K участвовать в соревнованиях «все против всех», которые дают гораздо более богатую информацию, чем парные сравнения. Для повышения надежности системы мы используем вероятностное моделирование и байесовские методы обновления.

Благодаря своей высокой эффективности K-Sort Arena может непрерывно включать новые модели и обновлять таблицу лидеров с минимальным количеством голосов.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
​​🗣Гайд по работе языковых моделей для начинающих

В этой статье вы узнаете о том, как устроены самые популярные языковые модели и что нужно знать, чтобы начать с ними работать.

Читать...
​​👾Как мы обучали нейросеть распознавать юридические документы

В этой статье мы рассмотрим разработку нейронной сети для анализа и верификации юридических документов, в частности, нормативных правовых актов.

Читать...
​​🗣Dolphin: длинный контекст как новая модальность для энергоэффективных языковых моделей на устройстве

Подход решает проблемы значительного потребления энергии и задержек, присущие моделям на устройстве.

Dolphin использует компактный декодер параметров 0,5B для извлечения обширной контекстной информации во встраивание памяти, существенно сокращая длину входных данных для первичной модели декодера параметров 7B.

Этот инновационный метод позволяет обрабатывать существенно более длинные контексты без типичных вычислительных затрат, связанных с расширенными последовательностями входных данных.

Эмпирические оценки демонстрируют 10-кратное улучшение энергоэффективности и 5-кратное сокращение задержек по сравнению с обычными методами обработки полноразмерного контекста без потери качества ответа.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
МТС Web Services запустила два новых кластера виртуальной инфраструктуры с графическими ускорителями, тем самым увеличив собственные GPU-мощности для обучения искусственного интеллекта на 40%. До конца года эта цифра увеличится еще в 3-4 раза.

Запуск новых сегментов позволит большему числу предприятий упростить и ускорить обучение и инференс собственных AI- и ML-моделей, за счет размещения их в облаке MWS. Инфраструктура подойдет для работы с любыми AI-моделями во всех отраслях экономики. А получить доступ к ней можно из любой точки страны.  
 
Также до конца года на базе GPU-инфраструктуры будут развернуты: платформа для разработки, обучения и развертывания ML-моделей, уже готовые модели ИИ для разных индустрий и направлений, доступные по API и AI-сервисы по модели SaaS.

@DevspПодписаться
​​😍Топ-7 высокооплачиваемых профессий в сфере ИИ

В этой статье мы разберёмся, что ждёт работодателей и соискателей в ближайшем будущем и каким специалистам в сфере ИИ, или AI, готовы платить больше всего.

Читать...
​​👾Создание искусственного датасета для обучения модели с использованием Paddle OCR

В этой статье мы подробно расскажем, как именно подошли к этому процессу.

Читать...
🗣Яндекс анонсировал Practical ML Conf, которая пройдет 14 сентября и будет доступна для просмотра онлайн

Это мероприятие, на котором Яндекс ежегодно анонсирует свои крупные запуски и делится опытом.

Все подробности и регистрация тут

@DevspПодписаться