Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
🤖Quantinuum о своём прогрессе в создании квантового ИИ

В статье о том, как квантовые компьютеры могут изменить наше понимание и применение ИИ.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👥 Как мы генерируем GPT-нейросетями миллиарды объявлений на малом количестве GPU

В этой статье автор рассказывает о соединении тяжёлых процессингов и GPU‑вычислений. Как реализовали высоконагруженный процессинг, который обрабатывает миллиарды товаров и превращает их в объявления, используя тяжёлые модели, такие как YandexGPT, DSSM, CatBoost и другие. Оказывается, связать тяжёлый процессинг и инференс моделей вполне реально, даже когда нагрузка в процессинге превышает возможности вашего сервиса.

Читать…
🤩От промптов к дообучению: четыре уровня адаптации open-source моделей

В этой статье расскажу, как мы разделяем разные уровни адаптации, что делаем на каждом из них и когда переходим на следующий.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔒Шифруй то, шифруй это, или LLM под замком

В этой статье мы поговорим о безопасном обращении с коммерческим контентом, шифровании данных, моделях и подходах к безопасному обращению и встраиванию коммерческих данных в модель.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
😎Обнаружение DGA доменов или тестовое задание на позицию intern ML-engineer

В этой статье мы рассмотрим простую задачу, которая используется одной компанией в качестве тестового задания для стажеров на позицию ML-engineer.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤙Полный гид по бенчмаркам LLM

В этой статье мы рассмотрим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
😎DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D Diffusion

Новая обучающая структура для генерации анимируемых 3D-аватаров из текста.

Ядро этой структуры лежит в скелетно-управляемой перегонке оценок и гибридном 3D-представлении гауссова аватара.

В частности, предлагаемая скелетно-управляемая перегонка оценок интегрирует элементы управления скелета из 3D-шаблонов человека в 2D-модели диффузии, повышая согласованность надзора SDS с точки зрения вида и позы человека.

Это облегчает генерацию высококачественных аватаров, смягчая такие проблемы, как множественные лица, дополнительные конечности и размытие.

Обширные эксперименты показывают, что DreamWaltz-G очень эффективен в создании и анимации 3D-аватаров, превосходя существующие методы как по визуальному качеству, так и по выразительности анимации.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🧐Что такое Sampling method и как он работает в моделях нейросети Stable Diffusion

В этой статье мы рассмотрим метод выборки (sampling method) в генеративных моделях, таких как Stable Diffusion или FLUX.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖Геймдев и ИИ: как нейросети меняют правила игры

В этой статье мы рассмотрим различные аспекты применения ИИ в индустрии, его влияние на будущее видеоигр и даже рассмотрим первый в мире нейросетевой игровой движок.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤨Как настроить LLM на локальном сервере? Пошаговое руководство для ML-специалистов

В этой статье мы рассмотрим инструменты для оптимизации расходов, включая квантизацию и LoRA-адаптеры.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔒Безопасность приложений больших языковых моделей (LLM, GenAI)

В этой статье мы рассмотрим основные стратегии защиты ваших моделей и приложений искусственного интеллекта.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔍MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models

Обучаемый метод обрезки, который устанавливает полуструктурированную разреженность в LLM, направленный на снижение вычислительных издержек во время вывода.

Вместо разработки нового критерия важности MaskLLM явно моделирует шаблоны N:M как обучаемое распределение с помощью выборки Gumbel Softmax.

Этот подход облегчает сквозное обучение на больших наборах данных.

Он позволяет настраивать маски для безпотерьного применения разреженности 2:4 к нижестоящим задачам или доменам.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🤨Можно ли доверять GPT-4o конфиденциальные данные?

В этой статье мы разберемся в политике конфиденциальности Open AI и выясняем, почему эксперты окрестили GPT-4o «турбопылесосом данных».

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔Как оценить качество LLM модели

В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩MIO: A Foundation Model on Multimodal Tokens

Новая базовая модель, построенную на многомодальных токенах, способную понимать и генерировать речь, текст, изображения и видео сквозным авторегрессивным способом.

Экспериментальные результаты показывают, что MIO демонстрирует конкурентоспособную, а в некоторых случаях и превосходящую производительность по сравнению с предыдущими двухмодальными базовыми линиями, базовыми линиями моделей any-to-any и даже базовыми линиями, специфичными для модальности.

Более того, MIO демонстрирует расширенные возможности, присущие его функции any-to-any, такие как чередующееся создание видеотекста, цепочка визуально-мысленных рассуждений, создание визуальных руководств, редактирование обучающих изображений и т. д.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🛡Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

В этой статье расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
😎Эффективные запросы к ChatGPT и подобным моделям: Полное руководство по идеальной формуле

В этой статье я расскажу вам о единственной формуле, которую нужно знать, чтобы мастерски составлять запросы (промты) к ChatGPT и получать точные и полезные результаты.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM