В этой статье мы рассмотрим метод выборки (sampling method) в генеративных моделях, таких как Stable Diffusion или FLUX.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы рассмотрим различные аспекты применения ИИ в индустрии, его влияние на будущее видеоигр и даже рассмотрим первый в мире нейросетевой игровой движок.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы рассмотрим инструменты для оптимизации расходов, включая квантизацию и LoRA-адаптеры.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы рассмотрим основные стратегии защиты ваших моделей и приложений искусственного интеллекта.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Обучаемый метод обрезки, который устанавливает полуструктурированную разреженность в LLM, направленный на снижение вычислительных издержек во время вывода.
Вместо разработки нового критерия важности MaskLLM явно моделирует шаблоны N:M как обучаемое распределение с помощью выборки Gumbel Softmax.
Этот подход облегчает сквозное обучение на больших наборах данных.
Он позволяет настраивать маски для безпотерьного применения разреженности 2:4 к нижестоящим задачам или доменам.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы разберемся в политике конфиденциальности Open AI и выясняем, почему эксперты окрестили GPT-4o «турбопылесосом данных».
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Новая базовая модель, построенную на многомодальных токенах, способную понимать и генерировать речь, текст, изображения и видео сквозным авторегрессивным способом.
Экспериментальные результаты показывают, что MIO демонстрирует конкурентоспособную, а в некоторых случаях и превосходящую производительность по сравнению с предыдущими двухмодальными базовыми линиями, базовыми линиями моделей any-to-any и даже базовыми линиями, специфичными для модальности.
Более того, MIO демонстрирует расширенные возможности, присущие его функции any-to-any, такие как чередующееся создание видеотекста, цепочка визуально-мысленных рассуждений, создание визуальных руководств, редактирование обучающих изображений и т. д.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье я расскажу вам о единственной формуле, которую нужно знать, чтобы мастерски составлять запросы (промты) к ChatGPT и получать точные и полезные результаты.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье расскажу про особенности применения больших языковых моделей для оптимизации бизнес-процессов.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье разберем, что такое ONNX, как экспортировать модели в этот универсальный формат и, что самое главное, как протестировать их с помощью Python.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье я поделюсь с вами своим опытом использования Golang, Kafka и Clickhouse на примере простого ETL-конвейера для параллельной передачи JSON-данных в базу данных с последующим прогнозированием температуры на основе машинного обучения.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье вы узнаете о механизме внимания (attention) в нейросетях, спецификациях self-attention и cross-attention, а также их роли в генерации изображений на основе текстовых описаний.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье расскажу вам о том, как мы силами пяти человек за месяц научили нашу большую языковую модель Cotype Lite общаться на татарском языке.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы рассмотрим генеративно‑состязательную сеть CipherGAN, используемую для определения базового шифровального отображения по банкам непарного зашифрованного текста и открытого текста.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Мы представляем базовую модель для оценки глубины с помощью метрики нулевого кадра.
Модель синтезирует карты глубины высокого разрешения с непревзойденной резкостью и высокочастотными деталями.
Прогнозы являются метрическими, с абсолютным масштабом, без опоры на доступность метаданных, таких как внутренние параметры камеры.
Модель быстрая, производит карту глубины 2,25 мегапикселя за 0,3 секунды на стандартном графическом процессоре.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье мы рассмотрим три основных подхода: Bagging, Boosting и Stacking, и посмотрим, как их реализовать на Python.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
• Кратко про Ensemble методы с примерами
• Машинное обучение и криптография: знакомимся с CipherGAN
• Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go
Please open Telegram to view this post
VIEW IN TELEGRAM