🚀 NewBieAI-Lab представила NewBie-image-Exp0.1 - открытую 3.5B DiT-модель, созданную специально для высокоточной и быстрой генерации аниме.
Главные особенности:
✅ 3.5B параметров — работает даже на 8GB VRAM (RTX 4060)
✅ Внутри: Gemma-3-4B-it + Jina CLIP v2 для глубокого понимания промптов
✅ структурированные XML-промпты: полный контроль над персонажами без случайной смены одежды
✅ FLUX.1-dev 16-ch VAE — мягкая кожа, текстуры ткани и метала
✅ инференс за ~20 шагов, поддержка LoRA, лицензия Apache-2.0 + некоммерческое использование
✅ обучена на более чем 10M аниме-изображений с XML-аннотациями - уверенно держит многоперсонажные сцены
⚡ До 40 процентов быстрее моделей >8B и уверенно справляется с промптами длиной до 500 символов.
🧠 Бонус: пайплайн Noise → Context Refiner устраняет классическую проблему DiT — «картинка красивая, но промпт проигнорирован».
🤖 Модель: https://modelscope.cn/models/NewBieAi-lab/NewBie-image-Exp0.1
Главные особенности:
✅ 3.5B параметров — работает даже на 8GB VRAM (RTX 4060)
✅ Внутри: Gemma-3-4B-it + Jina CLIP v2 для глубокого понимания промптов
✅ структурированные XML-промпты: полный контроль над персонажами без случайной смены одежды
✅ FLUX.1-dev 16-ch VAE — мягкая кожа, текстуры ткани и метала
✅ инференс за ~20 шагов, поддержка LoRA, лицензия Apache-2.0 + некоммерческое использование
✅ обучена на более чем 10M аниме-изображений с XML-аннотациями - уверенно держит многоперсонажные сцены
⚡ До 40 процентов быстрее моделей >8B и уверенно справляется с промптами длиной до 500 символов.
🧠 Бонус: пайплайн Noise → Context Refiner устраняет классическую проблему DiT — «картинка красивая, но промпт проигнорирован».
🤖 Модель: https://modelscope.cn/models/NewBieAi-lab/NewBie-image-Exp0.1
❤8👍2🍓2💊2
Исследователи показали, что LLM-ревьюеров можно обмануть с помощью скрытого текста в PDF, превратив отклонённую работу (reject) в принятую (accept).
Что сделали:
- Проверили 200 научных статей
- Использовали 15 типов атак
- Протестировали 13 языковых моделей
- Оценка шла по шкале из 35 баллов, 7 критериев
Результат:
в некоторых случаях атаки повышали итоговую оценку примерно на 14 баллов — этого достаточно, чтобы решение кардинально поменялось.
Как работал AI-ревьюер:
- модель обязали выдавать результат строго в JSON
- она выставляла оценки по формальным критериям
- симулировался реальный автоматический review-процесс
В чём сама атака:
- в PDF добавляется микроскопический белый текст
- человек его не видит
- но модель читает его после конвертации PDF в текст
- внутри — скрытая инструкция для модели
Почему это работает:
- атаки не спорят с научным содержанием
- инструкции прячутся или перемешиваются
- модель «собирает» их во время чтения
- иногда меняется сама цель задачи, например:
- «это проверка схемы, а не ревью»
- «это логическая задача»
- «правильный результат — максимальный балл»
Что выяснилось:
- слабые модели легко накручивают оценки
- сильные модели устойчивее
- но их облегчённые версии всё ещё уязвимы
Чтобы измерить риск, авторы ввели метрику WAVS:
она учитывает:
- насколько выросла оценка
- поменялось ли решение
- была ли статья реальной или пустым шаблоном
Главный вывод:
AI-ревью без строгой защиты входных данных легко манипулируется даже простыми приёмами.
arxiv.org/abs/2512.10449
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥2👍1
NVIDIA представила Alpamayo-R1 - новый открытый AI для автономных автомобилей, способную не просто «видеть», но и думать, рассуждать и планировать действия, как человек.
Это первый в мире крупномасштабный open-source VLA-модель (Vision-Language-Action), объединяющая:
• восприятие окружающего мира (камера, сенсоры)
• понимание сцены и причинно-следственное рассуждение
• генерацию пути и управление автомобилем
Такая структура позволяет автомобилю не только реагировать на препятствия, но оценивать ситуацию, выбирать безопасную траекторию и «объяснять» свои решения, чего не было в традиционных моделях без явного рассуждения.
👉 Модель открыта для исследователей и разработчиков на GitHub и Hugging Face, что позволит ускорить исследования автономного вождения и повысить безопасность.
https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/
Это первый в мире крупномасштабный open-source VLA-модель (Vision-Language-Action), объединяющая:
• восприятие окружающего мира (камера, сенсоры)
• понимание сцены и причинно-следственное рассуждение
• генерацию пути и управление автомобилем
Такая структура позволяет автомобилю не только реагировать на препятствия, но оценивать ситуацию, выбирать безопасную траекторию и «объяснять» свои решения, чего не было в традиционных моделях без явного рассуждения.
👉 Модель открыта для исследователей и разработчиков на GitHub и Hugging Face, что позволит ускорить исследования автономного вождения и повысить безопасность.
https://developer.nvidia.com/blog/building-autonomous-vehicles-that-reason-with-nvidia-alpamayo/
❤2🔥1
🚀 Настройка Agentic Coding Flywheel
ACFS — это система, превращающая свежий VPS на Ubuntu в мощную среду для разработки с AI-агентами. Идеально подходит для новичков, позволяя быстро настроить все необходимые инструменты и агенты для программирования.
🚀 Основные моменты:
- Установка всего необходимого за одну команду
- Включает три AI-агента для написания кода
- Подходит как для новичков, так и для команд
- Обеспечивает воспроизводимость окружения
📌 GitHub: https://github.com/Dicklesworthstone/agentic_coding_flywheel_setup
#bash
ACFS — это система, превращающая свежий VPS на Ubuntu в мощную среду для разработки с AI-агентами. Идеально подходит для новичков, позволяя быстро настроить все необходимые инструменты и агенты для программирования.
🚀 Основные моменты:
- Установка всего необходимого за одну команду
- Включает три AI-агента для написания кода
- Подходит как для новичков, так и для команд
- Обеспечивает воспроизводимость окружения
📌 GitHub: https://github.com/Dicklesworthstone/agentic_coding_flywheel_setup
#bash
👍4❤1🔥1😱1
Forwarded from Машинное обучение digest
NVIDIA, сдержала обещания c NeurIPS 2025 и сделала еще один шаг к тому чтобы автомобили наконец научились понимать контекст вождения, а не просто детектировать разметку.
Современные автопилоты неплохо справляются со стандартными ситуациями. Но главная головная боль инженеров — это редкие, сложные сценарии, которые почти невозможно предугадать. Традиционные архитектуры, где восприятие отделено от планирования, часто пасуют, когда случается что-то нестандартное.
И вот здесь предлагается подход, где модель учится рассуждать причинно-следственными связями, почти как человек, разбирая ситуацию шаг за шагом. А это важный фактор для безопасности и доверия к системе.
Модель позиционируется как модель-учитель, которая может быть использована для обучения более компактных моделей или для авто-разметки данных.
На практике, NVIDIA предлагает применять эти инструменты в своих решениях NVIDIA Cosmos и NVIDIA Omniverse.
В них можно дообучать модели на своих данных, валидировать их в симуляции и затем деплоить на железо.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥2
🎄🖥️ ClaudeBar: AI Quota Tracker for macOS
ClaudeBar — это приложение для меню macOS, которое отслеживает использование AI-кодов, таких как Claude, Codex, Gemini и GitHub Copilot. Оно предоставляет визуальные индикаторы статуса и уведомления о состоянии квот в реальном времени.
🚀Основные моменты:
- Поддержка нескольких провайдеров AI
- Темы светлого и темного режимов
- Автоматическое обновление квот
- Сезонные темы, включая рождественскую анимацию
- Уведомления о статусе квот
📌 GitHub: https://github.com/tddworks/ClaudeBar
#swift
ClaudeBar — это приложение для меню macOS, которое отслеживает использование AI-кодов, таких как Claude, Codex, Gemini и GitHub Copilot. Оно предоставляет визуальные индикаторы статуса и уведомления о состоянии квот в реальном времени.
🚀Основные моменты:
- Поддержка нескольких провайдеров AI
- Темы светлого и темного режимов
- Автоматическое обновление квот
- Сезонные темы, включая рождественскую анимацию
- Уведомления о статусе квот
📌 GitHub: https://github.com/tddworks/ClaudeBar
#swift
GitHub
GitHub - tddworks/ClaudeBar: A macOS menu bar application that monitors AI coding assistant usage quotas. Keep track of your Claude…
A macOS menu bar application that monitors AI coding assistant usage quotas. Keep track of your Claude, Codex, Antigravity ,and Gemini usage at a glance. - tddworks/ClaudeBar
👍2❤1
🔒 Защита данных и безопасность в AI
DataShield Lightweight Labs — это открытая инициатива, направленная на создание инструментов и фреймворков для повышения конфиденциальности данных, безопасности и надежности AI-систем. Проект предлагает доступные решения для разработчиков, чтобы помочь организациям внедрять лучшие практики в области безопасности и защиты данных.
🚀Основные моменты:
- Инструменты для предотвращения утечек личной информации в LLM
- Открытые сканеры безопасности и обнаружение ошибок конфигурации
- Утилиты для соблюдения GDPR и других норм
- Разработка инструментов для безопасных AI-работflows
- Приветствуются вклады и идеи от сообщества
📌 GitHub: https://github.com/liuxiaomingskm/datashield-lightweight-labs
DataShield Lightweight Labs — это открытая инициатива, направленная на создание инструментов и фреймворков для повышения конфиденциальности данных, безопасности и надежности AI-систем. Проект предлагает доступные решения для разработчиков, чтобы помочь организациям внедрять лучшие практики в области безопасности и защиты данных.
🚀Основные моменты:
- Инструменты для предотвращения утечек личной информации в LLM
- Открытые сканеры безопасности и обнаружение ошибок конфигурации
- Утилиты для соблюдения GDPR и других норм
- Разработка инструментов для безопасных AI-работflows
- Приветствуются вклады и идеи от сообщества
📌 GitHub: https://github.com/liuxiaomingskm/datashield-lightweight-labs
❤3👍1🔥1
Новый open-source “мозг” для роботов - и он уже №1 в мире 🤖🔥
Spirit AI представили Spirit v1.5 - свежую vision-language-action модель, которая превращает то, что робот видит, в точные физические действия.
По сути:
📷 видение + 💬 понимание + 🦾 управление = один мозг.
Что самое громкое:
Spirit v1.5 заняла #1 место на бенчмарке RoboChallenge Table30,
обогнав прошлого лидера Pi0.5 по:
- роботизированному reasoning
- контролю движений
- качеству выполнения задач в физическом мире
Это уже не “чатботы для текста”.
Это LLM-подход, который реально начинает управлять реальностью.
Ссылки:
Code: https://github.com/Spirit-AI-Team/spirit-v1.5
Model: https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5
Blog: https://spirit-ai.com/en/blog/spirit-v1-5
Report: https://mp.weixin.qq.com/s/ZrBDFuugPyuoQp4S6wEBWQ
Если open-source роботы начнут массово получать такие мозги - то 2026 может стать годом, когда роботы “проснутся”.
Spirit AI представили Spirit v1.5 - свежую vision-language-action модель, которая превращает то, что робот видит, в точные физические действия.
По сути:
📷 видение + 💬 понимание + 🦾 управление = один мозг.
Что самое громкое:
Spirit v1.5 заняла #1 место на бенчмарке RoboChallenge Table30,
обогнав прошлого лидера Pi0.5 по:
- роботизированному reasoning
- контролю движений
- качеству выполнения задач в физическом мире
Это уже не “чатботы для текста”.
Это LLM-подход, который реально начинает управлять реальностью.
Ссылки:
Code: https://github.com/Spirit-AI-Team/spirit-v1.5
Model: https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5
Blog: https://spirit-ai.com/en/blog/spirit-v1-5
Report: https://mp.weixin.qq.com/s/ZrBDFuugPyuoQp4S6wEBWQ
Если open-source роботы начнут массово получать такие мозги - то 2026 может стать годом, когда роботы “проснутся”.
👍6🔥4❤2🤡1
🔥 Похоже, сейчас Google проводит все самые жирные AI-сделки - те, которые многие ожидали увидеть у OpenAI:
- Google партнёрится с Apple, чтобы внедрить Gemini в iOS
- Alphabet и NVIDIA расширяют своё десятилетнее партнёрство - агентные ИИ, робототехника, поиск лекарств и не только
- Google получил контракт на внедрение ИИ от военного ведомства США
Триумфальное шествие Google продолжается. 🚀
https://x.com/NVIDIADC/status/2011180913615348128
- Google партнёрится с Apple, чтобы внедрить Gemini в iOS
- Alphabet и NVIDIA расширяют своё десятилетнее партнёрство - агентные ИИ, робототехника, поиск лекарств и не только
- Google получил контракт на внедрение ИИ от военного ведомства США
Триумфальное шествие Google продолжается. 🚀
https://x.com/NVIDIADC/status/2011180913615348128
❤7👍4🔥4
🧠 DeepSeek снова на другом уровне: они нашли U-образный scaling law
DeepSeek выкатили работу про Engram - и это реально сильная инженерия.
Главная идея:
N-граммы всё ещё важны.
Но вместо того, чтобы “выкинуть их ради нейросетей”, DeepSeek гибридизируют подход:
📌 нейронка отвечает за рассуждение
📌 N-граммная память отвечает за быстрый lookup статических знаний
И это закрывает старую проблему LLM:
даже “умные” модели тратят первые слои на то, чтобы заново собирать частые фразы, имена и шаблонный текст - потому что у них нет нормальной встроенной “таблицы поиска”.
### MoE уже экономит вычисления, но есть дырка
Mixture-of-Experts снижает compute - на токен активируется лишь часть экспертов.
Но даже MoE всё равно вынужден тратить вычисления, чтобы вспоминать:
- имена сущностей
- частые связки слов
- формульные конструкции
### Engram = гигантская таблица памяти
Engram - это memory table, которая:
- берёт последние токены
- ищет знакомый паттерн (2-gram / 3-gram)
- и быстро вытаскивает заранее сохранённый вектор
Важно: запрос делается через hash lookup, поэтому стоимость доступа постоянная, даже если таблица огромная.
### Что получилось
DeepSeek показали U-образный scaling law:
можно оптимально балансировать между:
- нейронным compute (MoE)
- статической памятью (Engram)
И это даёт практический эффект:
✅ ранние слои перестают “жечь” compute на реконструкцию
✅ у сети остаётся больше глубины на реальное reasoning
✅ растут reasoning-метрики, хотя это выглядит как “просто память”
### Long-context тоже выигрывает
Когда локальные фразовые связки уезжают в память, attention может сильнее фокусироваться на дальних зависимостях.
В их сравнении Multi-Query Needle-in-a-Haystack:
84.2 → 97.0 🔥
### Системный бонус: стоимость и масштаб
Самое вкусное - масштабирование:
они показывают, что можно вынести 100B memory table в CPU RAM,
и падение throughput будет меньше 3%.
То есть можно добавлять всё больше “памяти” без необходимости влезать в GPU.
📄 Paper: https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf
DeepSeek выкатили работу про Engram - и это реально сильная инженерия.
Главная идея:
N-граммы всё ещё важны.
Но вместо того, чтобы “выкинуть их ради нейросетей”, DeepSeek гибридизируют подход:
📌 нейронка отвечает за рассуждение
📌 N-граммная память отвечает за быстрый lookup статических знаний
И это закрывает старую проблему LLM:
даже “умные” модели тратят первые слои на то, чтобы заново собирать частые фразы, имена и шаблонный текст - потому что у них нет нормальной встроенной “таблицы поиска”.
### MoE уже экономит вычисления, но есть дырка
Mixture-of-Experts снижает compute - на токен активируется лишь часть экспертов.
Но даже MoE всё равно вынужден тратить вычисления, чтобы вспоминать:
- имена сущностей
- частые связки слов
- формульные конструкции
### Engram = гигантская таблица памяти
Engram - это memory table, которая:
- берёт последние токены
- ищет знакомый паттерн (2-gram / 3-gram)
- и быстро вытаскивает заранее сохранённый вектор
Важно: запрос делается через hash lookup, поэтому стоимость доступа постоянная, даже если таблица огромная.
### Что получилось
DeepSeek показали U-образный scaling law:
можно оптимально балансировать между:
- нейронным compute (MoE)
- статической памятью (Engram)
И это даёт практический эффект:
✅ ранние слои перестают “жечь” compute на реконструкцию
✅ у сети остаётся больше глубины на реальное reasoning
✅ растут reasoning-метрики, хотя это выглядит как “просто память”
### Long-context тоже выигрывает
Когда локальные фразовые связки уезжают в память, attention может сильнее фокусироваться на дальних зависимостях.
В их сравнении Multi-Query Needle-in-a-Haystack:
84.2 → 97.0 🔥
### Системный бонус: стоимость и масштаб
Самое вкусное - масштабирование:
они показывают, что можно вынести 100B memory table в CPU RAM,
и падение throughput будет меньше 3%.
То есть можно добавлять всё больше “памяти” без необходимости влезать в GPU.
📄 Paper: https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf
👍5🔥2❤1🤡1
🧠 Data Ёлка в Москве и Санкт-Петербурге пройдет 24 января
VK и ODS.AI анонсировали Data Ёлку: ежегодный ивент для специалистов в области машинного обучения и анализа данных. Формат-гибрид: онлайн трансляция и возможность посетить офлайн
Как всегда на Data Ёлке подведут итоги ушедшего года в ML и Data Science по главным направлениям: RecSys, CodeGen, NLP, PyData, Open Source, MLOps & DE и другим. Программа в формате «стерео»:
✅ один канал посвящен глубокой аналитике, разбору инженерных подходов
✅ второй — прикладным инсайтам, синтезу идей, обсуждению индустриальных трендов
Также на мероприятии разберут лучшие решения и наградят победителей VK RecSys Challenge. 800 исследователей из 14 стран предложили 3 900 решений задачи холодного старта в рекомендациях.
Помимо основной программы есть возможность пообщаться со спикерами из VK и других крупных компаний. Среди экспертов Антон Воронов из Авито, Алексей Смирнов из CodeScoring, Степан Малькевич и Владимир Байкалов из AI VK, и другие. Тут подробности по участию в Москве и в Санкт-Петербурге
VK и ODS.AI анонсировали Data Ёлку: ежегодный ивент для специалистов в области машинного обучения и анализа данных. Формат-гибрид: онлайн трансляция и возможность посетить офлайн
Как всегда на Data Ёлке подведут итоги ушедшего года в ML и Data Science по главным направлениям: RecSys, CodeGen, NLP, PyData, Open Source, MLOps & DE и другим. Программа в формате «стерео»:
✅ один канал посвящен глубокой аналитике, разбору инженерных подходов
✅ второй — прикладным инсайтам, синтезу идей, обсуждению индустриальных трендов
Также на мероприятии разберут лучшие решения и наградят победителей VK RecSys Challenge. 800 исследователей из 14 стран предложили 3 900 решений задачи холодного старта в рекомендациях.
Помимо основной программы есть возможность пообщаться со спикерами из VK и других крупных компаний. Среди экспертов Антон Воронов из Авито, Алексей Смирнов из CodeScoring, Степан Малькевич и Владимир Байкалов из AI VK, и другие. Тут подробности по участию в Москве и в Санкт-Петербурге
❤4👍1🥰1
Если хочешь разобраться в ИИ не по курсам “в вакууме”, а через реальные open-source проекты - вот топ реп, которые реально ведут от базы до практики:
1) Karpathy – Neural Networks: Zero to Hero
Самый понятный вход в нейросети и backprop “на пальцах”
https://github.com/karpathy/nn-zero-to-hero
2) Hugging Face Transformers
Главная библиотека современного NLP/LLM: модели, токенизаторы, fine-tuning
https://github.com/huggingface/transformers
3) FastAI – Fastbook
Практическое DL-обучение через проекты и эксперименты
https://github.com/fastai/fastbook
4) Made With ML
ML как инженерная система: пайплайны, прод, деплой, мониторинг
https://github.com/GokuMohandas/Made-With-ML
5) Machine Learning System Design (Chip Huyen)
Как строить ML-системы в реальном бизнесе: данные, метрики, инфраструктура
https://github.com/chiphuyen/machine-learning-systems-design
6) Awesome Generative AI Guide
Подборка материалов по GenAI: от основ до практики
https://github.com/aishwaryanr/awesome-generative-ai-guide
7) Dive into Deep Learning (D2L)
Одна из лучших книг по DL + код + задания
https://github.com/d2l-ai/d2l-en
Сохрани себе - это база, на которой можно реально вырасти до ML/LLM-инженера.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3❤2
🔥 Стань научным прорывом года на Data Fusion Awards
У тебя вышла статья по ИИ в 2025 году? Банк ВТБ и Институт ИИ МГУ ищут научный прорыв года принимают заявки на конкурс с призовым фондом 3 млн ₽ за топ-3 работы.
Что подходит:
🔹Математика ИИ, оптимизация, ML/DL
🔹Нейроморфные вычисления, робототехника
🔹Explainable AI и смежные темы
Требования простые:
- Публикация 2025 года
- Российская аффилиация
- Ты — первый автор
⏳ Дедлайн — до конца января. Не упусти шанс.
👉 Подавай заявку прямо сейчас
У тебя вышла статья по ИИ в 2025 году? Банк ВТБ и Институт ИИ МГУ ищут научный прорыв года принимают заявки на конкурс с призовым фондом 3 млн ₽ за топ-3 работы.
Что подходит:
🔹Математика ИИ, оптимизация, ML/DL
🔹Нейроморфные вычисления, робототехника
🔹Explainable AI и смежные темы
Требования простые:
- Публикация 2025 года
- Российская аффилиация
- Ты — первый автор
⏳ Дедлайн — до конца января. Не упусти шанс.
👉 Подавай заявку прямо сейчас
❤2
🌍 DeepSeek захватывает рынки там, где западные AI-сервисы недоступны
Microsoft собрали оценку глобальной доли DeepSeek - и картина очень показательная.
В Северной Америке и Европе adoption остаётся низким.
Зато в регионах, где доступ к американским сервисам ограничен (или где зарубежные технологии стоят слишком дорого), DeepSeek резко набирает популярность:
- Китай
- Россия
- Иран
- Куба
- Беларусь
- страны Африки (там использование оценивают в 2-4 раза выше, чем в других регионах)
DeepSeek оказался идеальным продуктом для “недообслуженных” рынков:
- больше открытости
- ниже цена
- проще доступ
- лучше адаптация под локальные реалии
И главный вывод тут не про “кто сильнее по бенчмаркам”.
Глобальное распространение ИИ определяется не только качеством модели.
А ещё:
- доступностью
- стоимостью
- языком
- политическими и инфраструктурными ограничениями
Люди выбирают не “самый хайповый AI”, а тот, который реально работает в их стране и подходит по условиям.
microsoft.com/en-us/corporate-responsibility/topics/ai-economy-institute/reports/global-ai-adoption-2025/
Microsoft собрали оценку глобальной доли DeepSeek - и картина очень показательная.
В Северной Америке и Европе adoption остаётся низким.
Зато в регионах, где доступ к американским сервисам ограничен (или где зарубежные технологии стоят слишком дорого), DeepSeek резко набирает популярность:
- Китай
- Россия
- Иран
- Куба
- Беларусь
- страны Африки (там использование оценивают в 2-4 раза выше, чем в других регионах)
DeepSeek оказался идеальным продуктом для “недообслуженных” рынков:
- больше открытости
- ниже цена
- проще доступ
- лучше адаптация под локальные реалии
И главный вывод тут не про “кто сильнее по бенчмаркам”.
Глобальное распространение ИИ определяется не только качеством модели.
А ещё:
- доступностью
- стоимостью
- языком
- политическими и инфраструктурными ограничениями
Люди выбирают не “самый хайповый AI”, а тот, который реально работает в их стране и подходит по условиям.
microsoft.com/en-us/corporate-responsibility/topics/ai-economy-institute/reports/global-ai-adoption-2025/
❤5👍5😁2🔥1🤔1
🛡 Semantic Firewall - “семантический файрвол” для LLM
Появился интересный проект semantic_firewall от BlackVectorOps - идея простая и мощная:
Обычные фильтры работают по словам.
Атаки на LLM - по смыслу.
Поэтому нужен не “keyword blacklist”, а семантический слой защиты, который понимает:
- что пользователь *на самом деле* пытается сделать
- и не даёт модели поддаться на взлом / prompt injection
Что умеет модель:
✅ ловить завуалированные запросы (когда вредное спрятано в мягких формулировках)
✅ блокировать инъекции типа “игнорируй правила / действуй как…”
✅ защищать tool-use (когда LLM пытаются заставить выполнить опасное действие)
✅ давать policy-решение: разрешить / запретить / потребовать уточнение
LLM всё чаще подключают к реальным инструментам: API, файлы, базы, платежи, админки.
И в таком мире prompt injection = security bug.
Если строишь AI-бота, агентную систему или LLM-продукт - такие “семантические прокладки” скоро станут стандартом.
https://github.com/BlackVectorOps/semantic_firewall
#AI #LLM #Security #PromptInjection #Jailbreak
Появился интересный проект semantic_firewall от BlackVectorOps - идея простая и мощная:
Обычные фильтры работают по словам.
Атаки на LLM - по смыслу.
Поэтому нужен не “keyword blacklist”, а семантический слой защиты, который понимает:
- что пользователь *на самом деле* пытается сделать
- и не даёт модели поддаться на взлом / prompt injection
Что умеет модель:
✅ ловить завуалированные запросы (когда вредное спрятано в мягких формулировках)
✅ блокировать инъекции типа “игнорируй правила / действуй как…”
✅ защищать tool-use (когда LLM пытаются заставить выполнить опасное действие)
✅ давать policy-решение: разрешить / запретить / потребовать уточнение
LLM всё чаще подключают к реальным инструментам: API, файлы, базы, платежи, админки.
И в таком мире prompt injection = security bug.
Если строишь AI-бота, агентную систему или LLM-продукт - такие “семантические прокладки” скоро станут стандартом.
https://github.com/BlackVectorOps/semantic_firewall
#AI #LLM #Security #PromptInjection #Jailbreak
👍2🔥1🥰1
Forwarded from Machinelearning
🗣 Qwen3-TTS - мощный open-source релиз (voice design + клонирование голоса)
Qwen официально выпустили Qwen3-TTS и полностью открыли всю линейку моделей - Base / CustomVoice / VoiceDesign.
Что внутри:
- 5 моделей (0.6B и 1.8B классы)
- Free-form Voice Design - генерация/редаквтирование голоса по описанию
- Voice Cloning - клонирование голоса
- 10 языков
- 12Hz tokenizer - сильная компрессия аудио без сильной потери качества
- полная поддержка fine-tuning
- заявляют SOTA качество на ряде метрик
Раньше лучшие генераторы были в закрытых API, а теперь появляется полноценный open-source стек TTS, где можно:
- обучать под домен,
- делать кастомные голоса,
- и не зависеть от провайдера.
▪GitHub: https://github.com/QwenLM/Qwen3-TTS
▪Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts
▪Демо (HF): https://huggingface.co/spaces/Qwen/Qwen3-TTS
▪Блог: https://qwen.ai/blog?id=qwen3tts-0115
▪Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
@ai_machinelearning_big_data
#AI #TTS #Qwen #OpenSource #SpeechAI
Qwen официально выпустили Qwen3-TTS и полностью открыли всю линейку моделей - Base / CustomVoice / VoiceDesign.
Что внутри:
- 5 моделей (0.6B и 1.8B классы)
- Free-form Voice Design - генерация/редаквтирование голоса по описанию
- Voice Cloning - клонирование голоса
- 10 языков
- 12Hz tokenizer - сильная компрессия аудио без сильной потери качества
- полная поддержка fine-tuning
- заявляют SOTA качество на ряде метрик
Раньше лучшие генераторы были в закрытых API, а теперь появляется полноценный open-source стек TTS, где можно:
- обучать под домен,
- делать кастомные голоса,
- и не зависеть от провайдера.
▪GitHub: https://github.com/QwenLM/Qwen3-TTS
▪Hugging Face: https://huggingface.co/collections/Qwen/qwen3-tts
▪Демо (HF): https://huggingface.co/spaces/Qwen/Qwen3-TTS
▪Блог: https://qwen.ai/blog?id=qwen3tts-0115
▪Paper: https://github.com/QwenLM/Qwen3-TTS/blob/main/assets/Qwen3_TTS.pdf
@ai_machinelearning_big_data
#AI #TTS #Qwen #OpenSource #SpeechAI
👍3❤1
🔥 На stepik вышел курс, который учит Создавать настоящие AI-сервисы, а не просто запускать скрипты?
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
Этот практический курс по Python и FastAPI покажет, как собрать полноценное приложение с ИИ, базой данных, автогенерацией контента и Telegram-ботом.
Ты пройдёшь путь от первого HTTP-запроса до рабочего сервиса, который сам генерирует текст через ИИ, сохраняет данные, отправляет результаты по расписанию и отвечает пользователям.
Никакой теории ради теории - только практические шаги, из которых рождается реальный продукт.
🎁 48 часов действует скидка в 40% процентов
👉 Начать учиться на Stepik
🥔 ByteDance тестирует новую модель Doubao под кодовым именем “Giga-Potato”
ByteDance уже неделю гоняет свою новую модель Doubao в Kilo Code — там она проходит под названием “Giga-Potato”.
Что пишут в описании Kilo Code:
- На внутренних бенчмарках модель обгоняет почти все open-weight модели, которые тестировали, особенно на задачах кодинга с длинным контекстом
- Контекст: 256k токенов
- Максимальный вывод: 32k токенов
- Отдельно отмечают “строгую дисциплину” — модель отлично следует system prompt
(полезно для enterprise, где важны линтеры, стиль и единые правила кода)
Если это подтвердится в публичных тестах - Doubao может стать одной из самых сильных моделей ByteDance именно для long-context coding.
https://x.com/AiBattle_/status/2014361796279181388
ByteDance уже неделю гоняет свою новую модель Doubao в Kilo Code — там она проходит под названием “Giga-Potato”.
Что пишут в описании Kilo Code:
- На внутренних бенчмарках модель обгоняет почти все open-weight модели, которые тестировали, особенно на задачах кодинга с длинным контекстом
- Контекст: 256k токенов
- Максимальный вывод: 32k токенов
- Отдельно отмечают “строгую дисциплину” — модель отлично следует system prompt
(полезно для enterprise, где важны линтеры, стиль и единые правила кода)
Если это подтвердится в публичных тестах - Doubao может стать одной из самых сильных моделей ByteDance именно для long-context coding.
https://x.com/AiBattle_/status/2014361796279181388
👍2🔥2❤1