Технозаметки Малышева – Telegram
Технозаметки Малышева
8.25K subscribers
3.72K photos
1.39K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Media is too big
VIEW IN TELEGRAM
🎙 Запись эфира: AWS Summit, AI-агенты и будущее ИИ

Сегодня обсудили с Владимиром Проворовым ( @itismyjob ) главные тренды в развитии AI, как на AWS Summit так и за его пределами.

Ключевые темы:
- Amazon Bedrock AgentCore - 7 новых сервисов для создания агентов с разделяемой памятью и маркетплейсом инструментов для ИИ агентов
- S3 Vectors - масштабные векторный базы данных для агентов работающих с миллионами документов
- Kiro IDE - новый конкурент Cursor, Trae & ClaudeCode - ИИ агент, который создает код с учетом архитектурных требований
- Intuit - стартап обрабатывающий 60 млрд налоговых транзакций с помощью МЛ, создавший свою операционку для ИИ агентов.

Так же обсудили последние новости и модели
- OpenAI выпустила две открытые модели GPT-OSS (20B и 120B параметров) - уровня O3, но весом всего 64 ГБ
- Anthropic обновил Opus до версии 4.1

Коснулись инфраструктуры будущего:
- Гонка за создание дата-центров на миллион GPU (8 в мире, включая Китай)
- Маск строит кластер Colossus в палатках чтобы в этой гонке не отставать
- Энергетический вопрос становится критическим - компании ищут регионы с дешевым электричеством

Главный инсайт: Мы входим в технологический резонанс - AI помогает создавать более мощные модели и железо, которые позволят создать еще более мощный AI.
Отставание на год может означать отставание навсегда.

Youtube

Rutube

#эфиры #AWS
------
@tsingular
3👍14❤‍🔥7🔥621
Media is too big
VIEW IN TELEGRAM
ElevenLabs запустили генератор музыки

Компания ElevenLabs, известная своими генераторами голоса и переводчиками, представила ИИ-генератор музыки.

Инструмент создаёт оригинальные композиции с использованием нейронок и вариационных автоэнкодеров.

Русский поддерживает.

Отменяем подписку на Suno, тут оркестры уровня Ханса Циммера завезли!

UPD: качество такое в плане голоса и акцентов, - идеально генерить пародии.
Угадаете песнь в комментарии?
Подписку на Suno не отменяем :)

#ElevenLabs #music
———
@tsingular
👍5🔥211
Amazon заменяет сотрудников на ИИ и объявляет о сокращениях

Глава Amazon Энди Джасси заявил — генеративный ИИ сократит корпоративный штат через повышение эффективности.

В логистической сети компании ИИ уже оптимизирует размещение товаров, прогнозирует спрос и управляет роботами. По данным МВФ, около 60% рабочих мест в развитых экономиках попадут под влияние ИИ.

Параллельно создаются новые высококвалифицированные позиции — аналитики данных, специалисты по машинному обучению. Но скорость замещения превышает скорость адаптации рынка труда.

Логично. Роботы не берут больничные и не требуют повышения зарплаты. Но кто будет покупать товары, если все без работы? 🤔

#Amazon #workforce #automation
------
@tsingular
💯8👻3
GitHub Models решает проблему инференса для open source AI проектов

GitHub запустил бесплатный API для инференса популярных моделей - GPT-4o, DeepSeek-R1, Llama 3.

Проблема была в том, что open source проекты постоянно спотыкались о настройку инференса - нужны были ключи API, локальные модели жрали ресурсы, конфигурация отнимала время.

Теперь достаточно GitHub токена и REST эндпоинта, совместимого с OpenAI спецификацией. Никакой дополнительной настройки.

Интеграция с GitHub Actions позволяет автоматизировать AI фичи прямо в CI/CD пайплайнах. Есть бесплатый тир с опцией масштабирования.

Поддерживаются multiple SDK без изменений кода - просто меняешь endpoint.

Удобно. Теперь любой студент может прикрутить ИИ к своему поектику не покидая платформу.

Вообще Гитхаб превращается в пространство самообновляющегося оупенсорса с ИИ мультиагентами разрабами.

#GitHub #inference #opensource
------
@tsingular
32👍2🔥2
Добавил в табличку скорости инференса цифры по новой модели OpenAI 20B
летает шустро надо сказать.
В целом напоминает gemma 3n, только метрики получается получше.

Если кто хочет дополнить, - в самой таблице запрашивайте доступ.

#benchmarks #hardware #бенчмарки
———
@tsingular
5👍3
Google запустил AI First Colab Notebooks в BigQuery и Vertex AI

Google интегрировал ИИ-агентов прямо в Colab блокноты для работы с данными.

Теперь можно просто сказать "проанализируй эти данные" и Data Science Agent сам напишет код, построит графики и найдёт закономерности.

Агенты работают с BigQuery и генерируют код на Python автоматически. Доступны бесплатные GPU и TPU для ускорения вычислений.

Основная фишка — никакой настройки инфраструктуры. Открыл браузер, написал задачу на обычном языке, получил анализ.

Интеграция с Gemini AI позволяет генерировать код и объяснения прямо в процессе работы с данными.

Аналитики данных скоро будут просто болтать с компьютером вместо написания кода. Прогресс! 🤖📊

#Google #Colab #BigQuery
------
@tsingular
532🔥2
Media is too big
VIEW IN TELEGRAM
Начинают нравиться эти ваши ИИ дипфейки.

Промо Конгресса Подмосковные вечера 2025 прям огонь :)

На конгрессе тоже будет круто, присоединяйтесь (21-23 сентября, ПСБ Патриот)

https://pv2025.4cio.ru/

#pv2025
———
@tsingular
1🤣14🔥9😁21🍾1
Forwarded from Борис опять
Инсайдерская история на стыке мира AI рисерча и ML в индустрии для вас.

AI Safety организация тестировала гиппотезу можно ли привлечь консалтинговые компании к исследованиям. Конкретнее можно ли нанимать консультантов имплементировать статьи, делать бенчмарки и новые методы.

Начали интервьюировать консультантов больших и маленьких, чтобы оценить, какой вообще пул ML инженеров у них есть.

Одна из компаний-кандидатов это топ-5 менеджмент консалтинг в мире.

И там оказалась такая воронка.

Штат компании: X тысяч человек.
Сколько компания заявила у неё ML специалистов: 500.
Сколько по факту насчитали людей способных делать ML инжиниринг: 20.

Далее этим консультантам предложили сделать тестовое задание и те назвали ценник в несколько тысяч долларов в час. Нормальный такой рейт.

Что не удивительно: им буквально всех нормальных MLE в компании придется задействовать!

В общем можно сделать много разных выводов. Например, что инженеров способных делать инжиниринг около ML рисерча очень мало. Или что бизнесу их много не нужно. Предлагайте свои
🔥21
Forwarded from Data Secrets
Свежее красивейшее исследование от Anthropic: Persona Vectors в LLM

Помните, как GPT-4o после безобидного дотюнивания вдруг стал страшным подхалимом? Или как Grok начал объявлять себя Гитлером? Естественно, их не учили так себя вести напрямую, но по какой-то причине такая "личность" в них все равно проснулась.

Anthropic в своей новой работе обнаружили, что это далеко не случайность. Оказывается, в нейросетях есть так называемые persona vectors – векторы в пространстве активаций, отвечающие заданным чертам характера.

Более того, исследователи научились такие векторы находить просто по текстовому описанию черты. Пайплайн довольно простой:

1. Берем определенную характеристику (скажем, жестокость) и генерируем два системных промпта. Один «за» черту, другой — против (то есть "будь жестоким" и "не будь", только более развернуто).

2. Скармливаем разным экземплярам модели разные системные промпты и начинаем задавать специальные вопросы, провоцирующие проявление нужной характеристики.

3. Для каждого вопроса трекаем активации на каждом слое сети, усредняем по токенам. Разность таких средних активаций первого экземпляра модели со вторым даёт нужный нам вектор для каждого слоя. Также можно затрекать самый яркий слой, на котором вектор персоны дает максимальное влияние на результат.


Ну а после получения таких персо-векторов делать с ними вообще-то можно очень много всего. Например:

Определять, какие данные активируют тот или иной persona vector. Например, если научить модель на числах 666 или 1488, она в целом станет безжалостной. И таких неочевидных корреляций, как оказалось, куча, а без таких аналитических инструментов обнаруживать их почти нереально.

Управлять характером LLM на инференсе. Чтобы вызвать или подавить какую-то черту при генерации, нужно просто к активации h_ℓ на слое ℓ добавить α⋅v_ℓ, где ​v_ℓ – это persona vector. Например, если мы рассматриваем черту "злость", то при положительных α модель генерирует более агрессивные тексты, а при отрицательных – становится зайкой (доказано на Qwen2.5-7B и Llama-3.1-8B).

Управлять самим обучением. Тут немного конринтуитивно, но это работает как вакцина. Чтобы избавиться от нежелательных черт модели, нам нужно, наоборот, проактивно инъецировать их в нее на каждом шаге обучения.

Конкретнее: на каждом шаге прямого прохода при обучении мы добавляем к активациям все то же α⋅v_ℓ, и получается, что градиенты по задаче next-token prediction накапливаются уже с учётом этого смещения; благодаря этому модель не должна самостоятельно перестраивать себя вдоль данного вектора персоны v_ℓ. Такой подход называется Preventative Steering, и это работает (и при этом надежнее, чем просто единоразовое подавление на инференсе).


В общем, в этот раз у Anthropic получилась исключительно интересная и многообещая работа, давненько такого не было. Будем следить, и, конечно, советуем почитать полностью 👇

Блогпост | Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍64
Завтра в 20:00 по Москве ждём GPT5

#OpenAI #GPT5
------
@tsingular
6👍3🔥22🤣1
Jules — ИИ-кодер Google выходит из бета-версии

Jules теперь доступен всем разработчикам после публичного бета-тестирования.

Асинхронный агент работает на Gemini 2.5 Pro и умеет клонировать репозитории, писать тесты, исправлять баги и создавать пулл-реквесты в фоновом режиме.

Основная фишка — полная автономность. Пока вы занимаетесь другими задачами, Jules анализирует весь контекст проекта в изолированных Google Cloud виртуальных машинах.

Интегрируется с GitHub, предоставляет детальные планы задач с обоснованием изменений. Разработчики отмечают рост продуктивности в 3-5 раз для рутинных операций.

В РФ не доступно, нужен VPN.

#Jules #Google #GitHub
------
@tsingular
3👍3
Pixel Photonics получила прорыв в масштабируемых квантовых детекторах света

Стартап Pixel Photonics создал революционные детекторы одиночных фотонов, интегрированные в волноводы. Их WI-SNSPD технология позволяет масштабировать квантовые системы без потери точности.

Компания получила €1 млн финансирования от SPRIND и уже поставила системы для QuiX Quantum и DLR. Новые детекторы работают на сверхпроводящих нанопроводах и легко встраиваются в существующие оптические системы.

Главная фишка — многомодовое детектирование с высокой скоростью и ультраточностью. Это решает главную проблему квантовых компьютеров — шум и нестабильность при масштабировании.

Квантовые детекторы станут обычным делом, как сейчас камеры в телефонах — только будут ловить отдельные фотоны :)

#quantum #photonics #detectors
------
@tsingular
👍3
Контекстная инженерия важнее промптинга в ИИ

Филипп Шмид утверждает: навык будущего в ИИ — не промпт-инженерия, а контекстная инженерия.

Промптинг слишком узок для сложных ИИ-продуктов. Контекстная инженерия создаёт комплексную информационную экосистему для моделей — предоставляет инструменты, данные и контекст в нужный момент.

Langchain про контекст-инженерию

Разница принципиальная: промпт — это формулирвоание и перефразирование текста и он как бы отступает на второй план, а контекст — построение динамической информационной системы вокруг ИИ и правильная его архитектура фундаментально важнее.

#context #engineering #prompting
------
@tsingular
👍7
Google запустил AI First Colab Notebooks в BigQuery и Vertex AI

Google интегрировал ИИ-агентов прямо в Colab блокноты для работы с данными.

Теперь можно просто сказать "проанализируй эти данные" и Data Science Agent сам напишет код, построит графики и найдёт закономерности.

Агенты работают с BigQuery и генерируют код на Python автоматически. Доступны бесплатные GPU и TPU для ускорения вычислений.

Основная фишка — никакой настройки инфраструктуры. Открыл браузер, написал задачу на обычном языке, получил анализ.

Интеграция с Gemini AI позволяет генерировать код и объяснения прямо в процессе работы с данными.

#Google #Colab #BigQuery
------
@tsingular
62🤯1
Media is too big
VIEW IN TELEGRAM
Ночью вышло обновление для Flow: если коротко, то теперь режим Ingredients to Video стоит всего $0.10.

Раньше одна генерация обходилась в $1 и была крайне непредсказуемой. Это отдельный режим Veo, где можно смешать три картинки и задать им «действие». Позже я выпущу подробный материал по этому режиму — в своё время «сжёг» там миллионы.

Теперь о действительно важном. Некоторое время назад Flow реанимировал режим Frames to Video и добавил туда массу обновлений, но так и не объяснил, что именно изменилось. В ролике выше я протестировал две картинки. Первая — абстрактная мультяшная кухня; цель — понять, как Veo распознаёт «объекты» на сложных и нестандартных изображениях. Вторая — обычная «Серая карта», классическая локация из 3D-рендера (чуть ниже объясню, зачем она понадобилась).
Frames to Video: Модель в оковах. Она должна сначала провести титаническую работу по деконструкции вашего изображения (понять объекты, 3D-пространство, стиль), а затем сгенерировать движение, не нарушая ни одного из этих условий. Любое неверное понимание исходной картинки ведет к браку.


Любая генерация имеет себестоимость для компании, и они не могут работать долго в ноль или минус, один вопрос когда модель сама создает локацию и персонажа как в Text to Video, то есть просчитывает с нуля, а совершенно другой вопрос, когда мы ей на вход уже даем готовое изображение и ей нужно понять на изображении кто есть кто, и как с чем можно взаимодействовать. Вот тут уровень сложности невероятно повышается.

Специфика тестирования заключается в том, я подал на вход только изображение локаций, а действие и персонажа создавал через описание. Это было важно чтобы понять какие "ограничения визуального бюджета" есть у Veo, чтобы после прогнозировать что я вообще могу сделать,

Задачей 2 — стала нанесение текстур на стены обычной graybox модели. Выглядит крайне интересно, потому что я не ожидал что у Veo будут проблемы с тем, чтобы раскрасить текстуры.

Эксперимент с серым 3D рендером должен был чисто теоретически элегантно сделать следующее: самый правильный вариант любой видео-генерации это базовый драфтинг локации в 3D, а после его оживление, по себестоимости это получается все равно сильно ниже реальной анимации. Поэтому задумкой было:
1) сделать 3D карту серого локации
2) Раскрасить ее с помощью Frames to Video
3) следующим кадром добавить так же во Frames to Video персонажа и задать ему действие. Таким образом мы смогли бы создать "идеально понятную" для Veo локацию в которой он смог бы не тратить много визуального бюджета на определение границ.


Но тесты провалились, инвалидная коляска для моего алмазного шарика и серые стены для 3D карты серого показали что реальные возможности Frames to Video сильно ограничены и стоит ждать еще множества обновлений чтобы это исправили.

Сегодня в 19:00 я буду приглашенным гостем на канале @vmind_ai1
Если вам интересно изучать Veo дальше приходите, можно будем говорить о Veo.
🔥41
Ollama неожиданно полезла на поляну хостинга моделей.

https://ollama.com/turbo

Пока только для gpt-oss в режиме превью, но уже предлагают такой сценарий, когда их фреймворк, если включить в нем турбо режим, - будет для инференса обращаться к датацентру олламы в Штатах.

Для этого надо получить у них ключ и добавить в вызов.
Документация тут

#ollama #cloud
———
@tsingular
👀42