Архитектурная уязвимость – как создаются и как «думают» нейросети?
Картина мира у нейросетей проявляется в весах и параметрах. Вес – это число с плавающей запятой, которое показывает силу связей в графе, а параметр – это одна ячейка памяти с числом.
Если модель имеет 70 млрд параметров, где каждый параметр занимает 2 байта памяти, соответственно, вес модели – около 140 гигабайт.
Картина мира - это совокупность весов (состояние модели), а архитектура - это алгоритм, который позволяет входным данным взаимодействовать с этими весами для получения результата.
На запрос пользователя «Подбери мне наилучший смартфон» система разбивает предложение на токены, далее на числовые идентификаторы, далее идентификатор, связанный со смартфоном, ассоциируется с начальным вектором этого слова, вшитым в память в момент обучения.
Модель заранее выучила, что вектор «смартфон» должен быть математически близок к вектору «телефон» и далек от вектора «банан».
Теперь вектор слова «смартфон» начинает путешествие через слои нейросети (через 32 или 96 слоев). На каждом слое происходит два главных процесса, где перемножаются веса. Вектор «смартфон» взаимодействует с вектором «наилучшие характеристики», поглощая в себя информацию с вектором, имеющим наибольшую вероятность.
Теперь этот обогащенный вектор идет в блок «памяти». Здесь происходит умножение матрицы на вектор. Каждая колонка матрицы – это детектор какого-то признака.
При умножении на веса активизируются те нейроны, которые связаны с флагманскими моделями в соответствии с запросами.
Теперь «обогащенный» вектор передается в последнюю матрицу (Unembedding Matrix), где в соответствии с конфигурацией «обогащенного» вектора выстраивается иерархия приоритетов для генерации токенов выходного ответа.
В чем уязвимость?
🔘 Веса статичны и никогда не меняются до момента нового цикла предварительного обучения.
🔘 Любая попытка дообучения ломает всю архитектуру модели – система в принципе не обучаемая на уровне архитектуры. Вместо накопления знаний, как у биологических организмов, происходит интерференция и замещение.
🔘 В нейросети знания хранятся в распределенном виде. Факт «Париж — столица Франции» не записан в одном конкретном нейроне. Он «размазан» тонким слоем по миллионам параметров. В модель нельзя ни добавить, ни изъять точечные знания в отличия от обычной СУБД на SQL.
🔘 Чудовищная неэффективность. На вопрос «2*2=?», чтобы сгенерировать всего один токен, вычислительное ядро должно активизировать все параметры в системе, включая квантовую физику, теорию струн и историю Древнего Рима и так каждый раз, создавая несоизмеримую нагрузку на все вычислительные блоки. Сейчас решается через MoE (смесь экспертов).
🔘 Отсутствие долгосрочной памяти и накопления опыта. Биологический мозг обладает синаптической пластичностью: связи меняются прямо в момент мыслительного процесса, у LLM долговременная память отсутствует и никакого накопления опыта не может быть на уровне архитектуры. Каждый раз с чистого листа.
🔘 Проклятие размерности. Когда модель интерполирует (строит векторный путь) от понятия А к понятию Б, этот путь может случайно пролечь через эту «пустоту», где нет обучающих примеров в пространстве 4096 измерений. В этой пустоте поведение модели математически не определено, создавая неизбежные галлюцинации.
🔘 Ошибки обучения – программирование связей между десятками миллиардов параметров практически всегда приводят к ошибкам интерпретации.
🔘 Накопление ошибки точности. Сигнал проходит через десятки и сотни слоев. На каждом слое происходит умножение матриц. Микроскопическая ошибка округления (шум) на 1-м слое, умноженная на веса, может усилиться к 50-му слою и полностью исказить смысл вектора к конечному слою.
🔘 Несовершенство алгоритмов компрессии информации. Десятки и сотни триллионов токенов сжимаются в десятки миллиардов параметров с компрессией 1:1000 и более. Уникальные факты, случайные числа, конкретные даты, цитаты, адреса. Это шум с точки зрения статистики, что приводит к несовершенству интерпретации.
Текущая архитектура LLM крайне уязвима, ресурснозатратна и неэффективна.
Картина мира у нейросетей проявляется в весах и параметрах. Вес – это число с плавающей запятой, которое показывает силу связей в графе, а параметр – это одна ячейка памяти с числом.
Если модель имеет 70 млрд параметров, где каждый параметр занимает 2 байта памяти, соответственно, вес модели – около 140 гигабайт.
Картина мира - это совокупность весов (состояние модели), а архитектура - это алгоритм, который позволяет входным данным взаимодействовать с этими весами для получения результата.
На запрос пользователя «Подбери мне наилучший смартфон» система разбивает предложение на токены, далее на числовые идентификаторы, далее идентификатор, связанный со смартфоном, ассоциируется с начальным вектором этого слова, вшитым в память в момент обучения.
Модель заранее выучила, что вектор «смартфон» должен быть математически близок к вектору «телефон» и далек от вектора «банан».
Теперь вектор слова «смартфон» начинает путешествие через слои нейросети (через 32 или 96 слоев). На каждом слое происходит два главных процесса, где перемножаются веса. Вектор «смартфон» взаимодействует с вектором «наилучшие характеристики», поглощая в себя информацию с вектором, имеющим наибольшую вероятность.
Теперь этот обогащенный вектор идет в блок «памяти». Здесь происходит умножение матрицы на вектор. Каждая колонка матрицы – это детектор какого-то признака.
При умножении на веса активизируются те нейроны, которые связаны с флагманскими моделями в соответствии с запросами.
Теперь «обогащенный» вектор передается в последнюю матрицу (Unembedding Matrix), где в соответствии с конфигурацией «обогащенного» вектора выстраивается иерархия приоритетов для генерации токенов выходного ответа.
В чем уязвимость?
Текущая архитектура LLM крайне уязвима, ресурснозатратна и неэффективна.
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥206👍99🤔65❤55💯17🥱4🐳4🤬3🙏3🤡3🤯2
7 месяцев непрерывного безумия
В ноябре американский рынок закрылся вновь в положительной области – формально всего +0.13% по закрытию месяца и +0.08% по среднемесячным значениям.
Далее буду рассматривать только среднемесячные значения, чтобы учитывать производительность на всем периоде с учетом всех циклов роста и падения, а не только под закрытие месяца.
С мая по ноябрь был завершен седьмой месяц непрерывного, оглушительного и ошеломляющего пампа – средняя производительность 3.29% в месяц по среднемесячным показателям. За всю историю сильнее было только три раза: в 2020 (3.67%), в 2009 (3.65%) и в 1980 (4.02%).
Сам по себе цикл из семи месяцев подряд роста – очень редкий (происходит 1 раз за 13 лет!), такое было в 2017 (с очень низкими темпами в 1.44%), в 2009 (3.65%), 1995 (2.54%), 1980 (4.04%), 1958 (3.13%) и 1954 (2.78%).
Соответственно, рост 7 месяцев с мая по ноябрь с производительностью выше 3.3% был только дважды в истории: в 2009 (восстановление после разгрома кризиса 2008 с обвалом на 55%) и 1980 (восстановление после 10-летия забвения с исключительно низкой базы исторически низких мультипликаторов).
В 2025 не было обвала, если не считать «шутку» в виде незначительной коррекции буквально за три дня (основной обвал был с 3 по 7 апреля за три торговых дня) в феврале-апреле после двух лет «адового пампа» в 2023-2024.
С точки зрения формальной и непредвзятой статистики, за всю историю существования рынка не было аналогичного пампа в относительном сравнении, изначально находясь на высокой базе (в 2009 и 1980 база под рост была низкой). Перед ростом в 2009 и 1980 был затяжной обвал на протяжении многих месяцев (2009) или лет (1980).
За последние 80 лет среднемесячный рост рынка более, чем на 2% был в условиях V-образного роста экономики и/или корпоративных прибылей (взаимосвязанные процессы), и/или при фискальном и монетарном стимулировании (профицит ликвидности), и/или при изначально низкой базе сравнения (после сильного предшествующего обвала).
Сейчас не выполняется ни одно из условий. Экономика, как и корпоративные финансы стагнируют (растут только избранные бигтехи по известным причинам и ранее показывал в цикле статей), избыточная ликвидность опустошена и денежные рынки уже трясет от локальных сквизов дефицита ликвидности (также ранее подробно показывал), а никакого обвала в начале 2025 не было (рост на изначально высокой базе).
В моменте в конце октября 2025 рынок превышал по капитализации 72 трлн vs 49.8 трлн на внутридневном дне 7 апреля, т.е. вздрючили более, чем на 22 трлн в моменте.
Для понимания пропорции. На пике пузыря доткомов вся совокупная капитализация рынка в моменте была около 15 трлн, что дает более 10 трлн (ближе к 11 трлн) за весь цикл роста с конца 1994 (или 5.5 лет).
За 7 месяцев сейчас создали 22 трлн vs менее 11 трлн в пузырь доткомов на протяжении 5.5 лет или в 19 раз (!!!) интенсивнее в расчете на месяц или в годовом выражении.
Да, цены изменились, инфляция и все такое (смотря как считать, от 2000 или от 1995-2000), но в сопоставимом сравнении разрыв на порядок будет.
По всем уровням и слоям мультипликаторов (корпоративные, денежные, макроэкономические, я на протяжении всего 2025 делал исчерпывающие обоснования перекупленности) сейчас перекупленность зашкаливает сильно выше самых агрессивных максимумов пузыря 2000 и 2021.
Интегральная текущая перекупленность рынка по комплексу индикаторов примерно в 1.7 раза относительно базы сравнения 2017-2019 и примерно вдвое от периода низких ставок 2010-2019.
Уровень вздрюченности рынка (собственный индикатор, объединяющий рыночный сентимент, волатильность, все слои мультипликаторов, технический, численный и семантический анализ) в ноябре составил 97 vs исторического максимума на уровне 100 в окт.25 (практический предел – 100), 90 в дек.24, 81 в дек.21 (пик предыдущего пузыря) и всего 72 на пике пузыря доткомов при норме 45 для растущего рынка.
На последней неделе ноября был установлен абсолютный рекорд в истории торгов по пампу с учетом уровня рынка (близости к хаям) и меры перекупленности.
В ноябре американский рынок закрылся вновь в положительной области – формально всего +0.13% по закрытию месяца и +0.08% по среднемесячным значениям.
Далее буду рассматривать только среднемесячные значения, чтобы учитывать производительность на всем периоде с учетом всех циклов роста и падения, а не только под закрытие месяца.
С мая по ноябрь был завершен седьмой месяц непрерывного, оглушительного и ошеломляющего пампа – средняя производительность 3.29% в месяц по среднемесячным показателям. За всю историю сильнее было только три раза: в 2020 (3.67%), в 2009 (3.65%) и в 1980 (4.02%).
Сам по себе цикл из семи месяцев подряд роста – очень редкий (происходит 1 раз за 13 лет!), такое было в 2017 (с очень низкими темпами в 1.44%), в 2009 (3.65%), 1995 (2.54%), 1980 (4.04%), 1958 (3.13%) и 1954 (2.78%).
Соответственно, рост 7 месяцев с мая по ноябрь с производительностью выше 3.3% был только дважды в истории: в 2009 (восстановление после разгрома кризиса 2008 с обвалом на 55%) и 1980 (восстановление после 10-летия забвения с исключительно низкой базы исторически низких мультипликаторов).
В 2025 не было обвала, если не считать «шутку» в виде незначительной коррекции буквально за три дня (основной обвал был с 3 по 7 апреля за три торговых дня) в феврале-апреле после двух лет «адового пампа» в 2023-2024.
С точки зрения формальной и непредвзятой статистики, за всю историю существования рынка не было аналогичного пампа в относительном сравнении, изначально находясь на высокой базе (в 2009 и 1980 база под рост была низкой). Перед ростом в 2009 и 1980 был затяжной обвал на протяжении многих месяцев (2009) или лет (1980).
За последние 80 лет среднемесячный рост рынка более, чем на 2% был в условиях V-образного роста экономики и/или корпоративных прибылей (взаимосвязанные процессы), и/или при фискальном и монетарном стимулировании (профицит ликвидности), и/или при изначально низкой базе сравнения (после сильного предшествующего обвала).
Сейчас не выполняется ни одно из условий. Экономика, как и корпоративные финансы стагнируют (растут только избранные бигтехи по известным причинам и ранее показывал в цикле статей), избыточная ликвидность опустошена и денежные рынки уже трясет от локальных сквизов дефицита ликвидности (также ранее подробно показывал), а никакого обвала в начале 2025 не было (рост на изначально высокой базе).
В моменте в конце октября 2025 рынок превышал по капитализации 72 трлн vs 49.8 трлн на внутридневном дне 7 апреля, т.е. вздрючили более, чем на 22 трлн в моменте.
Для понимания пропорции. На пике пузыря доткомов вся совокупная капитализация рынка в моменте была около 15 трлн, что дает более 10 трлн (ближе к 11 трлн) за весь цикл роста с конца 1994 (или 5.5 лет).
За 7 месяцев сейчас создали 22 трлн vs менее 11 трлн в пузырь доткомов на протяжении 5.5 лет или в 19 раз (!!!) интенсивнее в расчете на месяц или в годовом выражении.
Да, цены изменились, инфляция и все такое (смотря как считать, от 2000 или от 1995-2000), но в сопоставимом сравнении разрыв на порядок будет.
По всем уровням и слоям мультипликаторов (корпоративные, денежные, макроэкономические, я на протяжении всего 2025 делал исчерпывающие обоснования перекупленности) сейчас перекупленность зашкаливает сильно выше самых агрессивных максимумов пузыря 2000 и 2021.
Интегральная текущая перекупленность рынка по комплексу индикаторов примерно в 1.7 раза относительно базы сравнения 2017-2019 и примерно вдвое от периода низких ставок 2010-2019.
Уровень вздрюченности рынка (собственный индикатор, объединяющий рыночный сентимент, волатильность, все слои мультипликаторов, технический, численный и семантический анализ) в ноябре составил 97 vs исторического максимума на уровне 100 в окт.25 (практический предел – 100), 90 в дек.24, 81 в дек.21 (пик предыдущего пузыря) и всего 72 на пике пузыря доткомов при норме 45 для растущего рынка.
На последней неделе ноября был установлен абсолютный рекорд в истории торгов по пампу с учетом уровня рынка (близости к хаям) и меры перекупленности.
3👍199❤48🤔29😁21🔥17💯11🥱9🙏6🤬2🤡2🤣1
❗️СРОЧНЫЙ НАБОР НА ОБУЧЕНИЕ ТРЕЙДИНГУ НА БИРЖЕ
Можно годами наращивать капитал на вкладах или долгосрочных инвестициях, чтобы через 10–15 лет цифры на счёте хоть как-то приумножились.
А можно изучить правила биржевой торговли и заработать 50-100 тысяч в уже в этом месяце
И не важно, падает рынок или растет.
Диана Маркина - трейдер и инвестор с 8-летним опытом только за 2024 год заработала более 3,5 млн ₽ на бирже, а сейчас делится своей системой абсолютно бесплатно.
И это не про везение или удачу.
Это про системную работу с чёткими правилами, где можно начать даже с 5 000 рублей и постепенно наращивать капитал.
Лучше о ней расскажут результаты её учеников:
Виталий А. заработал 177.000₽ за 2 недели к вложенным 🚀
Галина С. за 3 месяца активной торговли увеличила свой депозит с 321 344р до 748960р на сделках по газу.
Мария В. с депозита 100.000₽ заработала 34.000₽ чистыми за неделю.
За 2 дня на её бесплатном обучении вы получите:
— пошаговый алгоритм открытия и закрытия сделки
— на что смотреть и как анализировать графики, рынки.
— как оценивать и контролировать риски
— как справляться с собственными эмоциями во время торговли.
ВСЁ ЧЁТКО, ПОНЯТНО И БЕЗ ЛИШНЕЙ ВОДЫ
И самое главное - вас ждет практика на уникальном тренажере, где можно отточить навыки торговли и протестировать свою стратегию на реальных сделках, не потратив при этом ни рубля
Мест всего 14, поэтому возьмут не всех
➡️Успейте записаться бесплатно
Можно годами наращивать капитал на вкладах или долгосрочных инвестициях, чтобы через 10–15 лет цифры на счёте хоть как-то приумножились.
А можно изучить правила биржевой торговли и заработать 50-100 тысяч в уже в этом месяце
И не важно, падает рынок или растет.
Диана Маркина - трейдер и инвестор с 8-летним опытом только за 2024 год заработала более 3,5 млн ₽ на бирже, а сейчас делится своей системой абсолютно бесплатно.
И это не про везение или удачу.
Это про системную работу с чёткими правилами, где можно начать даже с 5 000 рублей и постепенно наращивать капитал.
Лучше о ней расскажут результаты её учеников:
Виталий А. заработал 177.000₽ за 2 недели к вложенным 🚀
Галина С. за 3 месяца активной торговли увеличила свой депозит с 321 344р до 748960р на сделках по газу.
Мария В. с депозита 100.000₽ заработала 34.000₽ чистыми за неделю.
За 2 дня на её бесплатном обучении вы получите:
— пошаговый алгоритм открытия и закрытия сделки
— на что смотреть и как анализировать графики, рынки.
— как оценивать и контролировать риски
— как справляться с собственными эмоциями во время торговли.
ВСЁ ЧЁТКО, ПОНЯТНО И БЕЗ ЛИШНЕЙ ВОДЫ
И самое главное - вас ждет практика на уникальном тренажере, где можно отточить навыки торговли и протестировать свою стратегию на реальных сделках, не потратив при этом ни рубля
Мест всего 14, поэтому возьмут не всех
➡️Успейте записаться бесплатно
1🤡170👍64🤣25🤬11❤6👎5🔥2🤔2😁1😢1🥱1
Война на истощение - на кого поставить в битве ИИ?
Если среди американских производителей, я бы поставил на Google и объясню почему.
▪️ Ресурсы определяют долгосрочную устойчивость – Google имеет колоссальный операционный денежный поток в 150 млрд долларов в год, который может без потери стратегической устойчивости отгружать в «плантации ИИ фабрик», чего не может себе позволить OpenAI, Anthropic и xAI, сидящие на подсосе у венчурных инвесторов.
▪️ Мощнейшая инженерная школа DeepMind (практически все ведущие ученые в LLM являются выходцами из DeepMind). Работают медленнее и менее рисково, чем стартапы, но зато системно и последовательно.
▪️ Общемировая корпоративная и потребительская клиентская база в несколько миллиардов уникальных пользователей, удерживая через развитую сеть цифровых сервисов Google на всех уровнях (от развлекательных, поисковых, навигационных до бизнес сервисов) и слоях, платформах (мобильные, web, PC, серверные и IDE среды).
▪️ Full-stack платформа: собственное железо, которое выкупает само у себя по себестоимости (Google производит TPU Trillium / v6e) + имеет развитые облачные технологии Google Cloud Platform (GCP) + среда разработки Vertex AI и Google AI Studio с развитыми библиотеками и фреймфорками (Project IDX, Kotlin, Firebase Genkit и т.д.) + уникальный поисковый движок Google Search, платформу Youtube для сбора данных, дата-сетов и медиа трендов.
▪️ Индустриальный стандарт в WEB технологиях: архитектура Chromium, на котором базируются все современные веб браузеры и сам браузер Chrome с доминирующей рыночной долей, позволяющий отслеживать пользовательские предпочтения, вкусы, запросы и тренды во всех странах, всех возрастов и социальных групп (феноменальный дата сет).
▪️ Корпус данных и индексируемый набор данных последние 20 лет. Сейчас ни одна компания в мире не имеет настолько емкого и обширного доступа к текстовому и медиа контенту, как Google. Пока OpenAI третируют по судам из-за нелицензированного использованных данных многих веб-изданий, Google уже давно проиндексировали практически ВЕСЬ интернет и успешно кэшировали данные.
Практически все, что когда-либо было передано или написано в публичном пространстве – уже знает Google и хранит на специальных серверах. Теперь задача правильно все эти данные извлечь и разместить.
Эти уникальные характеристики и ресурсное обеспечение позволит Google доминировать (финансы, инженеры, платформа, датасеты, общемировая клиентская база и сквозная интеграция ИИ сервисов), здесь любой компании сложно перехватить лидерство.
Данные особо важны.
Gemini 3 обучалась, по моим оценкам (на основе данных обучения предыдущих моделей и аппроксимации с учетом расширенной мультимодальности), на 50-70 трлн токенов данных (большая часть видео-контент, где у Google абсолютное преимущество за счет Youtube) или почти 230 Терабайт чистого текста.
Какое количество качественных данных обучили в Gemini 3 – неизвестно, но сейчас вся мировая емкость интернета оценивается в следующей пропорции:
• Научная, техническая и специализированная литература всех дисциплин – 2 трлн токенов
• Научные статьи всех специальностей – 0.7 трлн токенов
• Мировая художественная литература всех жанров и времен – 3 трлн токенов
• Образовательная литература, методички – 1 трлн токенов
• Прочая литература, в том числе развлекательных – 3.5 трлн токенов среди относительно качественных
• Энциклопедии, справочники – 0.2 трлн токенов
• Код (в основном GitHub, StackOverflow с учетом техдокументации) – 2 трлн токенов среди относительно качественного кода
• Патенты, техническая документация, стандарты, законы – 2-2.5 трлн токенов.
Относительно качественный пласт данных оценивается около 15 трлн токенов за всю историю человечества, где качественных данных и источников не более 5-10%.
Цифровые новости, блоги и аналитические статьи около 40-45 трлн токенов, плюс еще 200-220 трлн емкость мировых соцсетей в публичной части, большая часть (свыше 99.8%) из которых скам, срач, копипасты, репосты, SEO-мусор.
Все это без медиа контента (графика, аудио, видео), только текст.
Если среди американских производителей, я бы поставил на Google и объясню почему.
▪️ Ресурсы определяют долгосрочную устойчивость – Google имеет колоссальный операционный денежный поток в 150 млрд долларов в год, который может без потери стратегической устойчивости отгружать в «плантации ИИ фабрик», чего не может себе позволить OpenAI, Anthropic и xAI, сидящие на подсосе у венчурных инвесторов.
▪️ Мощнейшая инженерная школа DeepMind (практически все ведущие ученые в LLM являются выходцами из DeepMind). Работают медленнее и менее рисково, чем стартапы, но зато системно и последовательно.
▪️ Общемировая корпоративная и потребительская клиентская база в несколько миллиардов уникальных пользователей, удерживая через развитую сеть цифровых сервисов Google на всех уровнях (от развлекательных, поисковых, навигационных до бизнес сервисов) и слоях, платформах (мобильные, web, PC, серверные и IDE среды).
▪️ Full-stack платформа: собственное железо, которое выкупает само у себя по себестоимости (Google производит TPU Trillium / v6e) + имеет развитые облачные технологии Google Cloud Platform (GCP) + среда разработки Vertex AI и Google AI Studio с развитыми библиотеками и фреймфорками (Project IDX, Kotlin, Firebase Genkit и т.д.) + уникальный поисковый движок Google Search, платформу Youtube для сбора данных, дата-сетов и медиа трендов.
▪️ Индустриальный стандарт в WEB технологиях: архитектура Chromium, на котором базируются все современные веб браузеры и сам браузер Chrome с доминирующей рыночной долей, позволяющий отслеживать пользовательские предпочтения, вкусы, запросы и тренды во всех странах, всех возрастов и социальных групп (феноменальный дата сет).
▪️ Корпус данных и индексируемый набор данных последние 20 лет. Сейчас ни одна компания в мире не имеет настолько емкого и обширного доступа к текстовому и медиа контенту, как Google. Пока OpenAI третируют по судам из-за нелицензированного использованных данных многих веб-изданий, Google уже давно проиндексировали практически ВЕСЬ интернет и успешно кэшировали данные.
Практически все, что когда-либо было передано или написано в публичном пространстве – уже знает Google и хранит на специальных серверах. Теперь задача правильно все эти данные извлечь и разместить.
Эти уникальные характеристики и ресурсное обеспечение позволит Google доминировать (финансы, инженеры, платформа, датасеты, общемировая клиентская база и сквозная интеграция ИИ сервисов), здесь любой компании сложно перехватить лидерство.
Данные особо важны.
Gemini 3 обучалась, по моим оценкам (на основе данных обучения предыдущих моделей и аппроксимации с учетом расширенной мультимодальности), на 50-70 трлн токенов данных (большая часть видео-контент, где у Google абсолютное преимущество за счет Youtube) или почти 230 Терабайт чистого текста.
Какое количество качественных данных обучили в Gemini 3 – неизвестно, но сейчас вся мировая емкость интернета оценивается в следующей пропорции:
• Научная, техническая и специализированная литература всех дисциплин – 2 трлн токенов
• Научные статьи всех специальностей – 0.7 трлн токенов
• Мировая художественная литература всех жанров и времен – 3 трлн токенов
• Образовательная литература, методички – 1 трлн токенов
• Прочая литература, в том числе развлекательных – 3.5 трлн токенов среди относительно качественных
• Энциклопедии, справочники – 0.2 трлн токенов
• Код (в основном GitHub, StackOverflow с учетом техдокументации) – 2 трлн токенов среди относительно качественного кода
• Патенты, техническая документация, стандарты, законы – 2-2.5 трлн токенов.
Относительно качественный пласт данных оценивается около 15 трлн токенов за всю историю человечества, где качественных данных и источников не более 5-10%.
Цифровые новости, блоги и аналитические статьи около 40-45 трлн токенов, плюс еще 200-220 трлн емкость мировых соцсетей в публичной части, большая часть (свыше 99.8%) из которых скам, срач, копипасты, репосты, SEO-мусор.
Все это без медиа контента (графика, аудио, видео), только текст.
3👍179🤔67❤45💯22🔥17🤯5👏3🥱3🐳3😱2🤬2
Понимание сильных и слабых сторон LLMs позволит не только использовать их более эффективно в личных и бизнес проектах, но и понимать уязвимость невероятного пузыря, не имеющего аналогов в истории человечества (около 52 избыточной мировой капитализации на ИИ хайпе и до 0.5 трлн инвестиций в год от мировых компаний в реальной экономике).
Оглушительный хайп вокруг ИИ во многом связан с попыткой проекцией сверхъестественных свойств, но эти LLMs имеют массу ограничений. Я выпустил очень много материалов, но даже в них рассмотрел лишь часть.
Начну с самого важного и принципиального.
▪️Фундаментальная неспособность к инновациям. Любая инновация (новая идея, альтернативная гипотеза, концептуальный или технологический прорыв) - это статистическая аномалия (выброс), а архитектура LLM в своем ядре заточена эти выбросы сглаживать и/или игнорировать (зависит от пресетов и настроек моделей).
LLM обучается минимизировать ошибку (Loss Function) на огромном массиве данных, она математически штрафуется за любые отклонения от «нормального» распределения. Веса модели - это усредненный слепок коллективного разума (и глупости).
LLM архитектурно не способна к инновациям, это семантический блендер. Если в обучающие данные положить стейк (научные факты), торт (художественную литературу) и гнилые овощи (форумный спам, интернет дебаты), на выходе вы получите однородную, легко усваиваемую питательную массу без вкуса и текстуры. В этом важно то, что выделить обратно стейк невозможно, из этого следует …
▪️Качество данных определяет все. Это не архитектурный баг, а обучающее несовершенство. В своей основе LLM выстраивают вектор распределения на статической интерполяции, где наиболее часто встречающиеся семантические конструкции имеют больший вес. Другими словами, чем чаше в обучении встречается некоторое утверждение, тем оно более истинное для LLMs (архитектурная уязвимость), но в обучении эксабайты медиа срачей и скама (обучающее несовершенство) всегда будут доминировать над очень ограниченной выборкой качественной научной, технической или художественной литературой.
Для решения этой проблемы есть множество механизмов, но они хороши в теории, а не на практике.
🔘 Data Up-sampling, когда в корпусе данных датасеты делятся на домены (энциклопедии, научная литература, база кода, интернет статьи, форумный троллинг и т.д), где приоритет отдают качественным публикациям и надежным источникам.
Это хорошо в теории, на практике нет надежных механизмов сепарации эксабайт (в 1 миллион раз больше, чем терабайт), в итоге происходит смешение данных и доминирование токсичной информации, которой на многие порядки выше, чем качественной.
🔘 Фильтрация на основе классификаторов с автоматической классификацией через специально натреннированную нейросеть (модель-цензор) для отсеивания откровенного скама, но не существует механизмов отсечения семантически качественных материалов, но концептуально пустых (здесь должен быть человек – эксперт, но на практике весь отбор данных почти полностью автоматический).
🔘 Дедупликация – когда через специальные алгоритмы сжимаются миллионы репостов одного и того же скама в единичный экземпляр для устранения переполнения стэка данных дубликатами. Если этого не делать, уникальная научная статья будет иметь нулевой вес в сравнении с эксабайтами медиа скама.
Теория от практики отличается. Нет надежного механизма агрегации и сепарации качественных источников от некачественных, когда речь идет об обработке сотен эксабайт данных.
Как решение, брать за основу архитектуру модели с небольшим количеством параметров на 8-10 млрд и целенаправленно обучать на специализированных доменах (например, медицина, химия, физика, программирование и т.д.). На выходе получится скорее очень сухое, скучное справочное бюро без возможности междисциплинарного взаимодействия и полноценного размышления.
Универсальные модели (в открытом доступе) страдают «заражением» токсичными данными и искаженной «картиной мира» не только из-за ошибок развесовки и несовершенства алгоритма, но и по причине ошибочной сепарации данных и изначально некачественных источников.
Оглушительный хайп вокруг ИИ во многом связан с попыткой проекцией сверхъестественных свойств, но эти LLMs имеют массу ограничений. Я выпустил очень много материалов, но даже в них рассмотрел лишь часть.
Начну с самого важного и принципиального.
▪️Фундаментальная неспособность к инновациям. Любая инновация (новая идея, альтернативная гипотеза, концептуальный или технологический прорыв) - это статистическая аномалия (выброс), а архитектура LLM в своем ядре заточена эти выбросы сглаживать и/или игнорировать (зависит от пресетов и настроек моделей).
LLM обучается минимизировать ошибку (Loss Function) на огромном массиве данных, она математически штрафуется за любые отклонения от «нормального» распределения. Веса модели - это усредненный слепок коллективного разума (и глупости).
LLM архитектурно не способна к инновациям, это семантический блендер. Если в обучающие данные положить стейк (научные факты), торт (художественную литературу) и гнилые овощи (форумный спам, интернет дебаты), на выходе вы получите однородную, легко усваиваемую питательную массу без вкуса и текстуры. В этом важно то, что выделить обратно стейк невозможно, из этого следует …
▪️Качество данных определяет все. Это не архитектурный баг, а обучающее несовершенство. В своей основе LLM выстраивают вектор распределения на статической интерполяции, где наиболее часто встречающиеся семантические конструкции имеют больший вес. Другими словами, чем чаше в обучении встречается некоторое утверждение, тем оно более истинное для LLMs (архитектурная уязвимость), но в обучении эксабайты медиа срачей и скама (обучающее несовершенство) всегда будут доминировать над очень ограниченной выборкой качественной научной, технической или художественной литературой.
Для решения этой проблемы есть множество механизмов, но они хороши в теории, а не на практике.
Это хорошо в теории, на практике нет надежных механизмов сепарации эксабайт (в 1 миллион раз больше, чем терабайт), в итоге происходит смешение данных и доминирование токсичной информации, которой на многие порядки выше, чем качественной.
Теория от практики отличается. Нет надежного механизма агрегации и сепарации качественных источников от некачественных, когда речь идет об обработке сотен эксабайт данных.
Как решение, брать за основу архитектуру модели с небольшим количеством параметров на 8-10 млрд и целенаправленно обучать на специализированных доменах (например, медицина, химия, физика, программирование и т.д.). На выходе получится скорее очень сухое, скучное справочное бюро без возможности междисциплинарного взаимодействия и полноценного размышления.
Универсальные модели (в открытом доступе) страдают «заражением» токсичными данными и искаженной «картиной мира» не только из-за ошибок развесовки и несовершенства алгоритма, но и по причине ошибочной сепарации данных и изначально некачественных источников.
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍193🤔49❤38💯37🔥6👌5👏4🤡3👎2🤬1🥱1
Про абсурдный курс рубля. Что следует понимать в оценке устойчивости рубля?
Сейчас динамика рубля похожа на «шизофренический марафон» в тотальном отрыве от фундаментальных диспропорций и композиции факторов риска.
С точки зрения стандартной макроэкономической логики, не существует обоснования текущим уровням по рублю – все это похоже на «шутку, розыгрыш».
Однако, мы сейчас живем в особой реальности агрессивных схематозов и отхода от рыночного ценообразования.
Оценивая валютный рынок, необходимо понимать, что:
- Больше нет привычного валютного рынка, т.к. значительная часть оборота является «теневой» на внебиржевом рынке с середины 2024, где затруднительно оперативно оценивать валютные балансы и диспропорции.
- Все типичные макромодели сломаны или даже уничтожены после нарушения естественного трансграничного денежного потока внутренних и внешних контрагентов с 2022 года.
- Большая часть финансовой статистики засекречена или сильно ограничена, а финансовый сектор в РФ является основным провайдером валютной ликвидности.
- Логика циркуляции валютных потоков нарушена после введения санкций и инфраструктурных рисков.
- Существенная часть спроса на валюту в рамках валютного хэджирования абсорбируется в квазивалютных инструментах (заменяющие облигации, золото), расчеты за которые происходят в рублях с привязкой к валютному ценообразованию.
- Не совсем понятен административный фактор (есть ли он?) курсообразования в условиях закрытого рынка, вынесенного на внебиржевой контур.
- Лаги распределения валютной выручки, которые динамически меняются. Не исключено, что части экспортной выручки просто не существует (аккумулируется в дебиторке).
- Лаги распределения валютных расчетов по импорту. Валюта, купленная на бирже или внебирже, «зависает» на корсчетах или возвращается. Это создает временный, но устойчивый профицит валютной ликвидности внутри контура, - валюта есть, а потратить её (вывести под импорт) сложно. Это давит на курс в сторону укрепления рубля, даже при плохом торговом балансе.
- Вероятные теневые схематозы с бартером и квазибартером.
Короче, все что сейчас происходит к рынку и «стандартным» экономическим законам отношения не имеет.
В расчетах устойчивости рубля необходимо оценить долгосрочный баланс спроса и предложения валюты.
Откуда формируется устойчивое предложение валюты в условиях внешней блокады и санкционных ограничений?
Приток валюты экспортеров (в среднем $6-7 млрд в месяц, что вдвое ниже середины 2024 и на треть ниже допустимой нормы) и операции Банка России на валютном рынке (сейчас в среднем $1.5 млрд в месяц, но с начала 2026 будет меньше) и это все.
Агрегированное предложение около $8 млрд в месяц, которое будет стремиться к $5-6 млрд (в 2.5-3 раза меньше, чем в 2024) на фоне ухудшения экспортного потока (низкие цены на нефть и газ + расширяющиеся дисконты + нестабильные поставки + удары по инфраструктуре + динамические запреты на экспорт нефтепродуктов + усиление санкций + трудности с репатриацией валютной выручки) и на фоне исчерпания ликвидной части ФНБ.
Внешних каналов фондирования нет и не предвидится.
При этом денежная масса раскачалась вдвое (значительная часть связана на срочных счетах, но пропорция будет увеличиваться в пользу текущих счетов при смягчении ДКП), доходы раскачались где то на 70% за 4 года, тогда как предложение товаров и услуг в гражданской экономике осталось на уровне 2021 или даже снизилось (весь рост экономики за счет ВПК и связанных с государством отраслей, как, например строительство).
Спрос на валюту интегрально сдерживается изменением структуры расчетов по импорту, санкциями и инфраструктурными рисками, но стратегический перекос экстремально в пользу спроса на валюту, т.е. резкой переоценки рубля.
Рубль вообще нечем сдерживать, исторически где-то 25-30% от денежном массы (в $) требовалось для агрегации предложения валюты за год, что при текущей М2 свыше $1.5 трлн – это $30 млрд в месяц предложения валюты (до санкций).
Любой сдвиг с точки зрения накопления валютной позиции и на тонком рынке сразу теряется равновесие, поэтому в крепкий рубль не верю.
Сейчас динамика рубля похожа на «шизофренический марафон» в тотальном отрыве от фундаментальных диспропорций и композиции факторов риска.
С точки зрения стандартной макроэкономической логики, не существует обоснования текущим уровням по рублю – все это похоже на «шутку, розыгрыш».
Однако, мы сейчас живем в особой реальности агрессивных схематозов и отхода от рыночного ценообразования.
Оценивая валютный рынок, необходимо понимать, что:
- Больше нет привычного валютного рынка, т.к. значительная часть оборота является «теневой» на внебиржевом рынке с середины 2024, где затруднительно оперативно оценивать валютные балансы и диспропорции.
- Все типичные макромодели сломаны или даже уничтожены после нарушения естественного трансграничного денежного потока внутренних и внешних контрагентов с 2022 года.
- Большая часть финансовой статистики засекречена или сильно ограничена, а финансовый сектор в РФ является основным провайдером валютной ликвидности.
- Логика циркуляции валютных потоков нарушена после введения санкций и инфраструктурных рисков.
- Существенная часть спроса на валюту в рамках валютного хэджирования абсорбируется в квазивалютных инструментах (заменяющие облигации, золото), расчеты за которые происходят в рублях с привязкой к валютному ценообразованию.
- Не совсем понятен административный фактор (есть ли он?) курсообразования в условиях закрытого рынка, вынесенного на внебиржевой контур.
- Лаги распределения валютной выручки, которые динамически меняются. Не исключено, что части экспортной выручки просто не существует (аккумулируется в дебиторке).
- Лаги распределения валютных расчетов по импорту. Валюта, купленная на бирже или внебирже, «зависает» на корсчетах или возвращается. Это создает временный, но устойчивый профицит валютной ликвидности внутри контура, - валюта есть, а потратить её (вывести под импорт) сложно. Это давит на курс в сторону укрепления рубля, даже при плохом торговом балансе.
- Вероятные теневые схематозы с бартером и квазибартером.
Короче, все что сейчас происходит к рынку и «стандартным» экономическим законам отношения не имеет.
В расчетах устойчивости рубля необходимо оценить долгосрочный баланс спроса и предложения валюты.
Откуда формируется устойчивое предложение валюты в условиях внешней блокады и санкционных ограничений?
Приток валюты экспортеров (в среднем $6-7 млрд в месяц, что вдвое ниже середины 2024 и на треть ниже допустимой нормы) и операции Банка России на валютном рынке (сейчас в среднем $1.5 млрд в месяц, но с начала 2026 будет меньше) и это все.
Агрегированное предложение около $8 млрд в месяц, которое будет стремиться к $5-6 млрд (в 2.5-3 раза меньше, чем в 2024) на фоне ухудшения экспортного потока (низкие цены на нефть и газ + расширяющиеся дисконты + нестабильные поставки + удары по инфраструктуре + динамические запреты на экспорт нефтепродуктов + усиление санкций + трудности с репатриацией валютной выручки) и на фоне исчерпания ликвидной части ФНБ.
Внешних каналов фондирования нет и не предвидится.
При этом денежная масса раскачалась вдвое (значительная часть связана на срочных счетах, но пропорция будет увеличиваться в пользу текущих счетов при смягчении ДКП), доходы раскачались где то на 70% за 4 года, тогда как предложение товаров и услуг в гражданской экономике осталось на уровне 2021 или даже снизилось (весь рост экономики за счет ВПК и связанных с государством отраслей, как, например строительство).
Спрос на валюту интегрально сдерживается изменением структуры расчетов по импорту, санкциями и инфраструктурными рисками, но стратегический перекос экстремально в пользу спроса на валюту, т.е. резкой переоценки рубля.
Рубль вообще нечем сдерживать, исторически где-то 25-30% от денежном массы (в $) требовалось для агрегации предложения валюты за год, что при текущей М2 свыше $1.5 трлн – это $30 млрд в месяц предложения валюты (до санкций).
Любой сдвиг с точки зрения накопления валютной позиции и на тонком рынке сразу теряется равновесие, поэтому в крепкий рубль не верю.
Telegram
Spydell_finance
Где долгосрочная точка равновесия по рублю?
Действительно, очень много гипотез генерировалось аналитическим сообществом в России относительно аномальной устойчивости рубля, но ни одна гипотеза не является «жизнеспособной».
• Ослабление доллара по индексу…
Действительно, очень много гипотез генерировалось аналитическим сообществом в России относительно аномальной устойчивости рубля, но ни одна гипотеза не является «жизнеспособной».
• Ослабление доллара по индексу…
4❤165💯116👍95🤔81🤡34👎11🙏10😱8😁7🔥5🤬3
Как улучшить аналитические навыки и получать максимум возможности на рынке труда?
Типичный пример успеха: финансовый менеджер работал в энергетической компании. Зарплата средняя, рост — только через повышение, которого можно ждать годами. Решил прокачать аналитику данных.
Через несколько месяцев обучения начал по-другому презентовать отчёты руководству. Вместо таблиц в Excel — интерактивные дашборды. Вместо предположений — чёткие выводы на данных. Заметили быстро. Сначала доплата за новый функционал, потом — новая позиция с удвоенной зарплатой.
Почему аналитика меняет правила игры:
Вы уже принимаете решения через цифры. Но делаете это интуитивно, без системы. Курс "Аналитик ПРО" от кейс-школы аналитики Changellenge >> Education даёт структуру и инструменты, которые ценят работодатели. Выпускники школы в alumni-сообществе постоянно делятся кейсами повышений, а также находят новые офферы.
Что конкретно дает курс:
• SQL, Python, BI и не только — 11 hard skills, за которые доплачивают
• Реальные кейсы от компаний уровня Сбера, Яндекса, Т-банка — не теория, а практика для резюме
• Защита решений перед экспертами — прокачка презентации
Онлайн, 8-10 часов в неделю. Подходит работающим специалистам.
Финансовая логика
Джуны-аналитики получают от 80 000 ₽. С вашим опытом — выше. Инвестиция в обучение окупается за 2-3 месяца. Есть рассрочка.
Детали → https://clck.ru/3QdyX7
Промокод →
Типичный пример успеха: финансовый менеджер работал в энергетической компании. Зарплата средняя, рост — только через повышение, которого можно ждать годами. Решил прокачать аналитику данных.
Через несколько месяцев обучения начал по-другому презентовать отчёты руководству. Вместо таблиц в Excel — интерактивные дашборды. Вместо предположений — чёткие выводы на данных. Заметили быстро. Сначала доплата за новый функционал, потом — новая позиция с удвоенной зарплатой.
Почему аналитика меняет правила игры:
Вы уже принимаете решения через цифры. Но делаете это интуитивно, без системы. Курс "Аналитик ПРО" от кейс-школы аналитики Changellenge >> Education даёт структуру и инструменты, которые ценят работодатели. Выпускники школы в alumni-сообществе постоянно делятся кейсами повышений, а также находят новые офферы.
Что конкретно дает курс:
• SQL, Python, BI и не только — 11 hard skills, за которые доплачивают
• Реальные кейсы от компаний уровня Сбера, Яндекса, Т-банка — не теория, а практика для резюме
• Защита решений перед экспертами — прокачка презентации
Онлайн, 8-10 часов в неделю. Подходит работающим специалистам.
Финансовая логика
Джуны-аналитики получают от 80 000 ₽. С вашим опытом — выше. Инвестиция в обучение окупается за 2-3 месяца. Есть рассрочка.
Детали → https://clck.ru/3QdyX7
Промокод →
SPYDELL20261🤡56👍23❤13🤣6👎3🔥3😁1🤬1
Направления бизнес применения LLMs
Сразу к ключевому моменту – нет никаких ожиданий ускорения технологического прогресса с использованием LLMs, главным образом по причине, что на уровне архитектуры LLMs вшит «антипрогресс», т.е. фундаментальная невозможность генерации новых смыслов, идей и концепций.
Способствовать ускорению прогресса, как инструмент, в условиях работы с грамотной командой инженеров? Да, но этих инструментов много и произвести декомпозицию вклада каждого из инструмента – весьма сложно.
Несмотря на кажущиеся всемогучесть и безграничное количество сфер применения, эффективные контуры у LLMs достаточно локализованы.
Попробую дать емкое определение… В своей основе, LLM – это механизм компрессии (сжатия), причем всегда с потерями и декомпрессии (генерации), причем всегда с галлюцинациями, неструктурированных массивов данных, выстраивая градиент векторов в соответствии со статистикой распределения паттернов.
Так значит, где применение наиболее эффективно?
🔘 Когда необходимо оценить вектор смысловых конструкций, не сильно вдаваясь в детали.
- краткое резюме встреч, конференций, семинаров, лекций, судебных заседаний;
- краткий пересказ книг, отчетов, статей, инструкций, законов, патентов, документации и т.д;
- обобщение больших массивов данных, например, поиск нарративов в новостях, аналитических и научных статьях, корпоративных отчетах и любой другой неструктурированной, но близкой по смыслу структуре данных;
- обобщение заявок в книге жалоб, обращений и в отзывах клиентов, где можно сразу определить фокусировку жалоб, сильные и слабые стороны продукта или услуги.
🔘 Сравнительный анализ текста, например, сравнение текста регламента/закона с текстом внутренней инструкции компании на предмет противоречий. Чем эта версия договора отличается от предыдущей? Подсвети риски, которые появились и похожие сценарии.
🔘 Стилистическая трансформация (или «перепиши текст в другом стиле»). Упрощение юридических формулировок, условий страхования или банковских договоров для обычных клиентов (простыми словами) или наоборот, превращение тезис в юридический документ, жалобу в официальные органы или техническое задание. Здесь же адаптация контента под разную аудиторию (возраст, профессия, когнитивная глубина).
🔘 Реструктуризация текста (Entity Extraction). Выделение из стенограммы совещания конкретных договоренностей: кто, что должен сделать, к какому сроку или выделение из скан копий договоров детализацию реквизитов для формирования другой докумнтации.
🔘 Креативная генерация – как принудительное создание пространства решения, например, генерация вариантов заголовков для статьи или слогана для рекламной кампании.
🔘 Мозговой штурм – из этой же серии, но более иерархическая и структурная генерация смыслов по схожим паттернам и направлениям, чтобы выйти из когнитивного тупика, зашоренности, посмотреть на проблему, задачу шире.
🔘 Автоматическая разметка данных и тэгетирование: установка классификаторов и тэгов по смежным группам, например кошек, собак, хомяков объединить в группу «животные», а кирпич, песок и бетон в группу «стройматериалы».
🔘 Кластеризация и сортировка документации по сценариям: автоматическая группировка документации различного типа по сценариям. Например, договора с азиатскими клиентами на 1кв26 с суммой выше 10 млн выделить в тот кластер и т.д.
🔘 Автоматическая разметка тональности контента и намерений (Sentiment & Intent Analysis): по инструкциям можно делать маркировку степени депрессивности или оптимистичности контента на основе формулировок и частоты упоминания определенных семантических конструкций. Эмоция – это очень формализованный паттерн, где можно поймать
🔘 Извлечение сущностей и атрибутов: компании, лица, суммы, даты, юрисдикции, продукты и т.д. в зависимости от структуры данных и типа задачи.
🔘 Классификация и группировка: автоматическая разметка обращений/новостей/документов по темам, продуктам, регионам, типам риска.
🔘 Нормализация формулировок: приведение разнородных описаний к единому словарю (например, причины жалоб, типы инцидентов, причины отказов).
Продолжение следует…
Сразу к ключевому моменту – нет никаких ожиданий ускорения технологического прогресса с использованием LLMs, главным образом по причине, что на уровне архитектуры LLMs вшит «антипрогресс», т.е. фундаментальная невозможность генерации новых смыслов, идей и концепций.
Способствовать ускорению прогресса, как инструмент, в условиях работы с грамотной командой инженеров? Да, но этих инструментов много и произвести декомпозицию вклада каждого из инструмента – весьма сложно.
Несмотря на кажущиеся всемогучесть и безграничное количество сфер применения, эффективные контуры у LLMs достаточно локализованы.
Попробую дать емкое определение… В своей основе, LLM – это механизм компрессии (сжатия), причем всегда с потерями и декомпрессии (генерации), причем всегда с галлюцинациями, неструктурированных массивов данных, выстраивая градиент векторов в соответствии со статистикой распределения паттернов.
Так значит, где применение наиболее эффективно?
- краткое резюме встреч, конференций, семинаров, лекций, судебных заседаний;
- краткий пересказ книг, отчетов, статей, инструкций, законов, патентов, документации и т.д;
- обобщение больших массивов данных, например, поиск нарративов в новостях, аналитических и научных статьях, корпоративных отчетах и любой другой неструктурированной, но близкой по смыслу структуре данных;
- обобщение заявок в книге жалоб, обращений и в отзывах клиентов, где можно сразу определить фокусировку жалоб, сильные и слабые стороны продукта или услуги.
Продолжение следует…
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Spydell_finance
Понимание сильных и слабых сторон LLMs позволит не только использовать их более эффективно в личных и бизнес проектах, но и понимать уязвимость невероятного пузыря, не имеющего аналогов в истории человечества (около 52 избыточной мировой капитализации на…
1👍128❤40🤔20🔥16💯6👌4🤡4🤯2🙏2👎1🤬1
LLM наиболее эффективна там, где нужно обработать уже имеющийся контекст (входные данные), а не генерировать факты из пространства своих весов.
Эффективны там, где требуется трансформация формы без изменения сути или экстракция, трансформация или перегруппировка структуры текста из неструктурированных массивов данных.
LLMs созданы для того (функциональное доминирование в архитектуре), чтобы эффективно сжимать текст (точнее сжимать и аппроксимировать закономерности в данных, а на выходе выполнять семантические преобразования), поэтому эффективно все, что связано с обобщением, конспектированием, резюмированием неструктурированных массивов данных (книг, отчетов, докладов, статей, исследований, инструкций, законов и т.д.)
• Это значит – создание сводок, дайджестов, структурированных протоколов, выделение ключевых нарративов и трендов (анализ клиентского поведения, анализ смещения тем и тональности во времени).
• Лингвистическая (упрощение или наоборот, детализация текстов) и стилистическая трансформация (рерайт и трансформация тональности),
• Преобразование текстов из одной структуры или формата в другой (например, из одного языка программирования в другой).
• Сравнительный анализ вместе с классификацией, кластеризацией и маршрутизации массивов данных.
• Генерация шаблонных текстов, отчетов, обзоров, комментариев по инструкциям в зависимости от сценариев, частично минимизируя бюрократическую нагрузку или «деклассируя» копирайтеров.
• Экспертная система/ ментор / учитель / справочное бюро, консультант в широком или узком применении, но при условии «замемления», т.е. доступа к внешним источникам и базам данных для верификации данных.
Имея доступ к среде программирования и компилятору, LLMs эффективны в формализованных дисциплинах, как физика, химия, математика, программирование, имея способность решать задачи, как лучшие умы планеты, но с очень многими оговорками – в специализированной среде (компилятор, изолированные тесты, симуляции, внешние верификаторы, заземление данных и т.д).
Из всего этого «вылезают» сценарные задачи:
• Декомпозиция запроса в дерево задач и формирование плана: что нужно уточнить, какие источники поднять, какие проверки сделать.
• Фокусировка на углублении источников данных – какие источники и данные необходимо собрать, чтобы закрыть все уязвимости, нерешенные вопросы в задаче?
• Автоматизация сравнительной аналитики – сопоставление технических параметров, спецификации и свойств продуктов конкурентов с выделением и систематизацией структуры, особенностей, характеристик, уязвимостей и так далее.
• Поиск слабых сигналов в жалобах/новостях/отчетах (ранние индикаторы проблем или трендов).
• Автоматическая проверка консистентности ответов, решений (LLM – как критик) для выявления слабых мест в отчете, аналитике или концепции.
• Генерация типовых кейсов для обучения в зависимости от уровня подготовки персонала.
• Консолидация схожего по смыслу контента в единое целое, создавая концентрат идей из разрозненных источников.
• Контроль качества и проверка на соответствие – сопоставление контента законам, регламентам, процедурам, требованиям и т.д.
• Поиск внутренних противоречий и пробелов (семантическая редактура текста).
• Консолидация различных версий идей мнений со сравнительной матрицей характеристик по каждой позиции/идеи (плюсы, минусы, уязвимости, риски).
• Сведение множества источников на консенсус/расхождения/нехватку данных.
• Создание пространства аргументаций на различные тезисы в зависимости от сценария.
• Концептуальное насыщение каркаса идей, когда через наброски тезисов создаются вектора распределения идей.
• Создание и редактура договоров, актов в соответствии с внутренним регламентов и внешним законодательством с контролем профильного специалиста.
• Обеспечение функционирование бюрократического аппарата (создание, поиск и редакция типовой электронной документации и отчетов).
Сценариев применения достаточно много, но на данном этапе скорее теоретические – будут работоспособны при условии роста стабильности и точности LLMs.
Эффективны там, где требуется трансформация формы без изменения сути или экстракция, трансформация или перегруппировка структуры текста из неструктурированных массивов данных.
LLMs созданы для того (функциональное доминирование в архитектуре), чтобы эффективно сжимать текст (точнее сжимать и аппроксимировать закономерности в данных, а на выходе выполнять семантические преобразования), поэтому эффективно все, что связано с обобщением, конспектированием, резюмированием неструктурированных массивов данных (книг, отчетов, докладов, статей, исследований, инструкций, законов и т.д.)
• Это значит – создание сводок, дайджестов, структурированных протоколов, выделение ключевых нарративов и трендов (анализ клиентского поведения, анализ смещения тем и тональности во времени).
• Лингвистическая (упрощение или наоборот, детализация текстов) и стилистическая трансформация (рерайт и трансформация тональности),
• Преобразование текстов из одной структуры или формата в другой (например, из одного языка программирования в другой).
• Сравнительный анализ вместе с классификацией, кластеризацией и маршрутизации массивов данных.
• Генерация шаблонных текстов, отчетов, обзоров, комментариев по инструкциям в зависимости от сценариев, частично минимизируя бюрократическую нагрузку или «деклассируя» копирайтеров.
• Экспертная система/ ментор / учитель / справочное бюро, консультант в широком или узком применении, но при условии «замемления», т.е. доступа к внешним источникам и базам данных для верификации данных.
Имея доступ к среде программирования и компилятору, LLMs эффективны в формализованных дисциплинах, как физика, химия, математика, программирование, имея способность решать задачи, как лучшие умы планеты, но с очень многими оговорками – в специализированной среде (компилятор, изолированные тесты, симуляции, внешние верификаторы, заземление данных и т.д).
Из всего этого «вылезают» сценарные задачи:
• Декомпозиция запроса в дерево задач и формирование плана: что нужно уточнить, какие источники поднять, какие проверки сделать.
• Фокусировка на углублении источников данных – какие источники и данные необходимо собрать, чтобы закрыть все уязвимости, нерешенные вопросы в задаче?
• Автоматизация сравнительной аналитики – сопоставление технических параметров, спецификации и свойств продуктов конкурентов с выделением и систематизацией структуры, особенностей, характеристик, уязвимостей и так далее.
• Поиск слабых сигналов в жалобах/новостях/отчетах (ранние индикаторы проблем или трендов).
• Автоматическая проверка консистентности ответов, решений (LLM – как критик) для выявления слабых мест в отчете, аналитике или концепции.
• Генерация типовых кейсов для обучения в зависимости от уровня подготовки персонала.
• Консолидация схожего по смыслу контента в единое целое, создавая концентрат идей из разрозненных источников.
• Контроль качества и проверка на соответствие – сопоставление контента законам, регламентам, процедурам, требованиям и т.д.
• Поиск внутренних противоречий и пробелов (семантическая редактура текста).
• Консолидация различных версий идей мнений со сравнительной матрицей характеристик по каждой позиции/идеи (плюсы, минусы, уязвимости, риски).
• Сведение множества источников на консенсус/расхождения/нехватку данных.
• Создание пространства аргументаций на различные тезисы в зависимости от сценария.
• Концептуальное насыщение каркаса идей, когда через наброски тезисов создаются вектора распределения идей.
• Создание и редактура договоров, актов в соответствии с внутренним регламентов и внешним законодательством с контролем профильного специалиста.
• Обеспечение функционирование бюрократического аппарата (создание, поиск и редакция типовой электронной документации и отчетов).
Сценариев применения достаточно много, но на данном этапе скорее теоретические – будут работоспособны при условии роста стабильности и точности LLMs.
Telegram
Spydell_finance
Направления бизнес применения LLMs
Сразу к ключевому моменту – нет никаких ожиданий ускорения технологического прогресса с использованием LLMs, главным образом по причине, что на уровне архитектуры LLMs вшит «антипрогресс», т.е. фундаментальная невозможность…
Сразу к ключевому моменту – нет никаких ожиданий ускорения технологического прогресса с использованием LLMs, главным образом по причине, что на уровне архитектуры LLMs вшит «антипрогресс», т.е. фундаментальная невозможность…
2👍142❤38🤔25👏11💯9👌3🥱3👎1🤬1🙏1🤡1
Ускорение российской экономики в октябре
Индекс выпуска товаров и услуг по базовым видам экономической деятельности вырос на 2.9% г/г (максимальный рост с дек.24) после 0.8% г/г в сентябре, за 10м25 рост составляет 1.1% г/г.
За последние 3м рост составил 1.05% г/г, +5.43% к 2023 и +16.1% к 2019 к соответствующему периоду (август-октябрь).
За 6м +1.4% г/г, +4.92% к 2023 и +15.4% к 2019 (май-октябрь), а за 12м +2.1% г/г, +7.6% к 2013 и +17.9% к 2019 (ноябрь-октябрь).
По долгосрочной траектории индекс выпуска вновь вернулся в точности к тренду 2017-2019 после вылета вверх с авг.24 по дек.24 и нормализации темпов роста на протяжении всего 2025.
На протяжении 8 лет драйверы роста и демпфирующие факторы каждый раз менялись, где период 2017-2019 можно разделить на три фазы (2017-2019, 2020-2021 и 2022-2025). С 2022 года масштабная структурная перестройка экономики (отсечение от внешних связей, попытка перехвата инициативы и доли рынка иностранных компаний вместе с выстраиванием экономики на военные рельсы – доминирование ВПК, как ключевой драйвер роста).
По оценкам Минэка, в октябре рост ВВП 1.6% г/г после 0.9% г/г в сентябре, а за 10м25 рост составил 1.0% г/г. Для сравнения, в 3кв25 +0.6% г/г, 2кв25 +1.1% г/г, а 1кв25 +1.4% г/г.
В отличие от эпизодов фрагментарного ускорения отдельных секторов (в основном дискретный выпуск продукции ВПК) на протяжении почти всего 2025, в октябре произошло ускорение по всем ключевым направлениям: потребительский спрос, строительство, сельское хозяйств, грузооборот транспорта за исключением оптовой торговли.
🔘 Строительство: +2.3% г/г в октябре после +0.2% г/г в сентябре, за 10м25 +3% г/г.
🔘 Сельское хозяйство: +7.0% г/г после +4.2% г/г в сентябре, за 10м25 +2.8% г/г.
🔘 Грузооборот транспорта: +2.7% г/г после (-0.2%) г/г в сентябре, за 10м25 (-0.4%) г/г.
🔘 Грузооборот транспорта за вычетом трубопроводных потоков: +3.1% г/г после +0.9% г/г в сентябре, за 10м25 (-1.0%) г/г.
🔘 ЖД грузооборот: +4.3% г/г после +0.2% г/г в сентябре, за 10м25 (-1.1%) г/г.
🔘 Оптовая торговля: сокращение на 2.5% г/г после +2.0% г/г в сентябре, за 10м25 (-3.0%) г/г.
🔘 Инвестиции в основной капитал (данные только поквартальные): в 3кв25 сокращение на 3.1% г/г после +1.5% г/г и +8.7% г/г в 1кв25.
🔘 Уровень безработицы остается крайне низким: 2.2% в октябре после 2.2% в сентябре (минимум за всю историю был 2.1% в августе), за 10м25 – 2.2%.
🔘 Число занятых: 74.6 млн SA после 74.4 млн в сентябре, за 10м25 – 74.5 млн vs 74.2 млн в 2024 и 73.6 млн в 2023.
Подробные данные о промышленности были ранее (1 и 2). Данные о потребительском спросе будут в следующем материале (в октябре там резкий рост, который выступил одним из драйвером ускорения экономики).
Говорить о развороте экономики к росту пока не приходится, но главный вывод в данных в том, что нет развития негативной тенденции, сформированной в середине 2025.
Индекс выпуска товаров и услуг по базовым видам экономической деятельности вырос на 2.9% г/г (максимальный рост с дек.24) после 0.8% г/г в сентябре, за 10м25 рост составляет 1.1% г/г.
За последние 3м рост составил 1.05% г/г, +5.43% к 2023 и +16.1% к 2019 к соответствующему периоду (август-октябрь).
За 6м +1.4% г/г, +4.92% к 2023 и +15.4% к 2019 (май-октябрь), а за 12м +2.1% г/г, +7.6% к 2013 и +17.9% к 2019 (ноябрь-октябрь).
По долгосрочной траектории индекс выпуска вновь вернулся в точности к тренду 2017-2019 после вылета вверх с авг.24 по дек.24 и нормализации темпов роста на протяжении всего 2025.
На протяжении 8 лет драйверы роста и демпфирующие факторы каждый раз менялись, где период 2017-2019 можно разделить на три фазы (2017-2019, 2020-2021 и 2022-2025). С 2022 года масштабная структурная перестройка экономики (отсечение от внешних связей, попытка перехвата инициативы и доли рынка иностранных компаний вместе с выстраиванием экономики на военные рельсы – доминирование ВПК, как ключевой драйвер роста).
По оценкам Минэка, в октябре рост ВВП 1.6% г/г после 0.9% г/г в сентябре, а за 10м25 рост составил 1.0% г/г. Для сравнения, в 3кв25 +0.6% г/г, 2кв25 +1.1% г/г, а 1кв25 +1.4% г/г.
В отличие от эпизодов фрагментарного ускорения отдельных секторов (в основном дискретный выпуск продукции ВПК) на протяжении почти всего 2025, в октябре произошло ускорение по всем ключевым направлениям: потребительский спрос, строительство, сельское хозяйств, грузооборот транспорта за исключением оптовой торговли.
Подробные данные о промышленности были ранее (1 и 2). Данные о потребительском спросе будут в следующем материале (в октябре там резкий рост, который выступил одним из драйвером ускорения экономики).
Говорить о развороте экономики к росту пока не приходится, но главный вывод в данных в том, что нет развития негативной тенденции, сформированной в середине 2025.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍184🤡40❤33🤔24🔥10😁6🥱3👌2👎1🤬1💯1
Последние пару месяцев все обсуждают жуткие случаи на рынке недвижимости, когда люди покупают квартиры у бабулек – а те через какое-то время отсуживают их себе обратно под предлогом «ой, а я не знала, что творила, да и вообще все деньги в итоге мошенникам отдала».
Суды, как ни странно, квартиры отдают обратно таким «неадекватным» пенсионеркам, а вот возвращать уплаченные покупателем деньги их не заставляют – то есть, люди просто остаются и без жилья, и без бабок (часто еще и с долгом по ипотеке перед банком).
При этом, все ТГ-каналы занимаются в основном пересказом одних и тех же фантазий журналистов на эту тему. И только один блогер, за которым я уже давно слежу, смог нормально разобраться в ситуации и объяснить – что конкретно происходит и почему.
Павел Комаровский у себя на канале (читайте этот материал вот здесь):
— Вместе с профессиональным юристом проанализировал десятки реальных судебных решений
— Подбил статистику по выигранным и проигранным делам
— Объяснил понятным языком, на что конкретно опираются суды в таких историях
— Вывел четкие правила, следование которым снижает риск остаться без квартиры до минимума
Честно: я каждый раз кайфую, когда читаю очередной материал на тему разумного отношения к финансам на канале Павла – так глубоко, как он, больше не копает никто. Если вы любите интересное авторское чтиво в стиле «просто о сложном», то от души рекомендую подписаться на @RationalAnswer – не пожалеете!
Суды, как ни странно, квартиры отдают обратно таким «неадекватным» пенсионеркам, а вот возвращать уплаченные покупателем деньги их не заставляют – то есть, люди просто остаются и без жилья, и без бабок (часто еще и с долгом по ипотеке перед банком).
При этом, все ТГ-каналы занимаются в основном пересказом одних и тех же фантазий журналистов на эту тему. И только один блогер, за которым я уже давно слежу, смог нормально разобраться в ситуации и объяснить – что конкретно происходит и почему.
Павел Комаровский у себя на канале (читайте этот материал вот здесь):
— Вместе с профессиональным юристом проанализировал десятки реальных судебных решений
— Подбил статистику по выигранным и проигранным делам
— Объяснил понятным языком, на что конкретно опираются суды в таких историях
— Вывел четкие правила, следование которым снижает риск остаться без квартиры до минимума
Честно: я каждый раз кайфую, когда читаю очередной материал на тему разумного отношения к финансам на канале Павла – так глубоко, как он, больше не копает никто. Если вы любите интересное авторское чтиво в стиле «просто о сложном», то от души рекомендую подписаться на @RationalAnswer – не пожалеете!
1🤡147👍66🔥22❤14😁14👎11🤔10🤬4🥱3😢2👌1
Потребительский спрос в России неожиданно вырос
За последние 12 месяцев совокупный номинальный потребительский спрос составил 84.1 трлн руб среди фиксируемого Росстатом оборота товаров и услуг.
В реальности обычно больше, т.к. значительная часть рыночного, ярморочного оборота за наличность, часть личных покупок на иностранных маркетплейсах и существенная часть услуг (интимные, образовательные, медицинские, строительные, бытовые и персональные услуги за наличку) не попадают напрямую в оценки (ограниченная дооценка).
В структуре потребительского спроса: 60.4 трлн – розничные продажи, 19.5 трлн – услуги, 4.1 трлн – общепит. С 2021 года общепит (1.7 трлн) по номиналу вырос очень сильно – в 2.4 раза!
▪️Потребительский спрос (розница + услуги + общепит) резко ускорился до 4.7% г/г (это максимальный темп роста с ноя.24) после 2.3% г/г в сентябре, к окт.23 +9.4%, к окт.21 +14.5%, к окт.19 +19.5%, а окт.14 +14.6%.
За 10м25 потребительский спрос вырос на 2.4% г/г, +9.9% к 10м23, +14.8% к 10м21, +19.7% к 10м19 и +14.9% к 10м14.
На этот раз в потребительский спрос я включил общественное питание, что методологические является корректной склейкой в отличие от всех прошлых обзоров, где был учет только розницы и услуг.
Интенсивный рост 2023-2024 сменился нормализацией в 2025, что является скорее нормой.
В 2017-2019 среднегодовой темп роста был около 2.8% в реальном выражении, в 2025 немного меньше (2.3-2.5%), но пока сохраняется разрыв с трендом 2017-2019 примерно на 1.5%.
▪️Розничный товарооборот вырос на 4.7% г/г в октябре после 1.7% в сентябре, +9.5% к окт.23, +12.1% к окт.21, +17.1% к окт.19 и +7.1% к окт.14.
За 10м25 розничные продажи выросли на 2.2% г/г, +10.7% к 10м23, +11.9% к 10м21, +17.6% к 10м19 и +8.0% к 10м14. Долгосрочный средний темп роста всего около 0.7% годовых во многом за счет стагнации 2014-2021, тогда как с 2021 года (за 4 года) среднегодовые темпы выросли до 2.8%.
▪️Услуги выросли на 4.6% г/г в октябре, имея сопоставимый темп в сентябре, к окт.23 +9.5%, к окт.21 +21.1%, к окт.19 +23.8% и +29.9% к окт.14.
За 10м25 услуги выросли на 3.5% г/г, +8.6% к 10м23, +23.6% к 10м21, +24.4% к 10м19 и +30.8% к 10м19. С 2014 года среднегодовой темп роста услуг составляет 2.4%, а за последние 4 года невероятные 5.4%.
Данные по услугам сильно отличаются от презентационных таблиц Росстата. В презентации +2.6% г/г за 10м25, тогда как по историческим рядам в соответствии со статистикой Росстата +3.5% г/г. Здесь и далее я использую исторические ряды. То, что контрольная сумма не сходится по базовым индикаторам – это всегда так было, бардак и несогласованность в статистике десятилетиями, поэтому крайне сложно обеспечивать сопоставимый анализ.
За последние 12 месяцев совокупный номинальный потребительский спрос составил 84.1 трлн руб среди фиксируемого Росстатом оборота товаров и услуг.
В реальности обычно больше, т.к. значительная часть рыночного, ярморочного оборота за наличность, часть личных покупок на иностранных маркетплейсах и существенная часть услуг (интимные, образовательные, медицинские, строительные, бытовые и персональные услуги за наличку) не попадают напрямую в оценки (ограниченная дооценка).
В структуре потребительского спроса: 60.4 трлн – розничные продажи, 19.5 трлн – услуги, 4.1 трлн – общепит. С 2021 года общепит (1.7 трлн) по номиналу вырос очень сильно – в 2.4 раза!
▪️Потребительский спрос (розница + услуги + общепит) резко ускорился до 4.7% г/г (это максимальный темп роста с ноя.24) после 2.3% г/г в сентябре, к окт.23 +9.4%, к окт.21 +14.5%, к окт.19 +19.5%, а окт.14 +14.6%.
За 10м25 потребительский спрос вырос на 2.4% г/г, +9.9% к 10м23, +14.8% к 10м21, +19.7% к 10м19 и +14.9% к 10м14.
На этот раз в потребительский спрос я включил общественное питание, что методологические является корректной склейкой в отличие от всех прошлых обзоров, где был учет только розницы и услуг.
Интенсивный рост 2023-2024 сменился нормализацией в 2025, что является скорее нормой.
В 2017-2019 среднегодовой темп роста был около 2.8% в реальном выражении, в 2025 немного меньше (2.3-2.5%), но пока сохраняется разрыв с трендом 2017-2019 примерно на 1.5%.
▪️Розничный товарооборот вырос на 4.7% г/г в октябре после 1.7% в сентябре, +9.5% к окт.23, +12.1% к окт.21, +17.1% к окт.19 и +7.1% к окт.14.
За 10м25 розничные продажи выросли на 2.2% г/г, +10.7% к 10м23, +11.9% к 10м21, +17.6% к 10м19 и +8.0% к 10м14. Долгосрочный средний темп роста всего около 0.7% годовых во многом за счет стагнации 2014-2021, тогда как с 2021 года (за 4 года) среднегодовые темпы выросли до 2.8%.
▪️Услуги выросли на 4.6% г/г в октябре, имея сопоставимый темп в сентябре, к окт.23 +9.5%, к окт.21 +21.1%, к окт.19 +23.8% и +29.9% к окт.14.
За 10м25 услуги выросли на 3.5% г/г, +8.6% к 10м23, +23.6% к 10м21, +24.4% к 10м19 и +30.8% к 10м19. С 2014 года среднегодовой темп роста услуг составляет 2.4%, а за последние 4 года невероятные 5.4%.
Данные по услугам сильно отличаются от презентационных таблиц Росстата. В презентации +2.6% г/г за 10м25, тогда как по историческим рядам в соответствии со статистикой Росстата +3.5% г/г. Здесь и далее я использую исторические ряды. То, что контрольная сумма не сходится по базовым индикаторам – это всегда так было, бардак и несогласованность в статистике десятилетиями, поэтому крайне сложно обеспечивать сопоставимый анализ.
2👍118🤔35❤22🤡13😁4🔥3👎2😢2🤬1🥱1
Нефтегазовые доходы в России продолжаются снижаться
В ноябре нефтегазовые доходы составили 531 млрд руб, что на 34% ниже сборов в ноя.24 (802 млрд) и значительно ниже, чем в ноя.23 (962 млрд) и ноя.22 (866 млрд).
За 11м25 нефтегазовые доходы составили 8 трлн (худший показатель с 2020) vs 10.34 трлн за 11м24 и 8.17 трлн за 11м23.
▪️НДПИ + таможенные пошлины составили 693 млрд vs 1083 млрд за ноябрь, за 11м25 – 8.61 трлн vs 11.64 трлн за 11м24 и 9.36 трлн за 11м23.
▪️НДД в ноябре не платят (в пределах погрешности – 4 млрд), за 11м25 – 1.61 трлн vs 2.05 трлн за 11м24 и 1.3 трлн за 11м23.
▪️Совокупные вычеты и льготы в пользу нефтяников составили 166 млрд в ноя.25 vs 282 млрд в ноя.24, за 11м25 в совокупности 2.19 трлн vs 3.34 трлн за 11м24 и 2.48 трлн за 11м23.
При какой конъюнктуре сложились результаты?
▪️Средняя цена Brent составила 63.6 долл за баррель (Urals – 44.9) или почти 30% гэп (максимум с 2023), за 11м25 – 69.6 (57.1) vs 81.3 (68.4) за 11м24 и 83 (62.7) за 11м23. За 11м25 средние цены Urals снизились на 16.5% г/г.
▪️USD/RUB: 80.26 в ноябре, за 11м25 – 84.0 vs 91.6 за 11м24 и 84.6 за 11м23.
▪️Средняя цена Urals в рублях: 3602 руб в ноябре – это минимум с января 2023 и цены, которые наблюдались в 2013-2014, за 11м25 – 4824 руб vs 6291 за 11м24 и 5421 за 11м23.
Учитывая низкие мировые цены на нефть в совокупности с рекордно высокими дисконтами на нефть (расширились до 30% при норме 15-17%), так и не понятен «прикол» с рублем – что за сеанс «самобичевания» отгружать нефть по 3300-3600 руб (почти вдвое ниже, чем в 2024)? Какой в этом смысл?
Цены текущего месяца являются базой для расчета налога, который уплачивается в следующем месяце, поэтому в декабре следует ожидать обвала нефтегазовых доходов до 430-470 млрд руб, а по итогам года получится менее 8.5 трлн vs 11.1 трлн в 2024, 8.82 трлн в 2023, 11.6 трлн в 2022, 9.06 трлн в 2021 и 5.23 трлн в 2020.
Начало следующего года при сложившиеся конъюнктуре будет еще сложнее, т.к. не до конца понятен вопрос с устойчивостью поставок энергоносителей в Индию, Турцию и Восточную Европу. С Китаем, как видится, все стабильно.
С 5 декабря чистые продажи валюты будут равны 14.5 млрд руб. в день, из которых продажи валюты на 8.9 млрд в рамках нерегулярных операций вне бюджетного правила и продажи на 5.6 млрд от Минфина в соответствии с корректировками доходов от базового уровня.
Чем больше Минфин с ЦБ продают, тем крепче рубль, но тем ниже нефтегазовые доходы, что требует в дальнейшем еще больших продаж валюты и тем еще ниже будущие доходы, что вновь требует еще больших продаж валюты до полного исчерпания ликвидной части ФНБ.
Сейчас вообще нет никаких проблем «скорректировать» курс в необходимый диапазон. Это происходит за пару дней по звонку в крупные российские банки или экспортеры с «рекомендацией» купить по рынку юани на несколько миллиардов ($3-4) в долларовом выражении (+задержать поступление валютной выручки), что на тонком и неликвидном рынке практически моментально приведет курс в диапазон 83-85 по USD/RUB и далее еще столько же для плавного выхода в диапазон 90-92.
Проблема корректировки существует в условиях открытого рынка, при наличии арбитражёров и устойчивых трансграничных потоков капитала, а сейчас с курсом можно делать все, что угодно в сторону девальвации (при неограниченном количестве рублей с дефицитом валюты), но не в сторону укрепления.
Только за счет курса при прочих равных условиях (физический объем экспорта, средневзвешенные экспортные цены, объем импорта) федеральный бюджет теряет в год не менее 3.5 трлн руб в год (нефтегазовые доходы + налог на импорт), что в несколько раз превышает все налоговые «новации» на 2026 год.
Это какая-то инопланетная логика - в чем прикол с этим курсом? Задушить экспортеров (основные поставщики капитальных расходов в реальный сектор экономики и дивидендов), задушить промышленность (импортозамещение, т.к. любое производство становится неконкурентоспособным) и терять примерно в три раза больше, чем получать от налоговых реформ, имея возможность установить любой курс в сторону девальвации.
В ноябре нефтегазовые доходы составили 531 млрд руб, что на 34% ниже сборов в ноя.24 (802 млрд) и значительно ниже, чем в ноя.23 (962 млрд) и ноя.22 (866 млрд).
За 11м25 нефтегазовые доходы составили 8 трлн (худший показатель с 2020) vs 10.34 трлн за 11м24 и 8.17 трлн за 11м23.
▪️НДПИ + таможенные пошлины составили 693 млрд vs 1083 млрд за ноябрь, за 11м25 – 8.61 трлн vs 11.64 трлн за 11м24 и 9.36 трлн за 11м23.
▪️НДД в ноябре не платят (в пределах погрешности – 4 млрд), за 11м25 – 1.61 трлн vs 2.05 трлн за 11м24 и 1.3 трлн за 11м23.
▪️Совокупные вычеты и льготы в пользу нефтяников составили 166 млрд в ноя.25 vs 282 млрд в ноя.24, за 11м25 в совокупности 2.19 трлн vs 3.34 трлн за 11м24 и 2.48 трлн за 11м23.
При какой конъюнктуре сложились результаты?
▪️Средняя цена Brent составила 63.6 долл за баррель (Urals – 44.9) или почти 30% гэп (максимум с 2023), за 11м25 – 69.6 (57.1) vs 81.3 (68.4) за 11м24 и 83 (62.7) за 11м23. За 11м25 средние цены Urals снизились на 16.5% г/г.
▪️USD/RUB: 80.26 в ноябре, за 11м25 – 84.0 vs 91.6 за 11м24 и 84.6 за 11м23.
▪️Средняя цена Urals в рублях: 3602 руб в ноябре – это минимум с января 2023 и цены, которые наблюдались в 2013-2014, за 11м25 – 4824 руб vs 6291 за 11м24 и 5421 за 11м23.
Учитывая низкие мировые цены на нефть в совокупности с рекордно высокими дисконтами на нефть (расширились до 30% при норме 15-17%), так и не понятен «прикол» с рублем – что за сеанс «самобичевания» отгружать нефть по 3300-3600 руб (почти вдвое ниже, чем в 2024)? Какой в этом смысл?
Цены текущего месяца являются базой для расчета налога, который уплачивается в следующем месяце, поэтому в декабре следует ожидать обвала нефтегазовых доходов до 430-470 млрд руб, а по итогам года получится менее 8.5 трлн vs 11.1 трлн в 2024, 8.82 трлн в 2023, 11.6 трлн в 2022, 9.06 трлн в 2021 и 5.23 трлн в 2020.
Начало следующего года при сложившиеся конъюнктуре будет еще сложнее, т.к. не до конца понятен вопрос с устойчивостью поставок энергоносителей в Индию, Турцию и Восточную Европу. С Китаем, как видится, все стабильно.
С 5 декабря чистые продажи валюты будут равны 14.5 млрд руб. в день, из которых продажи валюты на 8.9 млрд в рамках нерегулярных операций вне бюджетного правила и продажи на 5.6 млрд от Минфина в соответствии с корректировками доходов от базового уровня.
Чем больше Минфин с ЦБ продают, тем крепче рубль, но тем ниже нефтегазовые доходы, что требует в дальнейшем еще больших продаж валюты и тем еще ниже будущие доходы, что вновь требует еще больших продаж валюты до полного исчерпания ликвидной части ФНБ.
Сейчас вообще нет никаких проблем «скорректировать» курс в необходимый диапазон. Это происходит за пару дней по звонку в крупные российские банки или экспортеры с «рекомендацией» купить по рынку юани на несколько миллиардов ($3-4) в долларовом выражении (+задержать поступление валютной выручки), что на тонком и неликвидном рынке практически моментально приведет курс в диапазон 83-85 по USD/RUB и далее еще столько же для плавного выхода в диапазон 90-92.
Проблема корректировки существует в условиях открытого рынка, при наличии арбитражёров и устойчивых трансграничных потоков капитала, а сейчас с курсом можно делать все, что угодно в сторону девальвации (при неограниченном количестве рублей с дефицитом валюты), но не в сторону укрепления.
Только за счет курса при прочих равных условиях (физический объем экспорта, средневзвешенные экспортные цены, объем импорта) федеральный бюджет теряет в год не менее 3.5 трлн руб в год (нефтегазовые доходы + налог на импорт), что в несколько раз превышает все налоговые «новации» на 2026 год.
Это какая-то инопланетная логика - в чем прикол с этим курсом? Задушить экспортеров (основные поставщики капитальных расходов в реальный сектор экономики и дивидендов), задушить промышленность (импортозамещение, т.к. любое производство становится неконкурентоспособным) и терять примерно в три раза больше, чем получать от налоговых реформ, имея возможность установить любой курс в сторону девальвации.
4👍154🤔70❤43🔥39💯35🤡21😱14👎7🤯6🙏4😢3
О бюджетной дыре в России, связанной с курсом рубля
Многие по привычке обращают внимание на нефтегазовые доходы, но крайне чувствительная дыра формируется в налогах на импорт.
В структуре доходов федерального бюджета за 2024 год налог на импорт составил 17% или 6.26 трлн руб, а внутри налога на импорт наибольший вес формирует НДС на ввозимые товары (почти 77% в общих сборах), на втором месте ввозные пошлины (почти 20%) и акцизы (менее 4%).
На акцизы ставки практически всегда изначально фиксированы и идут в рублях, поэтому это категория сборов меньше всего подвержена валютой волатильности, но и доля самая маленькая.
НДС на ввозимые товары платится каждый раз при ввозе товара на пограничный контроль, за исключением редких случаев контрабанды. Импортер обязан заплатить налог еще до того, как товар выпустят с таможни.
НДС на импорт формируется, как (таможенная стоимость + ввозная пошлина + Акциз) × ставка НДС.
Таможенная стоимость считается в рублях по правилам таможенного законодательства. Курс для пересчёта указывается на дату регистрации декларации на товары.
Ставки на ввозные пошлины регулируются в рамках ЕАЭС и также исчисляются в рублях, как процент от таможенной стоимости или фиксированная сумма на единицу товара.
Сборы по налогу на импорт зависят от стоимостного валютного объема импорта, от курса рубля, от таможенных ставок и акцизов и от уровня администрирования (доля легального импорта, прошедшего через таможенные декларации, от совокупных поставок товаров в страну).
С 2020 по 2024 средний объем чистых сборов по налогу на импорт, поступивших в бюджет, составили 21.5% от рублевого объема импорта, а по самым актуальным данным – 22.4% в 2024 (поставки 27.9 трлн руб при сборах 6.25 трлн) и также 22.1% в 2023 (поставки 25.8 трлн руб при сборах 5.7 трлн).
Таможенные сборы к услугам не применяются. На импорт услуг распространяется НДС, но платится он по иному механизму – администрирование идет через ФНС.
Метод расчетов (в рублях, юанях или долларах) не влияет на сам механизм исчисления налогов, но меняет базу для их расчета, а с точки зрения формирования налога на импорт эффект нейтральный (не влияет на сборы).
За 9м25 импорт товаров 215.3 млрд или 18.26 трлн руб, что формирует прогнозные сборы на уровне 4090 млрд, а по факту собрали 3923 млрд, тогда как расхождение связано с периодом учета поставок и выплатой налогов на импорт.
За 2025 год оценочный объем импорта товаров может составить $305 млрд vs $301.5 млрд в 2024 и $303.1 млрд в 2023.
Рублевый объем импорта товаров в 2025 может составить 25.5 трлн руб, а сборы по налогу на импорт около 5.6 трлн руб.
Так какая дыра в бюджете? По фундаментально обоснованном равновесном курсе рубля около 105 по USD/RUB с учетом композиции всех макроэкономических и финансовых факторов, разрыв в 1.44 трлн (7.09 трлн сборов при ожидаемые 5.65 трлн).
По нефтегазовым доходам сборы в 2025 могут составить $101.2 млрд (8.46 трлн руб) vs $120.5 млрд (11.1 трлн руб) в 2024, $103.5 млрд (8.8 трлн руб) в 2023 и $169.3 млрд (11.6 трлн руб) в 2022.
При курсе 105 доходы нефтегазового бюджета составили бы 10.6 трлн, т.е. разрыв в 2.15 трлн.
Соответственно, дыра в бюджете, связанная с переукреплением рубля составляет около 3.6 трлн (1.44 + 2.15 трлн).
Что такое 3.6 трлн? Это ВТРОЕ (!) выше всех налоговых маневров на 2026 год с учетом роста НДС и налога на малый бизнес.
Любопытно, что кумулятивный эффект санкций для федерального бюджета в 2025 оценивается всего в $6 млрд к диспозиции 2024 (дельта физических поставок + дельта дисконта к мировым бенчмаркам), а остальные $13 млрд – мировая конъюнктура (снижение цен на нефть и газ), тогда как эффект курса рубля примерно в 7 раз сильнее санкций, т.е. эффект самобичевания сильнее санкций.
При текущем курсе рубля нефтегазовые доходы в 2026 году формируются около 6.2 трлн руб (еще минус 2.4 трлн от низкой базы 2025, что изначально делает невыполнимым исполнение бюджета на 2026 год), а налог с импорта около 5.2 трлн, увеличивая разрыв до 5.5 трлн при обоснованном курсе рубля не ниже 110 в 2026.
Многие по привычке обращают внимание на нефтегазовые доходы, но крайне чувствительная дыра формируется в налогах на импорт.
В структуре доходов федерального бюджета за 2024 год налог на импорт составил 17% или 6.26 трлн руб, а внутри налога на импорт наибольший вес формирует НДС на ввозимые товары (почти 77% в общих сборах), на втором месте ввозные пошлины (почти 20%) и акцизы (менее 4%).
На акцизы ставки практически всегда изначально фиксированы и идут в рублях, поэтому это категория сборов меньше всего подвержена валютой волатильности, но и доля самая маленькая.
НДС на ввозимые товары платится каждый раз при ввозе товара на пограничный контроль, за исключением редких случаев контрабанды. Импортер обязан заплатить налог еще до того, как товар выпустят с таможни.
НДС на импорт формируется, как (таможенная стоимость + ввозная пошлина + Акциз) × ставка НДС.
Таможенная стоимость считается в рублях по правилам таможенного законодательства. Курс для пересчёта указывается на дату регистрации декларации на товары.
Ставки на ввозные пошлины регулируются в рамках ЕАЭС и также исчисляются в рублях, как процент от таможенной стоимости или фиксированная сумма на единицу товара.
Сборы по налогу на импорт зависят от стоимостного валютного объема импорта, от курса рубля, от таможенных ставок и акцизов и от уровня администрирования (доля легального импорта, прошедшего через таможенные декларации, от совокупных поставок товаров в страну).
С 2020 по 2024 средний объем чистых сборов по налогу на импорт, поступивших в бюджет, составили 21.5% от рублевого объема импорта, а по самым актуальным данным – 22.4% в 2024 (поставки 27.9 трлн руб при сборах 6.25 трлн) и также 22.1% в 2023 (поставки 25.8 трлн руб при сборах 5.7 трлн).
Таможенные сборы к услугам не применяются. На импорт услуг распространяется НДС, но платится он по иному механизму – администрирование идет через ФНС.
Метод расчетов (в рублях, юанях или долларах) не влияет на сам механизм исчисления налогов, но меняет базу для их расчета, а с точки зрения формирования налога на импорт эффект нейтральный (не влияет на сборы).
За 9м25 импорт товаров 215.3 млрд или 18.26 трлн руб, что формирует прогнозные сборы на уровне 4090 млрд, а по факту собрали 3923 млрд, тогда как расхождение связано с периодом учета поставок и выплатой налогов на импорт.
За 2025 год оценочный объем импорта товаров может составить $305 млрд vs $301.5 млрд в 2024 и $303.1 млрд в 2023.
Рублевый объем импорта товаров в 2025 может составить 25.5 трлн руб, а сборы по налогу на импорт около 5.6 трлн руб.
Так какая дыра в бюджете? По фундаментально обоснованном равновесном курсе рубля около 105 по USD/RUB с учетом композиции всех макроэкономических и финансовых факторов, разрыв в 1.44 трлн (7.09 трлн сборов при ожидаемые 5.65 трлн).
По нефтегазовым доходам сборы в 2025 могут составить $101.2 млрд (8.46 трлн руб) vs $120.5 млрд (11.1 трлн руб) в 2024, $103.5 млрд (8.8 трлн руб) в 2023 и $169.3 млрд (11.6 трлн руб) в 2022.
При курсе 105 доходы нефтегазового бюджета составили бы 10.6 трлн, т.е. разрыв в 2.15 трлн.
Соответственно, дыра в бюджете, связанная с переукреплением рубля составляет около 3.6 трлн (1.44 + 2.15 трлн).
Что такое 3.6 трлн? Это ВТРОЕ (!) выше всех налоговых маневров на 2026 год с учетом роста НДС и налога на малый бизнес.
Любопытно, что кумулятивный эффект санкций для федерального бюджета в 2025 оценивается всего в $6 млрд к диспозиции 2024 (дельта физических поставок + дельта дисконта к мировым бенчмаркам), а остальные $13 млрд – мировая конъюнктура (снижение цен на нефть и газ), тогда как эффект курса рубля примерно в 7 раз сильнее санкций, т.е. эффект самобичевания сильнее санкций.
При текущем курсе рубля нефтегазовые доходы в 2026 году формируются около 6.2 трлн руб (еще минус 2.4 трлн от низкой базы 2025, что изначально делает невыполнимым исполнение бюджета на 2026 год), а налог с импорта около 5.2 трлн, увеличивая разрыв до 5.5 трлн при обоснованном курсе рубля не ниже 110 в 2026.
1🤔216❤65👍52🤣30🤡24😱18💯14👎9🔥9🤬5👌5
Совкомбанк снижает затраты предприятий на международные платежи до 30%
Для клиентов теперь открыта возможность выбора оптимального способа перевода валюты с минимальными издержками. Они могут выбрать фиксированную комиссию (от 0,3%) заранее купленной валютой (доллар, евро, китайский юань, дирхам ОАЭ) или индивидуальный тариф в рублях.
Пользоваться сервисом можно удалённо и без оформления дополнительной документации, поскольку эта услуга включена в стандартный пакет обслуживания расчётно-кассового учёта.
Банк обеспечивает полное сопровождение всех этапов платежа. Первые клиенты отмечают снижение затрат на международные операции на 15–30% и сокращение сроков обработки переводов в 2–3 раза.
Для клиентов теперь открыта возможность выбора оптимального способа перевода валюты с минимальными издержками. Они могут выбрать фиксированную комиссию (от 0,3%) заранее купленной валютой (доллар, евро, китайский юань, дирхам ОАЭ) или индивидуальный тариф в рублях.
Пользоваться сервисом можно удалённо и без оформления дополнительной документации, поскольку эта услуга включена в стандартный пакет обслуживания расчётно-кассового учёта.
Банк обеспечивает полное сопровождение всех этапов платежа. Первые клиенты отмечают снижение затрат на международные операции на 15–30% и сокращение сроков обработки переводов в 2–3 раза.
👍61🤡36🤔4❤2👎1🔥1🥰1🤬1