Недавно обсуждали дизайн рекламной системы (реальной), и разговор зашёл о том, где и как хранить векторы для айтемов и пользователей. На моё утверждение, что можно всё хранить на одной машине, возразили, что будет примерно 100-200 млн векторов, которые нужно хранить постоянно (пользователей можно считать на лету). К счастью, я как раз недавно прочитал ScaNN (Scalable Nearest Neighbors) от Google Research.
У ScaNN два плюса:
1) Эффективная квантизация через кодовые книги (ну это у многих).
2) Сжатие не просто ради сжатия, а минимизация ошибки в первую очередь в направлении вектора; ошибка, уводящая вбок, менее страшна.
The innovation of ScaNN is Anisotropic Vector Quantization. It recognizes that not all geometric errors are created equal. An error "sideways" (orthogonal) hurts your search accuracy much less than an error "lengthwise" (parallel).
Если взять эмбеддинг OpenAI (Ada-002) размерностью 1536, он будет весить 6 КБ. 100 млн таких эмбеддингов будут весить 600 ГБ — многовато.
Если его сжать через CodeBook — стандартно в 64 субпространства code book — он будет весить 64 байта. 100 млн таких эмбеддингов будут весить 6 ГБ.
Задача решена.
#SystemDesign
У ScaNN два плюса:
1) Эффективная квантизация через кодовые книги (ну это у многих).
2) Сжатие не просто ради сжатия, а минимизация ошибки в первую очередь в направлении вектора; ошибка, уводящая вбок, менее страшна.
The innovation of ScaNN is Anisotropic Vector Quantization. It recognizes that not all geometric errors are created equal. An error "sideways" (orthogonal) hurts your search accuracy much less than an error "lengthwise" (parallel).
Если взять эмбеддинг OpenAI (Ada-002) размерностью 1536, он будет весить 6 КБ. 100 млн таких эмбеддингов будут весить 600 ГБ — многовато.
Если его сжать через CodeBook — стандартно в 64 субпространства code book — он будет весить 64 байта. 100 млн таких эмбеддингов будут весить 6 ГБ.
Задача решена.
#SystemDesign
research.google
Announcing ScaNN: Efficient Vector Similarity Search
Posted by Philip Sun, Software Engineer, Google Research Suppose one wants to search through a large dataset of literary works using queries that r...
2❤155👍81🔥42👏9🤔8💅7
Хороший пример того, как можно торговаться на executive pay package.
Напоминает чем то примеры из книги: The Engineering Executive's Primer: Impactful Technical Leadership
Напоминает чем то примеры из книги: The Engineering Executive's Primer: Impactful Technical Leadership
"Can't increase cash comp before Series B."
“All execs get $250K max. No exception.”
She asked for 2% of ARR over $10M instead.
The CEO called it "brilliant."
When we hit $30M, that's $400K extra. In cash. Not equity.
1/ Best cash alternatives when startups are tight:
• Revenue / Profit Sharing: 2% of ARR (worth $380K at target)
• Milestone Triggers: $100K at product launch
• Funding Bonuses: $150K when Series B closes
• Customer Acquisition: $10K per enterprise client
• Post-Funding Guarantees: Base jumps $50K after raise
"All executives get the same base. Board policy."
So another exec negotiated what others didn't:
$25K childcare benefit
$75K travel package
$50K housing allowance
$65K executive MBA funding
Same base. $215K more total comp.
2/ Creative comp packages others never ask for:
• Childcare subsidies ($25K-$50K annually)
• Housing/relocation stipends (without actual moving)
• Education funding ($65K for executive programs)
• Premium travel policy (business class = $40K value)
• Coaching/professional development ($25K annually)
And sometimes the meat and potatoes annual bonus can do more for you:
3/ Annual bonus nuances most miss:
• Accelerators (1.5x bonus target if >$10m ARR)
• Quarterly bonus payouts
• Guarantees (Minimum 75% bonus target payout)
Even at early startups, you can add $200k+ to cash compensation
2❤40🤪31👍7🔥5
Вышла третья часть разговора между мной и Витей Кантором, в этот раз говорили про спорт
YouTube
Как спорт влияет на карьеру. Валерий Бабушкин 3 часть
В третьей части подкаста с Валерием Бабушкиным разговор вышел за рамки карьеры и машинного обучения.
На этот раз Виктор и Валерий обсудили спорт и его роль в жизни специалиста, работающего в высокоинтеллектуальной и конкурентной среде.
Как спортивный опыт…
На этот раз Виктор и Валерий обсудили спорт и его роль в жизни специалиста, работающего в высокоинтеллектуальной и конкурентной среде.
Как спортивный опыт…
21🔥110👍21❤15⚡14🤡6🎄6💩4👎3🤗3🤮2👀2
Игорь поделился замечательным Эссе - Capital in the 22nd Century
Кратко: Как будет развиваться мир, если капитал станет 100% заменой труда
Забавно, что несмотря на общую ошибочность (скорее всего) в своей аналитике, Thomas Piketty вполне мог описывать мир будущего
Еще из интересного - ввести для людей обязательный минимум на траты, что бы на накапливали капитал как суслики. Ведь кто раньше накопил, тот будет бесконечно впереди
Рекомендую
Кратко: Как будет развиваться мир, если капитал станет 100% заменой труда
As many noted at the time, this is probably an incorrect account of the past. Labor and capital complement each other. Wealthy people can keep accumulating capital, but hammers grow less valuable when there aren’t enough hands to use all of them, and hands grow more valuable when hammers are plentiful. Capital accumulation thus lowers interest rates (aka income per unit of capital) and raises wages (income per unit of labor). This effect has tended to be strong enough that, though inequality may have grown for other reasons, inequality from capital accumulation alone has been self-correcting.
But in a world of advanced robotics and AI, this correction mechanism will break. That is, though Piketty was wrong about the past, he will probably be right about the future.
Забавно, что несмотря на общую ошибочность (скорее всего) в своей аналитике, Thomas Piketty вполне мог описывать мир будущего
The world Piketty describes may not have existed in the past, but we will wake up in it one day; and he has thought more than most about how it might unfold, and how to tax and regulate it so that inequality stays at least somewhat contained.
Еще из интересного - ввести для людей обязательный минимум на траты, что бы на накапливали капитал как суслики. Ведь кто раньше накопил, тот будет бесконечно впереди
Third, by imposing on individuals the same regulation already imposed on foundations to prevent them from growing too quickly: a spending requirement. A minimum spending rate—either on an annual basis or, by capping inheritances, over a lifetime—would prevent those inclined to adopt high saving rates from outgrowing the rest.
Рекомендую
Telegram
Сиолошная
Канал SeeAll'а с новостями (и мыслями о них) из мира NLP, VR и космоса.
Более подробно смотри в первом сообщении в канале (оно закреплено). А еще у нас есть чат! Заходи: https://news.1rj.ru/str/+i_XzLucdtRJlYWUy
Более подробно смотри в первом сообщении в канале (оно закреплено). А еще у нас есть чат! Заходи: https://news.1rj.ru/str/+i_XzLucdtRJlYWUy
❤45🔥14🤣9😁7👀7🍌4
11 января в 16:00 по Лондону планируем провести стрим с Игорем, рассмотрим что изменилось с прошлого года
Обсудим, почему Дарио был прав и не прав одновременно, что произошло и где мы все будем в будущем.
P.S. Купили нормальные микрофоны
Обсудим, почему Дарио был прав и не прав одновременно, что произошло и где мы все будем в будущем.
P.S. Купили нормальные микрофоны
YouTube
Как мы (не) заменим 90% программистов AI
Обсудим, будем или не будем писать 90% кода через полгода руками, какие перспективы у нас есть, и что говорят те, кто уже кодит с помощью AI.
1🔥123❤30✍12😁7👎4👍2🤮2🎄1
Продолжение общего тренда, который стал проявляться года два назад
Максимум плюшек топ перформерам, все равно на остальных
Растущее неравенство
Мета и раньше была этим известна, теперь еще глубже пошли
Meta shakes up its review system with 'stronger rewards for top performers'
Максимум плюшек топ перформерам, все равно на остальных
Растущее неравенство
Мета и раньше была этим известна, теперь еще глубже пошли
Meta shakes up its review system with 'stronger rewards for top performers'
3👍79🤮18👏10🫡10❤6🕊2🤔1🤩1
Прочитал пост с блога Курсора - Scaling long-running autonomous coding - решил попробовать сделать тоже самое
Что получилось:
Agent Factory — переиспользуемая система оркестрации для мульти-агентной разработки
Основана на архитектуре из статьи Cursor про scaling agents, но с важными улучшениями:
4 типа агентов:
1. Primary Planner — архитектор, разбивает проект на домены
2. Sub-Planner — превращает домены в атомарные задачи
3. Worker — выполняет задачи (пишет код, но НЕ коммитит)
4. Judge — единственный, кто коммитит код (только после прохождения всех тестов)
Ключевые фичи:
Goal File — файл-источник истины, который агенты проверяют на каждом запуске. Можно менять цели проекта в реальном времени, и все агенты автоматически увидят изменения.
Queue-based система — задачи в виде markdown файлов, атомарное перемещение, защита от race conditions
Judge как gatekeeper — код коммитится только после прохождения pytest + ruff. Если тесты падают — создается тикет на фикс.
Параллельная работа — можно запускать несколько воркеров одновременно (через отдельные workspace или разные очереди)
launchd интеграция — агенты могут работать по расписанию или как демоны
Технические детали:
* Bash-оркестратор (не AI, детерминированный скрипт)
* Cursor Agent CLI для запуска агентов
* Структурированное логирование всех запусков
Практическое применение:
Сейчас проверяю может ли эта штука сделать что то вменяемое для разработки ML Pricing Engine — системы динамического ценообразования для storage depot.
Система полностью переиспользуемая — можно скопировать agent_factory/ в любой проект и начать работать.
Если получится что то вменяемое, выложу agent_factory на git
Есть теория, что Курсор это сделал, чтобы жечь больше токенов, за день выел все вызовы с enterprise версии Курсора. За день было потрачено 35 млн токенов и Курсор начал просить доп денег
Что получилось:
Agent Factory — переиспользуемая система оркестрации для мульти-агентной разработки
Основана на архитектуре из статьи Cursor про scaling agents, но с важными улучшениями:
4 типа агентов:
1. Primary Planner — архитектор, разбивает проект на домены
2. Sub-Planner — превращает домены в атомарные задачи
3. Worker — выполняет задачи (пишет код, но НЕ коммитит)
4. Judge — единственный, кто коммитит код (только после прохождения всех тестов)
Ключевые фичи:
Goal File — файл-источник истины, который агенты проверяют на каждом запуске. Можно менять цели проекта в реальном времени, и все агенты автоматически увидят изменения.
Queue-based система — задачи в виде markdown файлов, атомарное перемещение, защита от race conditions
Judge как gatekeeper — код коммитится только после прохождения pytest + ruff. Если тесты падают — создается тикет на фикс.
Параллельная работа — можно запускать несколько воркеров одновременно (через отдельные workspace или разные очереди)
launchd интеграция — агенты могут работать по расписанию или как демоны
Технические детали:
* Bash-оркестратор (не AI, детерминированный скрипт)
* Cursor Agent CLI для запуска агентов
* Структурированное логирование всех запусков
Практическое применение:
Сейчас проверяю может ли эта штука сделать что то вменяемое для разработки ML Pricing Engine — системы динамического ценообразования для storage depot.
Система полностью переиспользуемая — можно скопировать agent_factory/ в любой проект и начать работать.
Если получится что то вменяемое, выложу agent_factory на git
Есть теория, что Курсор это сделал, чтобы жечь больше токенов, за день выел все вызовы с enterprise версии Курсора. За день было потрачено 35 млн токенов и Курсор начал просить доп денег
Cursor
Scaling long-running autonomous coding
We've been experimenting with running coding agents autonomously for weeks at a time.
1🔥111😁69👍32❤19🥴12🤔5💩3🤡2❤🔥1👎1
🧭 Как на самом деле должна быть устроена data-функция?
Все data-специалисты в одном центре или внутри команд? Центр экспертизы, децентрализация или гибрид? Где проходит граница между скоростью и хаосом? Кто вы на самом деле: стратегический актив компании или ещё один IT-проект?
Почему в одних компаниях data-команды масштабируются и дают понятный impact, а в других появляются дублирующие роли, зоопарк стандартов и вечные споры о приоритетах?
И главный вопрос: кому должен подчиняться CDO, чтобы данные действительно работали на бизнес и почему это решение влияет на результат сильнее, чем выбор инструментов и моделей?
Об этом уже завтра в онлайн-эфире South HUB.
Живой разговор о структурах, ролях и управленческих решениях, которые определяют судьбу больших data-команд.
🗓 20 января, 18:00–19:00 (МСК), онлайн
▶ Смотреть в YouTube
💬 Смотреть в VK видео
Если вы руководите или строите data-функцию и чувствуете, что вопросы структуры и подчинения становятся критичнее моделей этот разговор для вас.
Все data-специалисты в одном центре или внутри команд? Центр экспертизы, децентрализация или гибрид? Где проходит граница между скоростью и хаосом? Кто вы на самом деле: стратегический актив компании или ещё один IT-проект?
Почему в одних компаниях data-команды масштабируются и дают понятный impact, а в других появляются дублирующие роли, зоопарк стандартов и вечные споры о приоритетах?
И главный вопрос: кому должен подчиняться CDO, чтобы данные действительно работали на бизнес и почему это решение влияет на результат сильнее, чем выбор инструментов и моделей?
Об этом уже завтра в онлайн-эфире South HUB.
Живой разговор о структурах, ролях и управленческих решениях, которые определяют судьбу больших data-команд.
🗓 20 января, 18:00–19:00 (МСК), онлайн
Если вы руководите или строите data-функцию и чувствуете, что вопросы структуры и подчинения становятся критичнее моделей этот разговор для вас.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥89❤25👍16💩8🤔2
От себя добавлю, что пока эксперименты и работа в ML оставляют желать лучшего.
То есть там, где нет чёткого пути, нужно множество экспериментов и гипотез, агенты выдают среднюю жвачку
С другой стороны, это ли не мечта, набрасывать гипотезы и проверять их
То есть там, где нет чёткого пути, нужно множество экспериментов и гипотез, агенты выдают среднюю жвачку
С другой стороны, это ли не мечта, набрасывать гипотезы и проверять их
👍80❤15🙈8😁5💯5🥰2
Forwarded from Записки C3PO
Год назад на все предикты Дарио большая часть моих знакомых смотрела, крутя палец у виска. Сейчас почти все мои знакомые SWE, начиная от стартапа и заканчивая бигтехом, пишут руками меньше 20% кода, а всё остальное делает агент. Я сам давно уже не программист, поэтому не показатель, но с появлением Cursor и Claude Code редко пишу код руками. С появлением Opus 4.5 — все 100% кода пишутся им в Claude Code. Более того, я в терминале работаю через Claude Code — настолько лень стало писать bash-команды самому.
https://news.1rj.ru/str/seeallochnaya/3305
https://news.1rj.ru/str/seeallochnaya/3305
Telegram
Сиолошная
Новое предсказание от Dario! Слушаем внимательно 🎧:
Сейчас, если говорить о моделях, которые пишут код... У нас в Anthropic есть инженеры, которые говорят: "Я больше вообще не пишу код. Я просто даю модели написать код, потом редактирую его и занимаюсь…
Сейчас, если говорить о моделях, которые пишут код... У нас в Anthropic есть инженеры, которые говорят: "Я больше вообще не пишу код. Я просто даю модели написать код, потом редактирую его и занимаюсь…
🥴67❤24🔥10🤨8🤡6👍1
Пока Игорь где-то шифруется с девятью битками, я продолжаю думать, куда их приткнуть — кроме стальных пластин и железных кошельков.
А с учётом моего недавнего опыта общения с одним британским банком, где мне минут 20 пришлось объяснять, почему я перевожу деньги с этого банка на свой же счёт в другом и что я сам себе не скаммер, хочется ещё и максимальной простоты, без лишнего геморроя.
Поэтому мысли снова вернулись к non-custodial. И тут вспомнился @Wallet.
Думаю попробовать написать в их саппорт — что-бы мне наконец разрешили покупать и продавать всякие SPYx (S&P 500). С предыдущего поста ничего не поменялось: регион всё ещё недоступен.
В целом, прямо сейчас тут видна явная ниша для бизнеса. Если польются пользователи, зачем ограничиваться только ETF и акциями? Логичнее продавать готовые стратегии — когда за тебя собирают портфель под твой риск-профиль, ведут его, а ты просто платишь комиссию.
Команда Wallet, приходите ко мне — помогу с такой фичей. Спрос будет - многим лень (как и мне) сидеть и выискивать тикеры по одному.
А с учётом моего недавнего опыта общения с одним британским банком, где мне минут 20 пришлось объяснять, почему я перевожу деньги с этого банка на свой же счёт в другом и что я сам себе не скаммер, хочется ещё и максимальной простоты, без лишнего геморроя.
Поэтому мысли снова вернулись к non-custodial. И тут вспомнился @Wallet.
Думаю попробовать написать в их саппорт — что-бы мне наконец разрешили покупать и продавать всякие SPYx (S&P 500). С предыдущего поста ничего не поменялось: регион всё ещё недоступен.
В целом, прямо сейчас тут видна явная ниша для бизнеса. Если польются пользователи, зачем ограничиваться только ETF и акциями? Логичнее продавать готовые стратегии — когда за тебя собирают портфель под твой риск-профиль, ведут его, а ты просто платишь комиссию.
Команда Wallet, приходите ко мне — помогу с такой фичей. Спрос будет - многим лень (как и мне) сидеть и выискивать тикеры по одному.
Telegram
Wallet
Purchase cryptocurrency by bank card, exchange, and transfer to other wallets. Support: @wallet_supportbot
4😁100👍35💩15❤7👎6🔥4🤡4