Данные по-большому – Telegram
Данные по-большому
132 subscribers
330 photos
59 videos
205 links
И все остальное по-маленькому.

Успешный успех в сфере DE, DS, AI, ML и прочего бигтеха, а также лайфстайл, мемы и новости айтишки и не только
Download Telegram
Forwarded from e/acc
Кто заменит курьеров?

По выходным стараюсь делать мини-рисерч по индустрии для инвестирования. Сегодня поделюсь про роботов-доставщиков. Гуманоиды сегодня переоценены (миллиарды долларов стоимость компаний, которые не генерируют выручки), плюс практические массовые гуманоиды это еще года 3. Роботы-доставщики уже работают и в ближайшее время автоматизируют миллионы позиций.

Рынок жирный. У Doordash в прошлом году было 2.58 млрд заказов и 8 млн людей-курьеров, которые заработали суммарно $18B - грубо выходит около $7 на одну доставку только в выплатах курьеру (и это при том, что базовая выплата у них начинается с $2-10+ за заказ). У Uber - 8.8 млн активных водителей и курьеров глобально. В Европе только Wolt - 260k курьеров, Deliveroo - 135k райдеров. Грубо, 30 млрд доставок еды в год, $2 за робо-доставку, $60B в год (против ~$250B/год которые тратят сегодня курьеров).

Если убрать человека из последней мили, математика резко меняется, к чему стремятся все маркетплейсы еды и доставки (фаундер Uber еще 10 лет сказал, что автономия это главный стратегический приоритет). Serve Robotics хочет довести стоимость доставки роботом до $1 на масштабе, Coco говорит про “меньше чем половину стоимости человека” на своих объемах, Robomart говорит про снижение до 70%. Практически это значит следующее - платформа/ресторан будут готовы платить роботам примерно $1-3 за дроп вместо ~$7-10 за человека, то есть экономия в 3-4 раза при нормальном покрытии по районам и стабильном ETA. Я видел отчет, что живые курьеры доставляют успешно 98.5% заказов (остальные приходится компенсировать, включая стоимость товара/блюда), а роботы уже сегодня - 99.5%

Посмотрим на самых интересных игроков рынка:
- Zipline (дроны-доставщики самолетного типа) - 1.6 млн+ доставок, 100 млн+ автономных миль, доставка где-то в мире каждые 60 секунд, работа на 4 континентах
- Serve Robotics (тротуарные боты, спин-аут Postmates, публично торгуется, оценка ярд) - 1,000 роботов в 5 городах, 100k+ доставок, средняя дистанция около 1.3 мили
- Coco Robotics (Лос-Анджелес/Майами/Хельсинки, интеграции с DoorDash и Uber) - 500k+ доставок, план - 10,000+ роботов в 2026
- Starship - одна из первых компаний в индустрии, но работает только на кампусах, флот больше 3к роботов, 9 млн доставок за все время
- Wing - сеть дронов, больше 0.5 млн доставок сегодня
- Meituan - китайская сеть дронов, несколько сотен тысяч доставок в год

Глобально, этот рынок в 10+ миллионов курьеров будет заменен роботами везде, где это имеет экономический смысл, и базовые технологии для этого готовы. Сегодня это создает фантастические перспективы для фаундеров. И не только в области создания и operations роботов, но и отдельными компонентами рынка:
- компьютер-вижн (под "грязную реальность" - дождь, ночь, толпы, собаки, коляски, стройки, узкие тротуары, обоссаные лифты)
- датасеты для навигации (тротуары, съезды, лестницы, пандусы, проходы, ограничения по времени, динамические препятствия, боевые консьержки)
- indoor-навигация (лифты, моллы)
- teleop (пожалуй, самый большой рынок сегодня)
- fleet ops (диспетчеризация, мониторинг, SLA, анти-вандализм, удаленная диагностика, зарядка)
- построить конкретную delivery-вертикаль (фарма, почта, товары, одежда, бухло и наркотики)

FrodoBots, например, уже публикуют датасет около 2,000 часов данных с тротуарных роботов из 10+ городов. Я говорил с фаундером и они видят спрос на миллионы долларов на их данные. Для инвесторов тут понятная ставка на снижение стоимости (рынок winner-takes-city, а не winner-takes-all), для пользователей - дешевле и быстрее доставка. Многим курьерам придется искать другую работу, но шансы что эти изменения НЕ случатся я оцениваю как 0%.
1
Вышли эпигенетические часы последнего поколения с наивысшей точностью определения возраста человека.

Как известно, можно был угашенным в ноль торчком в 25 лет с убитым сердцем, почками и печенью, а можно и в 50+ быть как Брайан Джонсон и по возрасту жизненных систем соответствовать возрасту 25-30 лет.

Настанет тот день когда вместо паспортного возраста возраст человека будет автоматически считываться раз в сутки с помощью встроенных под кожу датчиков. Этот возраст будет сопряжён со стоимостью медстраховки, и тогда люди быстро станут зожниками на спорте.

Сделают такие датчики не у нас, но внедрят у нас первыми на фоне постепенной отмены ОМС.

#научный_иммортализм #новости #продление_жизни
Про Запад не так. Особенно для скалистов вилка выше.
Про РФ так.

#зарплаты
Моё лицо когда меня спрашивают о зарплатой вилке

#memes
😁5
DBHub - новый незаменимый помощник когда не хочешь исследовать где что лежит, чтобы создавать очередную витрину данных, и хочешь чтобы рутину за тебя сделала LLM.

DBHub — это универсальный сервер баз данных MCP, реализующий интерфейс сервера Model Context Protocol (MCP).
Этот шлюз позволяет клиентам, совместимым с MCP, подключаться и исследовать различные базы данных:

Универсальный шлюз: Единый интерфейс для PostgreSQL, MySQL, MariaDB, SQL Server и SQLite

Безопасный доступ: Режим только для чтения, туннелирование SSH и поддержка шифрования SSL/TLS

Мультибазы данных: Подключение к нескольким базам данных одновременно с конфигурацией TOML

Готов к продакшену: Ограничение строк, контроль таймаута блокировок и пул соединений

Нативный MCP: Полная реализация Model Context Protocol с ресурсами, инструментами и промптами

Теперь можно не костылить Text-to-SQL а использовать готовый MCP.
Но как и всегда с AI инструментами, нужно быть осторожным, так как DBHub может дропнуть базу, а также:

Execute SQL queries directly from AI tools:
- Run SELECT queries for data analysis
- Execute DDL/DML in read-write mode
- Support for parameterized queries
- Multi-statement execution with transaction support
#технологии
Как должна выглядеть идеальная работа дата-инжира в 2026 году

1. Нанимаешь джунов, даёшь им задачу сделать опись данных в дата-каталоге типа Openmetadata. Можно и в эксельке, если совсем уж нет никаких дата-каталогов.
2. Нанимаешь миддлов, чтобы они подключили MCP к Hive, S3, Postgres и другим источникам данных.
3. Приходишь, пишешь промпт "Хочу витрину". GPT6 тебе все собирает, пишет даг, ты пробегаешься глазами, говоришь "Отлично!", деплоишь и идёшь отдыхать.

Можно даже и без джунов и миддлов, сам опись делаешь (но в бигтехе не получится, там таблиц тысячи, нужны джуны).
Дата-инженер - это умирающая профессия

Я искренне убежден, что дата-инженеры в ближайшие три года станут такими же динозаврами, как админы БД Oracle или BI-разработчики на Power BI.

Наши пайплайны отрисует текстовый процессор с контекстным окном в 2 миллиона токенов с доступом по REST или через CLI в Airflow.
Data quality и сборку витрин сделает он же, если дать ему доступы по MCP ко всей инфраструктуре (с аппрувами команд со стороны человека).
Если выдать текстовому процессору доступы к Confluence и Gitlab, то он поймет что и как в компании работает.
А если контекстное окно расширят до 10 миллионов токенов, то туда влезет вообще вся кодовая база среднестатистической IT-конторы и все знания компании, и он сможет точечно внести изменения в код в любом месте и ничего не сломать.

Профессия будущего с кучей денег - это AI Engineer, то есть текстово-процессорный инжир полного цикла: от деплоя моделей и прочего mlops до тюнинга перфоманса моделей и оптимизации расхода токенов. Такой инженер должен быть как немного дата-систиенсом, так и дата-инжиром и девопсом. При этом уклон, конечно, в ML. Самый богатый AI Engineer - это тот, кто сэкономил компании миллионы на моделях, из чего он сам себе в карман положит полмиллиона-миллион зелёных в год.

#прогнозы
1
Нормальная зарплата для дата-инженера - это 100 000 рублей в месяц.

Если этих денег тебе не хватает, то нужные средства тебе должна давать твоя женщина. Деньги - это выражение женской любви. Если много даёт, то ей много вернётся. Если хочет обеспеченного, то обеспечит тебя, и ты сразу будешь обеспеченным. А ты будешь ее вдохновлять и одаривать мужскими космическими энергиями, заботой и лаской, будешь радовать ее своим присутствием в ее жизни.

Если у тебя уже есть дети, то настоящей женщине для любви они не помеха, ведь чужих детей не бывает. Если у тебя есть дети, но ещё нет своей квартиры, то настоящей женщине с милым рай в шалаше, если любит, и вообще Бог дал зайку даст и вам лужайку.

Настоящая женщина также должна угадывать твое настроение и твои потребности, ей не надо сообщать "Хочу есть" - она видит что ты голодный вечером после работы дата-инженером и сразу идёт готовить минимум пять разных блюд.

Деньги от женщины - это выражение ее любви к тебе. Причем сумма тоже важна:
- Если ей 18, и у нее не было парня, то можешь и ты оплатить за нее пиво и чипсы в Пятёрочке.
- Если у нее был один парень, то 100 000 рублей в месяц тебе от нее - это базовый минимум.
- Два парня - 200 000 рублей.
- 50 парней - минимум пять миллионов в месяц она должна зарабатывать, чтобы доказать тебе что она тебя любит. Она пойдет на вторую, третью работу, на вахту риэлтором в Дубае лишь бы доказать тебе, что любит тебя. Иначе она тебя не любит, и от нее надо уходить.
- Если у нее уже есть дети, то она идёт на работу и обеспечивает их, а ты вдохновляешь ее на трудовые свершения ради любви.

Вот поэтому 100 тысяч рублей в месяц - это норма, дорогой друг. Расслабься и не парься, все у тебя замечательно, а если нет, то срочно ищи настоящую женщину. Не знаешь как - оставляй заявку в комментариях на курс от админа "Как найти настоящую женщину?", всего за 50 000 рублей по скидке перед новым годом.

#memes #сарказм
🤡3💊2🥴1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот почему айтишнику нужно работать по ТК РФ и получать минимум 500к в месяц, а лучше 700-900к в месяц
🤡4💊2🥴1🤝1
Интересная статья про то, как AI агенты убивают разработку ПО.

Зачем нужен Power Point, когда AI сгенерирует тебе презентацию в фирменном стиле компании?
Зачем нужны операционные системы, когда OpenAI создаёт генеративную ОС, в которой можно за пару промптов сгенерировать себе видеоредактор или свой личный Photoshop?

SaaS-сервисы пытаются интегрировать AI, но зачем их услуги, если можно сгенерировать свой личный Databricks или AWS?

#технологии
Forwarded from Machinelearning
📌Со-основатель Google DeepMind: вероятность появления AGI к 2028 году составляет 50%.

Шейн Легг, сооснователь и главный AGI-сайентист Google DeepMind в свежем видео-подкасте предлагает понятие "минимального AGI".

Это не обязательно "божественный сверхразум", а агент, способный выполнять когнитивные задачи, типичные для человека.

🟡Сегодня мы видим явный дисбаланс в возможностях моделей.

С одной стороны, топовые модели уже владеют 100–150 языками и обладают феноменальной общей эрудицией, зная детали о городах в Новой Зеландии.

С другой стороны, они спотыкаются на базовых вещах, доступных любому ребенку.

Например, в задачах на визуальное мышление модели путаются в перспективе: они могут не понять, что синяя машина на картинке больше красной, просто потому что она находится ближе.


Другой пример - работа с диаграммами: если попросить ИИ посчитать количество ребер, выходящих из узла на графе, он часто ошибается, так как не умеет внимательно пересчитывать объекты так, как это делает человек.


🟡Фундаментальных физических ограничений для преодоления человеческого уровня интеллекта не существует, если смотреть на это с инженерной точки зрения.

Человеческий мозг - это устройство весом чуть больше килограмма, потребляющее около 20 ватт энергии. Сигналы в нем передаются посредством электрохимических реакций со скоростью примерно 30 метров в секунду, а частота работы нейронов составляет всего около 100 герц.

Сравните это с современным дата-центром: это сооружение весом в сотни тонн, потребляющее 200 мегаватт. Сигналы там "бегают" со скоростью света, а тактовая частота процессоров достигает 10 млрд. герц.

Разница в масштабах — это десятки порядков сразу по нескольким измерениям: энергопотреблению, объему, пропускной способности и скорости. Поэтому считать человеческий интеллект верхним пределом возможного было бы ошибкой.

🟡Для достижения AGI недостаточно просто масштабировать данные.

Критическим барьером остается непрерывное обучение. Люди, приходя на новую работу, не обязаны знать все сразу - они учатся в процессе.

Современный ИИ представляет собой статичные объекты после тренировки. Чтобы это изменить, потребуются архитектурные инновации, например, внедрение систем эпизодической памяти, которые позволят модели запоминать новый опыт и дообучаться на нем в реальном времени, не забывая старое.

В ближайшие годы мы увидим переход от ИИ как инструмента к агентным системам, способным самостоятельно планировать и выполнять сложные цепочки действий, например, написать ПО или спланировать поездку "под ключ".

🟡Вопрос безопасности в таких системах Легг предлагает решать по аналогии с медленным мышлением у человека.

ИИ не должен просто реагировать инстинктивно; он должен демонстрировать цепочку рассуждений, которую можно промониторить. Это дает возможность проверить, почему модель приняла то или иное этически сложное решение — например, солгать злоумышленнику, чтобы спасти чью-то жизнь.

Если мы сможем видеть этот скрытый процесс размышления, доверие к системе вырастет. Это станет критически важным, когда ИИ начнет трансформировать рынок труда: например, в сфере разработки ПО, где вместо команды из 100 инженеров для той же работы может потребоваться всего 20 специалистов, использующих продвинутые инструменты.

🔜 Послушать умного человека в очках 53 минуты на Youtube


@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Выкатили Spark 4.1.
Вроде бы он дружит со Scala 3 и более оптимизированный в AQE.

#технологии
🔥1
Топ навыков, которые тебе не нужны в 2025, чтобы получать офферы:
1. Алгосы (если ты не квант и не работаешь близко к железу, то не нужны вообще)
2. Умение кодить (нужно только знать что такое геттеры, сеттеры, фабрики и прочее, а вот писать их уметь не нужно вообще)

Все это можно начитерить на изи. Если в компании есть этап с лайвкодингом, то там сидят ретрограды, к которым идти или не стоит, или туда ломятся вчерашние студенты, готовые работать за еду, и поэтому их этап с лайвкодингом можно и нужно начитерить. В норм компаниях лайвкодинг закончился в 2023-2024 годах, если был вообще.

Топ навыков, которые тебе нужны и которые не начитерить никак даже с транскрибатором:
1. System design и знания на уровне Senior solution architect и старшего системного аналитика.
2. Знание конкретных инструментов: что такое, как работает, как настраивать и где применять, а также какие косяки у инструмента есть.
3. Умение настраивать пайплайны AI-агентов. Новейший скилл чисто чтобы у тебя было время на детальный анализ проблем бизнеса, а не на технические затыки с кодом.

Если ты знаешь каким инструментом закрыть боли бизнеса и что может пойти не так в процессе развертывания этого инструмента, то тебе заплатят уйму денег за это, потому что лучше заплатить миллион в год тебе, нежели потерять десять миллионов на кривой архитектуре и падающих сервисах.

Будь не кодером, а суперпупердупер архитектором с глубокими знаниями каждого инструмента. А для последнего как раз нужно читать книжки и зазубривать вопросы и ответы с собесов.

#карьера #собесы
👍1
Самый короткий хинт как выучить до уровня гуру любой инструмент

1. Читаешь книгу
2. Видишь, допустим, что в Kafka есть такой параметр как batch size. Просишь текстовый процессор типа Claude или Perplexity раскидать архитектуру условно в трёх разных индустриях с применением Кафки в качестве брокера и придумать сценарии как, к примеру, увеличение батчсайза повлияет на работу всех систем, забирающих данные из Кафки. Так ты не просто знаешь про такой параметр, но и понимаешь как он на деле на что влияет.

#хинты
👍1🤝1