Data notes – Telegram
Data notes
45 subscribers
59 photos
5 videos
2 files
122 links
My data science notes
Download Telegram
Пользователи тестируют GPT-5 😁
😁2
Дороничев у Дудя. Одно из лучших объяснений, как работает ИИ для людей не из индустрии. Плюс рациональные и спокойные рассуждения о будущем человечества с ИИ тоже великолепные: никаких крайностей, паники и (анти-) утопий.
Расходимся?
Поучаствовал в вводном стриме, целью которого было познакомить начинающих предпринимателей с аналитикой данных. Однако вопросы в конце все равно были в основном про то, как вкатиться в индустрию , и заменит ли аналитиков AI
🔥4
Forwarded from 🤖 The Bell Tech
Триллионная дыра: почему ИИ-компании сжигают деньги без отдачи

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ THE BELL ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА THE BELL. 18+

Индустрия искусственного интеллекта все явственннее сталкивается с серьезной проблемой: бигтехи инвестируют сотни миллиардов долларов в строительство дата-центров для развития ИИ, но весь остальной бизнес не понимает, как на этой технологии заработать. Разрыв между инвестициями и реальной отдачей становится все заметнее.

💸 Математика не сходится

Популярность ChatGPT, Google Gemini и других сервисов среди обычных пользователей растет. Вместе с ней взлетает и спрос на вычислительные мощности и энергию. Но экономический эффект от внедрения AI продолжает решительно не оправдывать эти затраты.

По данным консалтинговой фирмы Bain&Co, которые приводит Bloomberg, разработчикам ИИ потребуется выручка в $2 трлн ежегодно, чтобы покрыть расходы на вычислительные мощности. Но их реальные доходы отстанут от этой цифры примерно на $800 млрд. Кроме того, если текущие темпы роста сохранятся, ИИ создаст колоссальную нагрузку на мировые цепочки поставок.

🆙 Гонка инвестиций не сбавляет ход

Техногиганты не собираются останавливаться — к концу года Amazon, Alphabet, Meta и Microsoft планируют вложить в AI свыше $300 млрд. По прогнозам Bloomberg Intelligence, к началу следующего десятилетия их совокупные годовые расходы превысят $500 млрд.

Тогда же глобальная потребность в вычислительных мощностях для AI может достичь 200 ГВт — половина придется на США. Компании направят до 10% технологических бюджетов на создание AI-платформ, включая агентов, способных выполнять сложные задачи с минимальным контролем человека.

Бизнес не понимает, зачем ему AI

Но пока технологические гиганты наращивают инвестиции, большинство компаний за пределами Кремниевой долины относятся к ИИ настороженно. FT проанализировала отчеты сотен американских компаний из индекса S&P 500. Результат неутешительный: многие упоминают AI в основном в контексте рисков — кибербезопасности, юридических проблем и возможных сбоев.

Легче всего адаптироваться компаниям, работающим с большими данными или клиентской поддержкой. Paycom (разработчик ПО для управления персоналом) использует AI для привлечения клиентов. Военная судостроительная компания Huntington Ingalls — ускоряет «принятие решений на поле боя». А Zoetis (одна из ведущих компаний в сфере здоровья животных) — автоматизирует медосмотры лошадей. Но даже среди них не все показывают рост акций.

Многие компании все еще руководствуются не стратегией, а страхом упустить выгоду, признает Харита Хандабатту из Gartner. Например, Coca-Cola пока ограничивается использованием ИИ для создания рекламы и не понимает, как еще применить технологию.

🥹 Риски яснее выгод

Парадоксально, но компании гораздо четче формулируют риски AI, чем его преимущества, пишет FT. В отчетах доводы в пользу внедрения расплывчаты, а угрозы классифицированы детально.

Первая, и потенциально главная, проблема — кибербезопасность. Например, Match Group (владелец дейтинг-сервисов) предупреждает об утечках персональных данных. Производитель спортивной одежды Lululemon беспокоится о компрометации информации. Microsoft считает, что неэффективное внедрение AI может навредить как отдельным людям, так и обществу.

Вторая — неудачи внедрения. Совместное исследование Microsoft и MIT показало, что 95% попыток внедрить генеративный AI для повышения производительности в самой Microsoft провалились. Причина в том, что AI-инструменты плохо интегрируются в существующую инфраструктуру компаний.

Третья — юридические риски. Meta инвестирует миллиарды в развитие «суперинтеллекта», но опасается исков за нарушение авторских прав при обучении моделей. Даже PepsiCo отмечает риски претензий за использование чужих технологий.

Что дальше?


Пока энергокомпании подсчитывают прибыль от AI-бума, сами разработчики ИИ балансируют на грани. Вопрос не в том, кто заработает на инфраструктуре, а успеют ли AI-компании стать прибыльными до того, как инвесторы закроют кран.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Друзья из Альфа-Банка ищут Middle+|Senior Data Scientist на проект в Альфа-Банк (работа через вендора)

Что предстоит делать на этой позиции?
Тебе предстоит развивать внутреннюю систему для автоматического анализа текстовых документов с применением больших языковых моделей (LLM):
- разрабатывать и внедрять различные сценарии анализа текстов (выделение параметров, суммаризация, классификация, сравнение документов)
- улучшать стабильность и качество текущих сценариев анализа текстов, оптимизировать код
- применять LLM, использовать NLP-инструменты, разрабатывать RAG-пайплайны, писать промпты
- совместно с командами DE, MLOps, мониторинга интегрировать сервисы в промышленную среду

Что ожидаем от кандидата?
- опыт решения NLP-задач
- опыт применения LLM в рабочих задачах
- уверенное владение ML-стеком Python: lightgbm/xgboost/catboost, Scikit-Learn, Pandas, Numpy
- опыт полного цикла разработки модели (от сбора требований до промышленной реализации и пилотирования)
- понимание принципов работы с малыми данными

По всем вопросам можете писать в личку @Goo_goo_goo_joob . Или мне , если стесняетесь:)
Рубрика “Чем занимаются Principal ребята в больших американских компаниях”

Во время работы контрактором в одной из Tier-2 компаний США имел честь довольно плотно общаться с несколькими Principal Data Scientists. Поделюсь своим видением того, чем же именно они занимаются в компаниях подобного уровня:

- Создание и поддержание культуры и стандартов работы с данными. Реальные примеры здесь: как наполнять таблицами в DWH, как создавать пайплайны, как вести документацию. Участие в написании и записи обучающе-просветительских материалов (презентации, воркшопы)
- Курирование довольно крупных проектов, таких как создание отдельных больших слоев в DWH (например, feature storage) с организацией документации, тестов и прочих сопутствующих ритуалов + отслеживание их выполнения. При этом написанием кода они тоже занимаются, поскольку роль по-прежнему инженерная, а не менеджерская - обычно это какие-то сложные кейсы, когда нужно, например, есть жесткие ограничения по времени работы ETL джобы и нужно выжать максимум эффективности при минимуме ресурсов. Так что hands on experience там что надо :)
- Код ревью, куда же без него. Обычно они являются owners какой-нибудь репы, вмерджиться в которую без их одобрения нельзя.
- Дежурство в чатах поддержки, например, есть условный канал #help-with-data с парой сотен коллег, которые задают либо технические вопросы, либо “а где лежат такие-то данные”. У принципалов есть обязательство выделять временные слоты, когда они мониторят эти чаты и помогают коллегам. Очень классная фича, когда любой коллега может “дотянуться” до топовой экспертизы, лично мне это очень помогло разрулить множество больших и маленьких проблем.
- Аналогичное обязательство есть по участию в тех собеседованиях: кто будет собесить Staff кандидата? Формально, нужен человек минимум одним грейдом выше :)

Так что хоть роль и техническая, разумеется, она уже больше про организацию и управление проектами и командами, но управление это как бы техническое, архитекторское.

Напоследок внесу свою лепту в разрушение стереотипа о том, что на таких позициях работают снобы, которых ”все достали своими однотипными вопросами”, наоборот, готовность помочь и чувство юмора у них на высоте. Так что гипотеза о том, что без софтов вы далеко не уедете (особенно в эпоху AI), подтверждается вновь и вновь
🔥4👍3
Продвинутые е-коммерсы уже расставляют ловушки для ваших AI-агентов😁
😁3
А вот что действительно важно, хотя почти не видно , так это то, что в последнем релизе Python 3.14 добавлена возможность отключить GIL и получить настоящий мультитрединг. Пока не все так гладко (нужна отдельная компиляция, не все даже стандартные либы поддерживаются), да и в 3.13 она уже была экспериментальной, но шаг значительный. Верим, что работы в этом направлении продолжатся
👍2
😁6
Coursera to Combine with Udemy to Empower the Global Workforce with Skills for the AI Era

https://investor.coursera.com/news/news-details/2025/Coursera-to-Combine-with-Udemy-to-Empower-the-Global-Workforce-with-Skills-for-the-AI-Era/default.aspx

Внезапно появилось объявление о слиянии Coursera и Udemy, общая оценка 2.5 млрд долларов. Монополии грядут прям везде.

Coursera - весьма хорошая платформа. Udemy, по ощущениям, выезжала чисто на маркетинге.

Интересно, как будет развиваться новая компания
👍1
Forwarded from Denis Sexy IT 🤖
Тут легенда ML-индустрии, ученый Эндрю Нг, сходил в Стэнфорд и поделился своим мнением про АИ и карьеру инженеров – видео длинное и я советую смотреть его, но вот топ-10 советов оттуда:

1. Держите рабочие AI-инструменты “свежими”: отставание быстро превращается в потерю продуктивности.
Сейчас выбор среды/ассистента для кода реально влияет на скорость и качество. Если вы используете инструменты на поколение старее, вы часто просто делаете ту же работу дольше и тяжелее

2. Код стал дешевле - дороже стало “решить, что строить” и “описать это четко”.
Когда написать код проще, узкое место смещается в постановку задачи: сформулировать цель, ограничения, критерии успеха, сценарии использования. То есть не “как закодить”, а “что именно нужно получить и как проверить, что получилось”

3. Умение разговаривать с пользователями - это ускоритель разработки, а не “софт-скилл ради галочки”.
Те, кто умеют сами собрать обратную связь, понять боль пользователя и быстро уточнить требования, двигаются быстрее, потому что меньше зависят от “переводчиков” между инженерами и рынком

4. Выбирайте работу по команде и людям, а не по “громкости бренда”. И требуйте ясности по команде заранее.
Если компания не готова сказать, в какую команду вы попадёте и что будете делать (или просит “сначала подпиши, потом разберёмся”), это риск: можно оказаться на задачах, которые не развивают вас в AI-направлении

5. Сделайте портфолио так, чтобы оно “рулило” интервью: пусть вас спрашивают про ваш проект, а не про случайные загадки.
Сильная тактика: собрать проект(ы), максимально похожие на будущую работу, и описать решения, компромиссы, метрики. Тогда интервью превращается в обсуждение реальной инженерии, где вы сильнее

6. Интервью - это проверка “командности под стрессом”, а не только IQ и алгоритмов.
Совет из истории: “стой на своём” можно, но без агрессии. Когда вам указывают на баг/угол, правильная реакция - совместно улучшать решение, а не защищаться как в споре

7. Код, сгенерированный AI, почти всегда приносит “долг по обслуживанию”: думайте как финансист.

Смысл простой: любой код потом надо сопровождать

Хороший “долг” - быстрый прототип, который приносит проверенную пользу/знания и окупает поддержку

Плохой “долг” - нагенерили “что-то крутое”, но никто не понимает, зачем, как работает и как чинить.
Важная мысль: выкинуть прототип - нормально, поддерживать непонятную кашу - дорого

8. Сейчас ценится не “сделал модель”, а “довёл до боевого использования”.
То есть: качество, надёжность, мониторинг, задержки, стоимость, безопасность, удобство для пользователя. На рынке сильный сигнал - умение доводить до работающего продукта, а не до демо

9. Станьте человеком, который переводит хайп в реальность: начните с вопроса “зачем?”.
Соцсети поощряют вовлечённость, а не точность. Поэтому трендовые слова (“агенты”, “всё заменим AI”) легко уводят в сторону. Практичный подход: сначала “зачем бизнесу?”, “какой показатель улучшаем?”, “что будет считаться успехом?” - и уже потом выбирать технологию

10. Готовьтесь к двум параллельным траекториям: большие облачные модели и небольшие локальные модели “у себя”.
В одних задачах будут доминировать мощные модели “как сервис”. В других (где важны приватность, IP, контроль, стоимость) - модели, которые разворачивают внутри компании. Полезные навыки на стыке: настройка под задачу (fine-tuning/адаптация), развёртывание, ограничения по данным, безопасность и эксплуатация.

Ну, база, что скажешь еще
👍5
Forwarded from max.sh
Год подходит к концу, поэтому самое время подводить итоги.

В этом посте разбираю одну из центральных тем блога в этом году: собеседования на ML/Research роли.

⚫️В первой половине года я много собеседовал и понял, что хочется делиться тем, что может помочь соискателям. Так появились эти тексты. Они разные по формату и теме, все субъективные и основаны на личном опыте. А теплые сообщения в личку о пользе текстов только мотивируют стараться

Типы вопросов на собеседованиях про Трансформеры
Подборка ресурсов для изучения RL в контексте LLM
Лонгрид ML Breadth Interview Deep Dive

Как готовиться к Coding Interview
Как готовиться к ML Design Interview
Как готовиться к ML Depth Interview

Рисерч стажировки в биг техе. Часть 1. Как попасть на собеседование
Рисерч стажировки в биг техе. Часть 2. Структура Интервью

⚫️Потом я оказался по другую сторону и начал собеседоваться сам. Собесы – это во многом рандом, поэтому любая информация помогает хоть немного увеличить шансы в этой лотерее. А реальные отзывы других людей так тем более. Я начал собирать истории подписчиков канала и делиться ими здесь. В итоге получилась солидная коллекция интервью-историй за 2025 год.

Все отзывы можно найти по тегу #интервью. А здесь оставлю ссылки на истории в зарубежные компании:

🌐Research Engineer в Google DeepMind
🍏Senior ML Engineer в Apple Music
💻Performance Engineer в Nvidia, Munich
💻OpenAI, Solutions Architect, Generative AI Deployment, London
Ⓜ️ Senior ML Engineer в Meta
🖥 Research Fellowship в Anthropic
🛒Applied Scientist, Amazon
🎧 Senior DL Engineer в Spotify, Personalization, London

Senior ML Engineer в Waymo, Perception Team, California
Solutions Architect в ByteDance, Дубай.
VP of AI ML в J.P. Morgan Chase, London
AI Engineer в Mistral.AI

🔥 Буду рад если поддержите пост репостами или поделитесь с друзьями. И забирайте себе в коллекцию, если готовитесь к новому приключению в следующем году!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Recap 2025

В профессиональном плане никаких достижений отметить не могу, по-прежнему работаю на разные страны, США, Африка, Россия (что внезапно оказывается довольно выгодно при текущем курсе рубля). До последнего откладывал погружение в AI, не люблю хайповые темы, предпочитаю занять выжидательную позицию с целью понять, стоит ли погружаться в тему или нет. Поняв, что всё-таки стоит, начал с небольшого проекта по разработке чат бота для техподдержки и сдачи очередного экзамена по AWS , а именно,  AI Practitioner, на этот раз в оффлайн режиме в тест центре.

А вот на личном было поинтереснее. Впервые в жизни всерьез занялся здоровьем по всем фронтам, понял, что если придерживаться жесточайшей дисциплины и выдержки, можно и здесь достичь потрясающих результатов. Например, полный отказ от мучного, сладкого и алкоголя на 4 месяца сделал больший вклад, чем посещение врачей в течение нескольких лет. Как пример результата - ни разу не заболел простудой в этом году, хотя раньше это случалось со мной раз в пару месяцев. Полностью избавился от необходимости приема успокоительных, снотворных и других ненужных здоровому организму препаратов впервые за 15 лет. И это только пара примеров. Ну и кажется, что попутно прохожу тот самый кризис среднего возраста, впервые задумался и смене индустрии, прорабатываю планы своих проектов и заработков вне найма, особенно на фоне криков о том, что кто-то кого-то там заменит. В любом случае, индустрия изменится необратимо и значительно, и быть готовым к этому нужно как минимум финансово.

Дочке скоро исполняется 3 года, она родилась в Аргентине, является гражданкой этой страны и, разумеется, в ее окружении говорят в основном на испанском. Мы наблюдаем здесь за нашей "когортой" детей,  тех детей русских мигрантов, которые тоже родились здесь три года назад, и понимаем, насколько сложно сохранить родную нам культуру для детей в другой стране. Здесь очень хорошо видно, насколько русский язык сложнее испанского, потому что дети, которыми не занимаются и отдают на воспитание няням, уже в три года не понимают своих русскоговорящих родителей. Наша дочь прекрасно говорит на обеих языках, и я считаю это одним из главных достижений уходящего года.
👍1
🔥1