Data Science – Telegram
Data Science
41.3K subscribers
1.65K photos
4 videos
47 files
2.05K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
🔋 Goldman Sachs выпустил 26-страничный отчёт об энергии и ИИ: **Powering the AI Era**

Главный вывод: дата-центры для ИИ потребляют электричество быстрее, чем энергетики успевают строить новые мощности.
Будущее индустрии будет зависеть не только от быстрых чипов, но и от того, кто сможет найти деньги и схемы финансирования для строительства.

🧵 Кратко по пунктам 👇

🚂 Каждый технологический бум имел опору
- XIX век — железные дороги
- 1990-е — оптоволоконные сети
- 2020-е — стойки с GPU
Одна «AI-фабрика» мощностью 250 МВт обойдётся примерно в $12 млрд.

📈 Почему обучение ИИ так прожорливо
- Кластеры состоят из тысяч GPU с жидкостным охлаждением.
- К 2027 году одна стойка будет потреблять в 50 раз больше энергии, чем облачная стойка 2022 года.
- Даже с оптимизациями мировой спрос на энергию дата-центров вырастет на 160% к 2030 году.

Энергосети не справляются
- Средний возраст ЛЭП в США — 40 лет.
- Разрешение на газовую станцию занимает до 7 лет.
- Goldman оценивает распределение новых источников:
- 30% комбинированные газовые станции
- 30% газовые «пикеры»
- 27,5% солнечная энергетика
- 12,5% другие источники

🔌 Как выкручиваются операторы
- Строят дата-центры прямо рядом с генераторами.
- Используют микросети, чтобы сглаживать пики нагрузки.
- Это ускоряет запуск, но создаёт конфликты с соседями — круглосуточно шумят дизельные или газовые турбины.

🟠 Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Attacking LLMs and AI Agents: Advertisement Embedding Attacks Against LLMs

📚 Paper

@datascienceiot
Динамические таблицы YTsaurus: рекламные профили поведенческого таргетинга

Поведенческий трагетинг — система, требующая обработки сотен тысяч событий в секунду со строгой exactly-once-семантикой и временем отклика в доли секунды. Она основана на динамических таблицах YTsaurus и включает механизмы сжатия данных, бинарных дельт и шардирования. Решение позволяет эффективно обновлять пользовательские профили в реальном времени. Может использоваться для разных потоков данных, где есть обновляемое состояние, высокая нагрузка, требования к latency и exactly-once. 

📚 Paper
"Transcendence" is when an LLM, trained on diverse data from many experts, can exceed the ability of the individuals in its training data.

This paper demonstrates three types: when AI picks the right expert skill to use, when AI has less bias than experts & when it generalizes.

📚 Read

@datascienceiot
Tencent AI Lab introduces Vision-SR1

A self-rewarding Vision-Language Model to fix visual hallucinations & language shortcuts

📚Paper: https://huggingface.co/papers/2508.19652
📚Code: https://github.com/zli12321/Vision-SR1.

@datascienceiot
OpenAi Realtime Prompting Guide

📚 Guide

@datascienceiot
"GPT-5 moves from human-comparable to above human-expert performance"

GPT-5 outperforms licensed human experts by 25-30% and achieves SOTA results on the US medical licensing exam and the MedQA benchmark.

I sound like a broken record, but AI models are better than most doctors.

📚 Paper

@datascienceiot
On the Theoretical Limitations of Embedding-Based Retrieval"

📚Статья: https://arxiv.org/abs/2508.21038

@datascienceiot