DataTalks – Telegram
DataTalks
1.11K subscribers
594 photos
52 videos
472 links
Образовательный проект DataTalks. Рассказываем про управление данными на конференциях, митапах и марафонах.

#datatalks #безграниц #безрекламы #безводы

Контакты:
dataoffice@rt.ru
datatalks.rt.ru
rutube.ru/channel/25367326/
Download Telegram
CNews опубликовал обзор Kubernetes-платформ для ИИ 2026 года, где выделяются возможности поддержки GPU, автоматического масштабирования и управления ресурсами под ML-нагрузки. Согласно обзору сейчас активно вырос спроса на Kubernetes, как на основу для масштабирования ИИ-инфраструктуры. Если лень читать обзор целиком, то нажимайте на спойлер ➡️ Платформа «Боцман» недавно признана лучшей российской Kubernetes-платформой для задач ИИ и машинного обучения по рейтингу CNewsMarket.

Немного матчасти. Kubernetes — это открытая платформа для оркестрации контейнеров, которая автоматизирует развертывание, масштабирование и управление контейнеризованными приложениями. Подробнее о том что это такое и зачем нужно хорошо написано здесь. Кстати, благодаря ИИ сразу и в сокращенном изложении, и в подробном.

Завершаем тему Kubernetes любопытной статьей с Хабра о том, как обновить Kubernetes-кластер сразу через несколько minor-версий с помощью ИИ-помощника.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31
Продолжаем тему Kubernetes полезной рекомендацией.

Уже завтра в 12:00 эксперты «Турбо Облака» и TData проведут вебинар про использование кубера в финтехе и ритейле.

➡️Зарегистрироваться можно по ссылке, а прочитать подробности в анонсе
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54👍4
RT.DataLake (решение для построение корпоративных озер данных от TData) получил сертификат ФСТЭК 4 уровня доверия.
А значит его можно безопасно внедрять на значимых объектах критической информационной инфраструктуры. Поздравляем коллег с этим значимым событием.

➡️ Подробности можно прочитать здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🎉3👍2
🟣Статья о том, как выбирать метрики для анализа и почему не все метрики одинаково хороши

🟣 Статья с 2 кейсами по анализу данных - глубокий анализ производственных потерь, оптимизация ассортимента и поиск «золотых» товаров, и кейс по геоаналитике

🟣Статья про важные навыки аналитика данных, содержит упражнения для прокачки «аналитической интуиции»

🟣И на закуску про инструмент для аналитики потоков данных - данных, которые меняются во времени.

———
#Подборка_статей #Аналитика_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
🟣 Статья о новом законопроекте об уголовной ответственности за автоматизированную обработку персональных данных

🟣 Обзор штрафов за утечки данных в России и мире

🟣 Статья о практике работы с ПДн — судебные кейсы 2025 года

🟣 Разбор методов сбора данных онлайн-сервисами — от явных до скрытых способов: cookies, анализ поведения, интеграции с партнерами

———
#Подборка_статей #Персональные_данные
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
🟣 Статья Авито про автоматическую проверку качества дэшбордов

🟣 Островок рассказал про интеграцию DataHub с нейросетями. Спойлер ➡️ Теперь искать владельцев таблиц и анализировать связи можно через простой диалог с ботом.

🟣 Статья о том, как и почему Лемана про переходила с проприетарного каталога данных на Open Source и что из этого получилось. Спойлер ➡️ Пошли ва-банк, выбрав вариант с собственной разработкой

———
#Подборка_статей #Data_Governance
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21
🟣 Ландшафт киберугроз 2025 года — масштабная аналитика от Positive Technologies. Спойлеры → рост атак на 6%, основные жертвы — госсектор (15%) и промышленность (15%), популярные методы — вредоносное ПО (71%) и социальная инженерия (51%). В России за 8 месяцев утекло 13 млрд строк персональных данных

🟣 Как сайты вычисляют мошенников — детальный технический разбор антифрод-систем

🟣 Киберпреступные форумы — интересная статья о том, как устроена информационная безопасность на "темной стороне" интернета

———
#Подборка_статей #Информационная_безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31
🟣Термодинамический способ ИИ-генерации — разработан прототип чипа для машинного обучения, который сможет потреблять в 10млн раз меньше электроэнергии

🟣Gemini 3 научили анализировать изображения как человек — приближать и отдалять изображение чтобы рассмотреть детали

🟣Adobe обновила Photoshop — улучшения в Generative Fill и новая бета-функция для работы с текстом

🟣Статья про аугментацию данных — как "испортить" картинки (повороты, шум, вырезание фрагментов, искажения), чтобы нейросеть обучалась лучше.

———
#Подборка_статей #Генерация_изображений
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2
💬 Хабр и сайт «Грамота.ру» подвели итоги голосования за фразу или слово 2025 года. В категории «Информационные технологии» победил «вайбкодинг». На втором месте «ИИ‑агент», на третьем — Max.

При выборе "слова года" используются следующие критерии: новизна, актуальность, частота употребления, освоение в языке. Подробнее о том, как проходит исследование и какие слова победили в отраслях психологии, экономки и финансов читайте здесь.

📞 А какое слово года у вас? Делитесь в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
➡️ Статья про подготовку данных для дэшбордов.

➡️ Статья о том, как делать дэшборды, понятные всем сотрудникам компании, независимо от их уровня погружения в продукт.

➡️ Статья о важности критического мышления при анализе графиков

➡️ И самая лучшая (на наш взгляд) книга про визуализацию данных

———
#Полезная_подборка #Аналитика_данных #Визуализация_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62
✏️ Коллеги из TData опубликовали 2 статьи (раз и два ) на Хабр, посвященные практическому применению LLM в инструментах DataGovernance.

В статьях описывается, как внедрение решений ИИ в DataGovernance упрощает жизнь аналитикам и коллегам, отвечающим за безопасность данных.

📞 Мы поговорили про эффекты внедрения обновленного инструмента RT.DataGovernance с Артемом Трофимовым - Директором направления организации управления данными через развитие инструментов и процессов в РТК ИТ.
Реализованы две важные функции ИИ, которые мы можем наблюдать в инсталляции RT.DataGovernance Ростелекома уже сейчас:
1. разметка персональных данных (ПДн)
2. описание объектов БД.
Решение этих задач вручную, без инструментов ИИ, никогда бы не было сделано, потому что заняло бы в разы больше времени.
Разметка ПДн в 20 раз увеличила скорость классификации данных по сравнению с ручной разметкой (при выполнении ручной проверки ресурсам в 3 ШЕ по фиксированному количеству объектов).
Описание объектов БД повысила доступность и понятность данных. Это позволяет аналитикам тратить на 15-30% меньше времени на задачи изучения данных (особенно когда речь идет о "сырых" данных систем-источников).
Спойлер!

Скоро будет внедрено и описание атрибутов, что сильно поможет в анализе тех таблиц, где сейчас нет никакого описания.


Все описанные функции доступны для любого подключенного ХД в датакаталоге DG. Поэтому будут полезны не только существующим пользователям DG, но и новым участникам.

➡️ Хотите узнать про DataGovernance в Ростелекоме больше – пишите свои вопросы в комментариях.
Ну и ставьте лайки, подписывайтесь на канал:)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍53