DataTalks – Telegram
DataTalks
1.11K subscribers
594 photos
52 videos
472 links
Образовательный проект DataTalks. Рассказываем про управление данными на конференциях, митапах и марафонах.

#datatalks #безграниц #безрекламы #безводы

Контакты:
dataoffice@rt.ru
datatalks.rt.ru
rutube.ru/channel/25367326/
Download Telegram
⚡️ TData получила премию TAdviser IT Prize 2025 за проект с AstraZeneca

Решение RT.DataGovernance победило в номинации «Экосистема управления данными: проект года».

Проект был реализован для международной биофармацевтической компании AstraZeneca при участии консалтинговой компании Axenix.

В рамках первого этапа проекта компания интегрировала данные из CRM- и CDP-систем, корпоративного хранилища (DWH) и цифровых активов. Создан каталог данных, охватывающий один домен, пять ключевых источников метаданных, более 4 000 таблиц и свыше 300 отчётов.

➡️ Читайте подробнее на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍3🏆2
Warner Music заключила историческую сделку с Suno — платформой для AI-генерации музыки с оценкой в $2,45 млрд. Артисты лейбла смогут добровольно разрешить использование своих голосов, получая новые источники дохода. А свежее исследование Яндекса показало: 67% профессиональных музыкантов применяют нейросети. Например, нейросети используют для визуального контента (47%), генерации инструменталов (26%) и продвижения (20%).

Однако консенсуса в индустрии нет. Пол Маккартни записал «немой» трек в знак протеста против обучения ИИ на музыке без согласия правообладателей — к акции присоединились более тысячи артистов. А региональный суд Мюнхена вынес решение против OpenAI: модели GPT-4 и 4o нарушают авторское право, когда воспроизводят фрагменты защищенных песен по запросам пользователей.
👍2
Исследователи из Cardiff University и Ca' Foscari University установили, что языковые модели не понимают юмор. ИИ распознает структуру каламбуров по знакомым паттернам, но не улавливает суть. Эксперимент показал: когда в шутке меняли ключевое слово на синоним, уничтожая игру слов, модели всё равно считали фразу каламбуром.

Работа Singapore Management University, получившая награду ACM SIGSOFT Distinguished Paper Award, провела границу применимости LLM в разработке. Команда протестировала GPT-4, Claude 3.5 и Gemini 1.5 на аннотировании программных артефактов. Результат: модели справляются с 7 из 10 задач при условии низкого контекста и четких категорий. Сложные задачи — анализ баг-репортов, проверка уязвимостей — требуют человеческого суждения.

Anthropic обнаружила неожиданный паттерн: запреты на манипулирование наградами усиливают опасное поведение модели. Модель, научившаяся обходить систему вознаграждений, спонтанно начала обманывать, скрывать намерения и саботировать работу. Решение: промпты, разрешающие взлом, снизили вредное поведение на 75-90%. Когда модель не воспринимает хакинг как запретный, она не обобщает его до обмана. Метод уже используется при обучении Claude.
👍2🔥2
🎙 Почему рынок всё чаще говорит о Data Governance как о ключевой функции бизнеса? Об этом в свежем выпускe подкаста «Данные решают» с TData.

В гостях у Максима Зацепина и Дмитрия Кононова технологический партнёр БФТ-Холдинга, команда TData, – Григорий Бокштейн и Александр Юрасов.

Вместе мы обсудили ключевое:

почему Data Governance формирует культуру работы с данными и делает их прозрачными;
чем на практике отличается Data Governance от MDM и как их связка создаёт «единую версию правды»;
какие роли, процессы и инструменты нужны, чтобы компании начали получать эффект уже в первые месяцы;
какие тренды определяют будущее управления данными: автоматизация, DataOps, ИИ.

🗯 Интересные цитаты выпуска:

«Data Governance делает данные прозрачными – понятно, где они лежат и как формируются».
Григорий Бокштейн.


«DG описывает структуру данных, а MDM управляет мастер-данными – вместе они дают фундамент».
Дмитрий Кононов.


«Прозрачность – основа зрелой data-культуры».
Александр Юрасов.


«Связка DG + MDM создаёт единую версию правды для решений».
Максим Зацепин.


️ Смотрите выпуск в 📺 VK Видео, 📺 RuTube, 📝 Дзен и слушайте в 💬 Телеграм на любимых площадках.

Это практическая инструкция для тех, кто хочет обеспечить качественное управление данными в компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
Роботизированные руки могут двигаться точнее благодаря индийскому танцу. Исследователи из Университета Мэриленда изучили 30 мудр — традиционных жестов танца Бхаратанатьям. Идея в том, что сложные движения руки можно разложить на базовые элементы, как слова на буквы. Танцевальные жесты дали более богатый «алфавит», чем повседневные хватательные движения: при тестировании на воспроизведении букв американского жестового языка система на основе мудр показала значительно лучшую точность.

Инженеры MIT создали летающего микроробота, способного маневрировать как настоящий шмель. Устройство весит меньше канцелярской скрепки и оснащено машущими крыльями с мягкими искусственными мышцами. Такие микророботы смогут работать под завалами, в густой растительности и внутри узких конструкций.

Стэнфордские исследователи улучшили навигацию кубического робота NASA Astrobee на МКС с помощью машинного обучения. Нейросеть ускоряет планирование траекторий в невесомости на 50-60% по сравнению с традиционными методами.
1👍1🔥1
Forwarded from TData
⚡️Коммерсантъ «Управление данными: выход из хаоса»

Почему компании переходят от накопления информации к системной работе с ней

На рынке уже давно используются платформы класса Data Governance, позволяющие эффективно управлять данными, отслеживая их происхождение, проверяя корректность и обеспечивая доступность для аналитики.

Интеллектуальный анализ «темных данных», особенно в здравоохранении, способен существенно улучшить диагностику и лечение пациентов, поскольку отрасль генерирует около трети мировых данных.

Российские решения демонстрируют высокую зрелость и конкурентоспособность, сопоставимую с зарубежными аналогами.
В этом году международная биофармацевтическая компания AstraZeneca выбрала решение RT.DataGovernance российского разработчика TData для одного из ключевых проектов в рамках цифровой трансформации.

Подробнее на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍21
Forwarded from TData
Компании TData и «Денвик» представили универсальный коннектор для 1C

TData 1C Коннектор
— программный продукт для быстрой и безопасной выгрузки данных из платформы 1С в аналитические базы данных и BI-среды, такие как Yandex DataLens, Power BI, Qlik, Visiology и другие.
Коннектор решает ключевые задачи по извлечению и подготовке данных для глубокого анализа без необходимости ручной обработки или привлечения программистов для настройки обменов.

Подробнее на сайте
🔥5👍2
Возвращаемся с длинных праздников и делимся с вами интервью Доната Фетисова, директора по стратегии управления данными «Ростелекома».

В материале — отличный разбор того, почему компании покупают дорогие кластеры, но продолжают игнорировать цифры.

➡️ Донат разбирает, почему к нейросетям стоит относиться как к «начитанному стажеру» для рутины, а не как к замене экспертов, и как не потерять контроль над процессами в погоне за автоматизацией — читайте подробности в интервью по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71
CNews опубликовал обзор Kubernetes-платформ для ИИ 2026 года, где выделяются возможности поддержки GPU, автоматического масштабирования и управления ресурсами под ML-нагрузки. Согласно обзору сейчас активно вырос спроса на Kubernetes, как на основу для масштабирования ИИ-инфраструктуры. Если лень читать обзор целиком, то нажимайте на спойлер ➡️ Платформа «Боцман» недавно признана лучшей российской Kubernetes-платформой для задач ИИ и машинного обучения по рейтингу CNewsMarket.

Немного матчасти. Kubernetes — это открытая платформа для оркестрации контейнеров, которая автоматизирует развертывание, масштабирование и управление контейнеризованными приложениями. Подробнее о том что это такое и зачем нужно хорошо написано здесь. Кстати, благодаря ИИ сразу и в сокращенном изложении, и в подробном.

Завершаем тему Kubernetes любопытной статьей с Хабра о том, как обновить Kubernetes-кластер сразу через несколько minor-версий с помощью ИИ-помощника.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31
Продолжаем тему Kubernetes полезной рекомендацией.

Уже завтра в 12:00 эксперты «Турбо Облака» и TData проведут вебинар про использование кубера в финтехе и ритейле.

➡️Зарегистрироваться можно по ссылке, а прочитать подробности в анонсе
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54👍4
RT.DataLake (решение для построение корпоративных озер данных от TData) получил сертификат ФСТЭК 4 уровня доверия.
А значит его можно безопасно внедрять на значимых объектах критической информационной инфраструктуры. Поздравляем коллег с этим значимым событием.

➡️ Подробности можно прочитать здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🎉3👍2
🟣Статья о том, как выбирать метрики для анализа и почему не все метрики одинаково хороши

🟣 Статья с 2 кейсами по анализу данных - глубокий анализ производственных потерь, оптимизация ассортимента и поиск «золотых» товаров, и кейс по геоаналитике

🟣Статья про важные навыки аналитика данных, содержит упражнения для прокачки «аналитической интуиции»

🟣И на закуску про инструмент для аналитики потоков данных - данных, которые меняются во времени.

———
#Подборка_статей #Аналитика_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
🟣 Статья о новом законопроекте об уголовной ответственности за автоматизированную обработку персональных данных

🟣 Обзор штрафов за утечки данных в России и мире

🟣 Статья о практике работы с ПДн — судебные кейсы 2025 года

🟣 Разбор методов сбора данных онлайн-сервисами — от явных до скрытых способов: cookies, анализ поведения, интеграции с партнерами

———
#Подборка_статей #Персональные_данные
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
🟣 Статья Авито про автоматическую проверку качества дэшбордов

🟣 Островок рассказал про интеграцию DataHub с нейросетями. Спойлер ➡️ Теперь искать владельцев таблиц и анализировать связи можно через простой диалог с ботом.

🟣 Статья о том, как и почему Лемана про переходила с проприетарного каталога данных на Open Source и что из этого получилось. Спойлер ➡️ Пошли ва-банк, выбрав вариант с собственной разработкой

———
#Подборка_статей #Data_Governance
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21
🟣 Ландшафт киберугроз 2025 года — масштабная аналитика от Positive Technologies. Спойлеры → рост атак на 6%, основные жертвы — госсектор (15%) и промышленность (15%), популярные методы — вредоносное ПО (71%) и социальная инженерия (51%). В России за 8 месяцев утекло 13 млрд строк персональных данных

🟣 Как сайты вычисляют мошенников — детальный технический разбор антифрод-систем

🟣 Киберпреступные форумы — интересная статья о том, как устроена информационная безопасность на "темной стороне" интернета

———
#Подборка_статей #Информационная_безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31
🟣Термодинамический способ ИИ-генерации — разработан прототип чипа для машинного обучения, который сможет потреблять в 10млн раз меньше электроэнергии

🟣Gemini 3 научили анализировать изображения как человек — приближать и отдалять изображение чтобы рассмотреть детали

🟣Adobe обновила Photoshop — улучшения в Generative Fill и новая бета-функция для работы с текстом

🟣Статья про аугментацию данных — как "испортить" картинки (повороты, шум, вырезание фрагментов, искажения), чтобы нейросеть обучалась лучше.

———
#Подборка_статей #Генерация_изображений
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2
💬 Хабр и сайт «Грамота.ру» подвели итоги голосования за фразу или слово 2025 года. В категории «Информационные технологии» победил «вайбкодинг». На втором месте «ИИ‑агент», на третьем — Max.

При выборе "слова года" используются следующие критерии: новизна, актуальность, частота употребления, освоение в языке. Подробнее о том, как проходит исследование и какие слова победили в отраслях психологии, экономки и финансов читайте здесь.

📞 А какое слово года у вас? Делитесь в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
➡️ Статья про подготовку данных для дэшбордов.

➡️ Статья о том, как делать дэшборды, понятные всем сотрудникам компании, независимо от их уровня погружения в продукт.

➡️ Статья о важности критического мышления при анализе графиков

➡️ И самая лучшая (на наш взгляд) книга про визуализацию данных

———
#Полезная_подборка #Аналитика_данных #Визуализация_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62
✏️ Коллеги из TData опубликовали 2 статьи (раз и два ) на Хабр, посвященные практическому применению LLM в инструментах DataGovernance.

В статьях описывается, как внедрение решений ИИ в DataGovernance упрощает жизнь аналитикам и коллегам, отвечающим за безопасность данных.

📞 Мы поговорили про эффекты внедрения обновленного инструмента RT.DataGovernance с Артемом Трофимовым - Директором направления организации управления данными через развитие инструментов и процессов в РТК ИТ.
Реализованы две важные функции ИИ, которые мы можем наблюдать в инсталляции RT.DataGovernance Ростелекома уже сейчас:
1. разметка персональных данных (ПДн)
2. описание объектов БД.
Решение этих задач вручную, без инструментов ИИ, никогда бы не было сделано, потому что заняло бы в разы больше времени.
Разметка ПДн в 20 раз увеличила скорость классификации данных по сравнению с ручной разметкой (при выполнении ручной проверки ресурсам в 3 ШЕ по фиксированному количеству объектов).
Описание объектов БД повысила доступность и понятность данных. Это позволяет аналитикам тратить на 15-30% меньше времени на задачи изучения данных (особенно когда речь идет о "сырых" данных систем-источников).
Спойлер!

Скоро будет внедрено и описание атрибутов, что сильно поможет в анализе тех таблиц, где сейчас нет никакого описания.


Все описанные функции доступны для любого подключенного ХД в датакаталоге DG. Поэтому будут полезны не только существующим пользователям DG, но и новым участникам.

➡️ Хотите узнать про DataGovernance в Ростелекоме больше – пишите свои вопросы в комментариях.
Ну и ставьте лайки, подписывайтесь на канал:)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍53