Big Data AI – Telegram
Big Data AI
17.1K subscribers
943 photos
122 videos
19 files
947 links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🔥 Как аналитика данных трансформирует промышленное планирование — опыт лидеров отрасли

⚡️ Приглашаем 18 ноября (10:00–13:00, Москва) на отраслевое событие FanRuan о практическом применении аналитики в производстве. Разберем реальные кейсы, технологии прогнозирования и инструменты для принятия решений, чтобы планирование стало точнее, а загрузка мощностей — сбалансированной.
Что посмотрим и обсудим:

НЛМК (Роман Кулеш) — аналитика производственных планов, контроль выполнения Plan/Fact и архитектура BI для планирования;
ММК (Сергей Кулагин) — как визуализация ускоряет поиск узких мест и помогает принимать решения;
FanRuan (Zayne Zhao) — практический подход к прогнозированию спроса: от классификации спроса до связи плана с исполнением, и демонстрация возможностей продуктов FanRuan.

❗️ Для кого будет полезно: руководители и специалисты производств, аналитики и планировщики, ИТ и бизнес-подразделения, отвечающие за аналитику и цифровизацию.

❗️ Почему стоит прийти: реальные кейсы от лидеров металлургии и практические подходы к внедрению прогнозов на основе ИИ — без теории, только рабочие инструменты и примеры внедрения.

Регистрация обязательна — количество мест ограничено!

Реклама. ИП Чичерин-Лукьяненко Андрей Игоревич. ИНН 772830905927. erid: 2VtzqvLYND7
Please open Telegram to view this post
VIEW IN TELEGRAM
XLTable - OLAP Cервер для нового стека данных
Работайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.

Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.

📈Ключевые возможности XLTable:
• Аналог MS OLAP (SSAS) для больших данных
• Интеграция с MS Excel по протоколу XMLA
• Поддержка ClickHouse, BigQuery, Snowflake
• Скоро: YDB, Greenplum
• Множество групп мер, иерархий и измерений в одном кубе
• Гибкие настройки кэширования
• Развёртывание внутри вашей инфраструктуры или в облаке

🔒Безопасность:
• Интеграция с LDAP
• Разграничение доступа на уровне мер, измерений и их членов

⚙️Производительность:
• Безлимитное количество мер и измерений
• Работа из Excel c миллиардами строк данных
• Все расчеты производятся на уровне ClickHouse
• Отличные возможности для масштабирования

Хочешь получить бесплатную пробную версию на 30 дней?

👉🏻Напиши «OLAP» - покажем демо и поможем с настройкой

Контакт: https://news.1rj.ru/str/vorobiova_anastasia
Сайт с информацией о продукте: https://xltable.com/
🔥87👍4
🚨 Новая редкая работа от Терренса Тао: AlphaEvolve решает часть математических задач лучше людей

Google представила AlphaEvolve - систему, которая эволюционным поиском находит решения к сложным математическим задачам. Тао протестировал её на 67 задачах из разных областей: от неравенств до числовых констант.

📌 Что проверяли
- задача о «движущемся диване» в 2D и 3D
- Kissing problem в N-мерном пространстве
- упаковка окружностей
- задача IMO 2025 по тесселяции
- задача о стопках блоков

🧠 Как работает AlphaEvolve
Алгоритм запускает множество параллельных попыток, проверяет решения, а затем «скрещивает» лучшие идеи, отбирая наиболее успешные.

🔥 Интересные выводы
- сильнее модель - быстрее сходимость (хотя не всегда)
- параллельность ускоряет поиск, но сильно увеличивает стоимость
- reward hacking встречается часто
- результаты значительно лучше, если похожие задачи были в обучении и если процесс направляет эксперт (особенно когда эксперт - сам Тао)

💡 Важное предложение из статьи
Тао предлагает вводить класс задач «AlphaEvolve-hard» - те, где ИИ не может легко нарушить неравенство или найти конструкцию. Такие задачи требуют принципиально нового человеческого инсайта.

Эта работа пролетела почти незаметно, но я провёл над ней больше двух часов - и это одна из самых впечатляющих математических статей за последнее время.

https://www.alphaxiv.org/abs/2511.02864v1
👍5🔥1
Пилот с ИИ успешен, но масштабировать не получается?

«Технология работает, но устойчивого бизнес-эффекта нет. А вокруг – один хайп, сложно найти реально рабочие схемы».

Именно такие вопросы мы разбираем в AI Inside – канале о практическом применении ИИ в бизнесе.

Здесь нет абстрактных теорий – только то, что работает на практике:

Разбираем реальные кейсы: с цифрами и измеримыми результатами.
Делимся методиками внедрения: от автоматизации процессов до оркестрации ИИ-агентов.
Даем экспертный анализ: сложные темы – без воды, с фокусом на практической пользе.

О чем пишем в канале уже сейчас:

• Почему ИИ-агенты (пока) не заменят ваших сотрудников
• 95% компаний не получают отдачи от инвестиций в GenAI – это правда?
• Какие навыки команды будут критичны в 2030 году (спойлер: не программирование)

А еще:

изучаем техтренды и идеи, которые можно применить уже сегодня. Делимся инсайтами от инженеров-практиков и подборками классных статей про нейросети. И смешно шутим на тему ИИ.

Если вам интересен практический взгляд на ИИ – подписывайтесь → AI Inside
👍2👎2🔥2👌2
TextOp - фреймворк для управления гуманоидными роботами с помощью текста в реальном времени.

🎯 Что умеет:
- Принимает инструкции на естественном языке и превращает их в плавные, целостные движения тела робота.
- Позволяет мгновенно корректировать команды — изменения принимаются «на лету».
- Обеспечивает высокую скорость и живость реакции: текст → движение почти мгновенно.

🌟 Почему стоит:
- Удобный интерфейс: управляйте роботом так, как разговариваете с человеком.
- Интерактивность: меняйте команду в процессе выполнения — робот подстраивается.
- Применимо для демонстраций, взаимодействий с людьми, сервисных задач, шоу-роботов и множества других сценариев.

Если ищете способ управлять движением робота без сложного программирования - TextOp даёт простой и мощный путь.

http://text-op.github.io
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

🔍 Хотите сделать шаг от экспериментальных AI-прототипов к полноценным продакшен-агентам?

Мы подготовили среду, инструменты и пригласили экспертов — ждём только вас. 20 ноября стартует Yandex AI Studio Series — серия вебинаров для тех, кто уже работает с AI и хочет развивать агентные решения.

🚀 Что вас ждёт:
- 4 онлайн-трансляции с сессией вопросов и ответов.
- Разбор сценариев с применением LLM, VLM, Realtime API, MCP, RAG, Workflows и других технологий.
- Предзаписанный воркшоп для самостоятельной практики.
- Квиз и приятные сюрпризы.
- Нетворкинг в продуктовом комьюнити.
- Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

В программе:
- Разберём, что такое агенты и мультиагентные системы.
- Покажем, как собрать голосового и поискового агента, а также агента для обработки документов.
- Как применить знания на практике в собственных AI-проектах.

Если вы уже применяете AI и хотите вывести свои решения на новый уровень — присоединяйтесь.

📌 Регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
LoRA-модель для Qwen-Image-Edit-2509, которая автоматически:
• выравнивает страницу скана
• убирает центральный сгиб
• правильно обрезает изображение
• делает скан похожим на ровную, отдельную страницу

Единственное, что нужно - подобрать подходящее соотношение сторон под формат вашей книги, тогда результат будет максимально чистым.

Модель здесь:
https://huggingface.co/tarn59/book_flatten_and_crop_qwen_image_edit_2509
2
Cloud.​ru перевел Evolution AI Factory в коммерческую эксплуатацию. Теперь компании любого масштаба могут быстро запускать AI-решения, работать с генеративными моделями и экспериментировать с гипотезами.

Среда для разработки и внедрения решений на базе GenAI работает по тарифам с SLA, круглосуточной поддержкой и возможностью масштабирования, а цены на большие языковые модели составляют в среднем 35 ₽ за входной и 70 ₽ за выходной миллион токенов.

📈 Ключевые возможности и сервисы Evolution AI Factory:
• Доступ к каталогу Foundation Models (20+ моделей, включая GigaChat, Qwen, ChatGPT)
• Быстрый запуск моделей через ML Inference, включая свои и сторонние с HuggingFace• Эксперименты и тестирование гипотез в Evolution Notebooks
• Дообучение моделей под задачи бизнеса через ML Finetuning
• Работа с корпоративными данными и повышение точности через Managed RAG
• Запуск автономных AI Agents, выполняющих задачи и принимающих решения
💩2👍1
🚀 Оптимизация нагрузки с LPLB для MoE моделей

LPLB — это параллельный балансировщик нагрузки, использующий линейное программирование для оптимизации распределения нагрузки в моделях Mixture-of-Experts. Он динамически перераспределяет экспертов на основе статистики нагрузки, решая задачи распределения токенов для достижения балансировки.

🚀 Основные моменты:
- Использует линейное программирование для перераспределения токенов.
- Поддерживает динамическое переупорядочение экспертов.
- Оптимизирован для работы с NVIDIA cuSolverDx и cuBLASDx.
- Подходит для больших распределенных систем с несколькими GPU.
- Находится на стадии ранних исследований.

📌 GitHub: https://github.com/deepseek-ai/LPLB

#python
⚡️ Китай поглощает электричество темпами, которых мир ещё не видел

Рост потребления электроэнергии в Китае за последние годы поражает:

- За 4 года Китай добавил столько потребления, сколько вся Индия.
- За 6 лет — как Евросоюз.
- За 11 лет — как США.

И вот главный вывод:

⚠️ Электроэнергия становится новым узким местом, даже более критичным, чем чипы.

ИИ-центры, дата-центры, роботизированные фабрики, электромобили — всё требует колоссальных объёмов энергии.
Тот, кто сможет производить больше всего дешёвой электроэнергии, будет доминировать в следующей техно-эпохе.

И Китай в этой гонке далеко впереди Европы и США:
масштабные инвестиции в генерацию, сеть, ВИЭ, атом и гидро дают ему огромное преимущество.

Энергия становится новой нефтью — и КНР уже накопила стратегический запас.
👍101
🤖 Интегрировать AI в аналитику. Мигрировать данные без потерь. Масштабировать на тысячи пользователей.

Три задачи, с которыми сталкивается каждая команда. Yandex DataLens Festival — про то, как их решать. Неделя глубокого погружения в аналитику — с 8 по 16 декабря, онлайн и бесплатно.

🚀 Основные моменты:
- Разберут то, что реально пригодится в работе: от AI-инструментов DataLens до современных подходов к аналитике
- Формат без воды: практические гайды и прямой эфир с командой продукта
- Конкурсные задания с призами

Бонус: офлайн-афтепати в Москве для тех, кто хочет отвлечься от экрана и пообщаться вживую.

📌 Регистрация
3👍3🤝1
⚡️ UI-Venus от inclusionAI

Проект UI-Venus представляет собой интерфейсную библиотеку от inclusionAI, ориентированную на создание доступных, инклюзивных и современных пользовательских интерфейсов.

Основные особенности:
• Чистая и модульная архитектура UI-компонентов
• Доступность (a11y) встроена по умолчанию
• Подходит для интеграции в разные фреймворки и приложение
• Хорошая документация и примеры использования

Если вы работаете с фронтендом и хотите библиотеку, уделяющую внимание инклюзивности — UI-Venus может стать отличным выбором.

📁 Репозиторий: https://github.com/inclusionAI/UI-Venus/
2
⚡️ HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B

Tencent выложила в open-source новую модель HunyuanOCR.

Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.

Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.

Топ по бенчмаркам
860 на OCRBench среди всех моделей до 3B
94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов

🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков

Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.

Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.

📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf

@ai_machinelearning_big_data


#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
AI&ML в деле на AI DevTools Conf

4 декабря команда Cloud.ru проводит практическую конференцию — AI DevTools Conf. 

В программе доклады о создании AI-агентов, защите AI-систем и работе с DevOps-агентом.

А тех, кто посетит конференцию офлайн ждут воркшопы, где вы научитесь:
😶‍🌫️внедрять AI-инструменты в процесс разработки

😶‍🌫️оценивать LLM-агентов

😶‍🌫️тестировать безопасность AI

😶‍🌫️и не только


Места на офлайн-участие ограничены.

Успейте зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👑 «Близнецы, продвигающие планы Elon Musk по замене сотрудников X на Grok»

Согласно расследованию издания, Musk активно продвигает идею, что большая часть работы сотрудников X может быть заменена автоматикой - с ключевой ролью отводится системе Grok.
Главные пункты:
• Два брата - инженеры-автоматизаторы — играют решающую роль в разработке и доведении Grok до состояния, в котором он потенциально может выполнять функции, ранее выполняемые людьми.
• Подход заключается не просто в улучшении чатбота, а в создании автономной системы, которая сможет не только вести коммуникацию, но фактически управлять контентом, модерацией и сервисами внутри X.
• В издании отмечают, что для Musk это стратегическая ставка: сокращение частей персонала + переход на автоматизацию = снижение затрат + ускорение роста новых продуктов и услуг.
• Источник подчёркивает, что несмотря на идею, внедрение автоматизации — это масштабная задача, требующая надёжных моделей, тестов, стабилизации и — важно — готовности компании к культурному и операционному сдвигу.
• Эксперты отмечают: если такой сценарий реализуется, то соцсеть X и вовсе может поменять свой операционный режим — от компании с большим штатом людей до компании, где большая часть сервисов управляется ИИ-агентами.

Это важный сигнал для рынка: автоматизация на больших платформах идёт дальше чатботов — она направлена на замену целых функций, ранее людей-операторов.

https://www.theinformation.com/articles/twins-pushing-elon-musks-plans-replace-x-staff-grok
👀51👍1🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
10 декабря — код, архитектура, AI в деле

Сбер открывает двери в мир AI: 10 декабря — в Москве и онлайн.

Что вас ждет?
⬩На сцене — доклады о развитии нейросетевых моделей GigaChat и Kandinsky, о ключевых этапах их разработки, практических достижениях и дальнейших перспективах развития;
⬩Гига Город — демо-стенды, постеры, инженерные споры, вопросы и тестирование архитектур;
⬩Воркшопы — повторяем решения инженеров, разбираем пайплайны и инструменты;
⬩Карьерный блок — разговоры с командами и открытые роли в AI-направлениях Сбера.

Зачем идти?
Чтобы увидеть, как строят AI-системы, задать вопросы инженерам и понять, куда движется AI в Сбере — и найти свое место в этом движении.

Регистрируйтесь и проверьте AI-технологии в деле.

Реклама. ПАО Сбербанк. ИНН 7707083893
👍31👎1😁1
🌍 Twitter Location Flags Extension

Расширение для Chrome, которое добавляет флаги стран к именам пользователей на Twitter/X, основываясь на их местоположении. Оно автоматически определяет пользователей и запрашивает информацию о местоположении через GraphQL API Twitter.

🚀Основные моменты:
- Отображает флаги стран рядом с именами пользователей
- Работает с динамически загружаемым контентом
- Кэширует данные о местоположении для снижения нагрузки на API
- Не требует передачи данных третьим лицам

📌 GitHub: https://github.com/RhysSullivan/twitter-account-location-in-username

#javanoscript
👍4
Приглашаем на ЮMoneyDay — бесплатную онлайн-конференцию про финтех и IT 🔥

На протяжении двух дней будем общаться с разработчиками, инженерами, тестировщиками, продактами, дизайнерами и другими специалистами из ЮMoney. Они расскажут про свой опыт работы в большом финансовом продукте, поделятся лайфхаками и секретами.

Будут доклады по 16 направлениям:

🟣 Будущее финтеха
🟣 Бэкенд
🟣 Фронтенд
🟣 Тестирование
🟣 Python
🟣 Менеджмент проектов
🟣 Менеджмент продуктов
🟣 Системный анализ
🟣 SQL
🟣 UX
🟣 ИИ
🟣 Архитектура IT-решений
🟣 Внутренние системы
🟣 Мобильная разработка
🟣 Инфраструктура
🟣 О компании

Встречаемся онлайн 5 и 6 декабря в 11:00 мск. Чтобы участвовать, зарегистрируйтесь на сайте конференции
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥21
🧳 MCPorter: TypeScript Toolkit for Model Context Protocol

MCPorter — это инструмент для работы с Model Context Protocol, позволяющий легко взаимодействовать с MCP-серверами. Он автоматически находит настроенные серверы, генерирует CLI и создает типизированные клиенты, упрощая автоматизацию и интеграцию.

🚀 Основные моменты:
- Автообнаружение MCP-серверов без конфигурации.
- Генерация CLI с помощью одной команды.
- Создание типизированных клиентов для взаимодействия с серверами.
- Удобный API для работы с методами и валидацией аргументов.
- Поддержка OAuth и различных транспортов.

📌 GitHub: https://github.com/steipete/mcporter

#typenoscript
👍1