Анализ данных (Data analysis) – Telegram
Анализ данных (Data analysis)
52.3K subscribers
2.91K photos
350 videos
1 file
2.46K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
📊 Раскройте данные с DataClaw! 🚀
DataClaw — это инструмент для структурирования истории взаимодействия с AI, позволяющий экспортировать данные в Hugging Face. Он очищает ваши сессии от конфиденциальной информации и создает готовый к публикации набор данных.

🚀Основные моменты:
- Преобразует историю взаимодействия с AI в структурированные данные
- Автоматически редактирует конфиденциальную информацию
- Публикует данные на Hugging Face с одним командным вызовом
- Создает распределенный набор данных для совместной работы человека и AI

📌 GitHub: https://github.com/peteromallet/dataclaw

#python
12🔥2😍1🌚1
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ OpenAI расширяет поддержку мейнтейнеров открытого кода.

Программа Codex Open Source Fund, запущенная год назад, получила апдейт льгот для разработчиков, которые поддерживают публичные репозитории.

Теперь участники программы получают не только API-кредиты, но и полный доступ к ChatGPT Pro с Codex на полгода.

Обновленный набор поддержки выглядит теперь так:

🟢API-кредиты для проектов, которые уже интегрировали Codex в pull request review, релизные пайплайны или другую инфраструктуру OSS.

🟢6 месяцев ChatGPT Pro с Codex.

🟠Условный доступ к Codex Security

Условность в том, то Codex Security одобряется вручную. OpenAI объясняет это возможностями GPT-5.4, команда рассматривает каждую заявку отдельно, чтобы убедиться, что инструмент применяется осознанно.


OpenAI формулирует требования к просителям программы размыто: core maintainer с write access к широко используемому публичному проекту. Что считается широко используемым - не уточняется.

Если проект не вписывается в стандартные критерии, OpenAI все равно рекомендует подавать заявку с объяснением роли проекта в экосистеме.

Неделю назад Antropic запустила похожую тему поддержки опен-сорса.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥116👍4
⚡️ Андрей Карпаты выложил минимальный репозиторий Autoresearch - систему, где AI сам проводит исследования.

Это упрощённая версия ядра обучения LLM из nanoGPT/nanochat:
весь код обучения помещается в один файл (~630 строк) и работает на одной GPU.

Как это устроено:

- человек редактирует prompt (.md)
- AI-агент автоматически меняет training code (.py)

Дальше начинается цикл автономных экспериментов.

Каждая точка на графике — полный запуск обучения LLM (~5 минут).

AI-агент работает в бесконечном цикле:

- создаёт git-ветку
- меняет архитектуру модели
- подбирает optimizer
- оптимизирует гиперпараметры
- запускает обучение
- коммитит улучшения

Если validation loss становится ниже, изменение сохраняется.

Фактически агент сам оптимизирует собственный код обучения и постепенно улучшает модель.

Можно запускать несколько агентов с разными промптами и сравнивать, кто быстрее двигает исследование.

Карпаты шутит, что раньше AI-исследования делали люди между:

- едой
- сном
- митингами

Теперь же исследования могут выполнять рои автономных AI-агентов, которые бесконечно гоняют эксперименты на кластерах.

GitHub: github.com/karpathy/autoresearch

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
2👍379🤩3🔥2
💰 Forbes: разработчикам могут больше не нужны редакторы кода.

Новая реальность AI-разработки: программирование постепенно уходит от ручного набора кода к автономным агентам, которые могут реализовывать целые проекты самостоятельно.

По данным Forbes, компания Cursor - один из самых быстрорастущих AI-стартапов в программировании - уже сталкивается с этой трансформацией. С появлением мощных агентных систем вроде Claude Code сама идея классического code editor может устареть.

AI-лабы готовы тратить огромные деньги, чтобы переманить их на свои платформы.

Внутренний анализ Cursor показал, что подписка Claude Code за $200 в месяц могла потреблять до $2000 вычислительных ресурсов - фактически Anthropic субсидировала пользователей.

Но сейчас масштабы ещё больше.

По данным источников, знакомых с расходами на compute, тот же план за $200 способен потреблять уже около $5000 вычислительных ресурсов.

AI-компании сейчас сознательно работают в убыток, чтобы захватить рынок разработчиков и закрепить свои инструменты как стандарт индустрии.

forbes.com/sites/annatong/2026/03/05/cursor-goes-to-war-for-ai-coding-dominance/

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍13🤣6😁2🔥1
Разработчики раньше vs разработчики сейчас
💯37🥴10😁74😐4👍2👌2🥱2🔥1
Tencent выпустила HY-WorldPlay — систему, которая превращает сцену в интерактивный 3D-мир.

Можно просто загрузить сцену или описание, и модель генерирует полноценное 3D-окружение, по которому можно перемещаться как в игре.

Это часть экосистемы Hunyuan 3D — набора моделей для генерации 3D-контента и виртуальных миров.

Что умеет HY-WorldPlay:

- превращает сцену в 3D-мир, по которому можно гулять
- генерирует окружение и объекты автоматически
- работает прямо в браузере
- полностью open-source

Такие системы постепенно делают возможным создание игровых миров и виртуальных пространств буквально из текста или изображения.

Попробовать: 3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay

GitHub: github.com/Tencent-Hunyuan/HY-WorldPlay

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
👍84🔥4
Прощай, Эксель!

Мой дорогой друг, я благодарен тебе за все эти годы. Ты выручал меня, когда 1С зависала, не было интернета, и мы с тобой за ночь справлялись с любой задачей.

Но время меняется, и у меня появились новые напарники. Американец Клод делает невероятно красивые дашборды (правда за деньги). А вот китаец Дипсик берется за любую работу, не ноет, делает бесплатно и в срок.

Я объясняю им задачу в двух словах, и за полчаса получаю аналитику, на которую мы с тобой раньше тратили по три дня.

Ничего личного. Просто серьёзные рабочие задачи я теперь делаю с ними. А к тебе буду иногда заглядывать, записать расходы на ремонт.
———

А если серьезно - считать руками в Экселе, это теперь непозволительная роскошь и для аналитика, и для любого менеджера.

Да, у всех был негативный опыт, но теперь ИИ работает с расчетами без галлюцинаций. Можно наладить полноценную онлайн-отченость без Excel, знания макросов или Pivot/Query.

Сомневатесь, что у вас получится?
Я докажу вам это в прямом эфире! Вместе мы с вами построим полноценный дашборд с помощью DeepSeek, пользуясь только бесплатным функционалом.

Вы своими глазами увидите и пощупаете руками, как в 2026 году нейросети работают с таблицами, делают онлайн-дашборды и анализ что-если.

Приходите в пятницу 12 марта в 18:00 на открытый урок.
Регистрация

Реклама. ООО "АНАЛИТИКА ПЕРСОНАЛА", ИНН 6671088519
🤣18🤨11🌚53😢1
🚀 Ускорьте понимание кода с FastCode!

FastCode — это высокопроизводительный фреймворк для анализа кода, обеспечивающий скорость, точность и экономичность. Он подходит для работы с большими кодовыми базами и поддерживает множество языков программирования, включая Python и JavaScript.

🚀 Основные моменты:
- 3-4x быстрее конкурентов
- Снижение затрат на 44-55%
- Высокая точность анализа
- Поддержка многопроцессорного анализа
- Интуитивно понятный веб-интерфейс

📌 GitHub: https://github.com/HKUDS/FastCode
👍145😍3
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 DeerFlow 2.0 (уже 27K+ звёзд на GitHub ⭐️) - это AI-система от ByteDance, которая работает как автономный сотрудник со своим собственным компьютерным рабочим пространством для исследований и программирования.

Обычные чат-боты просто генерируют текст и не запоминают ваши предпочтения.

DeerFlow решает эту проблему: ИИ получает изолированную виртуальную среду компьютера, где может безопасно запускать программы.

Когда ему дают большую задачу, основной агент создаёт несколько маленьких AI-ассистентов, которые работают одновременно.

Также система сохраняет ваши прошлые рабочие процессы, поэтому со временем лучше понимает ваши задачи.

DeerFlow не привязан к конкретной модели — он работает с любым LLM, который поддерживает OpenAI-совместимый API.

Есть полная поддержка локальных моделей, которые можно запускать прямо на своём компьютере с помощью инструментов вроде Ollama.

Пример: вы просите провести исследование 10 лучших AI-стартапов 2026 года для презентации.

Главный агент DeerFlow разбивает задачу на подзадачи:

- один суб-агент исследует каждую компанию
- другой собирает данные о финансировании
- третий анализирует конкурентов

Все агенты работают параллельно.

В конце результаты объединяются, и финальный агент собирает готовую презентацию со слайдами и визуализацией.

github.com/bytedance/deer-flow

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍217🔥4🥰4
🏴‍☠️ Google представила Gemini Embedding 2 - свою первую полностью мультимодальную модель эмбеддингов, которая отображает текст, изображения, видео, аудио и документы в единое общее векторное пространство.

Модель поддерживает 100+ языков, текстовые входы до 8192 токенов, до 6 изображений в одном запросе, видео до 120 секунд, нативные аудио-эмбеддинги и PDF-файлы до 6 страниц. Это позволяет упростить пайплайны для задач вроде RAG, семантического поиска, кластеризации и анализа тональности.

Благодаря технологии Matryoshka Representation Learning, которая позволяет гибко менять размер векторов (3072 → 1536 → 768), разработчики могут балансировать между качеством модели и затратами на хранение, сохраняя при этом передовое мультимодальное понимание данных.

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3011🔥7👏3
Отчетов и данных стало слишком много?
Пора переходить к продуманному BI-решению ↗️

12 марта в 11:00 провайдер облачных технологий Cloud.ru проведет вебинар «Evolution Managed BI: все возможности BI-сервиса в облаке».

Вы узнаете, как выжать максимум из системы аналитики:
➡️быстро получать инсайты
➡️работать с актуальными данными
➡️и ускорять принятие бизнес-решений

В программе вебинара:
▶️как устроен сервис Evolution Managed BI
▶️какие возможности есть для обработки, визуализации и безопасности данных
▶️как подключать разные источники и создавать дашборды
▶️как создавать кастомные SQL-запросы, настраивать автоотчеты и алерты
▶️как протестировать сервис бесплатно


Будет полезно аналитикам, дата-инженерам и всем, кто уже работает с Evolution Managed BI или планирует внедрение.

👉Зарегистрироваться👈
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2👍1
Если ты не можешь писать код без AI —
значит, ты вообще не умеешь писать код.


Согласны ?
👍58💯27🥴10😁3🍌32
✔️ The Most Disruptive Company in the World

Статья The Times про Anthropic скрывает гораздо более серьёзные выводы, чем может показаться при беглом чтении.

Если внимательно разобрать её по смыслу, становится ясно, насколько быстро ускоряется развитие AI.

Сегодня релизы моделей происходят уже не раз в несколько месяцев, а с интервалом в несколько недель. Разработка ускоряется настолько, что 70–90% кода для создания будущих моделей уже пишет сам Claude.

Фактически это означает, что AI начинает участвовать в создании следующего поколения AI.

Anthropic даже задержала выпуск Claude 3.7 Sonnet на 10 дней, пока команда не убедилась, что модель достаточно безопасна.

Это показывает, насколько осторожно компании относятся к новым возможностям моделей.

Внутри Anthropic считают, что период 2026–2030 станет ключевым для всей индустрии. Модели будут становиться быстрее, умнее и могут развиваться темпами, с которыми людям будет всё сложнее справляться.

Глава компании Дарио Амодеи предупреждает ещё жёстче. По его мнению, AI может вытеснить до половины начальных офисных профессий в течение ближайших 1–5 лет. При этом пока никто не понимает, куда переместятся эти люди и чем они будут заниматься. Он прямо говорит о риске появления большой группы людей с очень низкими доходами или без работы.

Внутри компании сотрудники начали обсуждать, не приблизились ли они к моменту, которого многие опасались: recursive self-improvement.

Это сценарий, в котором AI начинает улучшать сам себя. Каждая новая версия создаётся быстрее и становится сильнее предыдущей, что запускает ускоряющуюся цепочку развития.

Некоторые эксперты считают, что полностью автоматизированные AI-исследования могут появиться уже в течение года.

Если это произойдёт, скорость технологического прогресса может резко вырасти и тогда главным вопросом станет не создание AGI, а то, успеет ли общество адаптироваться к миру, где такие системы уже существуют.

https://time.com/article/2026/03/11/anthropic-claude-disruptive-company-pentagon/

🎯Полезные Мл-ресурсы 🚀 Max

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🥱11👍73🤣3🔥1
🌍 Tencent запустила HY 3D Studio по всему миру

Это AI-платформа для создания 3D-моделей в одном рабочем процессе.

Сервис автоматизирует почти весь пайплайн 3D-производства:

Image → 3D → topology → UV → texturing → rigging → animation

То есть можно взять обычную картинку и получить готовую 3D-модель с текстурами и анимацией.

Платформа ориентирована на:

- 3D-художников
- разработчиков игр
- создателей контента
- студии, работающие с 3D-графикой

Новые пользователи получают 20 бесплатных генераций в день (ограниченное время).

Для разработчиков также доступен API, и новым пользователям дают 200 бесплатных кредитов для начала работы.

🕹️ Попробовать HY 3D Studio
https://3d.hunyuanglobal.com/studio

⚙️ API
: https://tencentcloud.com/products/ai3d
👍4🔥21