Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.44K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Мы запускаем DS Lab – облачную IDE для удобной работы с мощным железом

Почти каждый, кто когда-либо пытался арендовать GPU или другие ресурсы, сталкивался с одной из трех проблем:

1. Сложность и затянутость установки окружения
2. Высокие цены и недоступность нужного железа
3. Прерывание сессий в случае Colab/Kaggle

Мы много раз испытывали все это на себе и решили сделать так, чтобы аренда железа была доступна каждому быстро и просто.

Наш сервис выглядит, как привычная IDE с понятным интерфейсом. Чтобы арендовать в ней ресурсы, вам нужно просто выбрать конфигурацию, – и вы тут же можете начать работать над своим проектом, запускать локальные модели и прочее. Всю установку мы берем на себя.

– Оплата происходит as you go: только за те ресурсы, которые вы фактически использовали. Есть бесплатная подписка, которая дает доступ к GPU-конфигурациям.

– По адекватным ценам доступны редкие видеокарты H100, H200, A100 и другие.

– После завершения сеанса ваши результаты никуда не пропадут, и вы сможете продолжить работу с того же места.


Попробовать бесплатно уже можно тут — dslab.tech

P.S. А также советуем подписаться на канал сервиса: @dslab. В нем мы делимся новостями и туториалами + сегодня там пройдет большой розыгрыш GPU-часов 🎁
Please open Telegram to view this post
VIEW IN TELEGRAM
4210🔥112👍43🎉12🗿7😁33🎄1
Все, Google планируют становиться полноценным конкурентом Nvidia: к 2027 году они хотят произвести 5 миллионов чипов TPU

Такие объемы однозначно намекают на планируемый старт прямых продаж чипов внешним клиентам.

Ранее стало известно, что Meta первая среди компаний закупит у Google партию TPU для установки в свои датацентры. То же самое, возможно, сделают и Anthropic в рамках недавнего соглашения с гигантом.

Короче, спрос растет. И Google собираются увеличивать предложение. Из расчетов-на-коленке получается, что каждая партия в 500 тысяч чипов может принести компании $13 млрд выручки и $0,40 на акцию.

Но есть нюансы.

Во-первых, чтобы конкурировать с Nvidia на этом рынке, Google придется радикально изменить цепочку поставок. Сейчас они fabless, то есть разрабатывают чипы, но не производят их. Изготовление происходит на внешних фабриках, таких как TSMC и Broadcom. Чем больше объемы – тем больше рисков в такой схеме. Пока непонятно, планирует ли Google переходить к вертикальной интеграции.

Во-вторых, CUDA. Стандарт де-факто, лучше которого нет. У Google пока нет сравнимой по силе экосистемы.

Интересно, как рынок порешает
🔥873119👍13🤔5👏21😁1🎉1🎄1
Forwarded from DS Lab • Новости сервиса
Разыгрываем 3.000 GPU-часов

В честь запуска dslab.tech мы объявляем огромный розыгрыш DS-коинов.

Каждый из 10 победителей получит 10.000 коинов (=10.000р), которые вы сможете потратить в DS Lab на аренду любого железа, включая мощные видеокарты A100, H100 и H200: хватит примерно на 300 часов!

Для участия просто:

Подписывайтесь на наши каналы @dslab и @data_secrets
Жмите на кнопку "Участвовать"

Вы также можете отдать бусты нашему каналу: тогда ваши голоса умножатся, как и шансы на победу.

Итоги розыгрыша подведем 22 декабря в 17:00. Удачи! 🎅
Please open Telegram to view this post
VIEW IN TELEGRAM
55🔥27🗿14👍9😁3🤯3❤‍🔥1🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Оптимуса Илона Маска опять обсмеивает весь Интернет

Кто-то на вчерашнем ивенте Tesla в Майами снял шикарное видео, на которое случайно попали кадры фееричного падения гуманоида прямо во время демонстрации.

В ролике отчетливо видно движение руками робота, которое очень напоминает жест теле-оператора, снявшего с себя VR гарнитуру. Видимо, бедолага забыл предварительно отключиться от управления.

Напоминаем, что ранее Илон Маск под демонстраиционными видео в твиттере утверждал, что Optimus действует автономно.

Советуем смотреть со звуком 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
😁29116👍11👾3🔥2🤯21🎄1
Data Secrets
Nvidia поссорились с Anthropic – причина опять Китай. Обо всем по порядку: В прошлую среду Anthropic выложили блогпост, в котором выступили за более жесткий контроль экпорта США и введение новых запретов на продажу чипов Nvidia. По мнению компании это ключевой…
Самая громкая новость сегодняшнего утра: Трамп объявил, что Nvidia сможет продавать чипы H200 в Китай

Он осудил политику Байдена и заявил, что в рамках новых правил разрешит поставки H200 в Китай.

Единственная «мелочь»: Nvidia придется платить государству 25% с продаж. То же самое касается и других компаний типа AMD и Intel. При этом новейшие чипы все еще попадают под ограничения.

Где-то наверное радуется один Дженсен Хуанг и грустит один Дарио Амодеи (напоминаем, что он чуть ли не сильнее всех топит за ограничения экспорта железа)
😁130👍36🔥16🤔31👌1🤨1🫡1🎄1
МТС Web Services получил две награды на ComNews Awards 2025: отличились проекты MWS Tables и MWS Data.

Аналог Google Sheets и Microsoft Excel MWS Tables стал лидером в категории «Лучший сервис для командной работы и создания приложений», а MWS Data отметили как «Лучшее решение для работы с данными».

MWS Tables является безкодовым табличным сервисом для командной работы и автоматизации процессов. Его используют для цифровизации операций, управления проектами и аналитики, сокращая при этом трудозатраты.

MWS Data - платформа для управления большими данными в реальном времени с ИИ-агентами. Это и хранение, и обработка, и визуализация, и контроль качества.
😁39👍179🗿7🔥3🤯31🎄1
TowardsDataScience запустили адвент-календарь по классическому ML и DL

Они пишут, что, хотя мы ежедневно занимаемся все более и более сложным обучением и алгоритмами, в то же время мы все больше и больше забываем, как они на самом деле работают. Все скрыто за функциями во фреймворках вроде PyTorch и Scikit-learn.

В своем календаре авторы предлагают всем нам дружно вспомнить базу. И причем не как-нибудь, а… с помощью Excel.

Да-да, мы все еще в 2025. Но не спешите начинать шутить: за обучением в Excel у них стоит конкретная идея.

Использование языка программирования также может скрыть некоторые операции за уже существующими функциями. В Excel же видно все расчеты шаг за шагом, там нет черных ящиков. Поэтому это лучший инструмент для изучения машинного обучения.


Сейчас на сайте уже вышли уроки по KNN, деревьям, LDA и другим простеньким алгоритмам. Но с каждым днем темы будут усложняться.

Студенты – вам мастхэв. Опытные – можете проверить себя 😐

https://towardsdatascience.com/machine-learning-and-deep-learning-in-excel-advent-calendar-announcement/
Please open Telegram to view this post
VIEW IN TELEGRAM
57🔥17🗿17👍7😁3🤨1🎄1
This media is not supported in your browser
VIEW IN TELEGRAM
Линус Торвальдс в новом интервью про ИИ:

"ИИ – это и пузырь, и революция. Очевидно, что это пузырь, но в то же время ИИ, я думаю, изменит общество и работу. Но не настолько, как нам пытаются доказать.

В случае с программированием, например, вайб-кодинг – действительно хороший интструмент. По-моему, он отлично подходит для старта в программировании чего-то, но продолжать поддерживать систему с помощью вайб-кодинга – это ужас. Вам по прежнему будут нужны люди, которые будут знать, как это делать правильно.

Я очень верю в ИИ, но не верю в то, что его окружает. Рынок и маркетинг сломаны. Скоро случится крах, и это будет кошмарно."


Последнее время кажется, что оптимистичны по поводу ИИ только те, кто продает на него подписки ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2624930💯22😁12👨‍💻3💘3🔥2🎄2🤓1
Знакомьтесь, это Лоран Саймонс. Ему 15 лет и на днях он получил докторскую степень по квантовой физике.

Сейчас парень занимается биологическим моделированием в стартапе DeepPiction: они разрабатывают ИИ-алгоритмы для поиска лекарств.

Мы уверены, что этот парень – AGI, но пока не можем это доказать 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁336🔥12958🤯30👍4🎄2
Новое исследование от Anthropic: как сделать так, чтобы все опасные знания хранились в модели отдельно от обычных

И снова про элаймент! Уж очень занятный в этот раз стартап предлагает подход. Называется он Selective GradienT Masking. Погнали разбираться.

Вообще, как такового элаймента на этапе претрейна не существует, все это добавляется уже после предобучения. А это довольно серьезный затык.

Пока единственный вариант, до которого люди додумались – это просто выбросить из датасета "опасные знания", но это (1) оч дорого и долго, потому что требует разметки; (2) отсекает дополнительно и много полезных знаний, и модель тупеет. Так что – ерунда.

А вот Anthropic предлагают сами данные не трогать, а вместо этого сделать так, чтобы вся опасная информация стекалась в отдельный кусок параметров, который затем можно просто... удалить. Работает это так:

– На каждый блок трансформера мы дополнительно надеваем голову внимания, которую помечаем, как "forget" параметры.

– Если на вход попадают данные, которые помечены, как "опасные", мы насильно зануляем все градиенты, кроме "forget". Это гарантирует, что все опасные знания стекаются в определенное место.

– Чтобы после модель могла хорошо работать без этих параметров, на части данных при прямом проходе им зануляют активации.


Как видите, это, по факту, та же самая фильтрация данных. Только умная. Во-первых, такой подход устойчив к шуму разметки. Во-вторых, метить все данные потенциально необязательно: выяснилось, что начиная с какого-то момента даже неразмеченное опасное содержимое датасета начинает тяготеть больше к "forget" параметрам. Это назвали эффектом Абсорбирования.

При этом модель после вырезания этой вот черной душонки глупеет меньше, чем при вырезании данных из датасета. Все-таки здесь мы действуем немного деликатнее. Ну и ведет она себя после этого так, как будто ей действительно ничего подобного никогда не показывали, а не как будто она временно об этом забыла.

В общем, на уровне механики и идеи – довольно интересный зачаток

https://alignment.anthropic.com/2025/selective-gradient-masking/
👍10237🔥24😁9🤔7🗿5👌2🤯1🐳1🎄1
⚡️ Anthropic передали права на MCP в Linux Foundation

Они вместе с OpenAI и Block основали Agentic AI Foundation (AAIF) – целевой фонд под эгидой Linux Foundation, чтобы продвигать открытые стандарты для агентного ИИ.

Linux Foundation – это некоммерческая организация, которая обеспечивает нейтральное управление открытыми проектами. Например, они хостят Kubernetes и Node.js.

Все проекты, переданные в LF, независимо поддерживаются и контролируются организацией + интеллектуальная собственность тоже принадлежит сообществу. Смысл этого в том, чтобы избежать возможных монополий компаний.

Anthropic задонатили в AAIF MCP (огромный смелый шаг!), OpenAI – AGENTS.md, а Block – фреймворк goose.

Кстати, обязанности по финансированию теперь тоже лежат на Linux Foundation. Среди платиновых членов AWS, Bloomberg, Cloudflare, Google, Microsoft и другие. Каждый год каждый из них платит большие взносы, которые идут на поддержку и развитие проектов.
Please open Telegram to view this post
VIEW IN TELEGRAM
129🔥43👍28😁3🤔2❤‍🔥1🎄1
Mistral выпустили опенсорсного CLI агента для кодинга Mistral Vibe

Это утилита с интерфейсом командной строки, которая выполняет все функции обычного агента для кодинга (меняет, пишет, тестит код и тд). Лицензия Apache 2. Установить можно с помощью команды:

uv tool install mistral-vibe

Любителям терминала должно зайти.

Под капотом – новая моделька стартапа Devstral 2. Она вышла в двух размерах: 123В и 24В. Все тоже в опенсорсе.

По метрикам старшая модель примерно на уровне DeepSeek-V3.2 и Kimi K2 Thinking, то есть довольно неплохо.

mistral.ai/news/devstral-2-vibe-cli
68🔥25👍11😁9🎄1
«Норникель» выложил в опенсорс доменную модель MetalGPT-1

Она интересна тем, что обучена на данных, которые обычно не циркулируют в открытой среде. Это всякие технологические регламенты, протоколы, НИОКР, проектная документация из области металлургии и гордобычи. Объем – примерно миллион текстов.

Размер самой модели – 32В, не маленькая. На ее основе компания уже строит ассистентов и автономных агентов, которые встраиваются непосредственно в узкие операционные процессы.

Архитектура типовая, но из-за того, что модель обучена на корпусе, которого веб никогда не увидит, разрыв в качестве на доменных задачах большой. В этом смысле открытые веса тут почти декоративны: без данных такое все равно не воспроизвести.

В ближайшем будущем у компаний будет появляться все больше таких доменных моделей, и рынок в каком-то смысле может даже разделиться по этому признаку.

Веса
2🔥21437👨‍💻16😁14👍9🗿95🐳2😎2🤨1🎄1
В Пентагоне появится подразделение для подготовки к AGI

Создание так называемого «Руководящего комитета по будущему искусственного интеллекта» утверждено в новом Национальном оборонном акте.

Комитет должен быть создан не позднее 1 апреля и будет заниматься оценкой возможных военных последствий AGI.

Кроме того, в задачи комитета входит анализ ИИ-политики других стран (в первую очередь Китая) и формирования стратегий на случай Скайнета 😮‍💨
Please open Telegram to view this post
VIEW IN TELEGRAM
😁903125👍1910🦄4🔥1🎄1
Уже пару дней все говорят о том, что на этой неделе нас ждут сразу две новые модели

Первая – GPT-5.2. Да-да, всего через месяц после GPT-5.1 (она же Shallotpeat, о которой мы писали здесь).

Помните, Альтман когда-то говорил, что после выхода GPT-5 путаницы с версиями больше не будет? Ну так вот…

Вторая – Gemini 3 Flash, тут все ожидаемо.

Одна из них, судя по всему, должна выйти уже завтра. Вторая – либо завтра, либо в начале следующей недели.

🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
92🔥31👍17🎄9😁422
Data Secrets
Датацентры могут перенестись в космос Nvidia заключили очень занятную сделку со стартапом под названием Starcloud. Они планируют начать создавать датацентры на орбите Земли. Утверждается, что у таких кластеров есть целый ряд преимуществ: 1. Можно экономить…
nanoGPT от Андрея Карпаты стала первой в мире LLM, обученной и запущенной в космосе

Мы уже несколько раз рассказывали вам о стартапе Starcloud. Они занимаются строительством космо-датацентров и к 2030 году планируют вынести на орбиту аж 5 гигаватт железа.

В начале ноября они запустили в космос первую в истории видеокарту H100 – на спутнике размером с холодильник.

Сначала сообщалось, что на ней планируется тюнить Gemma, но сегодня Starcloud рассказали, что вместо этого обучили целую модель с нуля!

Они взяли nano-GPT – минималистичную реализацию GPT на PyTorch от Андрея Карпаты, – обучили ее на полном собрании сочинений Шекспира и успешно запустили инференс! Gemma, кстати, тоже запускали, но только предзагруженную.
116237😁23🔥12👍10🗿9🎉8🏆6🤨4
Хотите обзор самого главного в ИИ за этот год?

Вот прям всю мякотку: от хардкорного ML / ИИ в разработке до взгляда на ИИ от бизнеса.
от тех же ребят, что сделали AI Dev Live (одна из крупнейших ИИ-конф, 3к+ участников).


В программе:

- Сдвиг парадигмы в управлении процессами, который все пропустили

- Как в 2026 бизнесу отличить: где ИИ-фанатизм со сливом бюджета, а где ИИ-инструменты с реальной ценностью?

- Почему одних разрабов ИИ бустит, а другие плюются от багов? Как укротить агентов и получать production-ready код от ИИ?

- RAG мертв? Почему enterprise уходит от векторных баз к агентам, куда движется индустрия LLM-провайдеров и какое место у локальных AI-решений?

- Кого и как нанимать в 2026 году? И, самое главное, что изучать, чтобы не уволили вас?


В общем, шикарная солянка контента от экспертных спикеров: парочка Head of AI, руководитель AI R&D-института, фаундеры и ко-фаундеры AI-first компаний: самый лучший состав, чтобы рассказать про ИИ со всех ракурсов.

⚡️ Вот ссылка для записи на предновогодний эфир (все еще можно бесплатно!)

Реклама. ИП Шейко Н.Е., ИНН 540131220129, erid 2VtzpxGT4JZ
Please open Telegram to view this post
VIEW IN TELEGRAM
🗿5722🔥159😁6🤯5🤨3🆒3👍2👌2
Тем временем новую Gemini 3 Flash заметили в Cursor

Ждем релиз сегодня?
🔥99👍218😁3