NEW BOT Телеграм, страница

Data Secrets

Закон Nvidia >> закон Мура

Что произошло? Прошла выставка COMPUTEX 2024, на которой выступил CEO NVIDIA Дженсен Хуанг. Он рассказывал об успехах Nvidia в производстве чипов и дальнейших планах.

В ходе выступления он показал график, который особенно зантересовал слушателей. На нем сравнивается закон Мура и рост производительности чипов компании.

Что такое закон Мура? Вообще это даже не закон, а наблюдение основателя Intel: "Количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые 24 месяца". Проще говоря: мощность процессоров удваивается каждые два года.

Так вот, не имея серьезной конкуренции, Nvidia, видимо, решила конкурировать с этим законом. И, как видите, получилось очень неплохо: последние 8 лет корпорация двигалась в 25 раз быстрее, чем завещал Мур. Это поразительно.

Полное выступление Хуанга смотрим тут.

🔥8917👍16😁9

9.15K views12:18

Data Secrets

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

«Для таких людей, как я, LLM – это уже прошлое, сейчас они скучны» - Ян Лекун.

Наверное, с Маском разборки устраивать интереснее

😁

Please open Telegram to view this post

VIEW IN TELEGRAM

53😁30💯10👍7❤3

8.58K views14:09

Data Secrets

У нас для вас отличные новости!

Погоня за ML специалистами не сбавляет обороты. На западе CEO лично звонят кандидатам, чтобы переманить их. Россия не отстает: один только Яндекс нанимает около 100 ML-инженеров каждый месяц, а зарплаты таких специалистов постоянно растут.

Чтобы вы не пропускали самые сочные вакансии в топовых компаниях России и за рубежом, мы создали канал Data Secrets | Карьера. Там можно легко найти работу с подходящим форматом, специальностью и задачами.

Также канал поможет мониторить рынок и тренды на нем, даже если сейчас вы не ищете оффер.

Подписывайтесь, чтобы держать руку на пульсе: @data_secrets_career

🔥19👍12😁10❤53🤯1🙈1

16.6K views17:18

Data Secrets

Годовая зарплата в $65 тыс. и активы на $2.8млрд? Легко, особенно когда ты Сэм Альтман. Итак, портфель CEO, который мы заслужили:

⚪️ 7,6% акций Reddit (на данный момент стоимость составляет более 700 миллионов долларов)

⚪️Инвестировал 15 000 долларов в 2% акций Stripe в 2009 году (сегодня это 1,3 млрд долларов)

⚪️Чек на 375 миллионов долларов в Helion, стартап в области ядерного синтеза (Microsoft является клиентом)

⚪️Инвестиции в компанию Exowatt, которая производит контейнерные энергетические системы для датацентров

⚪️Инвестиции в размере 180 миллионов долларов в Retro – стартап, который пытается увеличить продолжительность жизни человека

⚪️Инвестиции в несколько ИИ-компаний, включая Rain AI (чипы), 15% Humane и Limitless

⚪️Дома в Напе и на Гавайях

⚪️Персональная кредитная линия от JP Morgan Chase, которая позволяет ему брать займы под залог стоимости своего личного портфеля

⚪️Ну и коллекция спорткаров конечно, куда без них

Такие дела 💰

Please open Telegram to view this post

VIEW IN TELEGRAM

90🔥24👍12❤5🐳52❤‍🔥1👻1

8.71K views06:52

Data Secrets

Новый супер-качественный датасет FineWeb-Edu от HuggingFace

Недавно те же ученые представляли FineWeb – это был по сути отфильтрованный классический CommonCrawl. Теперь же с помощью классификатора на основе Llama-3-70B-Instruct они отобрали из FineWeb только те веб-страницы, которые относятся к образовательному контенту. Кстати, похожий прием мы видели у DeepSeekMath (читайте наш разбор).

Гипотеза исследователей была в том, что если обучать LLM на образовательном контенте, она будет лучше ризонить и вообще вырастет по бенчмаркам. Оказалось, что так и есть. Посмотрите на график: модели на FineWeb-Edu значительно обгоняют модели на FineWeb, C4 и тд.

Чтобы достичь перформанса FineWeb-Edu, другим датасетам нужно в 4 раза больше данных. Это еще раз доказывает, что качество обучающей выборки – это душа модели.

Сейчас FineWeb-Edu находится в открытом доступе в двух размерах: 1.3 триллиона токенов и 5.4 триллиона. Работу, кстати, высоко оценил Андрей Карпаты.

👍45🔥12❤10

8.91K views09:58

Data Secrets

⚡️ Галя, у нас отмена отмены!

Пару дней назад Docker Hub пару дней назад ушёл из России и Беларуси из-за санкций США, но теперь вдруг передумал.

Сейчас hub.docker.com снова доступен с российских IP-адресов, а наш

подробный гайд

про деплой ML-моделей с докером снова в силе.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥66😁30👍13🗿4❤3

10.7K views11:43

Data Secrets

Фаундеры в государственных советах безопасности VS фаундеры на презентации собственных продуктов

😁6015🔥3🙈1

8.91K views13:43

Data Secrets

Forwarded from XOR

Ничего необычного, просто глава NVIDIA расписывается на груди фанатки.

Вот что бывает, когда капитализация твоей компании составляется $2,8 трлн.

@xor_journal

👍6933🔥12💅3🤯2

7.95K views17:06

Data Secrets

GPT-5 или все-таки ROBO-1?

OpenAI ищут в команду инженера-робототехника. Также напоминаем, что в прошлом году они заключили контракт с Figure AI, чтобы встроить GPT в роботов, разработанных стартапом.

Голос дали, пора бы и телом обзавестись

🔥4818👾8❤2😁2⚡1

9.04K views06:18

Data Secrets

9 бывших и текущих сотрудников OpenAI публично требуют право в случае чего предупредить общественность об AGI

Они заявляют, что OpenAI ведет себя безрассудно в отношении AGI, оголтело летя впереди планеты всей.

Тем временем сотрудникам не разрешено не то что рассказывать о разработках компании, но и просто высказывать свое мнение о политике OpenAI. Иначе можно сказать «пока» всем своим акциям и, скорее всего, работе.

Сейчас сотрудники требуют обязать компанию прозрачно отчитываться о технологиях перед государством и разрешить ученым осведомлять общество о том, что на их взгляд может быть опасно.

Обожаю это чувство, как его… SkyNet

😁97❤14🔥87😨6👍5🙈5

8.86K views08:42

Data Secrets

Интересная ситуация произошла в Стэнфорде: там ученым пришлось извиняться перед китайцами за плагиат

Оказалось, что студенты скопипастили код из китайской MiniCPM-Llama3-V 2.5 для своего проекта Llama3-V. Вот и пришлось извинятся, хотя горе-ресерчеры утвеждают, что код писали вообще не они, а их коллега из университета Калифорнии, который сейчас не выходит на связь 😦

Медель выходила под флагом Стэнфордского университета, в соавторстве с несколькими профессорами, так что авторитет был подорван довольно сильно. Модель также пришлось удалить с Hugging Face. Да, жаль этих работяг.

Please open Telegram to view this post

VIEW IN TELEGRAM

😁8945😎4👍3❤1

9.3K views12:04

Data Secrets

Accuracy: -1.5

😁16729❤15🎉3🤨1

9.47K views13:54

Data Secrets

Вышел долгожданный код для xLSTM! Это та самая недавняя взрывная архитектура от создателей LSTM, которая может стать альтернативой трансформеру.

Установить библиотеку и поиграться с xLSTM можно с помощью pip install xlstm.

Репозиторий с кодом тут.

А если вы до сих пор не разобрались с этой многообещающей моделью, то напоминаем, что у нас на сайте лежит ее подробный наглядный разбор: https://datasecrets.ru/articles/10

❤55🔥217👍2🍓2

10.2K views16:11

Data Secrets

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Студенты-дипломники, ну как там дела за пару дней до сдач?

🤝85😁46🔥10🗿7❤4👍4👏2

9.84K views17:54

Data Secrets

⚡️ Тем временем Nvidia достигла капитализации в $3 триллиона, обогнала Apple и стала второй самой дорогой компанией в мире. Теперь компанию собирается проверить антимонопольная служба США.

Please open Telegram to view this post

VIEW IN TELEGRAM

😁103🤯21👀148👍6☃3❤1

9.62K views07:29

Data Secrets

Кстати, кроме этого выпада группы сотрудников OpenAI случилось еще кое-что

Раньше в OpenAI в команде Суцкевера работал исследователь Леопольд Ашенбреннер. Пол года назад его уволили, якобы из-за утечки информации.

А на днях он дал интервью и рассказал, что на самом деле его уволили по другой причине: он критиковал компанию за небезопасное поведение.

Также Леопольд опубликовал кучастраничный отчет о состоянии ИИ. В нем он пишет, что AGI появится уже к 2027 году, и затем очень скоро превратиться в суперинтеллект, который будет опасен для человечества. “Для этого не нужно верить в фантастику, нужно лишь верить в прямые линии на графиках».

По его словам, уже сегодня компании перешли от $10 миллиардных вычислительных кластеров к $100 миллиардным и даже триллионным кластерам.

Пора бы OpenAI выходить на свет, а то общественности еще долго придется оценивать ситуацию по выкрикам отдельных исследователей

61🤯21👍10❤4😁3🤓2🤗1

9.46K views10:32

Data Secrets

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Садимся снимать аниме – в опенсорс вышла модель ToonCraft, которая может сгенерировать мультипликацию по ключевым кадрам.

Она может "заполнить" ролик между двумя поданными кадрами, нарисовать мультик по скетчу и раскрасить анимацию по референсу.

Под капотом DynamiCrafter, которую зафайнтюнили на аниме. Для сохранения точного образа персонажей используется 3D-декодер.

Самое приятное: есть и статья, и демо, и код, и примеры – в общем все, что душе угодно.

❤5037👍12🤯4💅1

9.14K views15:09

Data Secrets

Stability AI опенсорснули часть функционала Stable Audio — нейросети для генерации музыки и звуков

Сеть обучена только на открытых данных, но ее, тем не менее, нельзя использовать в коммерческих целях. Да и работает она сильно обрезанно, по сравнению с закрытой версией: генерирует треки в четыре раза короче и не работает в режиме Audio2Audio.

Тем не менее, все что опенсорс, мы любим и уважаем (ну если только код не был "позаимствован", как у ребят из Стэнфорда).

Подробности и код для игр с моделькой оставили на сайте.

🔥13👍7❤1

8.54K views17:24

Data Secrets

Google такие: «Нечестно, OpenAI специально сделали свою презентацию за день до нашей»
Также Google: опенсорсят конкурента Gradio прямо в день выхода новой версии

Gradio – это тулза для билда ML-приложений из ноутбуков или из проекта. Новый Mesop от Google – в точности то же самое. Даже лендинг похож на игру «найди 10 отличий».

Тем не менее, достойно внимания: гитхаб

❤32🤨11🕊6👍3💘2

8.54K views06:09

About

Blog

Apps

Platform