NEW BOT Телеграм, страница

Data Secrets

Breaking! Llama-3 уже здесь и рвет лидерборды!

Две модели - на 8B и 70В – уже ворвались, одна – на 400B – еще тренируется. Обе вышедшие модельки стали лучшими в своем весе.

Единственное, чем модели не могут похвастаться – контекст. У обеих он составляет всего 8k.

Приятным бонусом идет интервью с Цукербергом о Llama-3, вышедшее пару минут назад.

Блогпост | Попробовать новую ламу

👍34🔥11❤7🥰1🏆1

7.54K views16:28

Data Secrets

⌨️

Please open Telegram to view this post

VIEW IN TELEGRAM

😁96❤4🔥3⚡1👍1🏆1

7.07K views18:15

Data Secrets

График наверху – это динамика частоты употребления слова «delve» (вникать) в статьях по медицине. Видите этот скачок в 2023? Вы скажете: ну и что? А то, что delve – это по каким-то причинам любимое слово ChatGPT. Бот использует его очень часто, и это стало…

Помните, пару недель назад мы показывали вам график резкого роста медицинских статей, в котором используется слово delve (вникать), любимое слово ChatGPT?

Так вот, это слово уже давно принято считать признаком, что текст сгенерирован. Но люди до сих пор недоумевают, почему именно delve? Что за тайна такая вокруг этого слова?

Кажется, мы разгадали, в чем тут дело.

Да, в США слово delve употребляется редко, но вот в Нигерии очень распространено: его, например, часто произносят учителя в начальной школе.

А в GPT есть RLHF, где качество ответов модели развернуто оценивается людьми. Над RLHF часто работают люди, чей труд дешевле, чем у среднего жителя США.

Понимаете, куда мы клоним? Для RLHF нанимают людей из Нигерии, для которых слово delve - классика, они описывают ответы модели, используя это слово («вникай глубже»), а затем их отзывы подгружаются обратно модель для дообучения. Вот она и запоминает это слово как «хорошее».

С вами была программа «Следствие вели» с DataSecrets

👍174😁64❤8🤯8🔥7🥰5⚡2

11.5K views06:12

Data Secrets

Кстати, вот вам лучшая иллюстрация RLHF 👹

Please open Telegram to view this post

VIEW IN TELEGRAM

😨46🤪12👍9😁6❤5

6.84K views08:58

Data Secrets

Тем временем Mistral активно ищет инвестиции

В декабре стартап уже привлек $415 млн. Тогда они оценивались в $2 млрд. Сейчас оценка компании – $5 млрд. К тому же, недавно Mistral стал получать доход.

Короче, несложная математика и здравый смысл подсказывает, что компания может привлечь сотни миллионов долларов. Среди инвесторов: Andreessen Horowitz, Microsoft (OpenAI ревнует, да) и др.

👍29🔥11❤7👏1😁1

7.04K views11:33

Data Secrets

На днях вышла новая книга по Computer Vision от трех крутых авторов: Antonio Torralba, Bill Freeman и Phillip Isola

Авторы работали над книгой почти 10 лет. В ней собрано вообще все, от линейных фильтров и оптики до современных диффузионнок. Скорее всего, чтиво скоро будет признано сообществом как мастрид.

Самая приятная вещь в книге - авторские иллюстрации. Ну и вообще, на выходные самое то.

👍66🤯13❤8🔥7

9.96K views15:19

Data Secrets

Опенсорс вперед ❤️

👍47❤22🥰11❤‍🔥7🔥4🌚1

7.47K views08:09

Data Secrets

Миниатюра: я пытаюсь файнтюнить новую Llama-3 на своем линово 2001 года

😁132❤11👍7🔥5🤯3

7.71K viewsedited 10:45

Data Secrets

Визуализация эмбеддингов от TensorFlow

Пространство эмбеддингов с огромной размерностью представить себе очень сложно. Поэтому иногда, чтобы лучше понять задачу и/или наглядно оценить качество векторов, полезно посмотреть на эмбеддинги меньшей размерности. Крутейший залипательный инструмент для этого – Embedding Projector.

Что делаем: загружаем свои эмбеддинги/выбираем предобученные -> выбираем алгоритм сокращения размерности -> любуемся. На картинке сверху, например, можно увидеть кластер чисел снизу слева. Это означает, что эмбеддинги неплохо отражают семантическую близость слов.

Красивое...

❤46👍19🔥8

8.55K views14:13

Data Secrets

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:55

This media is not supported in your browser

VIEW IN TELEGRAM

В Х парень поделился историей о том, как Claude-3 его загипнотизировал.

Эксперимент проводился ради шутки, но, неожиданно, автор якобы действительно захотел спать и отключился на час. В реплаях люди массово пишут, что больше ни за что не будут пользоваться LLM.

Получается, будильники в понедельник в 7 утра тоже нас гипнотизируют?

🤯35😁20❤6👍4🗿1

8.34K views07:40

Data Secrets

Ждем GPT-5 завтра?

😁86🔥13👍7🗿3😐2

7.8K views09:54

Data Secrets

Если сегодня Claude-3 может кого-то загипнотизировать, то через несколько лет ИИ станет в разы умнее гениев человечества?

В последнее время в сети часто мелькает график с картинки. Мнение сообщества снова разделилось.

Одни говорят: «как мы можем выйти за пределы человеческого разума, если тренируем модели только на данных от зеленой до оранжевой линии? Это невозможно».

Другие же отмечают, что LLM уже несколько раз показывали свою способность находить в обучающих данных паттерны, которых человек не видит, и делать на их основе продвинутые выводы. Эта способность и даст ИИ взлететь по экспоненте.

Что думаете?
❤️ - будет так, как на графике
🗿 - да не, не будет

🗿156❤119🤔24🌚3👍1🔥1

7.46K views12:04

Data Secrets

Обычный человек vs Data Scientist

Профдеформация вещь опасная, поэтому мы решили напомнить вам оригинальные значения DS-терминов.

Не забудь отправить друзьям, чтобы лучше тебя понимали.

👍65😁38🔥15❤5💅4🤗1

7.71K views14:19

About

Blog

Apps

Platform