Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
В Х парень поделился историей о том, как Claude-3 его загипнотизировал.

Эксперимент проводился ради шутки, но, неожиданно, автор якобы действительно захотел спать и отключился на час. В реплаях люди массово пишут, что больше ни за что не будут пользоваться LLM.

Получается, будильники в понедельник в 7 утра тоже нас гипнотизируют?
🤯35😁206👍4🗿1
Ждем GPT-5 завтра?
😁86🔥13👍7🗿3😐2
Если сегодня Claude-3 может кого-то загипнотизировать, то через несколько лет ИИ станет в разы умнее гениев человечества?

В последнее время в сети часто мелькает график с картинки. Мнение сообщества снова разделилось.

Одни говорят: «как мы можем выйти за пределы человеческого разума, если тренируем модели только на данных от зеленой до оранжевой линии? Это невозможно».

Другие же отмечают, что LLM уже несколько раз показывали свою способность находить в обучающих данных паттерны, которых человек не видит, и делать на их основе продвинутые выводы. Эта способность и даст ИИ взлететь по экспоненте.

Что думаете?
❤️ - будет так, как на графике
🗿 - да не, не будет
🗿156119🤔24🌚3👍1🔥1
Обычный человек vs Data Scientist

Профдеформация вещь опасная, поэтому мы решили напомнить вам оригинальные значения DS-терминов.

Не забудь отправить друзьям, чтобы лучше тебя понимали.
👍65😁38🔥155💅4🤗1
“Так, Цук, как и планировали, заходим, подбрасываем 8В и уходим”


llama-3 8b >>> gpt4, mistral large, mistral 8x22b, claude3 haiku
👍40🔥244👏2🤩2😁1
Оценка стоимости обучения известных моделей из отчета Stanford 2024 AI Index Report

Зацените разрыв: обучить оriginal transformer в 2017 стоило $930, а потом началось…

GPT-3 - $4.3M
GPT-4 - $78.4M
Gemini Ultra - $191.4M

Кстати, новой Llama-3 здесь нет, ее обучение стоило Meta $100M. Да, больше чем GPT-4.
🤯68👍64🔥2👏1👀1
Data Secrets
Amazon закрывают магазины Just Walk Out (те самые берешь и уходишь) Дело в том, что технология не возымела спрос у крупных ретейлеров. Ну хотя «технология» – сказано громко. Еще год назад выяснилось, что ИИ там никакого нет, и записи с камер вручную обрабатывают…
Только закрыли одно, уже начинают продавать другое

Amazon'у все не дает покоя идея умных магазинов. Их технология Just Walk Out c тысячью работников из Индии вместо ИИ провалилась, зато теперь они придумали Dash Cart.

Это умная тележка, которая отслеживает товары и считает общую стоимость продуктов с помощью компьютерного зрения и датчиков. Экран тележки обновляет сумму в реальном времени.

Amazon хочет, чтобы Dash Cart стала сервисом и начинает продавать изобретение торговым сетям. Fresh и Whole Foods уже используют тележки, Price Chopper и Mckeever’s Market пока тестируют новинку.
🔥189👍5❤‍🔥1💯1
Мы тоже решили прокатиться на волне тренда с мемом про MKBHD.

Представьте: вы опубликовали статью, а на утро видите это на YouTube. Ваши действия?
😁56👍8🔥5🤩31
MT-bench и почему это важно

Последнее время при сравнении разных LLM все в основном доверяют Chat Arena, хотя оценивание LLM там происходит не по метрикам, а просто на основе слепого голосования людей. А что, по метрикам теперь уже не модно?

Да, не модно, но, оказывается, все-таки есть бенчмарк, который поможет оффлайн оценить результаты на арене. Это MT-bench, который эстимейтит способность модели вести связный и информативный диалог. Правда ведь очевидно, что в основном именно эта метрика влияет на лояльность людей при голосовании?

GPT-4 на MT-bench выбивает 9.32, а новая крошка Llama-3 8B - 8.25. Всего ~1 балл ниже!
👍248🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
«Я думаю, опенсорсить LLM – это как опенсорсить ядерное оружие»

Вот такое внезапное заявление от небезызвестного Джеффри Хинтона. Он призывает правительство запретить модели с открытым исходным кодом.

При этом близкий друг Хинтона, Ян Лекун, напротив, выступает в поддержку опенсорс.
🤔63🤨20🗿16👍10🤯8🤪5🍌4🔥3🌚3🌭31
This media is not supported in your browser
VIEW IN TELEGRAM
И снова Google удивляет нас статьей. На этот раз они придумали ScreenAI для работы с UX продукта

Сеточка умеет все, что касается работы с интерфейсами и инфографикой. Может ответить на вопрос, настраивать навигацию, суммаризовать, аннотировать элементы и вот это все.

🟣Зачем они это делают? Сейчас ИИ-ассистенты вроде Siri работают с командами типа "позвони" только по четкому алгоритму, и не умеют справляться с ранее неизвестными интерфейсам. То есть, способность модели понимать UX и "пользоваться" сайтами и приложениями может стать ключевой вещью при внедрении ИИ в смартфоны.

🟣Как это работает? В два этапа - претрейнинг и файнтюнинг. На pt применяется self-supervised learning для генерации меток данных (внутри ViT), которые затем тюнятся на ft на данных, размеченных человеком.

Пока что это просто ресерч проект, и сеточка недоступна для пользования. Надеемся, она поможет компании сделать новый Google Pixel 9 еще ИИнтереснее.
Please open Telegram to view this post
VIEW IN TELEGRAM
34👍15🔥9😁1
Microsoft опубликовали Phi-3

Всего там три модели: mini (3.8B), small (7B) и medium (14B). Самая интересная из всех – mini. Эта крошка сравнима со старой версией GPT-3.5, Llama-3 8b и Mixtral 8x7b.

На бенчмарке MT-bench, который мы вчера обсуждали, моделька выбивает аж 8.38! При этом модель настолько мала, что ее можно запускать даже локально на телефоне. Тех.репорт про Phi-3 так и называется: A Highly Capable Language Model Locally on Your Phone.

Как говорят сами ученые: «The innovation lies entirely in our dataset for training». То есть, такого результата удалось добиться только за счет грамотной доработки и фильтрации данных, на которых училась предыдущая модель phi-2. 👏
Please open Telegram to view this post
VIEW IN TELEGRAM
👍50🔥15101👏1🤯1