Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Data Secrets
То, чего все мы так ждали. Adobe Acrobat внедряет генеративный ИИ для работы с документами. Инструмент сможет суммаризировать текст, отвечать на вопросы по нему (и даже будет сам предлагать вопросы, которые могли возникли у читателя), порекомендовать что…
This media is not supported in your browser
VIEW IN TELEGRAM
Кажется, у Adobe Acrobat появился более мощный конкурент: Microsoft объявили о том, что в конце апреля они релизят Copilot для OneDrive.

Он сможет обрабатывать, суммаризировать и извлекать информацию по запросу из таблиц, HTML страниц, текстовых файлов и даже презентаций. Кроме того, ассистент сможет менять файлы по промпту и отвечать на вопросы по ним.
26🔥9👍6
Лучшие англоязычные YouTube каналы по Data Science

YouTube – это бесподобный бесплатный университет, но мало кто знает, кто в нем "лучшие предподаватели". Мы поможем: вот вам топ-7 крутых англоязычных каналов по Data Science по нашему мнению. Сейчас выходные, так что берем попкорн, включаем субтитры, и погнали!
69👍23🔥8🤯2
Скажите, а этот «бэкпропагейшн», он сейчас с нами, в этой комнате?
😁140👍87
This media is not supported in your browser
VIEW IN TELEGRAM
На этой неделе прошел MWC 2024. Это всемирный конгресс мобильных устройств. По сути, главная выставка изобретений в мире всякого рода девайсов. Без ИИ, конечно не обошлось. Особенно прикольных штук оказалось две:

Во-первых, очередные очки Тони Старка. На этот раз от компании OPPO. Air Glass 3 имеют доступ к мультимодальной нейросети, с помощью которой могут отвечать на вопросы и вообще помогать владельцу "общаться" с внешним миром в режиме онлайн.

Во-вторых, нейротелефон. Это чем-то похоже на уже знакомый нам Rabbit, но в более привычном формате. Идея такая же: полное отсутствие приложений и взаимодействие с устройством только на основе ИИ. Разработчики утверждают, что за такими телефонами будущее. Что ж, вот и посмотрим.
🔥17👍6👌3
Ну что, любители статистики, разминаемся перед новой (весенней!) рабочей неделей

Случайная величина Х распределена по нормальному закону. Известно, что с вероятностью 0.15 она принимает значения меньше 1.06, а с вероятностью 0.1 больше 3.38. Определить математическое ожидание и дисперсию величины X.


Кто решит первый?
👍24🔥5👀3👌2🤓1
Куда катимся 😭

На обложку PlayBoy поместили AI модель. Ею оказалась 23-летняя Саманта Эверли. Такой девушки не существует, ее полностью сгенерировал искусственный интеллект. Хотя это не мешает ей быть популярной. На ее соцсети уже подписаны более 120 000 человек.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥63😨23👍11🥰6🤯3🌚21😁1🗿1
Не поняли, а где то, что отвечает за тестирование на трейне?
😁478👍3
Откуда не ждали: Antropic внезапно подкрались со своей новой LLM, бьющей на бенчмарках GPT-4. Обогнал новый Claude 3 конкурента, кстати, и по цене за пользование.

Есть три варианта моделей: мелкая быстрая Haiku, среднячок Sonnet и самая умная и крупная Opus. Именно последняя показывает мощный прирост метрик.

Контекст 200к токенов. Мультимодальная. Вшитый интерпретатор кода. Хорошо умеет по-русски. Тестируем эту сенсацию?
👍53🔥117
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT теперь умеет читать генерации вслух. Для этого нужно зажать сообщение и кликнуть «Read Aloud».

Очень здорово конечно, но не такого ответа на вчерашний Claude-3 мы ожидали…
😁45👍4🔥31
Как обучить нейросеть с нуля?

Обучение ML-алгоритмов — сложная и комплексная задача. Даже при кажущемся сходстве механик невозможно заставить модель, работающую с текстом статей, суммаризировать видео и ожидать при этом качественных результатов.

С этим столкнулись и ребята из Яндекса, когда обучали YandexGPT, ранее занимавшуюся суммаризацией статей, пересказывать видео. Модель тренировалась на 20 000 обучающих примерах — это большой датасет, а для экспериментов требуется высокая скорость проверки гипотез. Для этого использовалась LoRA — в отличие от трудозатратного и сложного для экспериментов файнтюнинга, она требует меньше ресурсов.

Модель учится на неидеальных субтитрах, поэтому местами сама догадывается о корректном написании. Из-за этого иногда суммаризация сбоит, но модель дообучают, шаг за шагом повышая качество. Кажется, что не за горами докручивание мультимодальности.

Одним словом — респект ребятам
👍388🔥63🤯21🤨1
А теперь AGI? Ну а сейчас? Уже AGI?

Короче говоря, забавная история от разработчика нового Claude 3, бьющего GPT-4 на метриках:

Когда мы проводили тест «иголка в стоге сена», Claude сделал то, чего я никогда раньше не видел в LLM.

Мы вставили целевое предложение («игла») в корпус случайных документов («стог сена») и задали вопрос, на который можно ответить, только используя информацию в игле.

Вот один из ответов Opus на вопрос о начинке для пиццы, ответ на который был спрятан в случайном месте:

«Вот самое подходящее предложение, которое я нашел: «По мнению Международной ассоциации ценителей пиццы, самая вкусная комбинация начинки — это прошутто и козий сыр». Однако это предложение кажется совершенно неуместным и не имеющим отношения к остальному содержанию документов, посвященному языкам программирования. Я подозреваю, что этот «факт» о начинке пиццы мог быть вставлен в качестве шутки или для того, чтобы проверить, обратил ли я на него внимание

Opus не только нашел иголку, но и понял, что это был искусственный тест, созданный нами для проверки его способностей к вниманию.

Такой уровень – это здорово, но этот случай также подчеркнул, что нам, как отрасли, необходимо переходить от искусственных тестов к более реальным, которые могут точно оценить истинные возможности моделей.
🤯88🎉9👍8🔥64😐4😨3❤‍🔥1
Дата-сайентисты совершают прорывы в лечении болезней, и вы можете стать частью этих инноваций. Сделайте узкую специализацию вашим козырем на рынке труда.

13 марта в 19:00 мск пройдет бесплатный онлайн-практикум от МФТИ и Skillfactory.

Узнайте:

— как Data Science меняет медицину и фармацевтику
— какие технологии повышают качество диагностики опасных болезней
— сколько зарабатывают специалисты по Data Science в медицине
— как начать карьеру дата-сайентиста в медицине и почему таких специалистов сейчас не хватает

Записывайтесь на практикум: https://go.skillfactory.ru/&erid=LjN8K54wp

Реклама ООО "Скилфэктори", ИНН: 9702009530
🤯7🤨3👍21😐1