Полезный кураторский список материалов по мультимодальным моделям
В него только что добавили еще несколько моделей, работ и примеров -
@machinelearning_ru
В него только что добавили еще несколько моделей, работ и примеров -
YOLO-World - EfficientSAM - Qwen-VL-Plus / Max - Ferret - MetaCLIP.
▪Github@machinelearning_ru
👍2🔥1
Статья ученых Лехайского университета (USA) и Microsoft Research об ИИ-модели Sora и ее возможном влиянии на различные отрасли.
В данной статье, основанной на публичных технических отчетах и проведении исследований, представлен всесторонний обзор истории Sora, связанных с ней технологий, приложений, остающихся проблем и будущих направлений развития моделей ИИ "текст-видео".
🔗 arXiv.org
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
⚡️ Новый прорыв от Microsoft: 1-разрядные LLMS.
Новые модели, использующие троичные значения (-1, 0, 1) вместо 16-разрядных.
Это делает их в 2,7 раза быстрее, использует в 3,5 раза меньше памяти графического процессора и в 71 раз меньше энергии.
Bitnet также соответствует традиционным моделям, таким как LLaMA 3B, или превосходит их по своим характеристикам.
📌 Статья
@machinelearning_ru
Новые модели, использующие троичные значения (-1, 0, 1) вместо 16-разрядных.
Это делает их в 2,7 раза быстрее, использует в 3,5 раза меньше памяти графического процессора и в 71 раз меньше энергии.
Bitnet также соответствует традиционным моделям, таким как LLaMA 3B, или превосходит их по своим характеристикам.
📌 Статья
@machinelearning_ru
👍8🔥5🤯3❤2
DeepMind’s New AI Makes Games From Scratch!
https://www.youtube.com/watch?v=-ZSVkjukC1U
@machinelearning_ru
https://www.youtube.com/watch?v=-ZSVkjukC1U
@machinelearning_ru
YouTube
DeepMind’s New AI Makes Games From Scratch!
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers
📝 The paper "Genie: Generative Interactive Environments" is available here:
https://sites.google.com/view/genie-2024/
📝 My paper on simulations that look almost like…
📝 The paper "Genie: Generative Interactive Environments" is available here:
https://sites.google.com/view/genie-2024/
📝 My paper on simulations that look almost like…
👍5❤3🔥1
⚡️ Отличное новое руководство по использованию MLX-графов для прогнозирования свойств молекул:
Очень просто запустить:
@machinelearning_ru
Очень просто запустить:
pip install mlx-graphs
https://mlx-graphs.github.io/mlx-graphs/tutorials/examples/qm9_tutorial.html@machinelearning_ru
👍7❤2🔥1
👉 Как Яндекс научил нейросеть пересказывать видео
На Хабре вышла статья ML-инженера Яндекса, где подробно рассказывается о разработке функции пересказа видео с помощью YandexGPT в Яндекс Браузере. Можно узнать, почему для задачи не подошла “статейная” YandexGPT, какие технические и продуктовые требования были к суммаризации видео и какой подход лучше для обучения.
🔗 Ссылка
@machinelearning_ru
На Хабре вышла статья ML-инженера Яндекса, где подробно рассказывается о разработке функции пересказа видео с помощью YandexGPT в Яндекс Браузере. Можно узнать, почему для задачи не подошла “статейная” YandexGPT, какие технические и продуктовые требования были к суммаризации видео и какой подход лучше для обучения.
🔗 Ссылка
@machinelearning_ru
❤4👍4🔥2👎1
На Hugging Face опубликовали модель машинного обучения, которая помещает объекты на видео на хромакей. После этого их можно использовать в видеоредакторах или других приложениях.
На платформе опубликовали саму модель и развернули демо;
большие видео не стоит грузить из-за лимита на GPU.
🤗 Загрузить своё видео и затестить
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤5🔥1
⚡️ Руководство YOLOv9: обучаем модель на собственном наборе данных
- запуск модели с предварительно обученными весами COCO
- файнтюнинг модели на своем датасете
- оценка модели
- развертывание модели
https://youtu.be/XHT2c8jT3Bc
@machinelearning_ru
- запуск модели с предварительно обученными весами COCO
- файнтюнинг модели на своем датасете
- оценка модели
- развертывание модели
https://youtu.be/XHT2c8jT3Bc
@machinelearning_ru
👍10❤4🔥1
⚡️ Новый способ точной настройки #Lms для повышения производительности при выполнении последующих задач (например, рассуждение и обобщение)
Исследовательская работа: https://arxiv.org/abs/2402.13228
Модель: https://huggingface.co/abacusai/Smaug-Mixtral-v0.1
@machinelearning_ru
Исследовательская работа: https://arxiv.org/abs/2402.13228
Модель: https://huggingface.co/abacusai/Smaug-Mixtral-v0.1
@machinelearning_ru
👍5❤1🔥1
Stable Diffusion 3 - An Amazing AI For Free!
https://www.youtube.com/watch?v=GiyGW1tCMOA
@machinelearning_ru
https://www.youtube.com/watch?v=GiyGW1tCMOA
@machinelearning_ru
YouTube
Stable Diffusion 3 - An Amazing AI For Free!
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.me/papers
📝 The paper "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis" is available here:
https://stability.ai/news/stable-diffusion-3-research-paper
…
📝 The paper "Scaling Rectified Flow Transformers for High-Resolution Image Synthesis" is available here:
https://stability.ai/news/stable-diffusion-3-research-paper
…
👍5❤2🔥1
Forwarded from Искусственный интеллект. Высокие технологии
Сравнив результаты 151 человека и GPT-4, которые выполняли задачи на альтернативное использование предметов (например, как можно еще использовать вилку, кроме очевидного способа), оценку последствий (исходы гипотетических ситуаций – например, исчезновение гравитации) и дивергентные ассоциации (назвать слова, максимально далекие друг от друга по смыслу), авторы сделали интересный вывод.
Вот некоторые интересные выводы из исследования:
@vistehno
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥3👎1🥰1
📚 Огромный список бесплатных книг по программированию на различных языках, включая русский.
Это один из наиболее популярных репозиториев на GitHub с бесплатной литературой.
▪Github
@machinelearning_ru
Это один из наиболее популярных репозиториев на GitHub с бесплатной литературой.
▪Github
@machinelearning_ru
🔥4❤2🥰1
Claude 3 AI: Smarter Than OpenAI's ChatGPT?
https://www.youtube.com/watch?v=9b7bx423SWk
@machinelearning_ru
https://www.youtube.com/watch?v=9b7bx423SWk
@machinelearning_ru
YouTube
Claude 3 AI: Smarter Than OpenAI's ChatGPT?
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.me/papers
📝 Claude 3 is available here - try it out for free (note that we are not affiliated with them):
https://www.anthropic.com/news/claude-3-family
Conference I am coming…
📝 Claude 3 is available here - try it out for free (note that we are not affiliated with them):
https://www.anthropic.com/news/claude-3-family
Conference I am coming…
❤3👍3🔥1
Flowise создан для аудитории, которая не готова кодить, но хочет получить доступ к AI. В приятном интерфейсе драг-н-дропом из готовых блоков можно построить бекенд своего будущего приложения.
При помощи Flowise можно:
FlowiseFlowise можно использовать как API. Тут потолок фантазий находится там, где заканчиваются комбинации блоков, но можно добавить и кастомные инструменты при помощи JS. Можно работать со звуком, изображениями и так далее.
Несколько практических кейсов применения Flowise:
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥5❤2
📹 BaoGPT
BaoGPT - это проект с искусственным интеллектом, который позволяет вам задавать вопросы о видео на YouTube
Полностью OSS, построенный на Long Chain, Anthropic и Qdrant, с интерфейсом Discord и Gradio
Ознакомьтесь с репозиторием здесь.
▪Github
@machinelearning_ru
BaoGPT - это проект с искусственным интеллектом, который позволяет вам задавать вопросы о видео на YouTube
Полностью OSS, построенный на Long Chain, Anthropic и Qdrant, с интерфейсом Discord и Gradio
Ознакомьтесь с репозиторием здесь.
▪Github
@machinelearning_ru
👍6🔥3❤1
Рик Баттл и Тедж Голлапуди из VMware, рассказали, что языковые модели часто непредсказуемо реагируют на запросы. На качество ответа влияет сам вопрос, набор входных данных и другие параметры. Разные комбинации дают разный результат, поэтому промпт-инженеры подбирали запросы методом тыка.
Рик Баттл рассказала про способ составления промптов с помощью самой языковой модели. Большинство таких запросов получаются нелогичными для человека, но дают лучший результат, чем метод подбора с помощью проб и ошибок. В одном из случаев запрос, составленный нейросетью, начинался с отсылки на «Звёздный путь», и это заметно улучшило сгенерированный ответ.
Баттл утверждают, что нейросети представляют собой набор математических моделей и алгоритмов, а люди не могут точно знать как они работают, и какие из команд оказывают на нейросеть большее влияние. Поэтому даже пользователи, называющие себя экспертами в промптинге, просто находят удачные комбинации, но не могут составлять сразу хорошие запросы.
В качестве ещё одного примера целесообразности использования нейросети для генерации промптов приводят недавний эксперимент Intel. Инженеры компании разработали инструмент для Stable Diffusion, который получает пользовательский запрос, а потом преобразует его в оптимальный для нейросети. В результате изображения, сгенерированные с помощью преобразованных промптов, получается более детализированными и эстетичными. Для преобразования запросов разработчики Intel обучили специальную нейросеть.
Исследователи считают, что профессия промпт-инженера уже утратила свою актуальность, не успев стать востребованной и популярной. Нынешние языковые модели могут генерировать более правильные и эффективные запросы чем люди.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥6👎2❤1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥2👎1