NEW BOT Телеграм, страница - 731712433

Machine Learning Research

963 subscribers

61 photos

7 videos

2 files

1.05K links

Download Telegram

About

Blog

Apps

Platform

Machine Learning Research

963 subscribers

Machine Learning Research

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

🔥EMU VIDEO:
Factorizing Text-to-Video Generation by Explicit Image Conditioning

Сегодня сразу два больших релиза от моих коллег из Meta GenAI! Один из них — опубликовали модель EMU-Video.

Новая модель строится на базе Text-2-image модели Emu, и теперь может генерить 4-секундные видео 512x512 в 16 fps.

Архитектура, грубо: мы берем pre-trained 2.7B Emu для генерации text-2-image, замораживаем Unet и добавляем в него дополнительные аттеншен слои, которые работают вдоль врменной оси. И тренируем только доп слои, на генерацию видео по тексту.

На вход даём либо картинку + текст, либо только текст (в этом случае картинку генерим с помощью Emu). На выходе — 65 фрейма 512x512.

Если погрузиться в детали, то сначала генерится 16 фреймов, а затем ещё одна модель с такой же архитектурой интерполирует видео до 65 фреймов.

Это теперь SOTA в text-2-video:
✔️ Emu-Video vs Gen-2: победа Emu-Video в 78.5% случаев
✔️Emu-Video vs Pika - победа в 98.5% случаев по оценке кожаных разметчиков.

Сайт проекта
Демо-результаты

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

536 viewsНиколай, 19:16

Machine Learning Research

Forwarded from Курсы Data Science

https://shad.yandex.ru/gptweek

GPT Week Школы анализа данных

Открытый онлайн-интенсив от ШАДа и экспертов Яндекса. Создатели YandexGPT поделятся опытом работы над большими языковыми моделями

572 viewsНиколай, 06:45

Machine Learning Research

Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

https://habr.com/ru/articles/774844/

Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

Всем доброго времени суток. Я давно обещала выложить сюда подробный гайд на тему того, как можно изучать Machine Learning самостоятельно, не тратя деньги на платные курсы , и, наконец, выполняю свое...

👍1

707 viewsНиколай, 16:58

Machine Learning Research

На kaggle есть курс по Computer Vision. Так вот теперь у него появился практический гайд
https://www.kaggle.com/code/ivanlydkin/computer-vision-course-practical-guide

🤖 Computer Vision course: Practical Guide

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

❤2

653 viewsНиколай, 09:50

Machine Learning Research

ChatGPT плохо отвечает на «простые вопросы». Как это починить?

https://habr.com/ru/companies/airi/articles/774934/

ChatGPT плохо отвечает на «простые вопросы». Как это починить?

Привет, Хабр! Меня зовут Антон Разжигаев, я аспирант в Сколтехе и участник научной группы Fusion Brain (AIRI). В этой статье я расскажу о нашей последней работе — Multilingual Triple Match — системе...

652 viewsНиколай, 11:19

Machine Learning Research

Kandinsky 3.0 — новая модель генерации изображений по тексту

https://habr.com/ru/companies/sberbank/articles/775590/

Kandinsky 3.0 — новая модель генерации изображений по тексту

«Без чувства современности художник останется непризнанным» , Михаил Пришвин, русский и советский писатель, прозаик и публицист В прошлом году на АI Journey мы представили модель Kandinsky 2.0 —...

🔥3

595 viewsНиколай, 09:26

Machine Learning Research

Новая лекция от Карпатого
https://youtu.be/zjkBMFhNj_g?si=gLNkXpNdTcs85Zzw

[1hr Talk] Intro to Large Language Models

This is a 1 hour general-audience introduction to Large Language Models: the core technical component behind systems like ChatGPT, Claude, and Bard. What they are, where they are headed, comparisons and analogies to present-day operating systems, and some…

🔥4

703 viewsНиколай, 17:47

Machine Learning Research

Большие языковые модели (LLM) в задачах

https://habr.com/ru/articles/775870/

Большие языковые модели (LLM) в задачах

В этой статье на практических примерах рассмотрим какие задачи из коробки могут решать современные большие языковые модели (large language models, LLM). Но сначала немного...

👍1

782 viewsНиколай, 07:08

Machine Learning Research

ОНЛАЙН-ИНТЕНСИВ

First Step in NLP 2.0

https://www.hse.ru/ma/mlds/nlpbootcamp/2023

Открытый онлайн-интенсив "First step in NLP 2.0 Bootcamp" — введение в обработку естественного языка

В интенсив входят 4 вебинара по Machine Learning, практические домашние задания и соревнование по классификации текстов на платформе Kaggle.

596 viewsНиколай, 17:52

Machine Learning Research

Forwarded from Dealer.AI

Взять LLM за RAGa в 60 минут

Вводный курс от deeplearning.ai
В мир прекрасного ранкинга и LMок

https://www.deeplearning.ai/short-courses/building-evaluating-advanced-rag/

DeepLearning.AI - Learning Platform

Building and Evaluating Advanced RAG

Learn advanced RAG retrieval methods like sentence-window and auto-merging that outperform baselines, and evaluate and iterate on your pipeline's performance.

472 viewsНиколай, 11:21

Machine Learning Research

Forwarded from Salute AI (Alexander Gavrilov)

Делимся уникальным курсом от команды SmartSpeech

Георгий Господинов, Александр Максименко, Павел Богомолов, Гриша Стерлинг — специалисты SberDevices, которые также примут участие в нашем митапе «Салют, GigaChat!», запустили третью итерацию своего знаменитого курса по голосовым технологиям для магистров МФТИ.

Курс охватывает широкий спектр тем:
▪️Детекция ключевых слов.
▪️Распознавание речи.
▪️Диаризация и верификация спикера.
▪️Синтез речи и многое другое.

🌐

GitHub репозиторий с открытыми материалами курса, включая записи лекций, слайды и домашние задания. Пригодится всем, кто стремится к глубокому пониманию речевых технологий и их применению в реальных проектах.

💡

Ждём вас на встрече с авторами курса и другими экспертами SberDevices на митапе

«Салют, GigaChat!»

о речевых технологиях и больших языковых моделях:

4 декабря

, Москва (офлайн + онлайн). Ваши коллеги и друзья также приветствуются!

✅

Регистрация на митап

обязательна

Подписывайтесь 👉 Salute AI

#SmartSpeech #митап_Салют_GigaChat #митап

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

484 viewsНиколай, 12:43

Machine Learning Research

Forwarded from Kantor.AI (Victor Kantor)

CoolGraph от Big Data МТС

Если вы немного в теме нейросетей, то знаете, что к данным с разной структурой применяются изначально разные архитектуры. В компьютерном зрении — на базе свёрток, в работе с текстами — вдохновлённые рекуррентными сетями и, конечно, трансформеры.

Резонный вопрос: а какие сети могли бы обобщить работу с произвольной структурой в данных? Ответ есть: графовые. Если вы можете по своим данным построить граф, отражающий взаимосвязь их отдельных частей (в компьютерном зрении пиксель связан с соседними пикселями, в тексте слово связано с другими словами), то дальше встаёт вопрос построения нейросети на основе этого графа.

Кроме того, бывают и совсем очевидные ситуации, когда граф возникает сам собой. Например, социальный граф — граф социальных взаимодействий между пользователями, или двудольный граф пользователи-товары в e-commerce и пользователи-фильмы в стриминговых сервисах.

Более того, часто компании, имеющие данные в виде графа, выжимают не всю пользу из этих данных. Просто потому, что придумывать табличные фичи по графу — это тоже отдельная объёмная работа. И здесь тоже помогают графовые нейросети: с ними можно построить граф-эмбеддинги, которые снимут вопрос построения hand-crafted графовых фичей. Именно с графовыми нейросетями и связана новая open source библиотека Big Data МТС.

Сегодня я представляю вам библиотеку CoolGraph, с помощью которой вы сможете построить первые графовые нейросети буквально в несколько строк кода. Задача библиотеки — популяризовать GNN и радикально снизить порог входа в них. Надеюсь, так же, как RecTools и Ambrosia, CoolGraph скоро прорастёт в код других компаний, начнёт попадать в описание стека в вакансиях и, вообще, всячески станет популярной и востребованной в DS-сообществе :)

GitHub - MobileTeleSystems/CoolGraph: Make GNN easy to start with

Make GNN easy to start with. Contribute to MobileTeleSystems/CoolGraph development by creating an account on GitHub.

✍1👍1

485 viewsНиколай, 17:26

Machine Learning Research

Introduction to AI

https://github.com/microsoft/AI-For-Beginners/blob/main/lessons/1-Intro/README.md

AI-For-Beginners/lessons/1-Intro/README.md at main · microsoft/AI-For-Beginners

12 Weeks, 24 Lessons, AI for All! Contribute to microsoft/AI-For-Beginners development by creating an account on GitHub.

👍1

543 viewsНиколай, 07:57

Machine Learning Research

Forwarded from Denis Sexy IT 🤖

This media is not supported in your browser

VIEW IN TELEGRAM

Довольно техническая, но наглядная визуализация того как работают
языковые модели внутри – от ввода до вывода текста, с пояснениями и формулами:
https://bbycroft.net/llm

Сайт работает лучше с компьютера

❤3

504 viewsНиколай, 13:28

Machine Learning Research

Кто такие LLM-агенты и что они умеют?

https://habr.com/ru/companies/ods/articles/776478/

Кто такие LLM-агенты и что они умеют?

В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными...

549 viewsНиколай, 08:10

Machine Learning Research

Forwarded from DL in NLP (Vlad Lialin)

MLX: An array framework for Apple silicon
github.com/ml-explore/mlx

Apple внезапно выкатила свой opensource DL-фреймворк: MLX

MLX оптимизирован под Apple Silicon и на первый взгляд очень похож по API на PyTorch. Но есть и отличия. Lazy computations by default (тык), unified memory — на Apple silicon нет разделения на CPU- и GPU-память. Документация к сожалению пока что сырая. Судя по их референсам к JAX и Mac-optimizes pytorch, я бы ожидал поддержку статических графов и наличие функции mlx.simplify как бы намекает, но в документации ни слова.

Понятно что главным применением для MLX будет инферить модельки на MacOS/iOS, но то что MLX это полноценный DL-фреймворк с autograd в том числе это немного намекает на то что Apple подумывает о том как бы использовать своё железо для тренировки

И вместе с этим выкатили быстрый фреймворк для загрузки данных: MLX-data. Работает и с MLX и с PyTorch.

Установка: pip install mlx
Пример тренировки трансформера: тык
Документация: тык

505 viewsНиколай, 16:23

Machine Learning Research

Forwarded from gonzo-обзоры ML статей

Gemini announced!

Looks like the most capable GPT competitor with better multimodal capabilities.

Site: https://deepmind.google/technologies/gemini/#introduction
Blog: https://blog.google/technology/ai/google-gemini-ai/
Technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

572 viewsНиколай, 16:29

Machine Learning Research

Forwarded from Сиолошная

UPD: чтобы попробовать Gemini, действительно нужно перейти по ссылке https://bard.google.com/chat

НО! Есть два предварительных шага:
1️⃣ вы должны быть в правильной стране. EU и UK на данный момент не получили обновление — у меня получилось с USA. Обычный VPN подходит, у меня стоял, вот ссылка для Google Chrome.

2️⃣нужно сменить язык Google-аккаунта на английский (для верности выбрать американский). Сделать можно вот по этой ссылке: https://myaccount.google.com/language

Если сделали всё правильно, то увидите при заходе светло-голубую плашку сверху: Bard has been updated in English with Gemini Pro.

Если не сработало, попробуйте сменить сервер VPN ещё раз, а также перезагрузить страницу со сбросом кэша, cmd/ctrl+shift+R )

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

801 viewsНиколай, 16:40

Machine Learning Research

Весьма актуальную штуку выложили на huggingface, особенно учитывая выход mixtral
https://huggingface.co/blog/moe

Mixture of Experts Explained

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

777 viewsНиколай, 15:38

Machine Learning Research

О методах позиционного кодирования в Transformer

https://habr.com/ru/articles/780116/

О методах позиционного кодирования в Transformer

Традиционный дисклеймер Статья посвящёна проблеме выбора метода позиционного кодирования в нейросетевых моделях на основе архитектуры Transformer. От читателя требуется понимание общих принципов...

650 viewsНиколай, 16:14

Machine Learning Research

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

https://habr.com/ru/companies/sberdevices/articles/780334/

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

Upd 11.01.2024. Добавили сравнение с новой моделью YandexGPT2 (не lite версия). С момента запуска GigaChat прошло около полугода, и за это время у нас появилось более полутора миллионов пользователей....

👍3

588 viewsНиколай, 17:45