Набор данных для генерации музыки различных жанров.
Набор данных содержит 11 144 MIDI-сэмплов, написанных и созданных профессиональными композиторами.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤3🔥2
UI на основе библиотеки Gradio для Stable Diffusion. Большое количество фич для генерации контента с удобным интерфейсом.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍5❤2🤨1
В AIRI создали модель на основе ДНК человека для решения задач по биоинформатике
Об этом рассказал директор по поисковым исследованиям AIRI Михаил Бурцев на международной конференции AI Journey. Он отметил, что сейчас наиболее важными прорывами будут те, которые связаны с языковыми моделями. В институте AIRI также начали исследования в этом направлении — модель GENA позволяет разбивать последовательности на кусочки, что увеличивает размер текста, который может попадать на вход. Для этого использовалась последняя сборка референсного генома человека.
Также институт AIRI разработал алгоритм MemUp, который позволяет решить задачу предсказания длинных последовательностей. Это память на основе предсказаний элементов с высокой неопределенностью.
На текущий момент модель основана на ДНК человека, но если добавить туда ДНК других видов, то модель не только сможет выучить, как устроено описание организма человека, но и описание других организмов. Например, обезьян, птиц, змей и так далее. В конечном итоге это позволит решить больше задач по биоинформатике.
Об этом рассказал директор по поисковым исследованиям AIRI Михаил Бурцев на международной конференции AI Journey. Он отметил, что сейчас наиболее важными прорывами будут те, которые связаны с языковыми моделями. В институте AIRI также начали исследования в этом направлении — модель GENA позволяет разбивать последовательности на кусочки, что увеличивает размер текста, который может попадать на вход. Для этого использовалась последняя сборка референсного генома человека.
Также институт AIRI разработал алгоритм MemUp, который позволяет решить задачу предсказания длинных последовательностей. Это память на основе предсказаний элементов с высокой неопределенностью.
На текущий момент модель основана на ДНК человека, но если добавить туда ДНК других видов, то модель не только сможет выучить, как устроено описание организма человека, но и описание других организмов. Например, обезьян, птиц, змей и так далее. В конечном итоге это позволит решить больше задач по биоинформатике.
👍20🔥9❤2
🎨 Kandinsky 2.0
Kandinsky 2.0 — первая мультиязычная диффузия для генерации изображений по тексту
- два мультилингвальных текстовых энкодера, эмбеддинги которых конкатенируются
- больше UNet (1.2 млрд параметров)
- динамический трешхолдинг в процессе сэмплирования
🖥 Github
➡️ Habr статья
🖥 Demo
🤗 Model
@ai_machinelearning_big_data
Kandinsky 2.0 — первая мультиязычная диффузия для генерации изображений по тексту
- два мультилингвальных текстовых энкодера, эмбеддинги которых конкатенируются
- больше UNet (1.2 млрд параметров)
- динамический трешхолдинг в процессе сэмплирования
🤗 Model
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤11🔥7🤨4
- Новая модель, которая позволяет легко и быстро менять местами части изображения.
- Новые модели преобразования текста в изображение.
- Диффузионные модели со сверхвысоким разрешением.Повышает разрешение изображений в 4 раза.
- Обновленная модель отрисовки
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍6❤1🐳1
Крупнейшие игроки российского технологического рынка присоединяются к Кодексу этики в сфере искусственного интеллекта. Свод правил разработал Альянс в сфере ИИ и обнародовал в рамках международной конференции по искусственному интеллекту AI Journey.
На конференции к Кодексу присоединились Datanа, Factory 5, ГК «GlobalTruck», ГеомирАгро, Цифровая платформа КАМАЗ, ГК Медси, Самолет, Сибур, Северсталь Менеджмент, РЖД, Русагро Технологии, Уралхим. Всего Кодекс поддержали 113 российских компаний и организаций.
«В нашем понимании развитие технологий ИИ в России должно ориентироваться исключительно на интересы человека, качество его жизни и благополучие. Именно на основе доверия граждан мы вместе с участниками Альянса и Кодекса этики продолжим создавать новую цифровую экосистему для технологического развития нашей страны», — так прокомментировал Кодекс зампред Правительства РФ Дмитрий Чернышенко.
На конференции к Кодексу присоединились Datanа, Factory 5, ГК «GlobalTruck», ГеомирАгро, Цифровая платформа КАМАЗ, ГК Медси, Самолет, Сибур, Северсталь Менеджмент, РЖД, Русагро Технологии, Уралхим. Всего Кодекс поддержали 113 российских компаний и организаций.
«В нашем понимании развитие технологий ИИ в России должно ориентироваться исключительно на интересы человека, качество его жизни и благополучие. Именно на основе доверия граждан мы вместе с участниками Альянса и Кодекса этики продолжим создавать новую цифровую экосистему для технологического развития нашей страны», — так прокомментировал Кодекс зампред Правительства РФ Дмитрий Чернышенко.
👍11👎5❤2😁2🤨1
SinDiffusion значительно улучшает качество и разнообразие сгенерированных изображений по сравнению с существующими подходами на основе GAN.
📌 Project: https://github.com/WeilunWang/SinDiffusion/blob/main
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥11👍9🔥2
Какие изменения произошли с библиотекой PyTorch-LifeStream за год?
Об этом рассказал Иван Киреев, исполнительный директор по исследованию данных в лаборатории по искусственному интеллекту Сбера во время международной конференции AI Journey.
Библиотека PyTorch-LifeStream нужна для построения нейронных сетей на событийных данных. В основном, изменилась структура библиотеки. Она была разбита на несколько модулей, благодаря чему в ней стало проще ориентироваться. Также изменилась система конфигурирования, появилось больше примеров использования библиотеки.
Всего в структуре библиотеки на текущий момент четыре блока:
1. Перепроцессинг данных
2. Загрузка
3. Набор слоёв
4. Набор фреймворков обучения
Что касается конфигурации, то была подключена Hydra. Все конфигурации хранятся в yaml-файлах, которые удобно редактировать.
Об этом рассказал Иван Киреев, исполнительный директор по исследованию данных в лаборатории по искусственному интеллекту Сбера во время международной конференции AI Journey.
Библиотека PyTorch-LifeStream нужна для построения нейронных сетей на событийных данных. В основном, изменилась структура библиотеки. Она была разбита на несколько модулей, благодаря чему в ней стало проще ориентироваться. Также изменилась система конфигурирования, появилось больше примеров использования библиотеки.
Всего в структуре библиотеки на текущий момент четыре блока:
1. Перепроцессинг данных
2. Загрузка
3. Набор слоёв
4. Набор фреймворков обучения
Что касается конфигурации, то была подключена Hydra. Все конфигурации хранятся в yaml-файлах, которые удобно редактировать.
👍13❤1👏1🥴1
TorchScale - набор инструментов с открытым исходным кодом, который позволяети разработчикам эффективно и действенно масштабировать Transformers.
pip install torchscale@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤3🔥2