Diffusion model, whose text-conditional component works in a highly compressed latent space of images
Würstchen - это диффузионная модель, которой работает в сильно сжатом латентном пространстве изображений.
Почему это важно? Сжатие данных позволяет на порядки снизить вычислительные затраты как на обучение, так и на вывод модели.
Обучение на 1024×1024 изображениях гораздо затратное, чем на 32×32. Обычно в других моделях используется сравнительно небольшое сжатие, в пределах 4x - 8x пространственного сжатия.
Благодаря новой архитектуре достигается 42-кратное пространственное сжатие!
🤗 HF: https://huggingface.co/blog/wuertschen
📝 Paper: https://arxiv.org/abs/2306.00637
🚀 Demo: https://huggingface.co/spaces/warp-ai/Wuerstchen
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍9❤6😁1
The highly cohesive and decoupled modular design of TopMost enables quick utilization, fair comparisons, and flexible extensions of different topic models.
TopMost обеспечивает полный жизненный цикл тематического моделирования, включая предварительную обработку данных, обучение модели, тестирование и оценку. Он охватывает наиболее популярные сценарии тематического моделирования, такие как статическое, динамическое, иерархическое и межъязыковое тематическое моделирование.
$ pip install topmostai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤3🔥1
📂 An Open-source Framework for Autonomous Language Agents
Agents is carefully engineered to support important features including planning, memory, tool usage, multi-agent communication, and fine-grained symbolic control.
Agents - это библиотека/фреймворк с открытым исходным кодом для создания автономных языковых агентов.
Библиотека тщательно продумана и поддерживает такие важные функции, как долгую краткосрочную память , использование продвинутых ии-инструментов, веб-навигацию, мультиагентное взаимодействие, а также совершенно новые возможности, включая взаимодействие человека и агента и символьное управление.
🖥 Github: https://github.com/aiwaves-cn/agents
📕 Paper: https://arxiv.org/pdf/2309.07870.pdf
⏩ Demo: https://github.com/aiwaves-cn/agents#web-demos
⭐️ Project: http://www.aiwaves-agents.com/
ai_machinelearning_big_data
Agents is carefully engineered to support important features including planning, memory, tool usage, multi-agent communication, and fine-grained symbolic control.
Agents - это библиотека/фреймворк с открытым исходным кодом для создания автономных языковых агентов.
Библиотека тщательно продумана и поддерживает такие важные функции, как долгую краткосрочную память , использование продвинутых ии-инструментов, веб-навигацию, мультиагентное взаимодействие, а также совершенно новые возможности, включая взаимодействие человека и агента и символьное управление.
pip install ai-agentsai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥4❤2🤯1
✏️ Модель для генерации субтитров, созданная Яндекс Браузером
Итак, Яндекс запустил внутри браузера новую нейросеть: она создаёт субтитры к любым русскоязычным видео на любом сайте. Субтитры работают даже для тех роликов, которые доступны после авторизации или загружены в облачные хранилища.
Нейросеть стала потреблять в 5 раз меньше оперативной памяти: оптимизация буферов и моделей позволили дойти до отметки в 150 Мб вместо 800 Мб. Для этого разработчики уменьшали накапливающиеся буферы, меняли архитектуру модели и перенастраивали процесс декодирования.
За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение — это когда предсказание работает с помощью скользящего окна со сдвигом.
Подробнее про генерацию субтитров можно почитать в статье на Хабре.
ai_machinelearning_big_data
Итак, Яндекс запустил внутри браузера новую нейросеть: она создаёт субтитры к любым русскоязычным видео на любом сайте. Субтитры работают даже для тех роликов, которые доступны после авторизации или загружены в облачные хранилища.
Нейросеть стала потреблять в 5 раз меньше оперативной памяти: оптимизация буферов и моделей позволили дойти до отметки в 150 Мб вместо 800 Мб. Для этого разработчики уменьшали накапливающиеся буферы, меняли архитектуру модели и перенастраивали процесс декодирования.
За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение — это когда предсказание работает с помощью скользящего окна со сдвигом.
Подробнее про генерацию субтитров можно почитать в статье на Хабре.
ai_machinelearning_big_data
🔥15👍5❤2
FlagEmbedding
FlagEmbedding can map any text to a low-dimensional dense vector which can be used for tasks like retrieval, classification, clustering, or semantic search. And it also can be used in vector databases for LLMs.
FlagEmbedding позволяет преобразовать любой текст в плотный низкоразмерный вектор, который может быть использован для решения таких задач, как поиск, классификация, кластеризация или семантический поиск. Кроме того, он может быть использован в векторных базах данных для LLM.
🖥 Github: https://github.com/flagopen/flagembedding
📕 Paper: https://arxiv.org/pdf/2309.07597v1.pdf
⭐️ Datasets: https://paperswithcode.com/dataset/beir
ai_machinelearning_big_data
FlagEmbedding can map any text to a low-dimensional dense vector which can be used for tasks like retrieval, classification, clustering, or semantic search. And it also can be used in vector databases for LLMs.
FlagEmbedding позволяет преобразовать любой текст в плотный низкоразмерный вектор, который может быть использован для решения таких задач, как поиск, классификация, кластеризация или семантический поиск. Кроме того, он может быть использован в векторных базах данных для LLM.
pip install -U FlagEmbeddingai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍6🔥6🥱1
💥 MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning
MMICL is a multimodal vision-language model with the ability to analyze and understand multiple images, as well as follow instructions.
MMICL - это хорошо продуманная модель с датасетом, которая позволяет беспрепятственно интегрировать визуальный и текстовый контекст в чередующемся виде для разработки
крупных мультимодальных моделей.
🖥 Github: https://github.com/haozhezhao/mic
📕 Paper: https://arxiv.org/abs/2309.07915v1
⭐️ Datasets: https://paperswithcode.com/dataset/mmbench
ai_machinelearning_big_data
MMICL is a multimodal vision-language model with the ability to analyze and understand multiple images, as well as follow instructions.
MMICL - это хорошо продуманная модель с датасетом, которая позволяет беспрепятственно интегрировать визуальный и текстовый контекст в чередующемся виде для разработки
крупных мультимодальных моделей.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥5❤1🥰1
🔥Free Certification Courses from Microsoft to try in 2023:
Бесплатные сертификационные курсы от Microsoft, которые можно пройти в 2023 году.
1. Get started with Microsoft data analytics
https://learn.microsoft.com/en-us/training/paths/data-analytics-microsoft
2. Prepare data for analysis with Power BI
https://learn.microsoft.com/en-us/training/paths/prepare-data-power-bi
3. Model data with Power BI
https://learn.microsoft.com/en-us/training/paths/model-data-power-bi
4. Build Power BI visuals and reports
https://learn.microsoft.com/en-us/training/paths/build-power-bi-visuals-reports
5. Data analysis in Power BI
https://coursya.com/product/microsoft-power-bi-data-analyst
6. Visualize data in Power BI
https://coursya.com/product/build-power-bi-visuals-and-reports-training
7. Model data in Power BI
https://coursya.com/product/power-bi-for-beginners-designing-a-data-model
8. Prepare data for analysis
https://coursya.com/product/prepare-data-for-analysis-training
9. Get started with Microsoft data analytics
https://coursya.com/product/get-started-with-microsoft-data-analytics-training
10. Microsoft Certified: Power BI Data Analyst Associate
https://coursya.com/product/microsoft-certified-power-bi-data-analyst-associate-certifications
ai_machinelearning_big_data
Бесплатные сертификационные курсы от Microsoft, которые можно пройти в 2023 году.
1. Get started with Microsoft data analytics
https://learn.microsoft.com/en-us/training/paths/data-analytics-microsoft
2. Prepare data for analysis with Power BI
https://learn.microsoft.com/en-us/training/paths/prepare-data-power-bi
3. Model data with Power BI
https://learn.microsoft.com/en-us/training/paths/model-data-power-bi
4. Build Power BI visuals and reports
https://learn.microsoft.com/en-us/training/paths/build-power-bi-visuals-reports
5. Data analysis in Power BI
https://coursya.com/product/microsoft-power-bi-data-analyst
6. Visualize data in Power BI
https://coursya.com/product/build-power-bi-visuals-and-reports-training
7. Model data in Power BI
https://coursya.com/product/power-bi-for-beginners-designing-a-data-model
8. Prepare data for analysis
https://coursya.com/product/prepare-data-for-analysis-training
9. Get started with Microsoft data analytics
https://coursya.com/product/get-started-with-microsoft-data-analytics-training
10. Microsoft Certified: Power BI Data Analyst Associate
https://coursya.com/product/microsoft-certified-power-bi-data-analyst-associate-certifications
ai_machinelearning_big_data
👍9🔥6❤4🖕1
🫦 HDTR: A Real-Time High-Definition Teeth Restoration Network for Arbitrary Talking Face Generation Methods
Talking Face Generation - новый проект для реконструкции движений лица для достижения высокой естественности движений губ из аудио.
🖥 Github: https://github.com/yylgoodlucky/HDTR-Net
📕 Paper: https://arxiv.org/abs/2309.07495v1
⭐️ Datasets: https://paperswithcode.com/dataset/lrs2
ai_machinelearning_big_data
Talking Face Generation - новый проект для реконструкции движений лица для достижения высокой естественности движений губ из аудио.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀Breathing New Life into 3D Assets with Generative Repainting
Новая модель. которая переносит возможности генеративных моделей 2D-изображений, таких как Stable Diffusion, в 3D. Проект позволяет получить яркие генерации 3D-объектов в различных категориях форм.
🖥 Github: https://github.com/kongdai123/repainting_3d_assets
☑️ Demo: https://www.obukhov.ai/repainting_3d_assets
🖥 Colab: https://colab.research.google.com/drive/18mDpuYO5TuI6tSkQk9ls2rS9sciNpR-c?usp=sharing
📕 Paper: https://arxiv.org/abs/2309.08523v1
⭐️ Datasets: https://paperswithcode.com/dataset/shapenet
ai_machinelearning_big_data
Новая модель. которая переносит возможности генеративных моделей 2D-изображений, таких как Stable Diffusion, в 3D. Проект позволяет получить яркие генерации 3D-объектов в различных категориях форм.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍5🔥4