Media is too big
VIEW IN TELEGRAM
📹 DEVA: Tracking Anything with Decoupled Video Segmentation
Decoupled video segmentation approach (DEVA), composed of task-specific image-level segmentation and class/task-agnostic bi-directional temporal propagation.
Новая модель сегментации видео для "отслеживания чего угодно" без обучения по видео для любой отдельной задачи.
🖥 Github: https://github.com/hkchengrex/Tracking-Anything-with-DEVA
🖥 Colab: https://colab.research.google.com/drive/1OsyNVoV_7ETD1zIE8UWxL3NXxu12m_YZ?usp=sharing
⏩ Project: https://hkchengrex.github.io/Tracking-Anything-with-DEVA/
📕 Paper: https://arxiv.org/abs/2309.03903v1
⭐️ Docs: https://paperswithcode.com/dataset/burst
ai_machinelearning_big_data
Decoupled video segmentation approach (DEVA), composed of task-specific image-level segmentation and class/task-agnostic bi-directional temporal propagation.
Новая модель сегментации видео для "отслеживания чего угодно" без обучения по видео для любой отдельной задачи.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥8❤2🌚2
🎯 DoLa: Decoding by Contrasting Layers Improves Factuality in Large Language Models
Фреймворк для уменьшения галлюцинаций с помощью предварительно обученных ЛЛМ, не требующая ни файнтюнинга.
🖥 Github: https://github.com/voidism/dola
🖥 Colab: https://colab.research.google.com/github/voidism/DoLa/blob/master/dola_evaluation.ipynb
📕 Paper: https://arxiv.org/abs/2309.03883v1
⭐️ Dataset: https://paperswithcode.com/dataset/truthfulqa
ai_machinelearning_big_data
Фреймворк для уменьшения галлюцинаций с помощью предварительно обученных ЛЛМ, не требующая ни файнтюнинга.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤5🔥1
Бесплатные курсы и руководства, для погружения в искусственный интеллект.
📂Elements of AI
https://elementsofai.com
📂Learn Prompting
https://learnprompting.org
📂Machine Learning
https://edx.org/learn/machine-learning/harvard-university-data-science-machine-learning
📂AI for everyone
https://coursera.org/learn/ai-for-everyone
📂500+ AI Chatbot Prompt Templates
https://theveller.gumroad.com/l/ChatGPTPromptTemplates-byTheVeller
📂Prompt Engineering
https://youtu.be/_ZvnD73m40o
📂ChatGPT Prompt Engineering for Developers
https://deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers
📂Google — AI for Anyone
https://edx.org/learn/artificial-intelligence/google-google-ai-for-anyone
📂Microsoft — AI For Beginners
https://microsoft.github.io/AI-For-Beginners
📂IBM — AI for Everyone: Master the Basics
https://edx.org/learn/artificial-intelligence/ibm-ai-for-everyone-master-the-basics
📂Google — Introduction to Generative AI
https://cloudskillsboost.google/journeys/118
📂DeepLearning — Finetuning LLMs
https://deeplearning.ai/short-courses/finetuning-large-language-models
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26❤7🔥4😁2🌭1
⚡Intel® Neural Compressor
Intel® Neural Compressor , targeting to provide unified APIs for network compression technologies
Intel® Neural Compressor - фреймворк для сжатия моделей, который позволяет проводить квантование, обрезку (sparsity), дистилляцию и поиск архитектуры нейронной сети. СОвместим с TensorFlow, PyTorch, ONNX Runtime и MXNet.
🖥 Github: https://github.com/intel/neural-compressor
📂 Docs: https://intel.github.io/neural-compressor
📕 Paper: https://arxiv.org/abs/2309.05516v1
⭐️ Dataset: https://paperswithcode.com/dataset/lambada
ai_machinelearning_big_data
Intel® Neural Compressor , targeting to provide unified APIs for network compression technologies
Intel® Neural Compressor - фреймворк для сжатия моделей, который позволяет проводить квантование, обрезку (sparsity), дистилляцию и поиск архитектуры нейронной сети. СОвместим с TensorFlow, PyTorch, ONNX Runtime и MXNet.
pip install neural-compressor
📂 Docs: https://intel.github.io/neural-compressor
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥9❤4
🔥 Free Certification Courses from Google to try in 2023.
Бесплатные сертификационные курсы от Google, для аналитиков, которые стоит пройти в 2023 году.
1. Basics of Machine Learning
https://grow.google/intl/en_in/
2. Machine Learning Crash Course
https://coursya.com/product/machine-learning-crash-course
3. Project Execution: Running the Project
https://coursera.org/learn/project-execution-google
4. Foundations of Project Management
https://coursera.org/learn/project-management-foundations
5. Project Initiation: Starting a Successful Project
https://coursera.org/learn/project-initiation-google
6. Project Planning: Putting It All Together
https://coursera.org/learn/project-planning-google
7. Google Analytics for Power Users
https://coursya.com/product/google-analytics-certification-coursya
8. Fundamentals of digital marketing
https://skillshop.exceedlms.com/student/collection/654330-digital-marketing?locale=en-GB
9. Python Basics for Data Analysis
https://coursya.com/product/learn-python-basics-for-data-analysis
10. Data Science Foundations
https://grow.google/intl/en_in/
11. Advanced Google Analytics
https://coursera.org/professional-certificates/google-data-analytics
12. Google Cloud Computing Foundations:
https://cloudskillsboost.google/course_templates/153
13. Data, ML, and AI in Google Cloud
https://coursya.com/product/google-cloud-computing-foundations-data-ml-and-ai-in-google-cloud-google-cloud-skills-boost
14. Agile Project Management
https://coursera.org/learn/agile-project-management
15. Google Project Management
https://coursera.org/professional-certificates/google-project-management
ai_machinelearning_big_data
Бесплатные сертификационные курсы от Google, для аналитиков, которые стоит пройти в 2023 году.
1. Basics of Machine Learning
https://grow.google/intl/en_in/
2. Machine Learning Crash Course
https://coursya.com/product/machine-learning-crash-course
3. Project Execution: Running the Project
https://coursera.org/learn/project-execution-google
4. Foundations of Project Management
https://coursera.org/learn/project-management-foundations
5. Project Initiation: Starting a Successful Project
https://coursera.org/learn/project-initiation-google
6. Project Planning: Putting It All Together
https://coursera.org/learn/project-planning-google
7. Google Analytics for Power Users
https://coursya.com/product/google-analytics-certification-coursya
8. Fundamentals of digital marketing
https://skillshop.exceedlms.com/student/collection/654330-digital-marketing?locale=en-GB
9. Python Basics for Data Analysis
https://coursya.com/product/learn-python-basics-for-data-analysis
10. Data Science Foundations
https://grow.google/intl/en_in/
11. Advanced Google Analytics
https://coursera.org/professional-certificates/google-data-analytics
12. Google Cloud Computing Foundations:
https://cloudskillsboost.google/course_templates/153
13. Data, ML, and AI in Google Cloud
https://coursya.com/product/google-cloud-computing-foundations-data-ml-and-ai-in-google-cloud-google-cloud-skills-boost
14. Agile Project Management
https://coursera.org/learn/agile-project-management
15. Google Project Management
https://coursera.org/professional-certificates/google-project-management
ai_machinelearning_big_data
👍19❤4🥰1
🗣Project NN-Pytorch-noscripts
This is a set of Python / Pytorch noscripts and tools for various speech-processing projects.
Набор скриптов и инструментов на языке Python / Pytorch для различных проектов по обработке речи.
🖥 Github: https://github.com/nii-yamagishilab/project-NN-Pytorch-noscripts
📕 Paper: https://arxiv.org/pdf/2309.06014v1.pdf
⭐️ Tasks: https://paperswithcode.com/task/speech-synthesis
ai_machinelearning_big_data
This is a set of Python / Pytorch noscripts and tools for various speech-processing projects.
Набор скриптов и инструментов на языке Python / Pytorch для различных проектов по обработке речи.
git clone --depth 1 https://github.com/nii-yamagishilab/project-NN-Pytorch-noscripts.gitai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤3🥰1
Diffusion model, whose text-conditional component works in a highly compressed latent space of images
Würstchen - это диффузионная модель, которой работает в сильно сжатом латентном пространстве изображений.
Почему это важно? Сжатие данных позволяет на порядки снизить вычислительные затраты как на обучение, так и на вывод модели.
Обучение на 1024×1024 изображениях гораздо затратное, чем на 32×32. Обычно в других моделях используется сравнительно небольшое сжатие, в пределах 4x - 8x пространственного сжатия.
Благодаря новой архитектуре достигается 42-кратное пространственное сжатие!
🤗 HF: https://huggingface.co/blog/wuertschen
📝 Paper: https://arxiv.org/abs/2306.00637
🚀 Demo: https://huggingface.co/spaces/warp-ai/Wuerstchen
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍9❤6😁1
The highly cohesive and decoupled modular design of TopMost enables quick utilization, fair comparisons, and flexible extensions of different topic models.
TopMost обеспечивает полный жизненный цикл тематического моделирования, включая предварительную обработку данных, обучение модели, тестирование и оценку. Он охватывает наиболее популярные сценарии тематического моделирования, такие как статическое, динамическое, иерархическое и межъязыковое тематическое моделирование.
$ pip install topmostai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤3🔥1
📂 An Open-source Framework for Autonomous Language Agents
Agents is carefully engineered to support important features including planning, memory, tool usage, multi-agent communication, and fine-grained symbolic control.
Agents - это библиотека/фреймворк с открытым исходным кодом для создания автономных языковых агентов.
Библиотека тщательно продумана и поддерживает такие важные функции, как долгую краткосрочную память , использование продвинутых ии-инструментов, веб-навигацию, мультиагентное взаимодействие, а также совершенно новые возможности, включая взаимодействие человека и агента и символьное управление.
🖥 Github: https://github.com/aiwaves-cn/agents
📕 Paper: https://arxiv.org/pdf/2309.07870.pdf
⏩ Demo: https://github.com/aiwaves-cn/agents#web-demos
⭐️ Project: http://www.aiwaves-agents.com/
ai_machinelearning_big_data
Agents is carefully engineered to support important features including planning, memory, tool usage, multi-agent communication, and fine-grained symbolic control.
Agents - это библиотека/фреймворк с открытым исходным кодом для создания автономных языковых агентов.
Библиотека тщательно продумана и поддерживает такие важные функции, как долгую краткосрочную память , использование продвинутых ии-инструментов, веб-навигацию, мультиагентное взаимодействие, а также совершенно новые возможности, включая взаимодействие человека и агента и символьное управление.
pip install ai-agentsai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥4❤2🤯1
✏️ Модель для генерации субтитров, созданная Яндекс Браузером
Итак, Яндекс запустил внутри браузера новую нейросеть: она создаёт субтитры к любым русскоязычным видео на любом сайте. Субтитры работают даже для тех роликов, которые доступны после авторизации или загружены в облачные хранилища.
Нейросеть стала потреблять в 5 раз меньше оперативной памяти: оптимизация буферов и моделей позволили дойти до отметки в 150 Мб вместо 800 Мб. Для этого разработчики уменьшали накапливающиеся буферы, меняли архитектуру модели и перенастраивали процесс декодирования.
За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение — это когда предсказание работает с помощью скользящего окна со сдвигом.
Подробнее про генерацию субтитров можно почитать в статье на Хабре.
ai_machinelearning_big_data
Итак, Яндекс запустил внутри браузера новую нейросеть: она создаёт субтитры к любым русскоязычным видео на любом сайте. Субтитры работают даже для тех роликов, которые доступны после авторизации или загружены в облачные хранилища.
Нейросеть стала потреблять в 5 раз меньше оперативной памяти: оптимизация буферов и моделей позволили дойти до отметки в 150 Мб вместо 800 Мб. Для этого разработчики уменьшали накапливающиеся буферы, меняли архитектуру модели и перенастраивали процесс декодирования.
За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение — это когда предсказание работает с помощью скользящего окна со сдвигом.
Подробнее про генерацию субтитров можно почитать в статье на Хабре.
ai_machinelearning_big_data
🔥15👍5❤2
FlagEmbedding
FlagEmbedding can map any text to a low-dimensional dense vector which can be used for tasks like retrieval, classification, clustering, or semantic search. And it also can be used in vector databases for LLMs.
FlagEmbedding позволяет преобразовать любой текст в плотный низкоразмерный вектор, который может быть использован для решения таких задач, как поиск, классификация, кластеризация или семантический поиск. Кроме того, он может быть использован в векторных базах данных для LLM.
🖥 Github: https://github.com/flagopen/flagembedding
📕 Paper: https://arxiv.org/pdf/2309.07597v1.pdf
⭐️ Datasets: https://paperswithcode.com/dataset/beir
ai_machinelearning_big_data
FlagEmbedding can map any text to a low-dimensional dense vector which can be used for tasks like retrieval, classification, clustering, or semantic search. And it also can be used in vector databases for LLMs.
FlagEmbedding позволяет преобразовать любой текст в плотный низкоразмерный вектор, который может быть использован для решения таких задач, как поиск, классификация, кластеризация или семантический поиск. Кроме того, он может быть использован в векторных базах данных для LLM.
pip install -U FlagEmbeddingai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍6🔥6🥱1
💥 MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning
MMICL is a multimodal vision-language model with the ability to analyze and understand multiple images, as well as follow instructions.
MMICL - это хорошо продуманная модель с датасетом, которая позволяет беспрепятственно интегрировать визуальный и текстовый контекст в чередующемся виде для разработки
крупных мультимодальных моделей.
🖥 Github: https://github.com/haozhezhao/mic
📕 Paper: https://arxiv.org/abs/2309.07915v1
⭐️ Datasets: https://paperswithcode.com/dataset/mmbench
ai_machinelearning_big_data
MMICL is a multimodal vision-language model with the ability to analyze and understand multiple images, as well as follow instructions.
MMICL - это хорошо продуманная модель с датасетом, которая позволяет беспрепятственно интегрировать визуальный и текстовый контекст в чередующемся виде для разработки
крупных мультимодальных моделей.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥5❤1🥰1