⚡️Scribble SDXL — позволяет превратить каракули в шедевр
Scribble SDXL создан на основе SDXL ControlNet и его можно без проблем запустить на Hugging Face.
Можно выбирать разные стили и экспериментировать.
🤗 Scribble SDXL
@Devsp — Подписаться
Scribble SDXL создан на основе SDXL ControlNet и его можно без проблем запустить на Hugging Face.
Можно выбирать разные стили и экспериментировать.
🤗 Scribble SDXL
@Devsp — Подписаться
⚡️ Хабр подвел итоги конкурса «Технотекст», в тройку лидеров в номинации ML попали:
• Статья Виктора Юрченко из Яндекса с рассказом о том, как нейросети помогают беспилотным автомобилям планировать своё движение
• Научно-популярная статья Игоря Котенкова из Open Data Science с разбором работы ChatGPT
• Статья Мурата Апишева о методах позиционного кодирования в Transformer.
@Devsp — Подписаться
• Статья Виктора Юрченко из Яндекса с рассказом о том, как нейросети помогают беспилотным автомобилям планировать своё движение
• Научно-популярная статья Игоря Котенкова из Open Data Science с разбором работы ChatGPT
• Статья Мурата Апишева о методах позиционного кодирования в Transformer.
@Devsp — Подписаться
⚡️ Cortex — AI-движок для создания LLM-приложений
Cortex — это open-source AI-движок для создания LLM-приложений.
Можно импортировать в виде библиотеки Cortex или использовать как сервер.
🖥GitHub
🟡Доки
@Devsp — Подписаться
Cortex — это open-source AI-движок для создания LLM-приложений.
Можно импортировать в виде библиотеки Cortex или использовать как сервер.
🖥GitHub
🟡Доки
@Devsp — Подписаться
🔥Burn — свежий open-source фреймворк для Deep Learning на Rust с упором на гибкость, эффективность вычислений и переносимость
Весь рабочий процесс глубокого обучения упрощается с помощью Burn, поскольку вы можете отслеживать прогресс своего обучения с помощью эргономичной панели управления и выполнять логические выводы повсюду, от встроенных устройств до больших кластеров графических процессоров.
Burn был создан с нуля с учетом обучения и умозаключений. Также стоит отметить, насколько Burn по сравнению с такими фреймворками, как PyTorch, упрощает переход от обучения к развертыванию, устраняя необходимость изменения кода.
🖥GitHub
🟡Доки
@Devsp — Подписаться
Весь рабочий процесс глубокого обучения упрощается с помощью Burn, поскольку вы можете отслеживать прогресс своего обучения с помощью эргономичной панели управления и выполнять логические выводы повсюду, от встроенных устройств до больших кластеров графических процессоров.
Burn был создан с нуля с учетом обучения и умозаключений. Также стоит отметить, насколько Burn по сравнению с такими фреймворками, как PyTorch, упрощает переход от обучения к развертыванию, устраняя необходимость изменения кода.
🖥GitHub
🟡Доки
@Devsp — Подписаться
😉Использование генеративного ИИ для автоматизации дата инжиниринга
В этой статье автор расскажет о генеративном искусственном интеллекте (Gen AI) и его использовании в инженерии данных, а также о LLM и ее характеристиках, способах использования в различных приложениях и важности качества данных и дизайна платформы данных для эффективного использования LLM-моделей.
Читать...
В этой статье автор расскажет о генеративном искусственном интеллекте (Gen AI) и его использовании в инженерии данных, а также о LLM и ее характеристиках, способах использования в различных приложениях и важности качества данных и дизайна платформы данных для эффективного использования LLM-моделей.
Читать...
🌟Dot — open-source приложение для локального разворачивания LLM, RAG и TTS для работы со своими документами
Dot — это автономное приложение с открытым исходным кодом, предназначенное для беспрепятственного взаимодействия с документами и файлами с использованием локальных LLM и поисковой дополненной генерации (RAG).
Он вдохновлен такими решениями, как Chat with RTX от Nvidia, обеспечивающими удобный интерфейс для тех, у кого нет опыта программирования.
Используя Phi-3 LLM по умолчанию, Dot обеспечивает доступность и простоту сразу после установки.
🖥GitHub
🟡Страничка Dot
@Devsp — Подписаться
Dot — это автономное приложение с открытым исходным кодом, предназначенное для беспрепятственного взаимодействия с документами и файлами с использованием локальных LLM и поисковой дополненной генерации (RAG).
Он вдохновлен такими решениями, как Chat with RTX от Nvidia, обеспечивающими удобный интерфейс для тех, у кого нет опыта программирования.
Используя Phi-3 LLM по умолчанию, Dot обеспечивает доступность и простоту сразу после установки.
🖥GitHub
🟡Страничка Dot
@Devsp — Подписаться
🌟Omost — использование мощи LLM, пишущих код, для генерации изображений
Omost — это проект по преобразованию возможностей кодирования LLM в возможности генерации изображений (или, точнее, создания изображений).
Он предоставляет модели LLM, которые будут писать коды для составления визуального содержимого изображений с помощью виртуального агента Omost Canvas.
В настоящее время мы предоставляем 3 предварительно обученные модели LLM, основанные на вариациях Llama3 и Phi3 (см. также примечания к модели в конце этой страницы).
🖥GitHub
🤗 Попробовать на Hugging Face
@Devsp — Подписаться
Omost — это проект по преобразованию возможностей кодирования LLM в возможности генерации изображений (или, точнее, создания изображений).
Он предоставляет модели LLM, которые будут писать коды для составления визуального содержимого изображений с помощью виртуального агента Omost Canvas.
В настоящее время мы предоставляем 3 предварительно обученные модели LLM, основанные на вариациях Llama3 и Phi3 (см. также примечания к модели в конце этой страницы).
🖥GitHub
🤗 Попробовать на Hugging Face
@Devsp — Подписаться
⚡️ Qwen2 - самый крутой релиз откртых LLM со времен Llama 3!
Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам.
Серия Qwen2 включает базовые и настроенные по инструкции модели 5 размеров, включая Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, Qwen2-72B.
📖 BLOG: https://qwenlm.github.io/blog/qwen2/
🤗 HF collection: https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f
🤖 https://modelscope.cn/organization/qwen
💻 GitHub: https://github.com/QwenLM/Qwen2
@Devsp — Подписаться
Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам.
Серия Qwen2 включает базовые и настроенные по инструкции модели 5 размеров, включая Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, Qwen2-72B.
📖 BLOG: https://qwenlm.github.io/blog/qwen2/
🤗 HF collection: https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f
🤖 https://modelscope.cn/organization/qwen
💻 GitHub: https://github.com/QwenLM/Qwen2
@Devsp — Подписаться
⭐️Мультиплеер Stable Audio, который можно запустить на Hugging Face
Генерируйте аудио из текстового описания, делитесь и учитесь у других, как наилучшим образом использовать эту новую модель.
🤗 Попробовать на Hugging Face
@Devsp — Подписаться
Генерируйте аудио из текстового описания, делитесь и учитесь у других, как наилучшим образом использовать эту новую модель.
🤗 Попробовать на Hugging Face
@Devsp — Подписаться
😎NeRF-Insert — редактирование 3D-сцены с помощью текстового промпта или с помощью изображения
NeRF-Insert позволяет добавлять объект в 3D сцену с помощью мультимодальных входных сигналов.
Вставленный объект может быть описан с помощью текстовой строки или ссылочного изображения.
Пользователь может определить область закрашивания, нарисовав всего 2-3 ручные маски.
▶️Страничка NeRF-Insert
🟡Arxiv
@Devsp — Подписаться
NeRF-Insert позволяет добавлять объект в 3D сцену с помощью мультимодальных входных сигналов.
Вставленный объект может быть описан с помощью текстовой строки или ссылочного изображения.
Пользователь может определить область закрашивания, нарисовав всего 2-3 ручные маски.
▶️Страничка NeRF-Insert
🟡Arxiv
@Devsp — Подписаться
🎙 Real-time in-browser speech recognition
Распознавание речи в браузере в режиме реального времени с помощью OpenAI Whisper!
Модель распознавания речи с 73 миллионами параметров, оптимизированная для вывода в Интернете.
▪️Сode: https://github.com/xenova/transformers.js/tree/v3/examples/webgpu-whisper
▪️Hf: https://huggingface.co/spaces/Xenova/realtime-whisper-webgpu
@Devsp — Подписаться
Распознавание речи в браузере в режиме реального времени с помощью OpenAI Whisper!
Модель распознавания речи с 73 миллионами параметров, оптимизированная для вывода в Интернете.
▪️Сode: https://github.com/xenova/transformers.js/tree/v3/examples/webgpu-whisper
▪️Hf: https://huggingface.co/spaces/Xenova/realtime-whisper-webgpu
@Devsp — Подписаться
🖥 Самые интересные публикации за последние дни:
• Мультиплеер Stable Audio, который можно запустить на Hugging Face
• NeRF-Insert — редактирование 3D-сцены с помощью текстового промпта или с помощью изображения
• Omost — использование мощи LLM, пишущих код, для генерации изображений
• Мультиплеер Stable Audio, который можно запустить на Hugging Face
• NeRF-Insert — редактирование 3D-сцены с помощью текстового промпта или с помощью изображения
• Omost — использование мощи LLM, пишущих код, для генерации изображений
🎙 Real-time in-browser speech recognition
Распознавание речи в браузере в режиме реального времени с помощью OpenAI Whisper!
Модель распознавания речи с 73 миллионами параметров, оптимизированная для вывода в Интернете.
▪️Сode: https://github.com/xenova/transformers.js/tree/v3/examples/webgpu-whisper
▪️Hf: https://huggingface.co/spaces/Xenova/realtime-whisper-webgpu
@Devsp — Подписаться
Распознавание речи в браузере в режиме реального времени с помощью OpenAI Whisper!
Модель распознавания речи с 73 миллионами параметров, оптимизированная для вывода в Интернете.
▪️Сode: https://github.com/xenova/transformers.js/tree/v3/examples/webgpu-whisper
▪️Hf: https://huggingface.co/spaces/Xenova/realtime-whisper-webgpu
@Devsp — Подписаться
⚡️L-MAGIC: Language Model Assisted Generation of Images with Coherence
Новая модель может создавать качественные панорамные сцены на основе одного входного изображения и текстового промпта!
L-MAGIC использует предварительно обученные модели распространения и языка без тонкой настройки, обеспечивая нулевую производительность.
В сочетании с моделями условного распространения он может принимать различные способы ввода, включая, помимо прочего, текст, карты глубины, эскизы и цветные сценарии.
▪️Github: https://github.com/IntelLabs/MMPano
▪️Paper: https://arxiv.org/abs/2406.01843
▪️Project: https://zhipengcai.github.io/MMPano/
▪️Video: https://youtu.be/XDMNEzH4-Ec
@Devsp — Подписаться
Новая модель может создавать качественные панорамные сцены на основе одного входного изображения и текстового промпта!
L-MAGIC использует предварительно обученные модели распространения и языка без тонкой настройки, обеспечивая нулевую производительность.
В сочетании с моделями условного распространения он может принимать различные способы ввода, включая, помимо прочего, текст, карты глубины, эскизы и цветные сценарии.
▪️Github: https://github.com/IntelLabs/MMPano
▪️Paper: https://arxiv.org/abs/2406.01843
▪️Project: https://zhipengcai.github.io/MMPano/
▪️Video: https://youtu.be/XDMNEzH4-Ec
@Devsp — Подписаться
🌟 Новый этап в обучении LLM. Представили YaFSDP — это собственная разработка Яндекса для ускорения обучения больших языковых моделей
Её использование поможет ускорить обучение LLM с открытым исходным кодом до 25%. Кроме того, решение поможет оптимизировать использование графических процессоров (GPU).
Читать…
Её использование поможет ускорить обучение LLM с открытым исходным кодом до 25%. Кроме того, решение поможет оптимизировать использование графических процессоров (GPU).
Читать…
🌟 SF-V — новый метод генерации видео от Snapchat
Новый метод генерации видео позволяет генерировать динамические и согласованные видео за 1 проход.
Обширные эксперименты показывают, что метод обеспечивает конкурентоспособное качество генерации синтезированных видео со значительно меньшими вычислительными затратами для процесса шумоподавления.
🟡Страничка SF-V
🖥GitHub
@Devsp — Подписаться
Новый метод генерации видео позволяет генерировать динамические и согласованные видео за 1 проход.
Обширные эксперименты показывают, что метод обеспечивает конкурентоспособное качество генерации синтезированных видео со значительно меньшими вычислительными затратами для процесса шумоподавления.
🟡Страничка SF-V
🖥GitHub
@Devsp — Подписаться