⚡️PHUDGE3: Phi-3 как масштабируемая система оценивания LLM
PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.
📎Arxiv
@Devsp — Подписаться
PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.
📎Arxiv
@Devsp — Подписаться
🔥 GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting
GaussianObject — платформа для представления и рендеринга 3D-объектов с помощью гауссовских пятен, которая обеспечивает высокое качество рендеринга всего с четырьмя входными изображениями.
▪️Github: https://github.com/GaussianObject/GaussianObject
▪️Colab: https://colab.research.google.com/drive/1WIZgM--tJ3aq25t9g238JAuAoXrQYVMs?usp=sharing#scrollTo=TlrxF62GNePB
▪️Project: https://gaussianobject.github.io
@Devsp — Подписаться
GaussianObject — платформа для представления и рендеринга 3D-объектов с помощью гауссовских пятен, которая обеспечивает высокое качество рендеринга всего с четырьмя входными изображениями.
▪️Github: https://github.com/GaussianObject/GaussianObject
▪️Colab: https://colab.research.google.com/drive/1WIZgM--tJ3aq25t9g238JAuAoXrQYVMs?usp=sharing#scrollTo=TlrxF62GNePB
▪️Project: https://gaussianobject.github.io
@Devsp — Подписаться
⚡️ Layer-Condensed KV Cache
Layer-Condensed KV Cache — новый вариант декодеров-трансформеров, в котором запросы всех уровней сочетаются с ключами и значениями только верхнего уровня.
Обеспечивает в 26 раз более высокую пропускную способность по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
▪repo: https://github.com/whyNLP/LCKV
▪abs: https://arxiv.org/abs/2405.10637
@Devsp — Подписаться
Layer-Condensed KV Cache — новый вариант декодеров-трансформеров, в котором запросы всех уровней сочетаются с ключами и значениями только верхнего уровня.
Обеспечивает в 26 раз более высокую пропускную способность по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
▪repo: https://github.com/whyNLP/LCKV
▪abs: https://arxiv.org/abs/2405.10637
@Devsp — Подписаться
⚡️Devon — open-source AI-программист
Devon — AI-помощник, которого можно использовать для парного программирования;
open-source аналог Devin.
Использует API Anthropic, или OpenAI, или Groq.
🖥GitHub
🟡Пример использования
@Devsp — Подписаться
Devon — AI-помощник, которого можно использовать для парного программирования;
open-source аналог Devin.
Использует API Anthropic, или OpenAI, или Groq.
🖥GitHub
🟡Пример использования
@Devsp — Подписаться
⚡️Phi-3-medium-4k-instruct
Phi-3 Vision — это легкая, современная открытая мультимодальная модель, построенная на наборах данных, которые включают в себя синтетические данные и отфильтрованные общедоступные веб-сайты с упором на очень высококачественные, аргументированные и плотные данные как в текстовом, так и в визуальном виде.
Модель прошла тщательный процесс усовершенствования, включающий как контролируемую точную настройку, так и прямую оптимизацию предпочтений, чтобы обеспечить точное соблюдение инструкций и надежные меры безопасности.
- Phi-3-Vision: https://huggingface.co/microsoft/Phi-3-vision-128k-instruct
- Phi-3-Small:
~8k: https://huggingface.co/microsoft/Phi-3-small-8k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-small-128k-instruct
- Phi-3-Medium:
~4k: https://huggingface.co/microsoft/Phi-3-medium-4k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-medium-128k-instruct
@Devsp — Подписаться
Phi-3 Vision — это легкая, современная открытая мультимодальная модель, построенная на наборах данных, которые включают в себя синтетические данные и отфильтрованные общедоступные веб-сайты с упором на очень высококачественные, аргументированные и плотные данные как в текстовом, так и в визуальном виде.
Модель прошла тщательный процесс усовершенствования, включающий как контролируемую точную настройку, так и прямую оптимизацию предпочтений, чтобы обеспечить точное соблюдение инструкций и надежные меры безопасности.
- Phi-3-Vision: https://huggingface.co/microsoft/Phi-3-vision-128k-instruct
- Phi-3-Small:
~8k: https://huggingface.co/microsoft/Phi-3-small-8k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-small-128k-instruct
- Phi-3-Medium:
~4k: https://huggingface.co/microsoft/Phi-3-medium-4k-instruct
~128k: https://huggingface.co/microsoft/Phi-3-medium-128k-instruct
@Devsp — Подписаться
🚀 MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning
MoRA - новый метод использования высокоранговых обновлений весов для файнтюнига моделей при сохранении того же количества обучаемых параметров, как и при использовании матриц низкого ранга.
▪repo: https://github.com/kongds/MoRA
▪abs: https://arxiv.org/abs/2405.12130
@Devsp — Подписаться
MoRA - новый метод использования высокоранговых обновлений весов для файнтюнига моделей при сохранении того же количества обучаемых параметров, как и при использовании матриц низкого ранга.
▪repo: https://github.com/kongds/MoRA
▪abs: https://arxiv.org/abs/2405.12130
@Devsp — Подписаться
⚡️Cover-Agent — инструмент с открытым исходным кодом, включающий в себя реализацию TestGen-LLM от Meta для автоматического улучшения наборов тестов
Cover-Agent использует генеративный искусственный интеллект для автоматизации и улучшения генерации тестов (сейчас в основном юнит-тестов).
Cover-Agent может запускаться через терминал, в будущем его планируется интегрировать в популярные CI-платформы.
Cover-Agent может работать через терминал, и его планируется интегрировать в популярные CI-платформы.
🖥GitHub
🟡Связанная статья Arxiv
@Devsp — Подписаться
Cover-Agent использует генеративный искусственный интеллект для автоматизации и улучшения генерации тестов (сейчас в основном юнит-тестов).
Cover-Agent может запускаться через терминал, в будущем его планируется интегрировать в популярные CI-платформы.
Cover-Agent может работать через терминал, и его планируется интегрировать в популярные CI-платформы.
🖥GitHub
🟡Связанная статья Arxiv
@Devsp — Подписаться
🔥open_clip — open-source реализация CLIP
CLIP — это нейросеть, разработанная OpenAI для выполнения задач визуального, а также языкового понимания. Алгоритмы нацелены на понимание связи между текстом и изображениями.
🖥GitHub
🟡Google Colab
@Devsp — Подписаться
CLIP — это нейросеть, разработанная OpenAI для выполнения задач визуального, а также языкового понимания. Алгоритмы нацелены на понимание связи между текстом и изображениями.
🖥GitHub
🟡Google Colab
@Devsp — Подписаться
🔥 YOLOv10: Real-Time End-to-End Object Detection
В новой версии добавлена новая функция сквозного обнаружения объектов в реальном времени. Код выпущен под лицензией GNU GPL v3.0
По сравнению с YOLOv9-C, YOLOv10-B имеет на 46% меньшую задержку и использует на 25% меньше параметров при той же производительности.
▪Paper: arxiv.org/pdf/2405.14458
▪Github: https://github.com/THU-MIG/yolov10/
▪Demo :https://huggingface.co/spaces/kadirnar/Yolov10
▪Colab: https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov10-object-detection-on-custom-dataset.ipynb#scrollTo=SaKTSzSWnG7s
@Devsp — Подписаться
В новой версии добавлена новая функция сквозного обнаружения объектов в реальном времени. Код выпущен под лицензией GNU GPL v3.0
По сравнению с YOLOv9-C, YOLOv10-B имеет на 46% меньшую задержку и использует на 25% меньше параметров при той же производительности.
▪Paper: arxiv.org/pdf/2405.14458
▪Github: https://github.com/THU-MIG/yolov10/
▪Demo :https://huggingface.co/spaces/kadirnar/Yolov10
▪Colab: https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov10-object-detection-on-custom-dataset.ipynb#scrollTo=SaKTSzSWnG7s
@Devsp — Подписаться
🌟WhisperKit — распознавание речи на устройствах Apple с помощью Whisper
WhisperKit — это пакет Swift, который интегрирует популярную модель распознавания речи Whisper от OpenAI с платформой Apple CoreML для эффективного локального вывода на устройствах Apple.
🖥GitHub
🟡Hugging Face
@Devsp — Подписаться
WhisperKit — это пакет Swift, который интегрирует популярную модель распознавания речи Whisper от OpenAI с платформой Apple CoreML для эффективного локального вывода на устройствах Apple.
🖥GitHub
🟡Hugging Face
@Devsp — Подписаться
🖥 Дайджест самых интересных публикаций за последние дни:
• Prompt engineering — путь к эффективной работе с ChatGPT
• Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно
• Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация
• Prompt engineering — путь к эффективной работе с ChatGPT
• Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно
• Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация
⚡️ Adobe выпустила DMD2!
Новый усовершенствованный метод дистилляции, который может превратить диффузионные модели, такие как SDXL, в мощные одношаговые генераторы изображений.
▪Project page: https://tianweiy.github.io/dmd2/
▪Code: https://github.com/tianweiy/DMD2
▪Demo: https://4e4a5c6a8b08f76802.gradio.live
@Devsp — Подписаться
Новый усовершенствованный метод дистилляции, который может превратить диффузионные модели, такие как SDXL, в мощные одношаговые генераторы изображений.
▪Project page: https://tianweiy.github.io/dmd2/
▪Code: https://github.com/tianweiy/DMD2
▪Demo: https://4e4a5c6a8b08f76802.gradio.live
@Devsp — Подписаться
🌟Sweep — AI-джун, который самостоятельно исправит мелкие ошибки в коде
Sweep — младший разработчик искусственного интеллекта, который превращает ошибки и запросы функций в изменения кода.
Sweep автоматически обрабатывает улучшения Devex, такие как добавление подсказок или улучшение тестового покрытия.
🖥GitHub
🟡Доки
@Devsp — Подписаться
Sweep — младший разработчик искусственного интеллекта, который превращает ошибки и запросы функций в изменения кода.
Sweep автоматически обрабатывает улучшения Devex, такие как добавление подсказок или улучшение тестового покрытия.
🖥GitHub
🟡Доки
@Devsp — Подписаться
🌟 Релиз YandexGPT 3 Lite
Стала доступна облегченная версия генеративной модели Яндекса третьего поколения. YandexGPT 3 Lite лучше и быстрее решает задачи в режиме реального времени, поэтому будет полезна в разных сценариях бизнеса. Особенно там, где важна оперативность ответов. Например, для колл-центра или при ответе в чат-боте на сайте.
На Хабре вышла статья, где команда YandexGPT подробно рассказала о ключевых этапах обучения. Например, об этапе выравнивания (Alignment), включающем в том числе стадию обучения с подкреплением (RL). Без него команда не смогла бы добиться такого роста в качестве, который был необходим для запуска новых возможностей и сервисов (например, Нейро).
✍️ Habr: https://habr.com/ru/companies/yandex/articles/817391/
@Devsp — Подписаться
Стала доступна облегченная версия генеративной модели Яндекса третьего поколения. YandexGPT 3 Lite лучше и быстрее решает задачи в режиме реального времени, поэтому будет полезна в разных сценариях бизнеса. Особенно там, где важна оперативность ответов. Например, для колл-центра или при ответе в чат-боте на сайте.
На Хабре вышла статья, где команда YandexGPT подробно рассказала о ключевых этапах обучения. Например, об этапе выравнивания (Alignment), включающем в том числе стадию обучения с подкреплением (RL). Без него команда не смогла бы добиться такого роста в качестве, который был необходим для запуска новых возможностей и сервисов (например, Нейро).
✍️ Habr: https://habr.com/ru/companies/yandex/articles/817391/
@Devsp — Подписаться
🚀 Open WebUI — удобный веб-интерфейс для LLM
Open WebUI — это расширяемый, многофункциональный и удобный автономный веб-интерфейс, предназначенный для работы полностью в автономном режиме.
Он поддерживает различные программы LLM, включая Ollama и API-интерфейсы, совместимые с OpenAI.
🖥GitHub
🟡Доки
@Devsp — Подписаться
Open WebUI — это расширяемый, многофункциональный и удобный автономный веб-интерфейс, предназначенный для работы полностью в автономном режиме.
Он поддерживает различные программы LLM, включая Ollama и API-интерфейсы, совместимые с OpenAI.
🖥GitHub
🟡Доки
@Devsp — Подписаться
🖥 Дайджест самых интересных публикаций за последние дни:
• Быстрая Data Quality проверка на базе алгоритма adversarial validation
• Sweep — AI-джун, который самостоятельно исправит мелкие ошибки в коде
• Open WebUI — удобный веб-интерфейс для LLM
• Быстрая Data Quality проверка на базе алгоритма adversarial validation
• Sweep — AI-джун, который самостоятельно исправит мелкие ошибки в коде
• Open WebUI — удобный веб-интерфейс для LLM
💻 Elia — UI для получения ответов от LLM прямо в терминале
Elia- это приложение для взаимодействия с LLM, которое полностью работает на вашем терминале и предназначено для работы с клавиатурой, эффективно и интересно в использовании.
Он хранит ваши разговоры в локальной базе данных SQLite и позволяет вам взаимодействовать с различными моделями.
🖥 GitHub
@Devsp — Подписаться
Elia- это приложение для взаимодействия с LLM, которое полностью работает на вашем терминале и предназначено для работы с клавиатурой, эффективно и интересно в использовании.
Он хранит ваши разговоры в локальной базе данных SQLite и позволяет вам взаимодействовать с различными моделями.
🖥 GitHub
@Devsp — Подписаться