Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🚀 MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning

MoRA - новый метод использования высокоранговых обновлений весов для файнтюнига моделей при сохранении того же количества обучаемых параметров, как и при использовании матриц низкого ранга.

repo: https://github.com/kongds/MoRA
abs: https://arxiv.org/abs/2405.12130

@DevspПодписаться
​​⚡️Cover-Agent — инструмент с открытым исходным кодом, включающий в себя реализацию TestGen-LLM от Meta для автоматического улучшения наборов тестов

Cover-Agent использует генеративный искусственный интеллект для автоматизации и улучшения генерации тестов (сейчас в основном юнит-тестов).
Cover-Agent может запускаться через терминал, в будущем его планируется интегрировать в популярные CI-платформы.

Cover-Agent может работать через терминал, и его планируется интегрировать в популярные CI-платформы.

🖥GitHub
🟡Связанная статья Arxiv

@DevspПодписаться
​​👤Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно

В этой статье вы узнаете о новых способах взаимодействия с нейросетью, включая возможность выбора голоса и тембра, а также возможность поделиться экраном и обрабатывать визуальную информацию.

Читать...
​​🔥open_clip — open-source реализация CLIP

CLIP — это нейросеть, разработанная OpenAI для выполнения задач визуального, а также языкового понимания. Алгоритмы нацелены на понимание связи между текстом и изображениями.

🖥GitHub
🟡Google Colab

@DevspПодписаться
​​🧠Prompt engineering — путь к эффективной работе с ChatGPT

В этой статье расскажу, как эффективно работать с ChatGPT в разных задачах и архитектуре.

Читать...
​​🔥 YOLOv10: Real-Time End-to-End Object Detection

В новой версии добавлена новая функция сквозного обнаружения объектов в реальном времени. Код выпущен под лицензией GNU GPL v3.0

По сравнению с YOLOv9-C, YOLOv10-B имеет на 46% меньшую задержку и использует на 25% меньше параметров при той же производительности.

Paper: arxiv.org/pdf/2405.14458
Github: https://github.com/THU-MIG/yolov10/
Demo :https://huggingface.co/spaces/kadirnar/Yolov10
Colab: https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov10-object-detection-on-custom-dataset.ipynb#scrollTo=SaKTSzSWnG7s

@DevspПодписаться
​​😎Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация

В этой статье мы расскажем о том, что такое NER, о его принципах работы и о том, как оно используется в реальной жизни.

Читать...
​​🌟WhisperKit — распознавание речи на устройствах Apple с помощью Whisper

WhisperKit — это пакет Swift, который интегрирует популярную модель распознавания речи Whisper от OpenAI с платформой Apple CoreML для эффективного локального вывода на устройствах Apple.

🖥GitHub
🟡Hugging Face

@DevspПодписаться
​​🖥 Дайджест самых интересных публикаций за последние дни:

Prompt engineering — путь к эффективной работе с ChatGPT

Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно

Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация
​​⚡️ Adobe выпустила DMD2!

Новый усовершенствованный метод дистилляции, который может превратить диффузионные модели, такие как SDXL, в мощные одношаговые генераторы изображений.

Project page: https://tianweiy.github.io/dmd2/
Code: https://github.com/tianweiy/DMD2
Demo: https://4e4a5c6a8b08f76802.gradio.live

@DevspПодписаться
​​🚀Быстрая Data Quality проверка на базе алгоритма adversarial validation

Из этой статьи вы узнаете, как оценивать качество данных при помощи алгоритма adversarial validation с использованием spark user defined function.

Читать...
​​🌟Sweep — AI-джун, который самостоятельно исправит мелкие ошибки в коде

Sweep — младший разработчик искусственного интеллекта, который превращает ошибки и запросы функций в изменения кода.

Sweep автоматически обрабатывает улучшения Devex, такие как добавление подсказок или улучшение тестового покрытия.

🖥GitHub
🟡Доки

@DevspПодписаться
🌟 Релиз YandexGPT 3 Lite

Стала доступна облегченная версия генеративной модели Яндекса третьего поколения. YandexGPT 3 Lite лучше и быстрее решает задачи в режиме реального времени, поэтому будет полезна в разных сценариях бизнеса. Особенно там, где важна оперативность ответов. Например, для колл-центра или при ответе в чат-боте на сайте.

На Хабре вышла статья, где команда YandexGPT подробно рассказала о ключевых этапах обучения. Например, об этапе выравнивания (Alignment), включающем в том числе стадию обучения с подкреплением (RL). Без него команда не смогла бы добиться такого роста в качестве, который был необходим для запуска новых возможностей и сервисов (например, Нейро).

✍️ Habr: https://habr.com/ru/companies/yandex/articles/817391/

@DevspПодписаться
​​🚀 Open WebUI — удобный веб-интерфейс для LLM

Open WebUI — это расширяемый, многофункциональный и удобный автономный веб-интерфейс, предназначенный для работы полностью в автономном режиме.

Он поддерживает различные программы LLM, включая Ollama и API-интерфейсы, совместимые с OpenAI.

🖥GitHub
🟡Доки

@DevspПодписаться
​​🖥 Дайджест самых интересных публикаций за последние дни:

Быстрая Data Quality проверка на базе алгоритма adversarial validation

Sweep — AI-джун, который самостоятельно исправит мелкие ошибки в коде

Open WebUI — удобный веб-интерфейс для LLM
​​💻 Elia — UI для получения ответов от LLM прямо в терминале

Elia- это приложение для взаимодействия с LLM, которое полностью работает на вашем терминале и предназначено для работы с клавиатурой, эффективно и интересно в использовании.

Он хранит ваши разговоры в локальной базе данных SQLite и позволяет вам взаимодействовать с различными моделями.

🖥 GitHub

@DevspПодписаться
​​👾 Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

В этой статье автор расскажет как можно объединить GPT-4 с бэкендом машинного обучения (ML Backend) Label Studio.

Читать...
​​🔥MiniCPM-Llama3-V 2.5 — мультимодальная LLM-ка уровня GPT-4 (почти), которую можно запустить на телефоне

MiniCPM-V — это серия конечных мультимодальных LLM (MLLM), предназначенных для понимания визуального языка.

Модели принимают изображение и текст в качестве входных данных и обеспечивают высококачественный текстовый вывод.

Модель может обрабатывать изображения с количеством пикселей до 1.8 млн, показывает всего 10.3% галлюцинаций на Object HalBench, поддерживает ~30 языков, активно используется квантование для общей оптимизации.

🖥GitHub

@DevspПодписаться
​​⚡️Scribble SDXL — позволяет превратить каракули в шедевр

Scribble SDXL создан на основе SDXL ControlNet и его можно без проблем запустить на Hugging Face.

Можно выбирать разные стили и экспериментировать.

🤗 Scribble SDXL

@DevspПодписаться
⚡️ Хабр подвел итоги конкурса «Технотекст», в тройку лидеров в номинации ML попали:

Статья Виктора Юрченко из Яндекса с рассказом о том, как нейросети помогают беспилотным автомобилям планировать своё движение
• Научно-популярная статья Игоря Котенкова из Open Data Science с разбором работы ChatGPT
Статья Мурата Апишева о методах позиционного кодирования в Transformer.

@DevspПодписаться
​​⚡️ Cortex — AI-движок для создания LLM-приложений

Cortex — это open-source AI-движок для создания LLM-приложений.

Можно импортировать в виде библиотеки Cortex или использовать как сервер.

🖥GitHub
🟡Доки

@DevspПодписаться