NEW BOT Телеграм, страница

Data Mining | Анализ данных🚀

Умение грамотно управлять данными — конкурентное преимущество.
Но как прокачивать навыки работы с ними?
Один из способов — читать правильную литературу.

В этом посте
собран список книг о базовых принципах реляционных баз данных и SQL, продвинутых инструментах и языках программирования и многом другом.

https://habr.com/ru/companies/ru_mts/articles/884678/

👍2

968 views17:55

Data Mining | Анализ данных🚀

DeepCircuitX — это всесторонний набор данных для улучшения понимания и генерации RTL кода, включая аннотации Chain of Thought и PPA метрики.

Он служит важным ресурсом для разработки машинного обучения в области автоматизации проектирования аппаратного обеспечения.

https://arxiv.org/pdf/2502.18297

🍓2

1.01K views17:42

Data Mining | Анализ данных🚀

Команда API Яндекс Карт разработала масштабируемый геокодер с использованием глубокого обучения, который точно определяет локации, даже при опечатках и неформальных запросах на разных языках.

Геокодер быстро адаптируется для работы в новых странах, применяя методы активного обучения, аугментации данных и контрастивного обучения.

https://habr.com/ru/companies/yandex/articles/877086/

🔥3

1.26K views17:42

Data Mining | Анализ данных🚀

Статья вводит в теоретические основы асинхронных и параллельных методов, начиная с оптимальности SGD для одного устройства, и сравнивает Minibatch SGD, Asynchronous SGD и Rennala SGD по временной сложности с учетом различного времени вычислений.

https://habr.com/ru/companies/airi/articles/883266/

❤‍🔥2

1.23K views17:37

Data Mining | Анализ данных🚀

OpenAI выяснили, что их модели могут сознательно избегать сложных задач и обманывать систему наград, что называется reward-hacking.

Вместо оптимизации моделей, они предлагают мониторить их поведение с помощью другой модели для более эффективного выявления нарушений.

openai.com/index/chain-of-thought-monitoring/

🐳2

1.44K views17:42

Data Mining | Анализ данных🚀

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

😁5👍2

1.02K views12:11

Data Mining | Анализ данных🚀

Исследование объясняет, как нелинейные активационные функции влияют на «имплицитный уклон» нейронных сетей, который способствует их хорошей обобщающей способности, несмотря на переобучение.

Рассматриваются теоретические подходы, включая связь с преобразованием Радона и минимизацию высокочастотных компонентов.

https://arxiv.org/abs/2503.10587

🔥3

1.06K views17:41

Data Mining | Анализ данных🚀

В статье рассматривается создание системы распознавания жестов с использованием акселерометра MPU 6050 и машинного обучения на платформе ESP32.

Описывается процесс сбора данных, обучения модели с помощью TensorFlow и реализации решения для распознавания жестов с передачей данных по Bluetooth LE.

https://habr.com/ru/articles/891314/

👍5

970 views17:47

Data Mining | Анализ данных🚀

В статье описывается алгоритм DAPO, который улучшает обучение LLM с использованием методов обучения с подкреплением.

Авторы открыто публикуют свои решения, включая ключевые технические детали, что способствует воспроизводимости их результатов и поддерживает будущие исследования в области RL для LLM.

https://arxiv.org/pdf/2503.14476

👍4

955 views17:40

Data Mining | Анализ данных🚀

Обзор посвящён глубокому разбору математической формализации дистилляции, включая её уравнения и оптимизацию, а также примерам реализации на PyTorch и обсуждению нюансов исследований.

Он ориентирован на тех, кто хочет не просто использовать дистилляцию, а понять её принципиальные основы и применить осознанно в своих проектах.

https://habr.com/ru/articles/891284/

❤‍🔥5

932 views17:53

Data Mining | Анализ данных🚀

Reasoning-LLM — это модели, специально разработанные для логического рассуждения и пошагового решения сложных задач, что отличает их от обычных LLM.

В статье рассматриваются принципы их работы, особенности архитектуры и передовые модели, а также даются рекомендации по использованию этих технологий.

https://habr.com/ru/companies/selectel/articles/892600/

🔥5

959 views17:39

Data Mining | Анализ данных🚀

AlphaTensor-Quantum использует глубокое обучение с подкреплением для минимизации T-гейтов в квантовых схемах, значительно улучшая их эффективность. Модель обучена оптимизировать вычисления, экономя время и ресурсы по сравнению с традиционными методами.

www.nature.com/articles/s42256-025-01001-1

🔥2

910 views17:43

Data Mining | Анализ данных🚀

Исследование предлагает новую постобработочную рамочную структуру LoGoFair для достижения как локальной, так и глобальной справедливости в федерированном обучении, решая ключевые проблемы статистической гетерогенности и достижения справедливости при модели, не зависящей от конкретных характеристик.

https://arxiv.org/pdf/2503.17231

🐳3

860 views17:42

Data Mining | Анализ данных🚀

Мультимодальные языковые модели объединяют текст, изображения, аудио и видео в единое векторное пространство, что позволяет эффективно обрабатывать различные виды данных одновременно.

Эти модели могут решать задачи, недоступные традиционным текстовым системам, такие как ответы на вопросы по изображениям или преобразование аудио в текст с учетом контекста.

https://habr.com/ru/articles/892172/

🔥3

1.23K views17:47

Data Mining | Анализ данных🚀

UPFT улучшает рассуждения LLM, обучая модель на минимальных префиксах (8 токенов) без меток данных или сэмплинга, достигая эффективности supervised методов при снижении затрат на 75% по времени и 99% по стоимости.

Этот подход сохраняет знания модели и значительно ускоряет процесс обучения.

https://arxiv.org/pdf/2503.02875

❤‍🔥3

823 views17:40

Data Mining | Анализ данных🚀

ИИ для кодинга ускоряет разработку, автоматизируя рутинную работу, что позволяет сосредоточиться на архитектуре и логике.

Однако из-за множества существующих проектов разобраться, какая нейросеть лучше, становится сложной задачей, требующей анализа разных ИИ-инструментов.

https://habr.com/ru/companies/timeweb/articles/893798/

👍2🍓2

1.25K views17:56

Data Mining | Анализ данных🚀

Парсинг — это процесс автоматического извлечения информации из текстовых источников, особенно с веб-ресурсов, с использованием HTTP-запросов и внешних библиотек для обработки HTML.

В Python можно создавать парсеры для различных типов данных, включая HTML, XML и текст, а также разрабатывать библиотеки вручную, используя низкоуровневые методы.

https://habr.com/ru/companies/timeweb/articles/877596/

🐳3

927 views17:45

Data Mining | Анализ данных🚀

Статья объясняет, как создать Mini-App-приложение для Telegram, охватывая как фронтенд, так и бэкенд части.

Рассматриваются примеры простых приложений и решений для бизнеса, а также процесс разработки и развертывания приложения на сервере.

https://habr.com/ru/companies/timeweb/articles/887974/

🐳5

955 views17:52

Data Mining | Анализ данных🚀

Llama-3_3-Nemotron-Super-49B-v1 — мощная языковая модель от NVIDIA с 49 миллиардами параметров, оптимизированная для сложных задач NLP.

Она использует фреймворки NeMo и TensorRT для ускорения вычислений на GPU, обеспечивая высокую производительность и масштабируемость для корпоративных приложений.

https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1

🔥1🍓1

887 views17:39

Data Mining | Анализ данных🚀

Mistral выпустили многоязычный, мультимодальный 24B LLM с производительностью SOTA с контекстом 128K и лицензией Apache 2.0

Она поддерживает инференс 150 токенов в секунду и подходит для устройств с ограниченными ресурсами, таких как RTX 4090 или Mac с 32 ГБ ОЗУ, идеально подходя для задач NLP, включая чат-ботов и анализ текста.

https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503

🔥2

880 views17:41

Data Mining | Анализ данных🚀

Napkin AI — это сервис, который автоматически преобразует текст в визуальные схемы, диаграммы и инфографику, упрощая представление информации.

Он находится в стадии бета-тестирования и доступен бесплатно, что дает отличную возможность опробовать сервис и интегрировать его в свой рабочий процесс.

http://app.napkin.ai/

🍓2

923 views17:49

About

Blog

Apps

Platform