NEW BOT Телеграм, страница

Data Mining | Анализ данных🚀

Сегодня на очереди справочники и пособия по ML, которые можно найти в открытом доступе.

Эти материалы помогут погрузиться в ML, разобраться в базовых математических концепциях, понять тренды опенсорсных технологий для систем ИИ и перейти к работе.

https://habr.com/ru/companies/mws/articles/872230/

👍7

1.56K views17:32

Data Mining | Анализ данных🚀

Статья описывает проблему галлюцинаций в LLM, которые могут генерировать неуместные или вымышленные факты.

Как утверждает автор, для решения данной проблемы необходима комбинация различных методов.

https://habr.com/ru/companies/raft/articles/864334/

❤‍🔥4👍4🔥1

1.01K views17:41

Data Mining | Анализ данных🚀

Рост потребности в вычислительных мощностях для ИИ может привести к дефициту электроэнергии.

Автор исследования анализирует влияние на дата-центры и меры по улучшению энергоэффективности, с примерами Selectel.

https://habr.com/ru/companies/selectel/articles/840270/

🔥4💯2

991 views17:37

Data Mining | Анализ данных🚀

Представлена модель OLMo 2 с улучшенной архитектурой, предобучением и инструктивным обучением, превосходящая аналоги по производительности при меньших вычислительных затратах.

https://arxiv.org/abs/2501.00656

❤‍🔥3

957 views17:35

Data Mining | Анализ данных🚀

не забыли про наш впн? 😎
зацените — aa.vpnand.com/?ref=1037!
мы обновили сайт и лого😎

зачем доверять непонятным впн, когда есть наш?

поддерживайте своих!!!!

⚡3❤‍🔥2🔥2

910 views15:36

Data Mining | Анализ данных🚀

OpenAI представили ИИ-агента Operator на основе GPT-4, который может автономно управлять компьютером, выполнять сложные задачи и взаимодействовать с браузером.

Он способен планировать поездки, заказывать доставку и бронировать столики, упрощая множество повседневных задач.

https://habr.com/ru/news/876158/

👍1

1.03K views17:35

Data Mining | Анализ данных🚀

В статье разбираются ключевые концепции тематического моделирования и основные архитектуры моделей этой области.

Предоставлена теория и много практики на интерфейсе библиотеки BigARTM.

https://datasecrets.ru/articles/13

👍2❤‍🔥1🔥1

1.03K views17:34

Data Mining | Анализ данных🚀

Статья представляет обзор видеокарт и какие из них будут оптимальным выбором для ML-задач.
Под катом — реальные примеры и результаты бенчмарков.

https://habr.com/ru/companies/selectel/articles/875078/

❤‍🔥2🔥2👍1

1.01K views17:39

Data Mining | Анализ данных🚀

DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков ML R&D
эта модель имеет особое значение.

Объясняем в иллюстрациях и схемах ⬇️

https://habr.com/ru/articles/877360/

🍓2👍1

1.1K views17:42

Data Mining | Анализ данных🚀

Исследование подчеркивает, что для успешного решения реальных задач важно учитывать не только отдельные способности моделей, но и взаимодействие их навыков.

Для этого необходимы дополнительные бенчмарки, такие как CrossEval, которые будут учитывать “Закон слабого звена”.

https://arxiv.org/pdf/2409.19951

🍓2

1.18K views17:38

Data Mining | Анализ данных🚀

Google представили архитектуру Titan, которая решает проблему забывания в трансформерах, добавив долгосрочную память.

Это позволяет эффективно обрабатывать контексты до 2+ миллионов токенов, улучшая точность и производительность.

https://arxiv.org/pdf/2501.00663v1

🍓2

1.36K views17:38

Data Mining | Анализ данных🚀

Anthropic представил метод защиты LLM от jailbreak атак, использующий синтетические данные и естественно-языковые правила.
Тесты показали высокую эффективность и низкий уровень ложных срабатываний (менее 0,5%).

https://arxiv.org/abs/2501.18837

❤‍🔥2

1.2K views17:41

Data Mining | Анализ данных🚀

Статья сравнивает два подхода к созданию игры “Пинг-Понг” на языке Go с использованием нейросетей DeepSeek и ChatGPT.
Основное внимание уделено различиям в реализации кода, результаты можно прочесть ⤵️

https://habr.com/ru/articles/878766/

❤‍🔥2

1.1K views17:35

Data Mining | Анализ данных🚀

Работа посвящена теоретическому анализу широко используемого типа MDM.
Авторы показали, что её эффективность сильно зависит от целевой метрики оценки.

Все выводы подтверждены эмпирическими исследованиями.

https://arxiv.org/pdf/2502.09622

👍3

999 views17:46

Data Mining | Анализ данных🚀

В материале объясняется, что выбор метода ML зависит от множества факторов, таких как данные и цели проекта.

Также представлена шпаргалка по алгоритмам Microsoft Azure, которая поможет выбрать оптимальный подход для предсказательной аналитики.

https://habr.com/ru/companies/microsoft/articles/317512/

🍓2

1.03K views17:46

Data Mining | Анализ данных🚀

OpenAI выпустили гайд по тому, как правильно обращаться с ризонинг-моделями.

В гайде объясняется, чем модели логического рассуждения отличаются от GPT-моделей, а также даются рекомендации по их применению и эффективному формулированию запросов.

https://platform.openai.com/docs/guides/reasoning-best-practices

❤‍🔥2

1.08K views17:51

Data Mining | Анализ данных🚀

В статье представлен PREFEVAL — бенчмарк для оценки способности LLM учитывать предпочтения пользователей в длинных контекстах.

Эксперименты показали, что даже с продвинутыми методами LLM сталкиваются с трудностями, но дообучение на PREFEVAL значительно улучшает результаты.

https://arxiv.org/pdf/2502.09597

🍓2

1.01K views17:48

Data Mining | Анализ данных🚀

ScaleAI обнаружили уязвимость Jailbreaking-to-Jailbreak (J2), при которой модель, обученная на отказах, может взломать другие ИИ и даже себя.

Это позволяет обходить защиту с успешностью в 93%, выявляя фундаментальную уязвимость в системах ИИ.

https://scale.com/research/j2

❤‍🔥3🔥3⚡1

989 views17:51

Data Mining | Анализ данных🚀

DeepSeek предложили NSA (Native Sparse Attention), разреженный механизм внимания, который делит процесс на три части: Token Compression, Token Selection и Sliding Window, что позволяет эффективно обрабатывать длинные последовательности.

Этот подход ускоряет вычисления и в некоторых случаях превосходит традиционное внимание.

arxiv.org/pdf/2502.11089

🍓3❤‍🔥1🐳1

1.01K views17:49

Data Mining | Анализ данных🚀

Автор рассматривает инструменты для развёртывания моделей ML , которые помогают масштабировать и управлять жизненным циклом, включая сервинг, мониторинг и управление API‑эндпоинтами.

Особое внимание уделяется выбору и применению инструментов для эффективной интеграции MLOps‑решений.

https://habr.com/ru/companies/otus/articles/883894/

👍4🍓2

1.06K views17:44

Data Mining | Анализ данных🚀

Умение грамотно управлять данными — конкурентное преимущество.
Но как прокачивать навыки работы с ними?
Один из способов — читать правильную литературу.

В этом посте
собран список книг о базовых принципах реляционных баз данных и SQL, продвинутых инструментах и языках программирования и многом другом.

https://habr.com/ru/companies/ru_mts/articles/884678/

👍2

968 views17:55

About

Blog

Apps

Platform