Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.31K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Статья обсуждает эволюцию LLM, от простых моделей к интеграции более сложных этапов мышления и предсказывает развитие многоагентных архитектур для улучшения обработки контекста и памяти.

https://habr.com/ru/companies/raft/articles/873372/
🔥3
Статья объясняет, как объединить различные архитектуры нейронных сетей через концепцию KAN для лучшего понимания их сходств и различий.

Автор предлагает новый подход, начиная с основ линейной алгебры и постепенно переходя к более сложным идеям.

https://habr.com/ru/articles/823388/
🔥3❤‍🔥1👍1
RetroLLM улучшает большие языковые модели, добавляя возможность извлечения точных данных в процессе генерации.

Это расширяет их функциональность, повышая точность и релевантность ответов для сложных задач.

https://habr.com/ru/companies/bothub/news/871708/
👍5
Сегодня на очереди справочники и пособия по ML, которые можно найти в открытом доступе.

Эти материалы помогут погрузиться в ML, разобраться в базовых математических концепциях, понять тренды опенсорсных технологий для систем ИИ и перейти к работе.

https://habr.com/ru/companies/mws/articles/872230/
👍7
Статья описывает проблему галлюцинаций в LLM, которые могут генерировать неуместные или вымышленные факты.

Как утверждает автор, для решения данной проблемы необходима комбинация различных методов.

https://habr.com/ru/companies/raft/articles/864334/
❤‍🔥4👍4🔥1
Рост потребности в вычислительных мощностях для ИИ может привести к дефициту электроэнергии.

Автор исследования анализирует влияние на дата-центры и меры по улучшению энергоэффективности, с примерами Selectel.

https://habr.com/ru/companies/selectel/articles/840270/
🔥4💯2
Представлена модель OLMo 2 с улучшенной архитектурой, предобучением и инструктивным обучением, превосходящая аналоги по производительности при меньших вычислительных затратах.

https://arxiv.org/abs/2501.00656
❤‍🔥3
не забыли про наш впн? 😎
зацените — aa.vpnand.com/?ref=1037!
мы обновили сайт и лого😎

зачем доверять непонятным впн, когда есть наш?

поддерживайте своих!!!!
3❤‍🔥2🔥2
OpenAI представили ИИ-агента Operator на основе GPT-4, который может автономно управлять компьютером, выполнять сложные задачи и взаимодействовать с браузером.

Он способен планировать поездки, заказывать доставку и бронировать столики, упрощая множество повседневных задач.

https://habr.com/ru/news/876158/
👍1
В статье разбираются ключевые концепции тематического моделирования и основные архитектуры моделей этой области.

Предоставлена теория и много практики на интерфейсе библиотеки BigARTM.

https://datasecrets.ru/articles/13
👍2❤‍🔥1🔥1
Статья представляет обзор видеокарт и какие из них будут оптимальным выбором для ML-задач.
Под катом — реальные примеры и результаты бенчмарков.

https://habr.com/ru/companies/selectel/articles/875078/
❤‍🔥2🔥2👍1
DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков ML R&D
эта модель имеет особое значение.

Объясняем в иллюстрациях и схемах ⬇️

https://habr.com/ru/articles/877360/
🍓2👍1
Исследование подчеркивает, что для успешного решения реальных задач важно учитывать не только отдельные способности моделей, но и взаимодействие их навыков.

Для этого необходимы дополнительные бенчмарки, такие как CrossEval, которые будут учитывать “Закон слабого звена”.

https://arxiv.org/pdf/2409.19951
🍓2
Google представили архитектуру Titan, которая решает проблему забывания в трансформерах, добавив долгосрочную память.

Это позволяет эффективно обрабатывать контексты до 2+ миллионов токенов, улучшая точность и производительность.

https://arxiv.org/pdf/2501.00663v1
🍓2
Anthropic представил метод защиты LLM от jailbreak атак, использующий синтетические данные и естественно-языковые правила.
Тесты показали высокую эффективность и низкий уровень ложных срабатываний (менее 0,5%).

https://arxiv.org/abs/2501.18837
❤‍🔥2
Статья сравнивает два подхода к созданию игры “Пинг-Понг” на языке Go с использованием нейросетей DeepSeek и ChatGPT.
Основное внимание уделено различиям в реализации кода, результаты можно прочесть ⤵️

https://habr.com/ru/articles/878766/
❤‍🔥2
Работа посвящена теоретическому анализу широко используемого типа MDM.
Авторы показали, что её эффективность сильно зависит от целевой метрики оценки.

Все выводы подтверждены эмпирическими исследованиями.

https://arxiv.org/pdf/2502.09622
👍3
В материале объясняется, что выбор метода ML зависит от множества факторов, таких как данные и цели проекта.

Также представлена шпаргалка по алгоритмам Microsoft Azure, которая поможет выбрать оптимальный подход для предсказательной аналитики.

https://habr.com/ru/companies/microsoft/articles/317512/
🍓2
OpenAI выпустили гайд по тому, как правильно обращаться с ризонинг-моделями.

В гайде объясняется, чем модели логического рассуждения отличаются от GPT-моделей, а также даются рекомендации по их применению и эффективному формулированию запросов.

https://platform.openai.com/docs/guides/reasoning-best-practices
❤‍🔥2
В статье представлен PREFEVAL — бенчмарк для оценки способности LLM учитывать предпочтения пользователей в длинных контекстах.

Эксперименты показали, что даже с продвинутыми методами LLM сталкиваются с трудностями, но дообучение на PREFEVAL значительно улучшает результаты.

https://arxiv.org/pdf/2502.09597
🍓2
ScaleAI обнаружили уязвимость Jailbreaking-to-Jailbreak (J2), при которой модель, обученная на отказах, может взломать другие ИИ и даже себя.

Это позволяет обходить защиту с успешностью в 93%, выявляя фундаментальную уязвимость в системах ИИ.

https://scale.com/research/j2
❤‍🔥3🔥31