🧐Обзор бенчмарков для тестирования LLM (больших языковых моделей)
В этой статье мы рассмотрим подробный список самых популярных бенчмарков для оценки LLM.
Читать...
В этой статье мы рассмотрим подробный список самых популярных бенчмарков для оценки LLM.
Читать...
Хабр
Обзор бенчмарков для тестирования LLM (больших языковых моделей)
Ирина Барская, Head Data Scientist в Яндексе, которая работала над голосовым ассистентом «Алиса» и Yasmina для рынка Саудовской Аравии, написала для портала Unite.ai обзор основных бенчмарков, которые...
🫥Как найти иголку в стоге сена? Или обзор Retrieval Algorithms
В этой статье мы рассмотрим информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.
Читать...
В этой статье мы рассмотрим информацию о всех наиболее известных и применяемых алгоритмах поиска, с описаниями и материалами для более глубокого изучения.
Читать...
Хабр
Как найти иголку в стоге сена? Или обозор Retrieval Algorithms
Появление трансформеров, а впоследствии LLM (Large Language Models) привело к активному распространению чат-ботов и различных ассистентов помогающих в получении информации или генерации контента. Но...
Forwarded from Data Secrets
Розыгрыш Machine Learning футболок
В честь запуска сайта с ML-вакансиями команда Data Secrets запускает розыгрыш 10 футболок для истинных любителей глубокого обучения.
Это лимитированная линейка нашего бренда. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена
Для участия нужно всего лишь быть подписанным на два наших канала: @data_secrets и @data_secrets_career, – и нажать кнопку "Участвовать" под этим постом.
Итоги подведем 18 сентября в 18:00. Желаем удачи!
В честь запуска сайта с ML-вакансиями команда Data Secrets запускает розыгрыш 10 футболок для истинных любителей глубокого обучения.
Это лимитированная линейка нашего бренда. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена
Для участия нужно всего лишь быть подписанным на два наших канала: @data_secrets и @data_secrets_career, – и нажать кнопку "Участвовать" под этим постом.
Итоги подведем 18 сентября в 18:00. Желаем удачи!
🤔Как давать нейросети задания, чтобы она вас понимала
В этой статье поговорим о том, как взаимодействовать с искусственным интеллектом, чтобы он выдавал качественный результат.
Читать...
В этой статье поговорим о том, как взаимодействовать с искусственным интеллектом, чтобы он выдавал качественный результат.
Читать...
Хабр
Как давать нейросети задания, чтобы она вас понимала
Вы уже знаете, на что способна нейросеть (спойлер: это десятки задач!). Однако она не всесильна — и не понимает, что такое хорошо, а что такое плохо, если вы ей это не объясните. В статье...
🤓OneGen: эффективная однопроходная унифицированная генерация и извлечение для LLM
Структура объединяет традиционно раздельные подходы к обучению для генерации и поиска, включая токены поиска, сгенерированные авторегрессионно.
Это позволяет одному LLM обрабатывать обе задачи одновременно в едином прямом проходе.
Мы проводим эксперименты с двумя различными типами составных задач, RAG и связыванием сущностей, чтобы проверить подключаемость, эффективность и результативность OneGen в обучении и выводе.
Кроме того, наши результаты показывают, что интеграция генерации и поиска в одном контексте сохраняет генеративные возможности LLM, одновременно улучшая производительность поиска.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Структура объединяет традиционно раздельные подходы к обучению для генерации и поиска, включая токены поиска, сгенерированные авторегрессионно.
Это позволяет одному LLM обрабатывать обе задачи одновременно в едином прямом проходе.
Мы проводим эксперименты с двумя различными типами составных задач, RAG и связыванием сущностей, чтобы проверить подключаемость, эффективность и результативность OneGen в обучении и выводе.
Кроме того, наши результаты показывают, что интеграция генерации и поиска в одном контексте сохраняет генеративные возможности LLM, одновременно улучшая производительность поиска.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
huggingface.co
Paper page - OneGen: Efficient One-Pass Unified Generation and Retrieval for LLMs
Join the discussion on this paper page
МТС Web Services представила новое направление на форуме Kazan Digital Week — ИИ-облако.
Оно поможет компаниям ускорить внедрение искусственного интеллекта без инвестиций в собственное оборудование. В его основе находится инфраструктура с графическими ускорителями для обучения и работы с ИИ.
На основе GPU компании смогут самостоятельно развернуть необходимое для работы с ИИ программное обеспечение, либо использовать «из коробки» уже готовые решения, доступные в ИИ-облаке. Например, ML-платформу – специализированное ПО, позволяющее автоматизировать процесс обучения моделей искусственного интеллекта, а также упрощающее их внедрение в бизнес-процессы компаний и последующую работу с ними.
Также в рамках ИИ-облака будут доступны готовые к работе «из коробки» сервисы MTS AI. Такие как Cotype – большая языковая модель, созданная для работы с корпоративными данными, Audiogram - платформа синтеза и распознавания речи на основе нейронных сетей с возможностью управления интонацией, ударениями и другими параметрами и сервис речевой аналитики WordPulse.
Оно поможет компаниям ускорить внедрение искусственного интеллекта без инвестиций в собственное оборудование. В его основе находится инфраструктура с графическими ускорителями для обучения и работы с ИИ.
На основе GPU компании смогут самостоятельно развернуть необходимое для работы с ИИ программное обеспечение, либо использовать «из коробки» уже готовые решения, доступные в ИИ-облаке. Например, ML-платформу – специализированное ПО, позволяющее автоматизировать процесс обучения моделей искусственного интеллекта, а также упрощающее их внедрение в бизнес-процессы компаний и последующую работу с ними.
Также в рамках ИИ-облака будут доступны готовые к работе «из коробки» сервисы MTS AI. Такие как Cotype – большая языковая модель, созданная для работы с корпоративными данными, Audiogram - платформа синтеза и распознавания речи на основе нейронных сетей с возможностью управления интонацией, ударениями и другими параметрами и сервис речевой аналитики WordPulse.
⚡️ML-подход к заблаговременному предотвращению оттока рекламодателей
В этой статье мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning).
Читать...
В этой статье мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning).
Читать...
Хабр
ML-подход к заблаговременному предотвращению оттока рекламодателей
В этом материале мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning). Прототип системы создан...
🖥 Самые интересные статьи за последние дни:
• Как давать нейросети задания, чтобы она вас понимала
• ML-подход к заблаговременному предотвращению оттока рекламодателей
• Как найти иголку в стоге сена? Или обзор Retrieval Algorithms
• Как давать нейросети задания, чтобы она вас понимала
• ML-подход к заблаговременному предотвращению оттока рекламодателей
• Как найти иголку в стоге сена? Или обзор Retrieval Algorithms
Telegram
Data Science | Machinelearning [ru]
🤔Как давать нейросети задания, чтобы она вас понимала
В этой статье поговорим о том, как взаимодействовать с искусственным интеллектом, чтобы он выдавал качественный результат.
Читать...
В этой статье поговорим о том, как взаимодействовать с искусственным интеллектом, чтобы он выдавал качественный результат.
Читать...
👤Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?
В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.
Читать...
В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.
Читать...
Хабр
Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?
ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем...
😎Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах
В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.
Читать...
В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.
Читать...
Хабр
Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах
Привет, Хабр! Меня зовут Вадим Селютин, я старший исследователь в компании VisionLabs. Наши решения по распознаванию лиц можно встретить в офисных центрах, московском метро и кассах самообслуживания...
👥Как мы строили сквозную аналитику и укрощали бизнес-требования
В этой статье расскажу, как и почему мы решили внедрить сквозную аналитику в компанию, с какими сложностями столкнулись и как побеждали бизнес-требования.
Читать...
В этой статье расскажу, как и почему мы решили внедрить сквозную аналитику в компанию, с какими сложностями столкнулись и как побеждали бизнес-требования.
Читать...
Хабр
Как мы строили сквозную аналитику и укрощали бизнес-требования
Привет! На связи Даниил, дата-инженер компании iSpring. Уже 23 года мы создаём инструменты для корпоративного обучения. В статье расскажу, как и почему мы решили внедрить сквозную аналитику в...
🧐Мониторинг токсичного контента в AI продуктах
В этой статье рассматривается процесс сбора данных, применение моделей машинного обучения (таких как distilbert и toxic bert) и метрики для оценки их эффективности.
Читать...
В этой статье рассматривается процесс сбора данных, применение моделей машинного обучения (таких как distilbert и toxic bert) и метрики для оценки их эффективности.
Читать...
Хабр
Мониторинг токсичного контента в AI продуктах
Введение С ростом популярности LLM (больших языковых моделей) начинает подниматься вопрос о внедрении систем мониторинга LLM, которые будут проверять промпт пользователей на наличие токсичного...
🤖OpenAI о новых моделях ИИ, которые умеют рассуждать
В этой статье автор вы узнаете об ограничениях бета-версии, о том, как работает новая модель OpenAI, особенностях промптинга и других тонкостях.
Читать...
В этой статье автор вы узнаете об ограничениях бета-версии, о том, как работает новая модель OpenAI, особенностях промптинга и других тонкостях.
Читать...
Хабр
OpenAI о новых LLM, которые умеют рассуждать
Модели OpenAI серии o1 — это новые большие языковые модели, обученные с помощью подкрепления для выполнения сложных рассуждений. Модели o1 думают, прежде чем ответить , и могут создавать длинную...
👨💻LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM
В этой статье автор расскажет о оптимизации исходного кода для использования с большими языковыми моделями, что может быть полезно для программистов и разработчиков, использующих LLM.
Читать...
В этой статье автор расскажет о оптимизации исходного кода для использования с большими языковыми моделями, что может быть полезно для программистов и разработчиков, использующих LLM.
Читать...
Хабр
LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM
Как известно, у больших языковых моделей (LLM) существуют ограничения по размеру контекстного окна. При постановке вопроса часто невозможно вставить весь исходный текст, что требует объединения кода...
🖥 Самые интересные статьи за последние дни:
• Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах
• Как мы строили сквозную аналитику и укрощали бизнес-требования
• OpenAI о новых моделях ИИ, которые умеют рассуждать
• LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM
• Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах
• Как мы строили сквозную аналитику и укрощали бизнес-требования
• OpenAI о новых моделях ИИ, которые умеют рассуждать
• LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM
Telegram
Data Science | Machinelearning [ru]
😎Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах
В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных…
В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных…
🧠Как искусственный интеллект может преобразить здравоохранение
В этой статье вы узнаете о потенциальном влиянии искусственного интеллекта (ИИ) на сферу здравоохранения, а также о том, как ИИ может трансформировать подход к профилактике и лечению хронических заболеваний.
Читать...
В этой статье вы узнаете о потенциальном влиянии искусственного интеллекта (ИИ) на сферу здравоохранения, а также о том, как ИИ может трансформировать подход к профилактике и лечению хронических заболеваний.
Читать...
Хабр
Как искусственный интеллект может преобразить сферу здравоохранения
Огромное количество – 129 миллионов американцев – имеют как минимум одно серьёзное хроническое заболевание. При этом 90% ежегодных расходов на здравоохранение (а именно 4,1 триллиона долларов) уходит...
🎮Генеративные модели в разработке видеоигр: будущее за играми от роботов?
В этой статье автор расскажет об изменениях, которые могут произойти в индустрии видеоигр с внедрением искусственного интеллекта, подчеркивая как потенциал, так и ограничения технологий.
Читать...
В этой статье автор расскажет об изменениях, которые могут произойти в индустрии видеоигр с внедрением искусственного интеллекта, подчеркивая как потенциал, так и ограничения технологий.
Читать...
Хабр
Генеративные модели в разработке видеоигр: будущее за играми от роботов?
Привет! Меня зовут Иван Самойлов (@sumshmuck на Хабре), я потихоньку растущий до мидла джун-фронтендер, плюс учу Питон и SQL, чтобы из фронта стать когда-нибудь фуллстеком. А моя страсть — это видеоигры, я в них постоянно рублюсь, когда время позволяет, и…
⚡️Симуляция DOOM через нейросеть
В этой статье автор расскажет о проекте, который использует нейросети для создания симуляции игрового процесса в классической игре DOOM.
Читать...
В этой статье автор расскажет о проекте, который использует нейросети для создания симуляции игрового процесса в классической игре DOOM.
Читать...
Хабр
Симуляция DOOM через нейросеть
Десятки, а то и сотни трехмерщиков и разработчиков работают над играми. Впрочем, примерный образ пайплайна всем и так известен. Сегодня мы не рассказываем про нейронку, которая запилит Uncharted 5 или...
🔒Безопасность приложений больших языковых моделей (LLM, GenAI)
В этой статье вы узнаете о ключевых уязвимостях, связанных с безопасностью приложений, использующих большие языковые модели (LLM) и генеративный искусственный интеллект (GenAI), а также о рекомендациях по их предотвращению.
Читать...
В этой статье вы узнаете о ключевых уязвимостях, связанных с безопасностью приложений, использующих большие языковые модели (LLM) и генеративный искусственный интеллект (GenAI), а также о рекомендациях по их предотвращению.
Читать...
Хабр
Безопасность приложений больших языковых моделей (LLM, GenAI)
OWASP Top 10 для приложений LLM и GenAI: Руководство для разработчиков и практиков Откройте для себя OWASP Top 10 для LLM и GenAI и изучите основные стратегии защиты ваших моделей...
🧠Эмуляция мозга: 6 ключевых вопросов на пути к AGI
В этой статье вы узнаете о текущих подходах и вызовах, связанных с созданием искусственного общего интеллекта (AGI) через эмуляцию мозга.
Читать...
В этой статье вы узнаете о текущих подходах и вызовах, связанных с созданием искусственного общего интеллекта (AGI) через эмуляцию мозга.
Читать...
Хабр
Эмуляция мозга: 6 ключевых вопросов на пути к AGI
Привет, на связи Sherpa Robotics. Сегодня мы хотим обратить ваше внимание на статью команды исследователей в области биоэлектроники Дианы Дека, Касвелла Барри и Самита Чакрабарти, опубликованную...
🖥 Самые интересные статьи за последние дни:
• Как искусственный интеллект может преобразить здравоохранение
• Эмуляция мозга: 6 ключевых вопросов на пути к AGI
• Безопасность приложений больших языковых моделей (LLM, GenAI)
• Как искусственный интеллект может преобразить здравоохранение
• Эмуляция мозга: 6 ключевых вопросов на пути к AGI
• Безопасность приложений больших языковых моделей (LLM, GenAI)
Telegram
Data Science | Machinelearning [ru]
🧠Как искусственный интеллект может преобразить здравоохранение
В этой статье вы узнаете о потенциальном влиянии искусственного интеллекта (ИИ) на сферу здравоохранения, а также о том, как ИИ может трансформировать подход к профилактике и лечению хронических…
В этой статье вы узнаете о потенциальном влиянии искусственного интеллекта (ИИ) на сферу здравоохранения, а также о том, как ИИ может трансформировать подход к профилактике и лечению хронических…