🔍OpenResearcher: использование ИИ для ускоренных научных исследований
Инновационная платформа, которая использует методы искусственного интеллекта (ИИ) для ускорения процесса исследования, отвечая на разнообразные вопросы исследователей.
Он создан на основе Retrieval-Augmented Generation (RAG) для интеграции больших языковых моделей (LLM) с актуальными знаниями, специфичными для предметной области.
OpenResearcher позволяет исследователям экономить время и повышать свой потенциал для открытия новых идей и осуществления научных прорывов.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Инновационная платформа, которая использует методы искусственного интеллекта (ИИ) для ускорения процесса исследования, отвечая на разнообразные вопросы исследователей.
Он создан на основе Retrieval-Augmented Generation (RAG) для интеграции больших языковых моделей (LLM) с актуальными знаниями, специфичными для предметной области.
OpenResearcher позволяет исследователям экономить время и повышать свой потенциал для открытия новых идей и осуществления научных прорывов.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
🤩DeepSeek-Prover-V1.5: использование обратной связи помощника по доказательствам для обучения с подкреплением и поиска по дереву Монте-Карло
Языковая модель с открытым исходным кодом, разработанную для доказательства теорем в Lean 4, которая улучшает DeepSeek-Prover-V1 за счет оптимизации как процессов обучения, так и вывода.
Предварительно обученная на DeepSeekMath-Base со специализацией на формальных математических языках, модель проходит контролируемую тонкую настройку с использованием улучшенного набора данных для формального доказательства теорем, полученного из DeepSeek-Prover-V1.
Дальнейшее уточнение достигается за счет обучения с подкреплением с обратной связью помощника по доказательству (RLPAF).
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Языковая модель с открытым исходным кодом, разработанную для доказательства теорем в Lean 4, которая улучшает DeepSeek-Prover-V1 за счет оптимизации как процессов обучения, так и вывода.
Предварительно обученная на DeepSeekMath-Base со специализацией на формальных математических языках, модель проходит контролируемую тонкую настройку с использованием улучшенного набора данных для формального доказательства теорем, полученного из DeepSeek-Prover-V1.
Дальнейшее уточнение достигается за счет обучения с подкреплением с обратной связью помощника по доказательству (RLPAF).
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
😎Введение в MLflow
В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпараметры с помощью optuna, сравнивать модели и выбирать лучшие параметры, а также рассмотрим логирование моделей, использование их в разных форматах, упаковку проекта в MLproject и установку удаленного Tracking Server MLflow.
Читать...
В этом руководстве мы посмотрим, как организовать эксперименты и запуски, оптимизировать гиперпараметры с помощью optuna, сравнивать модели и выбирать лучшие параметры, а также рассмотрим логирование моделей, использование их в разных форматах, упаковку проекта в MLproject и установку удаленного Tracking Server MLflow.
Читать...
❤1
🚀Оптимизация запросов к нейросетям: стратегии и советы
В этой статье мы рассмотрим, как оптимизировать запросы, чтобы извлечь максимум из взаимодействия с нейросетями, особенно с моделями языковых нейросетей (LLM) таких как ChatGPT, а также мы обсудим, какие параметры учитывать при создании промптов, как задавать вопросы и использовать контекст, чтобы получать ответы, соответствующие вашим нуждам.
Читать...
В этой статье мы рассмотрим, как оптимизировать запросы, чтобы извлечь максимум из взаимодействия с нейросетями, особенно с моделями языковых нейросетей (LLM) таких как ChatGPT, а также мы обсудим, какие параметры учитывать при создании промптов, как задавать вопросы и использовать контекст, чтобы получать ответы, соответствующие вашим нуждам.
Читать...
😀 Эмоциональный синтез в Алисе: как устроен
В этой статье вы узнаете, как команда Яндекса работала над обновлением Алисы в части выражения эмоций. Для этого в Алису внедрили технологию эмоционального синтеза, позволяющую ассистенту голосом выражать широкий диапазон эмоций. Такая обновленная Алиса пока живет только в Станции Лайт 2, а позже появится и на других умных устройствах.
Читать...
В этой статье вы узнаете, как команда Яндекса работала над обновлением Алисы в части выражения эмоций. Для этого в Алису внедрили технологию эмоционального синтеза, позволяющую ассистенту голосом выражать широкий диапазон эмоций. Такая обновленная Алиса пока живет только в Станции Лайт 2, а позже появится и на других умных устройствах.
Читать...
⚡️MeshFormer: High-Quality Mesh Generation with 3D-Guided Reconstruction Model
Модель реконструкции с разреженным видом, использующая явную 3D-структуру, входное руководство и контроль обучения.
Вместо трипланового представления модель сохраняет признаки в 3D-вокселях, комбинируя трансформаторы и 3D-свертки для интеграции проективного смещения.
Она обрабатывает RGB-вход и генерирует карты нормалей, предсказываемые с помощью 2D-моделей диффузии, что улучшает обучение геометрии.
Кроме того, использование Signed Distance Function (SDF) с рендерингом поверхности позволяет напрямую создавать качественные сетки, избегая сложных алгоритмов.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Модель реконструкции с разреженным видом, использующая явную 3D-структуру, входное руководство и контроль обучения.
Вместо трипланового представления модель сохраняет признаки в 3D-вокселях, комбинируя трансформаторы и 3D-свертки для интеграции проективного смещения.
Она обрабатывает RGB-вход и генерирует карты нормалей, предсказываемые с помощью 2D-моделей диффузии, что улучшает обучение геометрии.
Кроме того, использование Signed Distance Function (SDF) с рендерингом поверхности позволяет напрямую создавать качественные сетки, избегая сложных алгоритмов.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
👀Sapiens: Foundation for Human Vision Models
Семейство моделей для четырех основных задач, связанных с зрением человека: оценка позы в 2D, сегментация частей тела, оценка глубины и прогнозирование нормалей поверхности.
Модели изначально поддерживают вывод высокого разрешения 1K и чрезвычайно легко адаптируются для отдельных задач путем простой тонкой настройки моделей, предварительно обученных на более чем 300 миллионах изображений человека в дикой природе.
Простая конструкция модели также обеспечивает масштабируемость — производительность модели для разных задач улучшается по мере того, как мы масштабируем количество параметров с 0,3 до 2 миллиардов.
Sapiens постоянно превосходит существующие базовые показатели по различным бенчмаркам, связанным с зрением человека.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Семейство моделей для четырех основных задач, связанных с зрением человека: оценка позы в 2D, сегментация частей тела, оценка глубины и прогнозирование нормалей поверхности.
Модели изначально поддерживают вывод высокого разрешения 1K и чрезвычайно легко адаптируются для отдельных задач путем простой тонкой настройки моделей, предварительно обученных на более чем 300 миллионах изображений человека в дикой природе.
Простая конструкция модели также обеспечивает масштабируемость — производительность модели для разных задач улучшается по мере того, как мы масштабируем количество параметров с 0,3 до 2 миллиардов.
Sapiens постоянно превосходит существующие базовые показатели по различным бенчмаркам, связанным с зрением человека.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться
🖥 Самые интересные статьи за последние дни:
• MLSecOps: почему, зачем и кому это нужно?
• Практический кейс реализации AutoML в банке
• ML в маркетинге: как модели делают банк более чутким к негативу
• MLSecOps: почему, зачем и кому это нужно?
• Практический кейс реализации AutoML в банке
• ML в маркетинге: как модели делают банк более чутким к негативу
🤗CustomCrafter: индивидуальная генерация видео с сохранением движения и возможностей концептуальной композиции
Новую структуру, которая сохраняет способность модели генерировать движение и концептуальные комбинированные способности без дополнительного видео и тонкой настройки для восстановления.
Для сохранения концептуальной комбинированной способности мы разрабатываем модуль plug-and-play для обновления нескольких параметров в VDM, улучшая способность модели захватывать детали внешнего вида и способность концептуальных комбинирований для новых субъектов.
Используя подключаемость наших модулей обучения объекта, мы уменьшаем влияние этого модуля на генерацию движения на ранней стадии шумоподавления, сохраняя возможность генерировать движение VDM.
На более поздней стадии шумоподавления мы восстанавливаем этот модуль, чтобы восстановить детали внешнего вида указанного объекта, тем самым обеспечивая точность внешнего вида объекта.
🤗 Hugging Face
💾 Arxiv
📂 PDF
@Devsp — Подписаться
Новую структуру, которая сохраняет способность модели генерировать движение и концептуальные комбинированные способности без дополнительного видео и тонкой настройки для восстановления.
Для сохранения концептуальной комбинированной способности мы разрабатываем модуль plug-and-play для обновления нескольких параметров в VDM, улучшая способность модели захватывать детали внешнего вида и способность концептуальных комбинирований для новых субъектов.
Используя подключаемость наших модулей обучения объекта, мы уменьшаем влияние этого модуля на генерацию движения на ранней стадии шумоподавления, сохраняя возможность генерировать движение VDM.
На более поздней стадии шумоподавления мы восстанавливаем этот модуль, чтобы восстановить детали внешнего вида указанного объекта, тем самым обеспечивая точность внешнего вида объекта.
🤗 Hugging Face
💾 Arxiv
@Devsp — Подписаться