Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
МТС Web Services представила новое направление на форуме Kazan Digital Week — ИИ-облако.

Оно поможет компаниям ускорить внедрение искусственного интеллекта без инвестиций в собственное оборудование. В его основе находится инфраструктура с графическими ускорителями для обучения и работы с ИИ.

На основе GPU компании смогут самостоятельно развернуть необходимое для работы с ИИ программное обеспечение, либо использовать «из коробки» уже готовые решения, доступные в ИИ-облаке. Например, ML-платформу – специализированное ПО, позволяющее автоматизировать процесс обучения моделей искусственного интеллекта, а также упрощающее их внедрение в бизнес-процессы компаний и последующую работу с ними.

Также в рамках ИИ-облака будут доступны готовые к работе «из коробки» сервисы MTS AI. Такие как Cotype – большая языковая модель, созданная для работы с корпоративными данными, Audiogram - платформа синтеза и распознавания речи на основе нейронных сетей с возможностью управления интонацией, ударениями и другими параметрами и сервис речевой аналитики WordPulse.
​​⚡️ML-подход к заблаговременному предотвращению оттока рекламодателей

В этой статье мы опишем систему для заблаговременного предотвращения оттока рекламодателей, основанную на машинном обучении (ML, Machine Learning).

Читать...
​​👤Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Читать...
​​😎Real-time-распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах

В этой статье я расскажу про постановку задачи распознавания лиц, подходящие мобильные архитектуры, обучение распознаванию лиц на больших объемах данных и способы повысить точность маленькой архитектуры.

Читать...
​​👥Как мы строили сквозную аналитику и укрощали бизнес-требования

В этой статье расскажу, как и почему мы решили внедрить сквозную аналитику в компанию, с какими сложностями столкнулись и как побеждали бизнес-требования.

Читать...
​​🧐Мониторинг токсичного контента в AI продуктах

В этой статье рассматривается процесс сбора данных, применение моделей машинного обучения (таких как distilbert и toxic bert) и метрики для оценки их эффективности.

Читать...
​​🤖OpenAI о новых моделях ИИ, которые умеют рассуждать

В этой статье автор вы узнаете об ограничениях бета-версии, о том, как работает новая модель OpenAI, особенностях промптинга и других тонкостях.

Читать...
​​👨‍💻LLM-CodeSlim: Автоматическое сжатие и очистка кода для эффективного использования с LLM

В этой статье автор расскажет о оптимизации исходного кода для использования с большими языковыми моделями, что может быть полезно для программистов и разработчиков, использующих LLM.

Читать...
​​🧠Как искусственный интеллект может преобразить здравоохранение

В этой статье вы узнаете о потенциальном влиянии искусственного интеллекта (ИИ) на сферу здравоохранения, а также о том, как ИИ может трансформировать подход к профилактике и лечению хронических заболеваний.

Читать...
​​🎮Генеративные модели в разработке видеоигр: будущее за играми от роботов?

В этой статье автор расскажет об изменениях, которые могут произойти в индустрии видеоигр с внедрением искусственного интеллекта, подчеркивая как потенциал, так и ограничения технологий.

Читать...
​​🔒Безопасность приложений больших языковых моделей (LLM, GenAI)

В этой статье вы узнаете о ключевых уязвимостях, связанных с безопасностью приложений, использующих большие языковые модели (LLM) и генеративный искусственный интеллект (GenAI), а также о рекомендациях по их предотвращению.

Читать...
​​🧠Эмуляция мозга: 6 ключевых вопросов на пути к AGI

В этой статье вы узнаете о текущих подходах и вызовах, связанных с созданием искусственного общего интеллекта (AGI) через эмуляцию мозга.

Читать...
👨‍💻Промпт-инжиниринг: как найти общий язык с ИИ

В этой статье я расскажу почему эта профессия приобретает всё большую значимость и как можно использовать приёмы промпт-инжиниринга в работе и повседневной жизни.

Читать...
ИТМО определил самые популярные Open Source решения в сфере ML/Data в России

Свежее исследование от ИТМО определило лидеров среди компаний, активно развивающих open-source проекты в области машинного обучения. Первое место занял Яндекс c 120 решениями и 65000+ звёзд на GitHub (мощный отрыв от остальных участников). На втором месте — Сбер, а замыкает тройку Т-банк. Критериями оценки были популярность и востребованность проектов в РФ и остальном мире.

Исследователи отмечают, что лидерство компании стало возможным, благодаря множеству успешных open source проектов в сфере Data/ML, активному участию в поддержке сообщества через мероприятия и гранты, а также высокому качеству репозиториев и активным контрибьюторам.

Эксперты также поделились общими выводами по сфере:
— Вклад в открытый код становится важнее конкуренции
— Open source объединяет специалистов со всего мира
— GitHub остаётся стандартом, но растёт интерес к альтернативам
— Компаний ориентируются не только на внутренний, но и на международный рынок


Статью об исследовании можно почитать на хабре.
😎Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models

Takin TTS, языковую модель нейронного кодека, которая основана на усовершенствованном нейронном речевом кодеке и многозадачной обучающей структуре, способной генерировать высококачественную естественную речь с нуля.

Систему Takin Morphing с высокоразвязанными и продвинутыми подходами моделирования тембра и просодии, которая позволяет людям настраивать производство речи с их предпочтительным тембром и просодией точным и контролируемым образом.

Обширные эксперименты подтверждают эффективность и надежность наших моделей серии Takin AudioLLM.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🌐Встречаем нейроредактор в Браузере, или Как мы учили LLM-модели помогать пользователям с текстами

В этой статье вы узнаете о том, как мы улучшали предыдущее решение и в итоге пришли к идее отдельного инструмента.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔍Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM

В этой статье автор расскажет, как быстро получить приемлемое качество, когда базовые подходы не помогают.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM