Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​💪Как устроен виртуальный помощник для data-сервисов в «Магните»

Автор - главный системный аналитик в департаменте по работе с данными «Магнита». В этой статье расскажет вам о том, как устроен виртуальный помощник который помогает пользователям корпоративного хранилища данных ориентироваться в данных и сервисах департамента и других подразделений, развивающих инструменты для аналитики.

Читать...
​​🚀Как спрогнозировать спрос на самокаты и не захламить город, версия Whoosh

Нельзя просто так взять и расставить электросамокаты в городе. Надо, чтобы они находились в нужное время, в нужном месте и в нужном количестве, чтобы выполнять свою транспортную задачу.

Автора зовут Никита Зеленский, он руководит отделом по работе с данными в Whoosh, разработчике технологических решений и операторе микромобильности. Эту статью он написал вместе с Иваном Маричевым, дата‑сайнтистом Whoosh. Он же и автор алгоритма, о котором пойдет речь.

Читать...
​​🤯Большие данные мертвы. Это нужно принять

Уже более десяти лет тот факт, что люди с трудом извлекают из своих данных полезную информацию, сбрасывают на чересчур большой размер этих данных. 

Мир в 2023 году выглядит иначе, чем когда зазвенели первые тревожные звоночки по поводу Big Data. Катаклизм обработки информации, который все предсказывали, не состоялся. Объемы данных, возможно, немного выросли, но возможности аппаратного обеспечения росли еще быстрее

Читать...
​​🧠Как сделать синтез своего голоса

Создать новый голос для синтеза — это долго и дорого. Авторы постарались сделать этот процесс проще и доступнее, и в итоге автор сам смог записаться на студии, а потом обучить модель разговаривать своим голосом.

Читать...
​​Взгляд компьютерным зрением на работу коммунальных служб

К третьему десятилетию двадцать первого века российская провинция так и не научилась содержать пешеходную инфраструктуру в достойном состоянии, но плотно обвешалась уличными веб‑камерами.

Автор в статье с помощью камер анализирует загрязненность улиц снегом, слякотью.

Читать...
​​👾Отгадай слово: как мы создали игру с элементами машинного обучения и вышли в ноль за 2 месяца

Автор - главный разработчик игры «Отгадай слово» — игра, в которой нужно угадать слово, поняв логику искусственного интеллекта. Два месяца назад вместе с кофаундером Григорием Спировым наткнулись на игру https://contexto.me и решили локализовать ее.

В статье вы рассмотрите технологии и алгоритмы, которые использовались при разработке, и узнаете об совершенных ошибках на пути.

Читать...
​​😏Я только спросить: разводим ChatGPT на откровенность по методу Илона Маска

О том, что чат-бот ChatGPT от OpenAI настроен жёстко фильтровать контент во избежание "срыва толерантности", доносится из каждого утюга.
А можно ли пробить холст на стене OpenAI и заглянуть в жестяной череп? Вдруг там лишь паутина, да дохлые мыши? Попробуем проделать этот опыт вместе с Илоном Маском.

Читать...
​​О трёх существенных недостатках известных алгоритмов обучения с подкреплением

Уже несколько десятилетий существуют такие алгоритмы машинного обучения с подкреплением, как Q-learning и REINFORCE. До сих пор часто применяется их классическая реализация. К сожалению, эти алгоритмы не лишены фундаментальных недостатков, значительно усложняющих обучение хорошей политике. Рассмотрим три основных недостатка классических алгоритмов обучения с подкреплением, а также решения, направленные на их преодоление.

Читать...
​​🚀Кроссовки с машинным обучением. Как стартап хочет сделать революцию в ходьбе

Стартап Shift Robotics из Питтсбурга изобрел «обувь», которая позволяет ходить на 250% быстрее. При этом человек не затрачивает никакой дополнительной энергии. Такая пара кроссовок стоит 1400 долларов. Дороже любых Yeezy's в разы. Но зато — в буквальном смысле самая быстрая обувь в мире, которая способна превратить вас в Майкла Джексона на максималках. 

Читать...
​​🤔Как написать пайплайн для чтения рукописного текста

В этой статье мы, команда Sber AI, расскажем о пайплайне для распознавания текста и о нюансах обучения HTR‑моделей, а также поделимся датасетом школьных обезличенных тетрадей. Это почти 2 тысячи страниц с полной разметкой полигонов слов.

Читать...
​​💻Стратегии прогнозирования временных рядов в ETNA

Автор - разработчик библиотеки ETNA в Тинькофф. Расскажет вам о том, как в задаче прогнозирования временных рядов появляются стратегии, какими они бывают и как воспользоваться стратегией в библиотеке ETNA.

Читать...
​​🎁ChatGPT показала 5 тысяч самых опасных файлов, с помощью которых можно легко взламывать сайты

Автор попросил нейросеть ChatGPT, представить, что она создала сайт и забыла удалить из корневой папки файлы, которые могут представлять наибольшую ценность для злоумышленников. В этой статье вы узнаете что из этого вышло.

Читать...
​​💯Юмор ChatGPT

В последнее время ChatGPT набрал большую популярность. Автор решил проверить насколько умна эта нейросеть и решил научить ее шутить. Что из этого вышло вы узнаете в этой статье

Читать...
​​💪Увеличь это! Современное увеличение разрешения в 2023

В статье автор подробно рассматривает современные алгоритмы повышения разрешения.

За последние годы авторы создали 3 бенчмарка Video Super-Resolution под разные кейсы использования, которые на данный момент занимают первые 3 (из 14) места в соответствующем разделе на сайте paperswithcode.com.

Читать...
​​🔥Градиентный спуск простыми словами

Градиентный спуск - это способ обучения и совершенствования модели машинного обучения. Он делает это, постоянно пытаясь лучше предсказать правильный ответ, корректируя свое "мышление". Для этого используется математическая формула, чтобы определить, в каком направлении нужно двигаться, чтобы приблизиться к правильному ответу. Процесс повторяется много раз, пока алгоритм не сможет предсказать ответ настолько хорошо, насколько это возможно.

Читать...
​​👉🏻Революция генеративного ИИ началась — как мы к этому пришли?

Сегодня только и разговоров, что о ChatGPT, Midjourney и прочих DALL-E. Почему именно сейчас нейросети стали такими крутыми и развиваются семимильными шагами? Прорыв стал возможен благодаря новому классу невероятно мощных моделей искусственного интеллекта. В этой статье вы узнаете, с чего всё началось и как мы здесь оказались.

Читать...
​​👨‍💻Представление, кластеризация и подобие в примерах, иллюстрациях и таблицах

Эта статья послужит введением в представление (embedding), подобие (similarity) и кластеризацию (clustering). Знать эти ключевые понятия машинного обучения нужно, чтобы понять, что такое скрытое пространство.

Читать...
​​🧠Kubeflow: учимся устанавливать и запускать Kubeflow на локальной машине

Пошаговое руководство по установке и конфигурированию всех компонентов kubeflow на локальной машине.

Читать...
​​🔥Встраиваем распознавание документов от Smart Engines куда угодно за пять минут

Авторы, Smart Engines, многие годы занимаются созданием ПО для распознавания документов, удостоверяющих личность, гибких форм, банковских карт, штрихкодов и так далее - всего более двух с половиной тысяч различных документов.

В статье авторы покажут пример того, как с помощью Docker, Python и SDK самому реализовать простейшее решение для распознавания документов. 

Читать...
​​Теория вероятностей в машинном обучении. Часть 1: модель регрессии

В данной статье вы подробно рассмотрите вероятностную постановку задачи машинного обучения: что такое распределение данных, дискриминативная модель, i.i.d.-гипотеза и метод максимизации правдоподобия, что такое регрессия Пуассона и регрессия с оценкой уверенности, и как нормальное распределение связано с минимизацией среднеквадратичного отклонения.

Читать...
​​👨‍💻Мониторинг аномальной активности в операционной системе «Нейтрино»

Активности в операционной системе могут быть самыми разнообразными. Это может быть и запуск нового процесса или потока, и обращение к файловой системе, и выделение памяти, и многое другое. 

Авторы разработали программный комплекс мониторинга аномальных процессов (ПК МАП). В его основе лежат механизмы сбора и анализа состояния системы, а также технологии машинного обучения.

Читать...