Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20K subscribers
621 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Учим ИИ в игры играть!

Машинное обучение, нейросети, Data Science - слова из мантры программиста-модника. Но лишь единицы действительно разбираются в этих хайповых технологиях. Быть может мы заглянем в закулисье computer science и узнаем как обучить ИИ играть в компьютерные игры?

Смотреть видео...
​​Открытые данные. Как сматчить несматчиваемое или Нейросеть вам в помощь

Аналитик Никитин Александр и Head of ML Андрей Румянцев разобрались как с помощью машинного обучения смерджить несколько наборов данных из открытых источников и не сойти с ума. Open data, TF-IDF, faiss, pgvector, трансформеры и удивительное завершение нашего приключения — всё это под катом.

Читать...
​​2003–2023: Краткая история Big Data

Большие данные (Big Data) и, в частности, экосистема Hadoop появились немногим более 15 лет назад и развились к сегодняшнему дню так, как мало кто мог тогда предположить.

Ещё только появившись, опенсорсный Hadoop сразу стал популярным инструментом для хранения и управления петабайтами данных. Вокруг него сформировалась обширная и яркая экосистема с сотнями проектов, и он до сих пор используется многими крупными компаниями, даже на фоне современных облачных платформ. В текущей статье я опишу все эти 15 лет эволюции экосистемы Hadoop, расскажу о её росте в течение последнего десятилетия, а также о последних шагах в развитии сферы больших данных за последние годы.

Так что пристегнитесь и настройтесь на путешествие во времени вглубь 20 последних лет, поскольку наша история начинается в 2003 году в маленьком городке к югу от Сан-Франциско…

Читать...
​​Нейронная сеть для распознавания образов с TensorFlow: как с ней работать

В сегодняшней статье хотим поделиться опытом, как можно начать использовать TensorFlow в целях распознавания образов. Напомним, что TensorFlow — открытая программная библиотека для машинного обучения, разработанная компанией Google для решения задач построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигающая качества человеческого восприятия.

Цель статьи — привлечь этот инструмент для распознавания боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для того чтобы этого достичь, нужно выполнить несколько важных этапов, о чём и поговорим под катом.

Читать...
​​Глубокое обучение в диагностике: как AI спасает жизни и экономит средства на лечение

«Симптомы никогда не лгут», — так сказал самый блестящий диагност, доктор Хаус, который, увы существует только в телесериале. В реальной жизни симптомы часто нелегко обнаружить даже лучшим специалистам, а ошибочные диагнозы признаны самыми частыми и опасными медицинскими ошибками: с теми или иными ошибочными диагнозами сталкиваются ежегодно от 12 до 18 миллионов жителей США.

Есть надежда, что искусственный интеллект (artificial intelligence, AI) и машинное обучение (machine learning, ML) смогут в будущем изменить эту тревожную ситуацию. В этой статье рассматриваются самые успешные примеры использования машинного обучения в диагностике, подчёркивается его потенциал и описываются современные ограничения.

Читать...
​​10 лучших опенсорсных инструментов аннотирования для компьютерного зрения

Перевод статьи 10 of the best open-source annotation tools for computer vision 2022

Читать...
​​Машинное искусство и стиль Midjourney на примере круга

Этот текст для тех, кто хотел бы посмотреть на MidJourney в деле, но не может выделить время, чтобы, наконец, попробовать. 

Читать...
​​Что такое MLOps? Самый подробный текст про работу с ML-системами, который вы найдете в интернете

В этом материале мы подробно разбираем концепцию MLOps. Более того, делаем это тремя способами. Сначала теоретически — через самую толковую, на наш взгляд, схему MLOps. Затем — концептуально, через артефакты, которые заложены в подходе. И наконец, через понимание MLOps как информационной системы.

Сохраняйте текст в закладки, потому что на данный момент это, возможно, самое полное описание MLOps на русском языке (и не перевод очередной англоязычной статьи!). Подарим мерч Selectel тому, кто пришлет ссылку на более развернутое описание концепции в комментариях.

Читать...
​​Поиск пропавших людей на снимках лесного массива, полученных с помощью БПЛА или ещё один разбор задачи Цифрового Прорыва

Это статья является продолжением цикла материалов по разбору задач Всероссийского чемпионата "Цифровой Прорыв", связанных с Computer Vision. Решение, предлагаемое в статье, позволяет получить место в топ-10 лидерборда, при это реализация самого подхода у автора статьи заняла ~ 3-4 часа. В конце даются советы по улучшению решения, а также идеи, которые могут привести к победе.

Читать...
Когда смотришь на код который написал неделю назад
​​Tutorial к автоматизации разметки изображений с использованием OpenCV Python

Разметка- самая важная часть проекта глубокого обучения. Это решающий фактор того, насколько хорошо модель обучится. Однако это очень утомительно и отнимает много времени. Одним из решений является использование автоматизированного инструмента разметки изображений, который значительно сокращает время.

В этой статье мы обсудим некоторые приемы и приемы разметки в OpenCV. С помощью этих методов мы создадим автоматизированный инструмент для разметки одного класса. Он также будет иметь функцию отклонения ненужных объектов. Все это использует возможности некоторых простых алгоритмов в OpenCV.

Читать...
​​Data Science | Machinelearning [world] - канал на котором публикуются интересные англоязычные материалы из различных источников на такие темы как:

👉 Data Science and Data Analytics
👉 Machinelearning
👉 Python
👉 Algorithms

Добро пожаловать! @ds_international
​​Self-Supervised Learning. Проблематика и постановка задачи

В последнее 2-3 года в обучении нейросеток всё больше набирает обороты self-supervised подход. Это мощный инструмент, который позволяет использовать огромные массивы данных, при этом не требуя трудозатратной разметки. Так можно учиться на миллионах или даже миллиардах картинок. Благодаря такому подходу были получены большинство state-of-the-art результатов в последнее время на классических датасетах типа ImageNet.

Это первая статья в цикле, которая рассматривает основные преимущества Self-Supervised Learning (SSL) и общую постановку задачи. Цикл будет посвящён SSL для Computer Vision.

Читать...
​​Самые впечатляющие достижения ChatGPT

Как вы, наверное, знаете, на днях OpenAI выпустила языковую нейросеть ChatGPT. Этот текстовый ИИ уже побил все рекорды по хайпу. Он набрал 1 млн зарегистрированных пользователей меньше чем за неделю. Для сравнения, у Twitter достижение этой цифры заняло 2 года, у Facebook — 10 месяцев.

Читать...
​​Frontender's notes - самый большой канал по фронту с годной инфой по HTML, CSS, JS, TypeScript, React, Node.js и развитию Soft-skills, а также разборы вопросов для интервью и подборка крутых статей c опытом релокации айтишников в другие страны.

Вам сюда: 👉 @frontendnoteschannel

Ну а если вы любите почитать статейки о вебе в оригинале то вот сюда 👉 @frontend_international

В общем добро пожаловать!
​​Иногда ИИ поразительно непредсказуем. Он создал аномальный кошмар, который эксперты не могут объяснить

То, что потенциал нейросетей не познан на все 100, очевидно. Внезапное появление женщины как из фильмов ужасов, которая оставалась на каждой следующей картинке, — еще одно тому доказательство. Возможно, вы уже слышали про изображение Лоуб — тогда не будем тратить ваше время и предупредим, что это пост о ней. А для тех, кто не видел, собрали детали истории, которую даже специалисты называют аномалией. Осторожно, под катом чувствительный контент. 

Читать...
​​Реидентификация 2.0: как сделать камеры умнее

Специалисты компании «Криптонит» разработали эффективный подход к обработке видеоданных с помощью искусственных нейронных сетей.

Читать...
​​Dirty cat для категориальных переменных, или почему простых методов кодирования может быть недостаточно

Рассмотрим те минусы ohe, которые напрямую связаны с кодированием категориальных переменных.

Читать...