Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Epic Games продемонстрировала сервис MetaHuman Creator для создания моделей людей с фотореалистичными лицами

Epic Games продемонстрировала сервис MetaHuman Creator для создания моделей людей с фотореалистичными лицами, который работает прямо в браузере и позволяет сократить длительность работы с нескольких месяцев до пары часов.
MetaHuman Creator совместим с современными методами захвата движения для реалистичной анимации персонажей, которых затем можно с легкостью перенести в игры или фильмы. Разработчики могут изменять черты лица, цвет кожи, выбирать разные типы телосложения, причесок, одежды и даже модельку зубов.
Для работы не нужны специфичные знания в области моделирования, а на выходе получаются персонажи с детализацией на уровне самых продвинутых игр по типу The Last of Us Part II.
Вице-президент Epic Games по технологиям цифровых персонажей рассказал, что на создание сервиса ушли десятилетия исследований и разработок с привлечением нескольких сторонних компаний, но результат того стоил. Теперь создание убедительных моделей людей под силу практически каждому.

Смотреть
Какие ключевые слова обязательны при выборке данных с соединением таблиц (не учитывая cartesian product)?
#SQL
Ответ предусматривает несколько вариантов

ON - 4
👍 5%
SELECT - 7
👍👍 9%
USING - 1
👍 1%
JOIN - 57
👍👍👍👍👍👍👍👍 70%
FROM - 12
👍👍 15%
WHERE - 1
👍 1%
👥 82 человека уже проголосовало.
⬆️ Правильный ответ ⬆️
SELECT
JOIN
FROM
TracIn: способ оценить влияние отдельных объектов в данных на предсказания
TracIn — это масштабируемый метод оценки влияния отдельных объектов в данных на предсказания. Идея TracIn заключается в том, что бы отслеживать процесс обучения модели, чтобы засекать изменения в предсказаниях при переходе от одного объекта данных к другому. С помощью TracIn можно находить ошибки в разметке данных и выбросы. Кроме того, метод позволяет объяснять предсказания на примере объектов из обучающей выборки. Подход предложили исследователи из Google AI.
Выберите алгоритмы сортировки для которых асимптотическая оценка в наихудшем случае O(n<sup>2</sup>)
#Алгоритмы

Ответ предусматривает несколько вариантов

Шелла - 4
👍👍 9%
Быстрая - 8
👍👍👍 18%
Пузырьковая - 24
👍👍👍👍👍👍👍👍 55%
Слиянием - 4
👍👍 9%
Выбором - 4
👍👍 9%
👥 44 человека уже проголосовало.
⬆️ Правильный ответ ⬆️
Быстрая
Пузырьковая
Выбором
JigsawGAN: генеративная нейросетевая модель собирает пазлы
JigsawGAN — это генеративная self-supervised нейросетевая модель, которую обучили на задаче сбора пазлов. Модель принимает на вход хаотично расположенные части изображения. На основе этого модель восстанавливает оригинальное изображение. Нейросеть не требует дополнительной информации по изображению для поиска решения. Нейросеть обходит альтернативные подходы по количественным и качественным метрикам.
Какой алгоритм сортировки признается лучшим и наиболее эффективным?
#Алгоритмы

Сортировка Шелла - 8
👍👍👍 12%
Сортировка вставками - 1
👍 2%
Сортировка слиянием - 3
👍👍 5%
Сортировка Чарльза Хоара (быстрая) - 35
👍👍👍👍👍👍👍👍 53%
Шейкерная сортировка - 1
👍 2%
Сортировка бинарным деревом - 18
👍👍👍👍👍 27%
👥 66 человек уже проголосовало.
⬆️ Правильный ответ ⬆️
Сортировка Чарльза Хоара (быстрая)
Перед вами один из самых интересных учебников по машинному обучению – разделу искусственного интеллекта, изучающего методы построения моделей, способных обучаться, и алгоритмов для их построения и обучения. Автор воздал должное невероятному богатству предмета и не упустил из виду объединяющих принципов. Читатель с первых страниц видит машинное обучение в действии, но без не нужных на первых порах технических деталей. По мере изучения предмета тщательно подобранные примеры, сопровождаемые иллюстрациями, постепенно усложняются.
В чём разница между расширенным алгоритмом Евклида и обычным?
#Алгоритмы

Расширенный алгоритм Евклида позволяет извлечь дополнительную информацию - 26
👍👍👍👍👍👍👍👍 81%
Расширенный алгоритм Евклида работает быстрее, но более сложный в реализации - 5
👍👍 16%
Между ними нет существенной разницы - 1
👍 3%
👥 32 человека уже проголосовало.
⬆️ Правильный ответ ⬆️
Расширенный алгоритм Евклида позволяет извлечь дополнительную информацию
​​Математика для Data Science: 3 полезных закона

Закон Бенфорда
Закон Бенфорда — это математический закон в котором говорится о первой цифре числа из набора реальных данных.
Если мы представим случайное число, то было бы логично предположить, что его первая цифра также будет случайной. То есть вероятность того, что это будет число от 1 до 9, одинакова для каждого из этих чисел, и составляет около 11,1%. Однако это не так.
Закон Бенфорда утверждает, что первая цифра числа чаще будет меньшей, в большинстве реально встречающихся коллекций чисел.
Давайте попробуем применить этот закон к реальному датасету. Для этой статьи использовались данные из Kaggle о длительности песен в Spotify с 1921 по 2020 год. Вот график того, как часто та или иная цифра является первой:
Вам надо отсортировать массив из 6 элементов. Быстрей всего это выполнит?
#Алгоритмы

heap sort (пирамидальная сортировка) - 5
👍👍 9%
bubble sort (пузырьковая сортировка) - 29
👍👍👍👍👍👍👍👍 50%
quick sort (быстрая сортировка Хоара) - 24
👍👍👍👍👍👍👍 41%
👥 58 человек уже проголосовало.
⬆️ Правильный ответ ⬆️
bubble sort (пузырьковая сортировка)

Подробно можно почитать здесь
Искусственный интеллект поможет московским врачам при эндоскопии

В Боткинской больнице точный диагноз помогает ставить искусственный интеллект. Во время эндоскопии система не только показывает состояние внутренних органов, но легко обнаруживает подозрительный участок, а, значит, приступить к лечению можно незамедлительно.
"Искусственный интеллект" приходит на помощь к столичным врачам. Видеть больше, а значит, лучше ставить диагнозы. На обследовании - женщина 68 лет. В Боткинскую больницу поступила с жалобами на боли в кишечнике. Гастроскопия и колоноскопия должны дать полную картину состояния пациента. Но в этот раз исследования проводятся в буквальном смысле в "четыре глаза".
Так называемый "искусственный интеллект" – это, по сути, дополнительный монитор к эндоскопической системе, который позволяет врачу увидеть более детальную картину исследования, и при необходимости обратить внимание на подозрительный участок слизистой пациента.
От эндоскопического аппарата сигнал поступает в систему, где и начинается глубокий анализ. То, что может не заметить человек, программа не пропустит.
"Это плоское новообразование, которое может быть доктор сразу и не увидит, но с использованием искусственного интеллекта, который несколько раз немножечко с задержкой, но при этом акцентирует наше внимание на том, что здесь есть новообразование и надо обратить на него внимание", - объясняет заведующая эндоскопическим отделением Боткинской больницы Ирина Коржаева.
Обращает внимание врача "искусственный интеллект" синим квадратом. Он обозначает область, где обязательно нужна более точная диагностика. Окончательное решение о наличии или отсутствии патологии и дальнейшем лечении принимает только врач.
"Это, собственно говоря, очередное достижение нашей науки в пользу врача и в пользу, конечно, пациента, потому что из этих маленьких образований в некоторых случаях вырастают большие проблемы", - говорит заведующая эндоскопическим отделением Боткинской больницы Ирина Коржева.
Разработчики "Искусственного интеллекта" для эндоскопии - из Ярославского государственного университета. На базе регионального онкоцентра они опробовали, а теперь внедрили и в Боткинской больнице метод находить новообразования в организме пациента.
"Фактически переложили имеющиеся разработки в области детектирования объектов на вот эту тему эндоскопическую", - говорит один из разработчиков системы искусственного интеллекта Александр Ганин.
При этом искусственный интеллект применяют в медицине уже не первый год.
"Мы уже системно включаем в промышленную эксплуатацию новые алгоритмы, продолжаем прототипировать и подключать новые алгоритмы, и выводим в промышленную эксплуатацию в медицинских организациях и создаем этот рынок для разработчиков", - заявил Директор Центра диагностики и телемедицины Сергей Морозов.
А разработчики, в свою очередь, уже осваивают новое направление телемедицины. Совсем скоро они смогут определять факторы риска болезней сердца. Это поможет обнаруживать первые признаки инсульта или рассеянного склероза, а значит, вовремя лечить и спасать тысячи пациентов.
Как правильно использовать инструменты Data Engineering? Узнайте бесплатно, посмотрев демо-занятие «Spark Data API» и День открытых дверей курса «Экосистема Hadoop, Spark, HiveI» по ссылке: https://otus.pw/VnxA/

Для доступа ко всем бесплатным мероприятиям курса пройдите вступительный тест: https://otus.pw/EZnl/

Успейте занять последние места на курсе «Экосистема Hadoop, Spark, Hive». Старт занятий 25 февраля. После обучения вы сможете писать распределенные приложения, работать с потоками данных, обрабатывать большие объемы данных и оптимизировать приложения.
Сколько условных операторов типа if-else следует использовать для реализации алгоритма:
y = 1, если x > 0
y = 0, если x = 0
y = -1, если x < 0
#Программирование

Три - 10
👍👍 12%
Четыре
▫️ 0%
Два - 71
👍👍👍👍👍👍👍👍 88%
👥 81 человек уже проголосовал.
Математика для Data Scientist: необходимые разделы

Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по-настоящему глубоко анализировать и систематизировать огромные массивы данных.

Для специалиста Data Science важны следующие направления математики:

статистика;
теория вероятностей;
математический анализ;
линейная алгебра.

Подробно
Эта книга не только учебник, но и краткое руководство к решению задач. Излагаемые основы теории вероятностей и математической статистики сопровождаются большим количеством задач (в том числе экономических), приводимых с решениями и для самостоятельной работы. При этом упор делается на основные понятия курса, их теоретико-вероятностный смысл и применение. Приводятся примеры использования вероятностных и математико-статистических методов в задачах массового обслуживания и моделях финансового рынка.