Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
632 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Метод k-средних
#algorithms
Всеми любимый неконтролируемый алгоритм кластеризации. Учитывая набор данных в виде векторов, мы можем создавать кластеры точек на основе расстояний между ними. Это один из алгоритмов машинного обучения, который последовательно перемещает центры кластеров, а затем группирует точки с каждым центром кластера. Входные данные – количество кластеров, которые должны быть созданы, и количество итераций.

Полезная ссылка:
sklearn.cluster.KMeans
Вводные гайды:
Видео по кластеризации
Введение в кластеризацию
​​Игорь Ашманов: появление мыслящих роботов невозможно не только в ближайшем будущем, но вообще никогда

ПРИЗРАК ФУТУРИЗМА
Небывалое развитие IT-технологий последних лет создает ощущение, что вот-вот искусственный интеллект, описанный фантастами, станет реальностью. О том, куда может зайти прогресс, мы беседуем с разработчиком виртуальных собеседников-инфов, директором компании «Ашманов и партнеры» Игорем Ашмановым.
— Игорь, сейчас много говорят о так называемых искусственных нейронных сетях, на основе которых будут созданы боты, обладающие полноценным искусственным интеллектом. Как вы это прокомментируете?
— Давайте начнем с определения понятия «искусственный интеллект» (ИИ). В принципе само это словосочетание представляет собой искаженный перевод английского термина artificial intelligence, «искусственное понимание». Ученые под ИИ подразумевают не умение думать, а умение распознавать и адекватно реагировать. В случае виртуальных собеседников (инфов) — адекватно отвечать. Например, интернет-поисковик, выполняющий запросы пользователя,— классический пример ИИ. В сознании же жертв голливудских фильмов ИИ представляется неким андроидом, способным самостоятельно мыслить и осознавать себя. И именно на жертв подобной подмены понятий рассчитаны всякие шаманские спекуляции на терминах вроде «искусственная нейронная сеть». В данном случае это просто один из методов хранения и обработки данных, и «нейроны» здесь не подразумевают никакой связи с биологией. И какими бы мощными ни становились компьютеры и программное обеспечение, все равно робот никогда не сможет не только чувствовать, как человек, но и самостоятельно мыслить. А теории о том, что на каком-то этапе критическая масса железа и ПО будет превышена и тогда в компьютере заведется некий интеллект,— чистое шаманство. На мой взгляд, появление мыслящих роботов невозможно не только в ближайшем будущем, но вообще никогда. В каком-то смысле это уже философско-религиозный вопрос: мозг как физическое сочетание тканей рождает сознание или нематериальное сознание использует мозг, равно как руки и ноги? Если верно первое, то теоретически можно создать искусственным путем стопроцентный аналог мозга, на который снизойдет сознание. Но лично я в это не верю.
— Возможно ли, что по мере развития технологий будут созданы виртуальные собеседники — пусть не мыслящие самостоятельно, но по разговору практически неотличимые от людей?
— А это вполне возможно. Можно будет считать, что ИИ создан (в научном, а не шаманском понимании), когда человек не сможет по разговору отличить сетевого инфа от живого собеседника. Этот барьер называется тестом Тьюринга. И пока не создан виртуальный собеседник, способный его пройти. Другое дело, что тестируют инфов эксперты — во-первых, готовые, что их собеседник окажется виртуальным, а во-вторых, обладающие навыками выведения инфов на чистую воду. Для обычных же пользователей соцсетей тест Тьюринга уже можно считать пройденным: на уровне общения в сети хорошо проработанные инфы остаются нераспознанными. Только надо понимать, что инф не общается, а лишь имитирует общение. Например, когда вы не знаете, что сказать, то для поддержания разговора произносите какую-нибудь проходную фразу, некий энкод (двусмысленное высказывание, основанное на использовании речевых клише.— «Деньги»), который заставляет собеседника сменить тему. Инфы поступают точно так же. В них заложено ядро разумных микродиалогов вполне человеческого уровня и построен коммуникативный алгоритм постоянного сведения разговора к этому ядру. Только и всего.

Источник: www.kommersant.ru
This media is not supported in your browser
VIEW IN TELEGRAM
Функции потерь (Loss Functions)
Для большинства именно с этого начинается знакомство с Data Science — функции потерь помогают создавать рекомендательные и прогнозные системы, определять тенденции в массивах данных.
Допустим, у вас есть модель линейной регрессии, которой вы предлагаете исходные данные. Полученный результат вы сравниваете с образцом, чтобы определить, как далеко от реальности он лежит. Эта информация помогает вам оптимизировать функцию прогнозирования.
Как же подсчитать эту разницу? Для этого вы представляете эти данные в виде двух векторов и применяете к ним функцию потерь. Например, пусть ожидаемый прогноз — это вектор P, а ваши результаты — вектор E. Тогда P-E — это разница между данными, а длина этого третьего вектора и представляет собой величину ошибки.
​​Логистическая регрессия

Логистическая регрессия ограничена линейной регрессией с нелинейностью (в основном используется сигмоидальная функция или tanh) после применения весов, следовательно, ограничение выходов приближено к + / - классам (что равно 1 и 0 в случае сигмоида). Функции кросс-энтропийной потери оптимизированы с использованием метода градиентного спуска.
Примечание для начинающих: логистическая регрессия используется для классификации, а не регрессии. В целом, она схожа с однослойной нейронной сетью. Обучается с использованием методов оптимизации, таких как градиентный спуск или L-BFGS. NLP-разработчики часто используют её, называя “классификацией методом максимальной энтропии”.

На рисунку изображен сигмоид.

Используйте LR для обучения простых, но очень “крепких” классификаторов.
Полезная ссылка:
sklearn.linear_model.LogisticRegression
Вводный гайд:
Логистическая регрессия | классификация
Какой параметр в HTML позволит открывать ссылки в новом окне браузера

target="_top" - 1
👍 1%
target="_parent" - 4
👍 3%
target="_blank" - 131
👍👍👍👍👍👍👍👍 92%
target="_self" - 7
👍 5%
👥 143 человека уже проголосовало.
⬆️ Правильный ответ ⬆️

target="_blank"
​​Книга «Карьера программиста» основана на опыте практического участия автора во множестве собеседований, проводимых лучшими компаниями. Это квинтэссенция сотен интервью со множеством кандидатов, результат ответов на тысячи вопросов, задаваемых кандидатами и интервьюерами в ведущих мировых корпорациях. Из тысяч возможных задач и вопросов в книгу были отобраны 189 наиболее интересных и значимых.

Шестое издание этого мирового бестселлера поможет вам наилучшим образом подготовиться к собеседованию при приеме на работу программистом или руководителем в крупную IT-организацию или перспективный стартап. Основную часть книги составляют ответы на технические вопросы и задания, которые обычно получают соискатели на собеседовании в таких компаниях, как Google, Microsoft, Apple, Amazon и других. Рассмотрены типичные ошибки, которые допускают кандидаты, а также эффективные методики поготовки к собеседованию. Используя материал этой книги, вы с легкостью подготовитесь к устройству на работу в Google, Microsoft или любую другую ведущую IT-компанию.
Вокенизация — новый прорыв в области здравого смысла ИИ?
Вокенизация — новый метод на основе неконтролируемого обучения, который позволяет масштабировать современные небольшие визуально-языковые наборы данных, подобные MS COCO, до размеров английской Википедии, то есть миллиардов записей.
В сущности гигантские языковые модели учатся видеть мир.
Как и зачем включают искусственный интеллект в веб-разработку

Ведущие гиганты технологической индустрии используют технологию искусственного интеллекта несколькими способами. Такие компании, как Amazon, Microsoft, Facebook, Google и Apple, активно осваивают эту технологию.
​​SVM (Метод опорных векторов)

SVM – линейная модель, такая как линейная/логистическая регрессия. Разница в том, что она имеет margin-based функцию потерь. Вы можете оптимизировать функцию потерь, используя методы оптимизации, например, L-BFGS или SGD.
Одна уникальная вещь, которую могут выполнять SVM – это изучение классификаторов классов.
SVM может использоваться для обучения классификаторов (даже регрессоров).
Полезная ссылка:
sklearn.svm.SVC
Вводные гайды:
Машина опорных векторов
sklearn.linear_model.SGDClassifier
Философия Java

Java нельзя понять, взглянув на него только как на коллекцию некоторых характеристик, - необходимо понять задачи этого языка как частные задачи программирования в целом.
Эта книга - о проблемах программирования: почему они стали проблемами, и какой подход использует Java в их решении. Поэтому обсуждаемые в каждой главе черты языка неразрывно связаны с тем, как они используются для решения определенных задач.
Эта книга, выдержавшая в оригинале не одно переиздание, за глубокое и поистине философское изложение тонкостей языка считается одним из лучших пособий для программирующих на Java.
Грандиозное судилище по факту злоупотребления искусственным интеллектом крупнейшими компаниями.


Google, Deepmind, Alphabet, Facebook, Tesla, Nearalink, Сергей Брин, Ларри Пейдж, Марк Цукерберг, Илон Маск, Сандар Пичаи, PR Newswire и John Does.

Это самый значительный и важный судебный процесс 21 века, и он оказывает влияние на весь мир. Генеральный директор и учредители Марк Цукерберг, Илон Маск, Сергей Брин, Ларри Пейдж и Сандар Пичаи также названы ответчиками вместе со своими компаниями.
Машинный перевод статьи, источник указан внизу. Судьбу ответчиков вы можете проследить самостостоятельно.

КРАТКИЕ ФАКТЫ

Угроза человечеству с помощью неправомерного использования искусственного интеллекта, соучастия и помощи в физическом геноциде внутри Китая путем передачи технологий искусственного интеллекта, участия в культурном геноциде человечества и управления и программирования человеческой расы с помощью социальной инженерии с помощью кодирования ИИ и алгоритмической обработки биометрических данных ИИ.
Это фаза 1 первого судебного процесса. Мы открыты для поддержки на глобальном уровне. У нас есть сеть, состоящая из тысяч человек по всему миру и десятков тысяч в Китае, которые являются свидетелями и пострадали в Китае из-за технологий и передачи данных ответчиками. Ниже приведены краткие сведения о соответствии федеральным делам, извлеченные из официального документа, поданного в Сан-Диего , Калифорния. Чтобы узнать подробности о финансовых, личных и корректирующих поведенческих требованиях, вы можете получить доступ к делу в базе данных федерального суда.
​​Нейронные сети прямого распространения (Feed Forward Neural Networks)
В основном, это многоуровневые классификаторы логистической регрессии. Многие слои весов разделены нелинейностями (sigmoid, tanh, relu + softmax и cool new selu). Также они называются многослойными перцептронами. FFNN могут быть использованы для классификации и “обучения без учителя” в качестве автоэнкодеров.
FFNN можно использовать для обучения классификатора или извлечения функций в качестве автоэнкодеров.
Полезные ссылки:
sklearn.neural_network.MLPClassifier
sklearn.neural_network.MLPRegressor
Вводные гайды:
FFNN
Автоэнкодеры
​​Свёрточные нейронные сети

Практически все современные достижения в области машинного обучения были достигнуты с помощью свёрточных нейронных сетей.
Они используются для классификации изображений, обнаружения объектов или даже сегментации изображений. Изобретенные Яном Лекуном в начале 90-х годов, сети имеют сверточные слои, которые действуют как иерархические экстракторы объектов.
Вы можете использовать их для работы с текстом (и даже для работы с графикой).

Полезные ссылки:
Интерактивная система обучения GPU c глубоким обучением
TorchCV: библиотека видения PyTorch имитирует ChainerCV
ChainerCV: библиотека для глубокого обучения и компьютерного зрения
Документация Keras
Вводные гайды:
CNN для визуального распознавания
Гайд для начинающих по CNN
​​Регуляризация (Regularization)

При создании аналитических моделей следует избегать двух крайностей — недообучения (underfitting) и переобучения (overfitting), В первом случае алгоритм делает поспешные выводы, во втором строит функцию слишком близко к исходным данным.
Истина лежит посередине, и достичь ее помогает регуляризация.
Для этого к целевой функции добавляются весовые коэффициенты. Они не позволяют функции «отвлекаться» на избыточные данные, обеспечивая нужный результат.

Недообучение, оптимальный результат, переобучение.
​​Ковариантная матрица (Covariance Matrix)
Бивариантный анализ позволяет изучать взаимосвязи между парами переменных. Ковариантность, которая применяется в такой работе, помогает определить линейное направление изменений в таких моделях. Позитивная ковариантность означает, что увеличение или уменьшение одной переменной приводит к симметричному изменению другой. Отрицательная ковариантность свидетельствует об обратном изменении — увеличение одного параметра уменьшает второй, и наоборот.
Определяя значение ковариантности, мы получаем показатель корреляции, который лежит в пределах от -1 до 1. Он объединяет в себе величину и направление линейной взаимосвязи двух переменных.
​​Рекуррентные нейронные сети (RNNs)
RNNs моделируют последовательности, применяя один и тот же набор весов рекурсивно к состоянию агрегатора в момент времени t и вход в момент времени t. Чистые RNN редко используются сейчас, но его аналоги, например, LSTM и GRU являются самыми современными в большинстве задач моделирования последовательности.
LSTM, который используется вместо простого плотного слоя в чистой RNN.
Используйте RNN для любой задачи классификации текста, машинного перевода, моделирования языка.
Полезные ссылки:
Модели и примеры, созданные с помощью TensorFlow
Бенчмарк текстовой классификации в PyTorch
Open-Source система перевода
Вводные гайды:
Глубокое обучение для обработки языка от Stanford
Статьи по RNN
Понимание LSTM
Условные случайные поля (CRFs)
Они используются для моделирования последовательности, как RNN, и могут использоваться в сочетании с RNN. Они также могут быть использованы в других задачах структурированных прогнозирования, например, в сегментации изображения. CRF моделирует каждый элемент последовательности (допустим, предложение), таким образом, что соседи влияют на метку компонента в последовательности, а не на все метки, независимые друг от друга.
Используйте CRF для связки последовательностей (в тексте, изображении, временном ряду, ДНК и т. д.).
Полезная ссылка:
sklearn-crfsuite
Вводные гайды:
Введение в условные случайные поля
YouTube плейлист по условным случайным полям
​​Если вы думали, что современные медицинские открытия совершаются только учеными-супергероями, то вот интересный факт: специалисты по Data Science тоже в этом замешаны.

Аналитики работают с большим массивом данных и просто творят чудеса. Помогают делать прогнозы развития болезней и хирургических рисков во время операций, находить связь между видами рака и комбинацией генов, выявлять риск побочных эффектов от лекарств. И это далеко не все.

Хотите окунуться в мир исследований? Тогда записывайтесь на факультет «Data Science в медицине» GeekBrains. Узнаете, как работать с научными данными и использовать машинное обучение и нейросети для решения сложных задач.

Кстати, на факультете помогают с трудоустройством. А еще специалисты по Data Science весьма неплохо зарабатывают.

Изучите новую специальность и станьте аналитиком-супергероем → https://geekbrains.ru/link/scdgRg
​​«Эмоциональный искусственный интеллект»
Искусственный интеллект, традиционно призванный решать «рациональные» задачи, в последние годы обретает способности, присущие только человеку, а именно — распознавание и синтез эмоций и социального поведения. Для чего машинам эмоции? Как научить роботов воспринимать социальные сигналы и корректно на них реагировать? Сможет ли компьютер чувствовать людей лучше, чем это делаем мы сами? Все эти вопросы изучает область Affective Computing - как при помощи методов компьютерного зрения, машинного обучения и анализа естественного языка можно извлекать разнообразную информацию о человеке. Появившись более 20 лет назад, сегодня это направление включает исследователей со всего мира: лаборатории, создающие эмоциональный искусственный интеллект, есть в крупнейших университетах (MIT, Cambridge и др.) и корпорациях (Microsoft, Apple, Amazon). Поговорим о том, куда движется индустрия эмоционального искусственного интеллекта, какие прогнозы ее развития, какие препятствия стоят на пути внедрения технологий, и рассмотрим практические кейсы, которые есть уже сегодня.
Источник: www.youtube.com
Деревья принятия решений и случайные леса

Один из самых распространённых алгоритмов машинного обучения. Используется в статистике и анализе данных для прогнозных моделей. Структура представляет собой “листья” и “ветки”. На “ветках” дерева решения записаны атрибуты, от которых зависит целевая функция, в “листьях” записаны значения целевой функции, а в остальных узлах – атрибуты, по которым различаются случаи.
Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение. Цель состоит в том, чтобы создать модель, которая предсказывает значение целевой переменной на основе нескольких входных переменных.
Полезные ссылки:
sklearn.ensemble.RandomForestClassifier
sklearn.ensemble.GradientBoostingClassifier
Документация XGBoost
Документация CatBoost