NEW BOT Телеграм, страница

Data Science | Machinelearning [ru]

Метод k-средних
#algorithms
Всеми любимый неконтролируемый алгоритм кластеризации. Учитывая набор данных в виде векторов, мы можем создавать кластеры точек на основе расстояний между ними. Это один из алгоритмов машинного обучения, который последовательно перемещает центры кластеров, а затем группирует точки с каждым центром кластера. Входные данные – количество кластеров, которые должны быть созданы, и количество итераций.

Полезная ссылка:
sklearn.cluster.KMeans
Вводные гайды:
Видео по кластеризации
Введение в кластеризацию

1.28K viewsedited 16:54

👍 8 👎

Data Science | Machinelearning [ru]

Игорь Ашманов: появление мыслящих роботов невозможно не только в ближайшем будущем, но вообще никогда

ПРИЗРАК ФУТУРИЗМА
Небывалое развитие IT-технологий последних лет создает ощущение, что вот-вот искусственный интеллект, описанный фантастами, станет реальностью. О том, куда может зайти прогресс, мы беседуем с разработчиком виртуальных собеседников-инфов, директором компании «Ашманов и партнеры» Игорем Ашмановым.
— Игорь, сейчас много говорят о так называемых искусственных нейронных сетях, на основе которых будут созданы боты, обладающие полноценным искусственным интеллектом. Как вы это прокомментируете?
— Давайте начнем с определения понятия «искусственный интеллект» (ИИ). В принципе само это словосочетание представляет собой искаженный перевод английского термина artificial intelligence, «искусственное понимание». Ученые под ИИ подразумевают не умение думать, а умение распознавать и адекватно реагировать. В случае виртуальных собеседников (инфов) — адекватно отвечать. Например, интернет-поисковик, выполняющий запросы пользователя,— классический пример ИИ. В сознании же жертв голливудских фильмов ИИ представляется неким андроидом, способным самостоятельно мыслить и осознавать себя. И именно на жертв подобной подмены понятий рассчитаны всякие шаманские спекуляции на терминах вроде «искусственная нейронная сеть». В данном случае это просто один из методов хранения и обработки данных, и «нейроны» здесь не подразумевают никакой связи с биологией. И какими бы мощными ни становились компьютеры и программное обеспечение, все равно робот никогда не сможет не только чувствовать, как человек, но и самостоятельно мыслить. А теории о том, что на каком-то этапе критическая масса железа и ПО будет превышена и тогда в компьютере заведется некий интеллект,— чистое шаманство. На мой взгляд, появление мыслящих роботов невозможно не только в ближайшем будущем, но вообще никогда. В каком-то смысле это уже философско-религиозный вопрос: мозг как физическое сочетание тканей рождает сознание или нематериальное сознание использует мозг, равно как руки и ноги? Если верно первое, то теоретически можно создать искусственным путем стопроцентный аналог мозга, на который снизойдет сознание. Но лично я в это не верю.
— Возможно ли, что по мере развития технологий будут созданы виртуальные собеседники — пусть не мыслящие самостоятельно, но по разговору практически неотличимые от людей?
— А это вполне возможно. Можно будет считать, что ИИ создан (в научном, а не шаманском понимании), когда человек не сможет по разговору отличить сетевого инфа от живого собеседника. Этот барьер называется тестом Тьюринга. И пока не создан виртуальный собеседник, способный его пройти. Другое дело, что тестируют инфов эксперты — во-первых, готовые, что их собеседник окажется виртуальным, а во-вторых, обладающие навыками выведения инфов на чистую воду. Для обычных же пользователей соцсетей тест Тьюринга уже можно считать пройденным: на уровне общения в сети хорошо проработанные инфы остаются нераспознанными. Только надо понимать, что инф не общается, а лишь имитирует общение. Например, когда вы не знаете, что сказать, то для поддержания разговора произносите какую-нибудь проходную фразу, некий энкод (двусмысленное высказывание, основанное на использовании речевых клише.— «Деньги»), который заставляет собеседника сменить тему. Инфы поступают точно так же. В них заложено ядро разумных микродиалогов вполне человеческого уровня и построен коммуникативный алгоритм постоянного сведения разговора к этому ядру. Только и всего.

Источник: www.kommersant.ru

1.28K viewsedited 07:00

👍 8 👎 6

Data Science | Machinelearning [ru]

This media is not supported in your browser

VIEW IN TELEGRAM

Функции потерь (Loss Functions)
Для большинства именно с этого начинается знакомство с Data Science — функции потерь помогают создавать рекомендательные и прогнозные системы, определять тенденции в массивах данных.
Допустим, у вас есть модель линейной регрессии, которой вы предлагаете исходные данные. Полученный результат вы сравниваете с образцом, чтобы определить, как далеко от реальности он лежит. Эта информация помогает вам оптимизировать функцию прогнозирования.
Как же подсчитать эту разницу? Для этого вы представляете эти данные в виде двух векторов и применяете к ним функцию потерь. Например, пусть ожидаемый прогноз — это вектор P, а ваши результаты — вектор E. Тогда P-E — это разница между данными, а длина этого третьего вектора и представляет собой величину ошибки.

1.32K views16:00

👍 15 👎

Data Science | Machinelearning [ru]

Логистическая регрессия

Логистическая регрессия ограничена линейной регрессией с нелинейностью (в основном используется сигмоидальная функция или tanh) после применения весов, следовательно, ограничение выходов приближено к + / - классам (что равно 1 и 0 в случае сигмоида). Функции кросс-энтропийной потери оптимизированы с использованием метода градиентного спуска.
Примечание для начинающих: логистическая регрессия используется для классификации, а не регрессии. В целом, она схожа с однослойной нейронной сетью. Обучается с использованием методов оптимизации, таких как градиентный спуск или L-BFGS. NLP-разработчики часто используют её, называя “классификацией методом максимальной энтропии”.

На рисунку изображен сигмоид.

Используйте LR для обучения простых, но очень “крепких” классификаторов.
Полезная ссылка:
sklearn.linear_model.LogisticRegression
Вводный гайд:
Логистическая регрессия | классификация

1.41K views07:00

👍 11 👎

Data Science | Machinelearning [ru]

Какой параметр в HTML позволит открывать ссылки в новом окне браузера

target="_top" - 1
👍 1%
target="_parent" - 4
👍 3%
target="_blank" - 131
👍👍👍👍👍👍👍👍 92%
target="_self" - 7
👍 5%
👥 143 человека уже проголосовало.

1.28K viewsedited 15:59

target="_top" - 1

target="_parent" - 4

target="_blank" - 131

target="_self" - 7

Data Science | Machinelearning [ru]

⬆️ Правильный ответ ⬆️

target="_blank"

1.27K views18:00

🤘 18 👎 5

Data Science | Machinelearning [ru]

Книга «Карьера программиста» основана на опыте практического участия автора во множестве собеседований, проводимых лучшими компаниями. Это квинтэссенция сотен интервью со множеством кандидатов, результат ответов на тысячи вопросов, задаваемых кандидатами и интервьюерами в ведущих мировых корпорациях. Из тысяч возможных задач и вопросов в книгу были отобраны 189 наиболее интересных и значимых.

Шестое издание этого мирового бестселлера поможет вам наилучшим образом подготовиться к собеседованию при приеме на работу программистом или руководителем в крупную IT-организацию или перспективный стартап. Основную часть книги составляют ответы на технические вопросы и задания, которые обычно получают соискатели на собеседовании в таких компаниях, как Google, Microsoft, Apple, Amazon и других. Рассмотрены типичные ошибки, которые допускают кандидаты, а также эффективные методики поготовки к собеседованию. Используя материал этой книги, вы с легкостью подготовитесь к устройству на работу в Google, Microsoft или любую другую ведущую IT-компанию.

1.39K views07:00

Скачать

👍 5 👎 2

Data Science | Machinelearning [ru]

Вокенизация — новый прорыв в области здравого смысла ИИ?
Вокенизация — новый метод на основе неконтролируемого обучения, который позволяет масштабировать современные небольшие визуально-языковые наборы данных, подобные MS COCO, до размеров английской Википедии, то есть миллиардов записей.
В сущности гигантские языковые модели учатся видеть мир.

1.32K views16:00

Подробно...

👍 5 👎

Data Science | Machinelearning [ru]

Как и зачем включают искусственный интеллект в веб-разработку

Ведущие гиганты технологической индустрии используют технологию искусственного интеллекта несколькими способами. Такие компании, как Amazon, Microsoft, Facebook, Google и Apple, активно осваивают эту технологию.

1.33K views07:00

Подробно

👍 4 👎

Data Science | Machinelearning [ru]

SVM (Метод опорных векторов)

SVM – линейная модель, такая как линейная/логистическая регрессия. Разница в том, что она имеет margin-based функцию потерь. Вы можете оптимизировать функцию потерь, используя методы оптимизации, например, L-BFGS или SGD.
Одна уникальная вещь, которую могут выполнять SVM – это изучение классификаторов классов.
SVM может использоваться для обучения классификаторов (даже регрессоров).
Полезная ссылка:
sklearn.svm.SVC
Вводные гайды:
Машина опорных векторов
sklearn.linear_model.SGDClassifier

1.37K views16:00

👍 8 👎 1

Data Science | Machinelearning [ru]

Философия Java

Java нельзя понять, взглянув на него только как на коллекцию некоторых характеристик, - необходимо понять задачи этого языка как частные задачи программирования в целом.
Эта книга - о проблемах программирования: почему они стали проблемами, и какой подход использует Java в их решении. Поэтому обсуждаемые в каждой главе черты языка неразрывно связаны с тем, как они используются для решения определенных задач.
Эта книга, выдержавшая в оригинале не одно переиздание, за глубокое и поистине философское изложение тонкостей языка считается одним из лучших пособий для программирующих на Java.

1.38K views07:00

👍 8 👎 2

Скачать

Data Science | Machinelearning [ru]

Грандиозное судилище по факту злоупотребления искусственным интеллектом крупнейшими компаниями.

Google, Deepmind, Alphabet, Facebook, Tesla, Nearalink, Сергей Брин, Ларри Пейдж, Марк Цукерберг, Илон Маск, Сандар Пичаи, PR Newswire и John Does.

Это самый значительный и важный судебный процесс 21 века, и он оказывает влияние на весь мир. Генеральный директор и учредители Марк Цукерберг, Илон Маск, Сергей Брин, Ларри Пейдж и Сандар Пичаи также названы ответчиками вместе со своими компаниями.
Машинный перевод статьи, источник указан внизу. Судьбу ответчиков вы можете проследить самостостоятельно.

КРАТКИЕ ФАКТЫ

Угроза человечеству с помощью неправомерного использования искусственного интеллекта, соучастия и помощи в физическом геноциде внутри Китая путем передачи технологий искусственного интеллекта, участия в культурном геноциде человечества и управления и программирования человеческой расы с помощью социальной инженерии с помощью кодирования ИИ и алгоритмической обработки биометрических данных ИИ.
Это фаза 1 первого судебного процесса. Мы открыты для поддержки на глобальном уровне. У нас есть сеть, состоящая из тысяч человек по всему миру и десятков тысяч в Китае, которые являются свидетелями и пострадали в Китае из-за технологий и передачи данных ответчиками. Ниже приведены краткие сведения о соответствии федеральным делам, извлеченные из официального документа, поданного в Сан-Диего , Калифорния. Чтобы узнать подробности о финансовых, личных и корректирующих поведенческих требованиях, вы можете получить доступ к делу в базе данных федерального суда.

1.53K views16:01

Читать продолжение

👍 8 👎 7

Data Science | Machinelearning [ru]

Нейронные сети прямого распространения (Feed Forward Neural Networks)
В основном, это многоуровневые классификаторы логистической регрессии. Многие слои весов разделены нелинейностями (sigmoid, tanh, relu + softmax и cool new selu). Также они называются многослойными перцептронами. FFNN могут быть использованы для классификации и “обучения без учителя” в качестве автоэнкодеров.
FFNN можно использовать для обучения классификатора или извлечения функций в качестве автоэнкодеров.
Полезные ссылки:
sklearn.neural_network.MLPClassifier
sklearn.neural_network.MLPRegressor
Вводные гайды:
FFNN
Автоэнкодеры

1.52K views07:00

👍 8 👎

Data Science | Machinelearning [ru]

Свёрточные нейронные сети

Практически все современные достижения в области машинного обучения были достигнуты с помощью свёрточных нейронных сетей.
Они используются для классификации изображений, обнаружения объектов или даже сегментации изображений. Изобретенные Яном Лекуном в начале 90-х годов, сети имеют сверточные слои, которые действуют как иерархические экстракторы объектов.
Вы можете использовать их для работы с текстом (и даже для работы с графикой).

Полезные ссылки:
Интерактивная система обучения GPU c глубоким обучением
TorchCV: библиотека видения PyTorch имитирует ChainerCV
ChainerCV: библиотека для глубокого обучения и компьютерного зрения
Документация Keras
Вводные гайды:
CNN для визуального распознавания
Гайд для начинающих по CNN

1.58K viewsedited 16:00

👍 10 👎

Data Science | Machinelearning [ru]

Регуляризация (Regularization)

При создании аналитических моделей следует избегать двух крайностей — недообучения (underfitting) и переобучения (overfitting), В первом случае алгоритм делает поспешные выводы, во втором строит функцию слишком близко к исходным данным.
Истина лежит посередине, и достичь ее помогает регуляризация.
Для этого к целевой функции добавляются весовые коэффициенты. Они не позволяют функции «отвлекаться» на избыточные данные, обеспечивая нужный результат.

Недообучение, оптимальный результат, переобучение.

1.42K viewsedited 07:00

👍 14 👎 2

Data Science | Machinelearning [ru]

Ковариантная матрица (Covariance Matrix)
Бивариантный анализ позволяет изучать взаимосвязи между парами переменных. Ковариантность, которая применяется в такой работе, помогает определить линейное направление изменений в таких моделях. Позитивная ковариантность означает, что увеличение или уменьшение одной переменной приводит к симметричному изменению другой. Отрицательная ковариантность свидетельствует об обратном изменении — увеличение одного параметра уменьшает второй, и наоборот.
Определяя значение ковариантности, мы получаем показатель корреляции, который лежит в пределах от -1 до 1. Он объединяет в себе величину и направление линейной взаимосвязи двух переменных.

1.42K views07:00

👍 17 👎 2

Data Science | Machinelearning [ru]

Рекуррентные нейронные сети (RNNs)
RNNs моделируют последовательности, применяя один и тот же набор весов рекурсивно к состоянию агрегатора в момент времени t и вход в момент времени t. Чистые RNN редко используются сейчас, но его аналоги, например, LSTM и GRU являются самыми современными в большинстве задач моделирования последовательности.
LSTM, который используется вместо простого плотного слоя в чистой RNN.
Используйте RNN для любой задачи классификации текста, машинного перевода, моделирования языка.
Полезные ссылки:
Модели и примеры, созданные с помощью TensorFlow
Бенчмарк текстовой классификации в PyTorch
Open-Source система перевода
Вводные гайды:
Глубокое обучение для обработки языка от Stanford
Статьи по RNN
Понимание LSTM

1.45K views16:00

Data Science | Machinelearning [ru]

Условные случайные поля (CRFs)
Они используются для моделирования последовательности, как RNN, и могут использоваться в сочетании с RNN. Они также могут быть использованы в других задачах структурированных прогнозирования, например, в сегментации изображения. CRF моделирует каждый элемент последовательности (допустим, предложение), таким образом, что соседи влияют на метку компонента в последовательности, а не на все метки, независимые друг от друга.
Используйте CRF для связки последовательностей (в тексте, изображении, временном ряду, ДНК и т. д.).
Полезная ссылка:
sklearn-crfsuite
Вводные гайды:
Введение в условные случайные поля
YouTube плейлист по условным случайным полям

1.37K views07:01

👍 2 👎

Data Science | Machinelearning [ru]

Если вы думали, что современные медицинские открытия совершаются только учеными-супергероями, то вот интересный факт: специалисты по Data Science тоже в этом замешаны.

Аналитики работают с большим массивом данных и просто творят чудеса. Помогают делать прогнозы развития болезней и хирургических рисков во время операций, находить связь между видами рака и комбинацией генов, выявлять риск побочных эффектов от лекарств. И это далеко не все.

Хотите окунуться в мир исследований? Тогда записывайтесь на факультет «Data Science в медицине» GeekBrains. Узнаете, как работать с научными данными и использовать машинное обучение и нейросети для решения сложных задач.

Кстати, на факультете помогают с трудоустройством. А еще специалисты по Data Science весьма неплохо зарабатывают.

Изучите новую специальность и станьте аналитиком-супергероем → https://geekbrains.ru/link/scdgRg

1.36K views13:53

Записаться!

Data Science | Machinelearning [ru]

«Эмоциональный искусственный интеллект»
Искусственный интеллект, традиционно призванный решать «рациональные» задачи, в последние годы обретает способности, присущие только человеку, а именно — распознавание и синтез эмоций и социального поведения. Для чего машинам эмоции? Как научить роботов воспринимать социальные сигналы и корректно на них реагировать? Сможет ли компьютер чувствовать людей лучше, чем это делаем мы сами? Все эти вопросы изучает область Affective Computing - как при помощи методов компьютерного зрения, машинного обучения и анализа естественного языка можно извлекать разнообразную информацию о человеке. Появившись более 20 лет назад, сегодня это направление включает исследователей со всего мира: лаборатории, создающие эмоциональный искусственный интеллект, есть в крупнейших университетах (MIT, Cambridge и др.) и корпорациях (Microsoft, Apple, Amazon). Поговорим о том, куда движется индустрия эмоционального искусственного интеллекта, какие прогнозы ее развития, какие препятствия стоят на пути внедрения технологий, и рассмотрим практические кейсы, которые есть уже сегодня.
Источник: www.youtube.com

1.39K views07:00

Посмотреть

👍 4 👎 1

Data Science | Machinelearning [ru]

Деревья принятия решений и случайные леса

Один из самых распространённых алгоритмов машинного обучения. Используется в статистике и анализе данных для прогнозных моделей. Структура представляет собой “листья” и “ветки”. На “ветках” дерева решения записаны атрибуты, от которых зависит целевая функция, в “листьях” записаны значения целевой функции, а в остальных узлах – атрибуты, по которым различаются случаи.
Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение. Цель состоит в том, чтобы создать модель, которая предсказывает значение целевой переменной на основе нескольких входных переменных.
Полезные ссылки:
sklearn.ensemble.RandomForestClassifier
sklearn.ensemble.GradientBoostingClassifier
Документация XGBoost
Документация CatBoost

1.41K views16:18

👍 6 👎

About

Blog

Apps

Platform