Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
NBDT: интерпретируемые нейронные деревья решений
NBDT — это нейросетевая архитектура деревьев решений для задач классификации. Модель объединяет в себе интерпретируемость классического алгоритма дерева решений с качеством предсказаний современных нейросетей. Разработчики тестировали модель на задаче классификации изображений.
Вы Data Engineer и хотите оптимизировать работу с большими данными? Начните осваивать инструменты уже 4 февраля на демо-занятии «Spark Streaming». Вадим Заигрин познакомит вас со Spark Streaming и Structured Streaming, вместе вы изучите их особенности и напишете простое приложение обработки потоков.

Что такое демо-занятие? Это возможность попробовать онлайн-курс «Экосистема Hadoop, Spark, Hive» и познакомиться с преподавателем. Для регистрации пройдите вступительный тест https://otus.pw/ZrwG/
Big Data реанимируют плановую экономику?
Многие из нас когда-то думали, что идея плановой экономики в теории и на практике канула в Лету.

Большинство экономистов сегодня утверждают, что плановая экономика не работает, а последние 20 лет XX века на смену почти всем плановым экономикам пришли рыночные экономики.

Тем не менее с развитием новых технологий (облачные вычисления, большие объемы данных и искусственный интеллект) некоторые начинают верить, что мы можем снова вернуться к плановой экономике.

Джек Ма, один из самых известных предпринимателей Китая, основатель и председатель Alibaba Group, выразил оптимизм по поводу будущего восстановления плановой экономики.

"Последние 100 лет нам всем казалось, что рыночная экономика – отличное решение всех проблем. Однако последние 30 лет все больше людей отдают предпочтение плановой экономике", — заявил миллиардер.

Это такая великая романтическая мечта человечества – хотя она не раз проваливалась в реальности, – так что неудивительно, что она все еще привлекательна для представителей социальных элит, таких как Джек Ма.

С развитием технологий, все, кто занимаются централизованным планированием, могут получить больше данных и информации и проанализировать эти данные. Более того, в обозримом будущем эти навыки будут дополнительно усовершенствованы.

Ма считает, что плановая экономика – мечта, которая может стать реальностью. И все благодаря его компаниям Taobao и Alipay, работающим в сфере электронной коммерции и электронных платежей в Китае, а, значит дающим возможность собирать огромное количество данных о потребительском спросе. Для Джека Ма и других "технических социалистов" подобные данные могут стать краеугольным камнем плановой экономики.

Тем не менее, если мы более внимательно посмотрим на это, то поймем, что эти данные просто:

1. Данные, основанные на опыте прошлых сделок, которые нельзя использовать для прогнозирования потребительских предпочтений в будущем.

2. Данные, полученные с помощью опросов, которые не могут отражать реальные предпочтения клиентов.

В любом случае с ослепительными новыми технологиями все данные о реальном мире, которые можно якобы получить, не более чем красивый мираж.

Те, кто считают проблему социализма просто информационной проблемой, просто не в состоянии понять, что основная проблема социализма заключается в отсутствии роли цен в центрально-плановой экономике.

Роль цен в рыночной экономике основополагающая, так как цены являются незаменимым инструментом в экономических расчетах. Предприниматели могут рассчитать прибыль, изучив разнообразие рыночных цен в отношении производственных факторов и ожидаемых цен на конечные продукты. И исходя из этого организовать производство.

Поэтому, даже если у вас есть отличные данные, без этого механизма рыночных цен ни экономический расчет, ни эффективное распределение ресурсов невозможны. Поскольку рациональное планирование или распределение ресурсов требуют экономических расчетов, сами расчеты нуждаются в ценах, которые можно определить только на рынке в реальном мире обмена владельцами частной собственностью.

Плановая экономика требует государственного и коллективного контроля над ресурсами, поэтому при ней сложно рационально планировать работу современной экономической системы.

В результате теоретически плановая экономика неспособна определять цены, необходимые для экономического расчета.

Передовые технологии способны помочь Джеку Ма оптимизировать его стратегии на частных предприятиях в капиталистическом обществе.

Тем не менее в современной экономике пока нет доступных цен, на основе которых возможен экономический расчет, так что провал плановой экономики неизбежен.

Как пишет Джозеф Салерно в своем послесловии к "Экономическому расчету в социалистическом обществе": "В отсутствии возможности определения реальных цен на конкурсной основе все знания мира не дадут человеку возможности распределять производственные ресурсы экономически правильно в рамках общественного разделения труда".
Объектно-ориентированное программирование — это фундамент современных языков программирования, включая C++, Java, C#, Visual Basic, .NET, Ruby и Objective-C. Кроме того, объекты лежат в основе многих веб-технологий, например JavaScript, Python и PHP. Объектно-ориентированное программирование обеспечивает правильные методики проектирования, переносимость кода и его повторное использование, однако для того, чтобы все это полностью понять, необходимо изменить свое мышление.
Перед вами — первая книга о глубоком обучении, написанная на русском языке. Глубокие модели оказались ключом, который подходит ко всем замкам сразу: новые архитектуры и алгоритмы обучения, а также увеличившиеся вычислительные мощности и появившиеся огромные наборы данных привели к революционным прорывам в компьютерном зрении, распознавании речи, обработке естественного языка и многих других типично «человеческих» задачах машинного обучения. Эти захватывающие идеи, вся история и основные компоненты революции глубокого обучения, а также самые современные достижения этой области доступно и интересно изложены в книге. Максимум объяснений, минимум кода, серьезный материал о машинном обучении и увлекательное изложение — в этой уникальной работе замечательных российских ученых и интеллектуалов.
В России планируют создать интеллектуального помощника учителя
Интеллектуального помощника учителя, который будет проверять задачи учащихся, планируется создать в России. Об этом сообщили в понедельник ТАСС в пресс-службе "Платформы Национальной технологической инициативы" (НТИ).
"В части искусственного интеллекта развивается конкурс решений по распознаванию текстов, именно их семантической логики, который мы реализуем в рамках проекта "Про чтение". В 2021 году реализуется уже несколько "пилотов" в этом направлении с российскими школами и университетами, в первую очередь с российскими школами, по созданию именно интеллектуального помощника учителя, который будет проверять задачи учеников, как бы сокращая время автоматизированной проверки, давая возможность больше раскрыться творческому потенциалу учителя", - рассказали в пресс-службе.
Технологический конкурс "Про чтение" призван стимулировать развитие новых подходов в области машинного обучения, которые позволят создать искусственный интеллект, способный к глубокому пониманию смысла текста и анализу причинно-следственных связей по широкому набору тематик.
Национальная технологическая инициатива - долгосрочная программа по созданию новых рынков и обеспечению условий для технологического лидерства России к 2035 году. В рамках НТИ одобрены дорожные карты развития технологий по направлениям (рынкам) "Аэронет", "Автонет", "Маринет", "Нейронет". В числе сквозных технологий НТИ - искусственный интеллект, интернет вещей, большие данные, квантовые технологии, новые и портативные источники энергии, нейротехнологии. Задачи НТИ интегрированы в нацпроект "Наука".
Источник: tass.ru
Имеется таблица Women:
+-----+-----------+-------+
| Id | FirstName | Score |
+-----+-----------+-------+
| 1 | Gwyneth | 1000 |
| 3 | Jennifer | 800 |
| 4 | Paris | NULL |
| 5 | Misha | 3000 |
+-----+-----------+-------+
Сколько строк вернет запрос:
SELECT FirstName, Score FROM Women
WHERE Score >= ANY (SELECT Score FROM Women
WHERE FirstName='Megan');

0 - 51
👍👍👍👍👍👍👍👍 41%
1 - 5
👍👍 4%
2 - 2
👍 2%
3 - 8
👍👍 7%
4 - 8
👍👍 7%
5 - 8
👍👍 7%
Запрос содержит ошибку и не будет выполнен - 41
👍👍👍👍👍👍👍 33%
👥 123 человека уже проголосовало.
⬆️ Правильный ответ ⬆️
0
Справочник подготовлен профессиональными администраторами и опытными разработчиками, использующими различные диалекты SQL для поддержки сложных корпоративных приложений. Основная задача издания – служить кроссплатформенным руководством для тех, кто, не будучи экспертами, зани мается переносом кода (включая пользовательские приложения) между раз личными СУБД. Независимо от того, является ли читатель новичком в SQL или имеет значительный опыт его использования, он найдет много полезных сове тов и приемов в этой лаконичной и удобной для работы книге.
​​Бесплатный вебинар ««Разворачиваем приложение на Apache Spark в Kubernetes. Пошаговый рецепт»» от Mail.ru Cloud Solutions

Cовременный DevOps-подход к работе со Spark, связанный с использованием Kubernetes, позволяет решать задачи изоляции рабочих сред, гибкого управления ресурсами и масштабирования. Популярные материалы останавливаются на запуске тестового приложения в K8s. В своем вебинаре команда MCS идет дальше: даже начинающие научатся обрабатывать данные с помощью Spark в облаке. 

На вебинаре вы вместе со специалистами Mail.ru:
— Установите Kubernetes Operator for Apache Spark (Spark Operator);
— Запустите тестовый пример Spark-задачи/приложения;
— Соберете свой Docker-образ со Spark и кастомным приложением;
— Добавите необходимые библиотеки, креды для доступа к S3-хранилищу;
— Научитесь читать из S3 и записывать в него.

По итогам вебинара вы получите готовый репозиторий с инструкцией и сможете самостоятельно повторить все действия, которые будут продемонстрированы в рамках вебинара.

Мероприятие пройдет в четверг, 4 февраля, онлайн. 
Начало в 17:00 по Москве. 

👉 Регистрируйтесь: https://vk.cc/bXIm7V
#SQL
Дана таблица cars:
color
-----
blue
red
null
blue
Каким будет результат следующего запроса:
SELECT COUNT(DISTINCT color) FROM cars

red blue null - 6
👍👍 8%
3 - 20
👍👍👍👍 25%
2 - 47
👍👍👍👍👍👍👍👍 59%
211 - 6
👍👍 8%
👥 79 человек уже проголосовало.
⬆️ Правильный ответ ⬆️
2
DISTINCT учитывает колонки со значением null, но COUNT не учитывает
Чего ожидать от технологий в 2021 году?
Благодаря развитию облачных сервисов работа из дома (и вообще откуда угодно) станет обычным делом, а за нашим поведением будут следить умные устройства.
1. Рост популярности облаков
За последние годы с облачными сервисами научились работать даже те, кто изначально относился к ним скептически. Это закономерное последствие массового перехода на дистанционную работу и учёбу: всеобщая самоизоляция вызвала взрывной рост спроса на фоне коронавируса всплеск интереса к системам удалённого взаимодействия. В 2020 году спрос на российском облачном рынке на 70% превышал плановые показатели. При этом пользователи часто интересовались не отдельными услугами, а комплексными решениями.
Эксперты исследовательской компании IDC предрекают, что в 2021 году интерес к облачным сервисам продолжит расти. Кроме того, большинство компаний создадут механизмы, которые вдвое ускорят их переход на облачную инфраструктуру и приложения.
​​Будущее рядом — освой профессию Data Scientist

В настоящее время искусственный интеллект — это не фантазии американских сценаристов-выдумщиков. Это реальность, которая стремительно врывается в нашу жизнь. Но с одной поправкой. Незаменимый помощник Data Scientist — специалист по машинному обучению, который выбирает архитектуру и обучающие алгоритмы, для работы с этими данными.
 
И у тебя как раз есть шанс стать тем самым незаменимым специалистом благодаря курсу от Skillbox «Профессия Data Scientist». 

Тебе предстоит научиться очень многим интересным вещам: от программирования на Python и визуализации данных до программирования на R и применения нейронных сетей для решения реальных задач.

Начать обучение на курсе — ответственное решение, и лучше познакомиться с курсом еще до покупки. Поэтому Skillbox дарит доступ к первым двум модулям курса.

Вы познакомитесь с основами языка Python и его применением в анализе данных, научитесь пользоваться Jupyter Notebook — рабочим инструментом в области Data Scienсe. Регистрируйтесь по ссылке со скидкой: https://clc.am/68IT4A
#программирование
#алгоритмы
Выберите алгоритмы построения выпуклой оболочки.

Ответ предполагает несколько вариантов

Метод меток Форда-Фалкерсона - 5
👍👍👍 22%
Грэхема - 3
👍👍 13%
Штрасена
▫️ 0%
Обход по Джарвису - 15
👍👍👍👍👍👍👍👍 65%
👥 23 человека уже проголосовало.
⬆️ Правильный ответ ⬆️
Грэхема
Обход по Джарвису
Китайцы создали альтернативу Android и iOS на Ubuntu для смартфонов и планшетов
Импортозамещение в Китае активно реализуется. На днях была представлена мобильная операционная система JingOS, которая предназначена для планшетов. В ближайшее время разработчики планируют создать и версию для смартфонов, так что эта ОС — прямой конкурент (пока лишь для Китая) Android и iOS.
⭐️ Рекомендуем канал про московский ИT-рынок @ICT_Moscow

Авторы канала публикуют новости и материалы о разработках стартапов и компаний столицы, сопровождая их контактами ключевых лиц. Сейчас здесь также проходит опрос разработчиков решений в сфере искусственного интеллекта о реалиях и барьерах при реализации проектов.

Еще в канале публикуются мнения представителей индустрии по актуальным темам, вакансии из первых рук, свежие отраслевые исследования, эксклюзивные аналитические материалы, а каждое утро начинается с обзора главных ИT-новостей.

👉 Подписывайтесь чтобы следить за тем, что происходит с ИT в Москве: https://news.1rj.ru/str/ICT_Moscow
Группа ученых предложила создать ИИ для радикального продления жизни
Группа ученых в области искусственного интеллекта и практической медицины предложила план создания ИИ следующего поколения для существенного увеличения продолжительности жизни человека. План заключается в использовании методов глубокого обучения для исследования мельчайших биологических процессов и их взаимовлияния на здоровье пациентов. Авторы, в числе которых один из ключевых исследователей ИИ в мире, предлагают бизнесу заняться развитием новой отрасли знаний — медицины долгожительства.
В статье «Искусственный интеллект и медицина долголетия» авторы — Алекс Жаворонков, биофизик и основатель Deep Longivity, Эвелин Юдифь Бишоф, практикующий врач, специалист по героонкологии, ведущий специалист университетской клиники Базеля в Швейцарии, и Ли Кайфу, один из ведущих исследователей ИИ в мире, возглавлявший ИИ-подразделения в Apple, SGI, Microsoft и Google, — описали основы применения технологии глубокого обучения в изучении долголетия и возможностей продления срока жизни, которые открываются перед медициной и бизнесом.
«Искусственный интеллект обладает громадным потенциалом в терапии. Однако способность отслеживать и изучать мельчайшие изменения, которые совершаются в человеческом теле каждую секунду в течение жизни и у большого количества пациентов позволяет разработать новую отрасль медицины — медицину долгожительства», — заявила профессор Бишоф.
Традиционный подход медицины заключается в лечении заболеваний, однако, как показали исследования, даже полная победа над заболеваниями не даст серьезного увеличения средней продолжительности жизни. Так, полное уничтожение рака приведет в США к увеличению средней продолжительности жизни всего на 2,3 года среди новорожденных и на 1,3 года — в возрасте 65 лет. Полное искоренение гриппа и пневмонии продлит жизнь в среднем на 0,5 и 0,2 года, соответственно, пишет EurekAlert.
Эти цифры такие маленькие оттого, отмечают авторы, что существует множество биологических процессов и заболеваний, которые начинают сокращать продолжительность жизни в пожилом возрасте, так что уничтожение одной причины не дает значимого результата в общем итоге. Основная движущая сила большинства этих заболеваний и процессов — старение организма.
Старение — универсальное свойство всех живых организмов. Современные системы искусственного интеллекта достигли сверхчеловеческой точности в прогнозировании различных параметров и изучении закономерностей на основе множества типов данных. Обучившись предсказывать возраст по данным о долголетии, нейронные сети глубокого обучения способны раскрыть базовые биологические и физиологические процессы, которые проявляются у человека со временем в виде тесным образом взаимосвязанных патологий. Авторы инициативы намерены помочь созданию такого ИИ.
Результаты исследования ученых из США показали, что продолжительность жизни человека можно предсказать в юном возрасте, измерив объем генетических мутаций. Эту информацию в будущем можно использовать для определения тех, кто находится в группе риска, чтобы вовремя начать профилактические меры.
Pile: открытый датасет для обучения языковых моделей на 825 гигабайт
Pile — это датасет с разнообразными текстами на 825 гигабайт для обучения языковых моделей. Датасет состоит из 22 датасетов меньшего размера, которые объединили в один. Кроме датасета, создатели опубликовали бенчмарк для тестирования языковых моделей на качество моделирования.
Для какого из ключевых слов можно добавить строку "TABLE employees", чтобы запрос выполнился для таблицы employees?
SQL

SELECT - 5
👍👍 8%
ALTER - 6
👍👍 10%
INSERT INTO - 10
👍👍👍 16%
UPDATE - 4
👍👍 7%
DROP - 36
👍👍👍👍👍👍👍👍 59%
👥 61 человек уже проголосовал.