This media is not supported in your browser
VIEW IN TELEGRAM
Распространенные задачи, которые решают алгоритмы машинного обучения
Распределение клиентских заявок по рейтингу
Оценка входящих запросов на e-commerce площадках для их распределения по степени маржинальности и вероятности сделки. Качественные запросы (“горячие лиды”) направляются отделу продаж для обработки в первую очередь. На них можно назначить самых опытных менеджеров, чтобы повысить вероятность заключения сделки. Для некоторых ритейл-проектов конверсия повышается в 2 раза, если связаться с автором качественной заявки в течение первых 15 минут после заполнения.
Распределение клиентских заявок по рейтингу
Оценка входящих запросов на e-commerce площадках для их распределения по степени маржинальности и вероятности сделки. Качественные запросы (“горячие лиды”) направляются отделу продаж для обработки в первую очередь. На них можно назначить самых опытных менеджеров, чтобы повысить вероятность заключения сделки. Для некоторых ритейл-проектов конверсия повышается в 2 раза, если связаться с автором качественной заявки в течение первых 15 минут после заполнения.
This media is not supported in your browser
VIEW IN TELEGRAM
Как Голливуд использует машинное обучение и другие современные технологии
В декабре прошлого года трейлер фильма «Мстители: Финал» установил мировой рекорд популярности, набрав за первые 24 часа 289 млн просмотров в интернете. При создании фильма Marvel Studios активно использовала искусственный интеллект, чтобы скопировать лица людей и воспроизвести их в цифровых персонажах. Искусственный интеллект в Голливуде применяется прежде всего для создания визуальных эффектов. Но это далеко не единственная сфера его использования в современной киноиндустрии. Вот четыре компании, использующие ИИ, чтобы ее изменить.
В декабре прошлого года трейлер фильма «Мстители: Финал» установил мировой рекорд популярности, набрав за первые 24 часа 289 млн просмотров в интернете. При создании фильма Marvel Studios активно использовала искусственный интеллект, чтобы скопировать лица людей и воспроизвести их в цифровых персонажах. Искусственный интеллект в Голливуде применяется прежде всего для создания визуальных эффектов. Но это далеко не единственная сфера его использования в современной киноиндустрии. Вот четыре компании, использующие ИИ, чтобы ее изменить.
Российская команда сделала мощные беруши Veer с рекордным уровнем шумоизоляции и плавной регулировкой громкости. Беруши подойдут тем, кто устал от шума в офисе и дома и хочет работать в тишине, а не под музыку.
Чтобы снизить уровень шума, просто покрутите кольцо на корпусе. Беруши не нужно вынимать каждый раз, когда вы собираетесь поговорить.
В мае стартовали предзаказы долгожданных беруш Veer на официальном сайте https://clck.ru/P3cbL
Первая эксклюзивная партия будет изготовлена из прочного и лёгкого авиационного алюминия в июле 2020 года.
Оплатите сейчас и получите свои беруши со скидкой🤘🏻
Чтобы снизить уровень шума, просто покрутите кольцо на корпусе. Беруши не нужно вынимать каждый раз, когда вы собираетесь поговорить.
В мае стартовали предзаказы долгожданных беруш Veer на официальном сайте https://clck.ru/P3cbL
Первая эксклюзивная партия будет изготовлена из прочного и лёгкого авиационного алюминия в июле 2020 года.
Оплатите сейчас и получите свои беруши со скидкой🤘🏻
This media is not supported in your browser
VIEW IN TELEGRAM
Что такое тензор?
Концепция тензора была создана в 1900 году двумя итальянскими математиками — Туллио Леви-Чивита и Грегорио Риччи-Курбастро, и, как это обычно бывает, основывалась на работе других математиков. Страница в Википедии о тензорах начинается так:
Те́нзор (от лат. tensus, «напряжённый») — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п.
Звучит непросто для тех, кто не разбирается в математике!
К счастью, на практике намного проще понять, что такое тензор и как он используется в науке о данных.
Концепция тензора была создана в 1900 году двумя итальянскими математиками — Туллио Леви-Чивита и Грегорио Риччи-Курбастро, и, как это обычно бывает, основывалась на работе других математиков. Страница в Википедии о тензорах начинается так:
Те́нзор (от лат. tensus, «напряжённый») — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п.
Звучит непросто для тех, кто не разбирается в математике!
К счастью, на практике намного проще понять, что такое тензор и как он используется в науке о данных.
This media is not supported in your browser
VIEW IN TELEGRAM
HITACHI ПРИМЕНЯЕТ ИИ ДЛЯ УСКОРЕНИЯ СХД НА ФОНЕ СНИЖЕНИЯ СТОИМОСТИ ВЛАДЕНИЯ
Анонсированные в апреле новейшие накопители Hitachi интересны как с технической стороны, так и с точки зрения экономики, а также рынка в целом. Hitachi представила Virtual Storage Platform E990 — all-flash-систему хранения данных, обладающую поддержкой NVMe, активно использующую AI и, что важно, позиционированную на наиболее массовый «средний класс» корпоративного рынка.
На первый взгляд, новинка совершенно ординарная, но при ближайшем рассмотрении оказывается весьма интересной. Что любопытного в новом решении и почему оно интересно в контексте рынка?
Анонсированные в апреле новейшие накопители Hitachi интересны как с технической стороны, так и с точки зрения экономики, а также рынка в целом. Hitachi представила Virtual Storage Platform E990 — all-flash-систему хранения данных, обладающую поддержкой NVMe, активно использующую AI и, что важно, позиционированную на наиболее массовый «средний класс» корпоративного рынка.
На первый взгляд, новинка совершенно ординарная, но при ближайшем рассмотрении оказывается весьма интересной. Что любопытного в новом решении и почему оно интересно в контексте рынка?
This media is not supported in your browser
VIEW IN TELEGRAM
Применение искусственного интеллекта и 5G на заводе ABB в Финляндии
Завод промышленных приводов ABB в Хельсинки является главным центром, где ведутся научно-исследовательские работы и опытно-конструкторские разработки приводов бизнес-направления «Электропривод».
Пилотный проект ABB, Atostek и Telia создает основу для новых промышленных решений с использованием беспроводных технологий. Это первое промышленное применение искусственного интеллекта и 5G на производстве промышленных приводов на заводе ABB в Хельсинки.
В рамках данного проекта создана автоматизированная система обеспечения качества производства в реальном времени с использованием 5G. Изображение с камер мгновенно передается в облако, где осуществляется анализ изображения и проверка состояния изделия.
Такие технологии представляют собой бесценный ресурс для оценки качества и снижения брака в тех областях, где необходимо выполнять одинаковые операции сотни раз в день – как, например, при сборке конденсаторного блока промышленного привода.
Завод промышленных приводов ABB в Хельсинки является главным центром, где ведутся научно-исследовательские работы и опытно-конструкторские разработки приводов бизнес-направления «Электропривод».
Пилотный проект ABB, Atostek и Telia создает основу для новых промышленных решений с использованием беспроводных технологий. Это первое промышленное применение искусственного интеллекта и 5G на производстве промышленных приводов на заводе ABB в Хельсинки.
В рамках данного проекта создана автоматизированная система обеспечения качества производства в реальном времени с использованием 5G. Изображение с камер мгновенно передается в облако, где осуществляется анализ изображения и проверка состояния изделия.
Такие технологии представляют собой бесценный ресурс для оценки качества и снижения брака в тех областях, где необходимо выполнять одинаковые операции сотни раз в день – как, например, при сборке конденсаторного блока промышленного привода.
This media is not supported in your browser
VIEW IN TELEGRAM
«Ростелеком» совместно с Devar запускает платформу для детей с использованием нейросетевых технологий, искусственного интеллекта (AI) и дополненной реальности (AR). С помощью мобильного приложения дети смогут выполнять обучающие задания, рассказали в пресс-службе «Ростелекома».
Курсы разделены на три возрастные категории:
для детей 3-5 лет;
для детей 6-8 лет;
для детей 9-14 лет.
Учебные задания представлены в игровой форме. У ребёнка есть виртуальные помощники со своей историей и характером. Приложение помогает тренировать память, внимание, проводить опыты и эксперименты при помощи домашних предметов, снимать видео и фото для своих помощников в AR.
Помимо учебных материалов на платформе представлен развлекательный контент — музыкальная библиотека, в июле к ней добавятся детские книги, аудиокниги и различные видео. Подборка курсов формируется по интересам ребёнка.
Курсы разделены на три возрастные категории:
для детей 3-5 лет;
для детей 6-8 лет;
для детей 9-14 лет.
Учебные задания представлены в игровой форме. У ребёнка есть виртуальные помощники со своей историей и характером. Приложение помогает тренировать память, внимание, проводить опыты и эксперименты при помощи домашних предметов, снимать видео и фото для своих помощников в AR.
Помимо учебных материалов на платформе представлен развлекательный контент — музыкальная библиотека, в июле к ней добавятся детские книги, аудиокниги и различные видео. Подборка курсов формируется по интересам ребёнка.
This media is not supported in your browser
VIEW IN TELEGRAM
Интересные концепции: утиная типизация
Слышали фразу: "Если что-то выглядит как утка, плавает как утка и крякает как утка, то, вероятно, это утка"? Эта поговорка характеризует утиную типизацию == утипизацию
Слышали фразу: "Если что-то выглядит как утка, плавает как утка и крякает как утка, то, вероятно, это утка"? Эта поговорка характеризует утиную типизацию == утипизацию
This media is not supported in your browser
VIEW IN TELEGRAM
1. Не надо решать вопросы безопасности в последнюю очередь
2. Все приложения разные, у них разные нужды, поэтому выбирать технологии для разработки нужно, исходя из особенностей проектов. Не стоит ориентироваться на популярность технологий или поддаваться давлению руководства
3. Микросервисы нужны далеко не всем
4. Стандартизированное окружение разработки — это хорошо
5. Реализация подсистемы, отвечающей за настройки приложения, может оказаться более сложной, чем кажется на первый взгляд. Поэтому такие вещи нужно как следует планировать
6. Зависимости стоит использовать тогда, когда они нужны
7. Не нужно писать абстракции до тех пор, пока в этом не возникнет реальная необходимость
8. Иногда свой проект стоит «сжигать» и «возрождать из пепла»
9. Ваша компания — это не Google
10. Не стоит формировать свои взгляды на разработку ПО, полностью полагаясь на идеи случайных людей из интернета
2. Все приложения разные, у них разные нужды, поэтому выбирать технологии для разработки нужно, исходя из особенностей проектов. Не стоит ориентироваться на популярность технологий или поддаваться давлению руководства
3. Микросервисы нужны далеко не всем
4. Стандартизированное окружение разработки — это хорошо
5. Реализация подсистемы, отвечающей за настройки приложения, может оказаться более сложной, чем кажется на первый взгляд. Поэтому такие вещи нужно как следует планировать
6. Зависимости стоит использовать тогда, когда они нужны
7. Не нужно писать абстракции до тех пор, пока в этом не возникнет реальная необходимость
8. Иногда свой проект стоит «сжигать» и «возрождать из пепла»
9. Ваша компания — это не Google
10. Не стоит формировать свои взгляды на разработку ПО, полностью полагаясь на идеи случайных людей из интернета
This media is not supported in your browser
VIEW IN TELEGRAM
Что такое ETL?
ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя:
извлечение данных из внешних источников;
их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели;
и загрузка их в хранилище данных.
С точки зрения процесса ETL, архитектуру хранилища данных можно представить в виде трёх компонентов:
источник данных: содержит структурированные данные в виде таблиц, совокупности таблиц или просто файла (данные в котором разделены символами-разделителями);
промежуточная область: содержит вспомогательные таблицы, создаваемые временно, и, исключительно для организации процесса выгрузки;
получатель данных: хранилище данных или база данных, в которую должны быть помещены извлечённые данные.
ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя:
извлечение данных из внешних источников;
их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели;
и загрузка их в хранилище данных.
С точки зрения процесса ETL, архитектуру хранилища данных можно представить в виде трёх компонентов:
источник данных: содержит структурированные данные в виде таблиц, совокупности таблиц или просто файла (данные в котором разделены символами-разделителями);
промежуточная область: содержит вспомогательные таблицы, создаваемые временно, и, исключительно для организации процесса выгрузки;
получатель данных: хранилище данных или база данных, в которую должны быть помещены извлечённые данные.
This media is not supported in your browser
VIEW IN TELEGRAM
Чек-лист для Data Science
➡️Наука о данных (Data Science) — не магия, а ваш бизнес никто не знает лучше вас. Помогайте специалисту инсайтами и информацией о бизнес-процессах, и результат не заставит себя ждать. Знание и понимание предметной области критически важно.
➡️Для анализа данных нужны данные. Лучше, если их много и они адекватные. Модель никогда не будет лучше данных, которые ей дадут. Не забывайте принцип «Мусор на входе — мусор на выходе».
➡️Исследователь данных не волшебник, способный спрогнозировать все изъяны нашего мира. Не рассчитывайте на это.
➡️Всегда перед постановкой ML-задачи (машинное обучение) спрашивайте себя: принесет ли решение значимую выгоду? Если нет, не беритесь за нее.
➡️Определите, к какому результату должна стремиться модель, какие ошибки критичны, а какими можно пренебречь.
➡️Если вы знаете конечную цель оптимизации (деньги, время), сосредоточьтесь сразу на ней. Так весь процесс будет проще и прозрачнее.
➡️Наука о данных (Data Science) — не магия, а ваш бизнес никто не знает лучше вас. Помогайте специалисту инсайтами и информацией о бизнес-процессах, и результат не заставит себя ждать. Знание и понимание предметной области критически важно.
➡️Для анализа данных нужны данные. Лучше, если их много и они адекватные. Модель никогда не будет лучше данных, которые ей дадут. Не забывайте принцип «Мусор на входе — мусор на выходе».
➡️Исследователь данных не волшебник, способный спрогнозировать все изъяны нашего мира. Не рассчитывайте на это.
➡️Всегда перед постановкой ML-задачи (машинное обучение) спрашивайте себя: принесет ли решение значимую выгоду? Если нет, не беритесь за нее.
➡️Определите, к какому результату должна стремиться модель, какие ошибки критичны, а какими можно пренебречь.
➡️Если вы знаете конечную цель оптимизации (деньги, время), сосредоточьтесь сразу на ней. Так весь процесс будет проще и прозрачнее.
Основным понятием в Spark является RDD (Resilient Distributed Dataset), который представляет собой Dataset, над которым можно делать преобразования двух типов (и, соответственно, вся работа с этими структурами заключается в последовательности этих двух действий).
Tick Tok стремительно завоёвывает мир. Согласно данным Sensor Tower, это приложение для коротких видео было загружено более 2 миллиардов раз с App Store и Google Play. Что же за магия стоит за этим сенсационным приложением, вызывающим такое пристрастие со стороны пользователей? Не удивительно, что ответ кроется в рекомендательном движке на основе ML.
This media is not supported in your browser
VIEW IN TELEGRAM
Когда стоит использовать глубокое обучение
Глубокое обучение стоит использовать, когда:
более простые модели (логистическая регрессия) не дают требуемой верности;
требуется распознавать сложные паттерны в изображениях, NLP или звуковых данных;
размерность данных велика;
входные данные обладают временным измерением (последовательности).
Глубокое обучение стоит использовать, когда:
более простые модели (логистическая регрессия) не дают требуемой верности;
требуется распознавать сложные паттерны в изображениях, NLP или звуковых данных;
размерность данных велика;
входные данные обладают временным измерением (последовательности).
This media is not supported in your browser
VIEW IN TELEGRAM
Полезные инструменты: virtualenv + pip
Опыт показывает, что каждый проект обладает своими зависимостями (библиотеками), а если и одинаковыми, то версии не совпадают. Чтобы упростить запуск и настройку проекта разработчики пишут
Файл
Опыт показывает, что каждый проект обладает своими зависимостями (библиотеками), а если и одинаковыми, то версии не совпадают. Чтобы упростить запуск и настройку проекта разработчики пишут
INSTALL.md, README.md, make-файлы и что более важно - requirements.txt.Файл
requirements.txt - это правило хорошего тона для Python проектов. Файл содержит список необходимых библиотек для запуска с указанием версий:Наконец-то мы нашли этот канал!
Друзья, кто работает, учится или планирует начать заниматься программированием – welcome в Твой Программист.
🔥 Здесь есть всё, что нужно IT-специалисту: от статей до новостей, от обучения до юмора, от интерактива до просто полезных советов.
Автор собирает вокруг канала крутое коммьюнити, с которым познавать сферу будет ещё легче и интересней. Советуем подписаться 😌
Друзья, кто работает, учится или планирует начать заниматься программированием – welcome в Твой Программист.
🔥 Здесь есть всё, что нужно IT-специалисту: от статей до новостей, от обучения до юмора, от интерактива до просто полезных советов.
Автор собирает вокруг канала крутое коммьюнити, с которым познавать сферу будет ещё легче и интересней. Советуем подписаться 😌
This media is not supported in your browser
VIEW IN TELEGRAM
Почему ошибаются алгоритмы машинного обучения
Мы часто слышим о том, как очередной сложный алгоритм искусственного интеллекта начал ошибаться или стал следовать предрассудкам, которым машины не должны быть подвержены. Почему так происходит?
Из-за чего появляются эти ложные положительные и отрицательные ответы и так ли это важно? Для начала давайте определим три термина из Матрицы смешения: точность, возврат и правильность.
Мы часто слышим о том, как очередной сложный алгоритм искусственного интеллекта начал ошибаться или стал следовать предрассудкам, которым машины не должны быть подвержены. Почему так происходит?
Из-за чего появляются эти ложные положительные и отрицательные ответы и так ли это важно? Для начала давайте определим три термина из Матрицы смешения: точность, возврат и правильность.
Компьютерное зрение против нежелательного видеоконтента
Хотите узнать о практических кейсах применения computer vision и machine learning? Тогда подключайтесь к нашему онлайн-митапу МТС и КРОК 8 июля в 19:00.
Участие бесплатно, регистрация по ссылке https://bit.ly/2NMBd1R
Мы расскажем про:
- анализ выкладки товаров на витринах в салонах МТС;
- классификацию текстов узконаправленной тематики в условиях малого - количества данных;
- детектирование нежелательного контента в видеопотоке;
- калибровку камеры для адаптации существующих детекторов к различным условиям.
Хотите узнать о практических кейсах применения computer vision и machine learning? Тогда подключайтесь к нашему онлайн-митапу МТС и КРОК 8 июля в 19:00.
Участие бесплатно, регистрация по ссылке https://bit.ly/2NMBd1R
Мы расскажем про:
- анализ выкладки товаров на витринах в салонах МТС;
- классификацию текстов узконаправленной тематики в условиях малого - количества данных;
- детектирование нежелательного контента в видеопотоке;
- калибровку камеры для адаптации существующих детекторов к различным условиям.
This media is not supported in your browser
VIEW IN TELEGRAM
Vaex (eng)
Vaex — это высокопроизводительная библиотека Python для ленивых DataFrame’ов, работающих по алгоритму out-of-core (обработка данных во внешней памяти). Предназначена она для визуализации и изучения больших наборов данных. Vaex может вычислять базовую статистику для более чем миллиарда строк за одну секунду. Она поддерживает несколько визуализаций, тем самым позволяя интерактивное изучение больших данных.
Vaex — это высокопроизводительная библиотека Python для ленивых DataFrame’ов, работающих по алгоритму out-of-core (обработка данных во внешней памяти). Предназначена она для визуализации и изучения больших наборов данных. Vaex может вычислять базовую статистику для более чем миллиарда строк за одну секунду. Она поддерживает несколько визуализаций, тем самым позволяя интерактивное изучение больших данных.
This media is not supported in your browser
VIEW IN TELEGRAM
Vaex против Dask
Vaex не похож на сам Dask, но имеет сходства с его DataFrame’ами, которые создаются на основе DataFrame’ов Pandas. Это означает, что Dask наследует проблемы Pandas, например необходимость полной загрузки данных в RAM для их обработки. В Vaex же этой проблемы нет.
Vaex не создаёт копий DataFrame’ов, а значит может обрабатывать более крупные DataFrame’ы на машинах с меньшим количеством основной памяти.
И Vaex, и Dask используют ленивую обработку. Единственное отличие в том, что первый вычисляет поле при необходимости, а для второго нам нужно явно использовать функцию вычисления.
Для того, чтобы полноценно воспользоваться преимуществами Vaex, данные должны быть в формате HDF5 или Apache Arrow.
Vaex не похож на сам Dask, но имеет сходства с его DataFrame’ами, которые создаются на основе DataFrame’ов Pandas. Это означает, что Dask наследует проблемы Pandas, например необходимость полной загрузки данных в RAM для их обработки. В Vaex же этой проблемы нет.
Vaex не создаёт копий DataFrame’ов, а значит может обрабатывать более крупные DataFrame’ы на машинах с меньшим количеством основной памяти.
И Vaex, и Dask используют ленивую обработку. Единственное отличие в том, что первый вычисляет поле при необходимости, а для второго нам нужно явно использовать функцию вычисления.
Для того, чтобы полноценно воспользоваться преимуществами Vaex, данные должны быть в формате HDF5 или Apache Arrow.