Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20K subscribers
634 photos
40 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Всем привет, сегодня @stalkerser составил подборку интересных каналов:

♦️ @prorobots - Этот канал с интересными новостями роботизации, с упором на тренды в этой области. То есть не просто новости, а их анализ, прогнозы, мнения.
♦️ @devsp - Статьи на тему data science, machine learning, big data, python, математика
♦️ @ChanelPC - Обзоры и тестирования компьютерных комплектующих, периферийных и сетевых устройств, игровых аксессуаров
♦️ @dotnetreview Авторские статьи по технологиям, языкам программирования и инструментам для разработки в .Net.
This media is not supported in your browser
VIEW IN TELEGRAM
Искусственный интеллект на квадратном миллиметре
Мозг человека часто сравнивают с компьютером. Машины давно обогнали содержимое черепной коробки в скорости и объеме вычислений, однако ученые продолжают вдохновляться устройством природного «компьютера» при создании машин нового поколения. Разработчиков прельщает принцип передачи информации между синапсами мозга — соединениями между нейронами. Синапс получает сигналы от одного нейрона в виде ионов и отправляет сигнал дальше по цепочке следующему нейрону.
This media is not supported in your browser
VIEW IN TELEGRAM
Сайт для разработчиков Stack Overflow провел опрос среди 65 тыс. пользователей, чтобы узнать, какие языки программирования они знают и сколько им за это платят. С помощью этих данных Stack Overflow составил рейтинг, расположив языки по возрастанию дохода, который они приносят программистам. При подсчете результатов была использована медианная зарплата за 50 рабочих недель, иностранную валюту конвертировали в доллары.
This media is not supported in your browser
VIEW IN TELEGRAM
В Москве внедрили проект по голосовому заполнению медицинских карт
Группа компаний ЦРТ оптимизировала работу врачей лучевой диагностики с помощью интеллектуальных речевых технологий.
В основе решения — Voice2med, продукт на основе искусственного интеллекта, созданный группой ЦРТ с нуля, который позволяет надиктовывать информацию для карт, протоколов и других документов через гарнитуру. Система распознает все медицинские термины и выражения.
Как утверждают в компании, качество распознавания речи составляет 97–98%. Во время проведения исследования врач надиктовывает текст, который в режиме реального времени распознается и автоматически переносится в состав заполняемого протокола в медицинскую информационную систему. Решение позволяет избавить медицинских работников от рутинных записей и сфокусироваться на исследовании.
This media is not supported in your browser
VIEW IN TELEGRAM
Пакеты Julia для машинного обучения 
Несмотря на то, что Julia все еще относительно молодой и перспективный язык, иногда он просто поражает своей не по годам зрелой экосистемой. Особенно это проявляется в области машинного обучения. И, хотя другие языки, например Python, могут похвастаться большим количеством проработанных пакетов для этой области, соответствующие им аналоги в Julia определенно заслуживают нашего внимания. Во-первых, эти пакеты написаны на быстром высокоуровневом языке, а во-вторых, они представляют собой великолепные компоненты ПО, простые в применении, независимо от того, из какого языка они используются.
Всем привет!

В четверг 25 июня мы зовем всех, кого интересуют вопросы современных производительных баз данных, присоединиться к нашему Online Databases Meetup #2.

В программе:

📌 Как собрать гибридное облако на Kubernetes, которое может заменить DBaaS, покажет Пётр Зайцев, CEO Percona.

📌 Как Mail.ru Cloud Storage эволюционировало за свои три года в проде и вместе с ним менялся подход к Tarantool в его архитектуре, поделится Владимир Перепелица, архитектор Mail.ru Cloud Solutions

📌 Всё о JSON в Postgres расскажет Олег Бартунов, сооснователь, CEO Postgres Professional.

📌 А стратегическими планами по развитию Postgres Pro поделится Иван Панченко, сооснователь, заместитель генерального директора Postgres Professional.

Приходите, будет интересно!

Для участия необходимо зарегистрироваться:
https://corp.mail.ru/ru/press/events/databases-2/
This media is not supported in your browser
VIEW IN TELEGRAM
Российские программисты воплотили метафору в реальность.
Выражение «говорящая голова» встречалось почти каждому. В различных контекстах оно может обозначать разные понятия: от телевизионного ведущего-новостника, диктора за столом в студии, до человека, который особо не раздумывает над смыслом произносимых тезисов. Российские программисты решили, что этому выражению пора обрести реальное воплощение.
This media is not supported in your browser
VIEW IN TELEGRAM
Мишустин предложил снизить страховые взносы и налог на прибыль IT-компаниям
Премьер-министр России Михаил Мишустин предложил снизить страховые взносы для IT-компаний с 14% до 7,6%, а также уменьшить налог на прибыль с 20% до 3%. Об этом сообщают «Ведомости» со ссылкой на двух федеральных чиновников.
Помимо этого, предлагается отменить НДС с рекламы разработок и софта на зарубежных цифровых площадках. Также разработчики софта могут получить возможность на получение специальных субсидий.
Все изменения будут бессрочными.
This media is not supported in your browser
VIEW IN TELEGRAM
Распространенные задачи, которые решают алгоритмы машинного обучения

Распределение клиентских заявок по рейтингу
Оценка входящих запросов на e-commerce площадках для их распределения по степени маржинальности и вероятности сделки. Качественные запросы (“горячие лиды”) направляются отделу продаж для обработки в первую очередь. На них можно назначить самых опытных менеджеров, чтобы повысить вероятность заключения сделки. Для некоторых ритейл-проектов конверсия повышается в 2 раза, если связаться с автором качественной заявки в течение первых 15 минут после заполнения.
This media is not supported in your browser
VIEW IN TELEGRAM
Как Голливуд использует машинное обучение и другие современные технологии
В декабре прошлого года трейлер фильма «Мстители: Финал» установил мировой рекорд популярности, набрав за первые 24 часа 289 млн просмотров в интернете. При создании фильма Marvel Studios активно использовала искусственный интеллект, чтобы скопировать лица людей и воспроизвести их в цифровых персонажах. Искусственный интеллект в Голливуде применяется прежде всего для создания визуальных эффектов. Но это далеко не единственная сфера его использования в современной киноиндустрии. Вот четыре компании, использующие ИИ, чтобы ее изменить.
Российская команда сделала мощные беруши Veer с рекордным уровнем шумоизоляции и плавной регулировкой громкости. Беруши подойдут тем, кто устал от шума в офисе и дома и хочет работать в тишине, а не под музыку.

Чтобы снизить уровень шума, просто покрутите кольцо на корпусе. Беруши не нужно вынимать каждый раз, когда вы собираетесь поговорить.

В мае стартовали предзаказы долгожданных беруш Veer на официальном сайте https://clck.ru/P3cbL

Первая эксклюзивная партия будет изготовлена из прочного и лёгкого авиационного алюминия в июле 2020 года.

Оплатите сейчас и получите свои беруши со скидкой🤘🏻
This media is not supported in your browser
VIEW IN TELEGRAM
Что такое тензор?
Концепция тензора была создана в 1900 году двумя итальянскими математиками — Туллио Леви-Чивита и Грегорио Риччи-Курбастро, и, как это обычно бывает, основывалась на работе других математиков. Страница в Википедии о тензорах начинается так:
Те́нзор (от лат. tensus, «напряжённый») — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п.
Звучит непросто для тех, кто не разбирается в математике!
К счастью, на практике намного проще понять, что такое тензор и как он используется в науке о данных.
This media is not supported in your browser
VIEW IN TELEGRAM
HITACHI ПРИМЕНЯЕТ ИИ ДЛЯ УСКОРЕНИЯ СХД НА ФОНЕ СНИЖЕНИЯ СТОИМОСТИ ВЛАДЕНИЯ

Анонсированные в апреле новейшие накопители Hitachi интересны как с технической стороны, так и с точки зрения экономики, а также рынка в целом. Hitachi представила Virtual Storage Platform E990 — all-flash-систему хранения данных, обладающую поддержкой NVMe, активно использующую AI и, что важно, позиционированную на наиболее массовый «средний класс» корпоративного рынка. 
На первый взгляд, новинка совершенно ординарная, но при ближайшем рассмотрении оказывается весьма интересной. Что любопытного в новом решении и почему оно интересно в контексте рынка?
This media is not supported in your browser
VIEW IN TELEGRAM
Применение искусственного интеллекта и 5G на заводе ABB в Финляндии
Завод промышленных приводов ABB в Хельсинки является главным центром, где ведутся научно-исследовательские работы и опытно-конструкторские разработки приводов бизнес-направления «Электропривод».
Пилотный проект ABB, Atostek и Telia создает основу для новых промышленных решений с использованием беспроводных технологий. Это первое промышленное применение искусственного интеллекта и 5G на производстве промышленных приводов на заводе ABB в Хельсинки.
В рамках данного проекта создана автоматизированная система обеспечения качества производства в реальном времени с использованием 5G. Изображение с камер мгновенно передается в облако, где осуществляется анализ изображения и проверка состояния изделия.
Такие технологии представляют собой бесценный ресурс для оценки качества и снижения брака в тех областях, где необходимо выполнять одинаковые операции сотни раз в день – как, например, при сборке конденсаторного блока промышленного привода.
This media is not supported in your browser
VIEW IN TELEGRAM
«Ростелеком» совместно с Devar запускает платформу для детей с использованием нейросетевых технологий, искусственного интеллекта (AI) и дополненной реальности (AR). С помощью мобильного приложения дети смогут выполнять обучающие задания, рассказали в пресс-службе «Ростелекома».
Курсы разделены на три возрастные категории:
для детей 3-5 лет;
для детей 6-8 лет;
для детей 9-14 лет.
Учебные задания представлены в игровой форме. У ребёнка есть виртуальные помощники со своей историей и характером. Приложение помогает тренировать память, внимание, проводить опыты и эксперименты при помощи домашних предметов, снимать видео и фото для своих помощников в AR.
Помимо учебных материалов на платформе представлен развлекательный контент — музыкальная библиотека, в июле к ней добавятся детские книги, аудиокниги и различные видео. Подборка курсов формируется по интересам ребёнка.
This media is not supported in your browser
VIEW IN TELEGRAM
Интересные концепции: утиная типизация
Слышали фразу: "Если что-то выглядит как утка, плавает как утка и крякает как утка, то, вероятно, это утка"? Эта поговорка характеризует утиную типизацию == утипизацию
This media is not supported in your browser
VIEW IN TELEGRAM
1. Не надо решать вопросы безопасности в последнюю очередь
2. Все приложения разные, у них разные нужды, поэтому выбирать технологии для разработки нужно, исходя из особенностей проектов. Не стоит ориентироваться на популярность технологий или поддаваться давлению руководства
3. Микросервисы нужны далеко не всем
4. Стандартизированное окружение разработки — это хорошо
5. Реализация подсистемы, отвечающей за настройки приложения, может оказаться более сложной, чем кажется на первый взгляд. Поэтому такие вещи нужно как следует планировать
6. Зависимости стоит использовать тогда, когда они нужны
7. Не нужно писать абстракции до тех пор, пока в этом не возникнет реальная необходимость
8. Иногда свой проект стоит «сжигать» и «возрождать из пепла»
9. Ваша компания — это не Google
10. Не стоит формировать свои взгляды на разработку ПО, полностью полагаясь на идеи случайных людей из интернета
This media is not supported in your browser
VIEW IN TELEGRAM
Что такое ETL?
ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя:
извлечение данных из внешних источников;
их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели;
и загрузка их в хранилище данных.
С точки зрения процесса ETL, архитектуру хранилища данных можно представить в виде трёх компонентов:
источник данных: содержит структурированные данные в виде таблиц, совокупности таблиц или просто файла (данные в котором разделены символами-разделителями);
промежуточная область: содержит вспомогательные таблицы, создаваемые временно, и, исключительно для организации процесса выгрузки;
получатель данных: хранилище данных или база данных, в которую должны быть помещены извлечённые данные.
This media is not supported in your browser
VIEW IN TELEGRAM
Чек-лист для Data Science
➡️Наука о данных (Data Science) — не магия, а ваш бизнес никто не знает лучше вас. Помогайте специалисту инсайтами и информацией о бизнес-процессах, и результат не заставит себя ждать. Знание и понимание предметной области критически важно.
➡️Для анализа данных нужны данные. Лучше, если их много и они адекватные. Модель никогда не будет лучше данных, которые ей дадут. Не забывайте принцип «Мусор на входе — мусор на выходе».
➡️Исследователь данных не волшебник, способный спрогнозировать все изъяны нашего мира. Не рассчитывайте на это.
➡️Всегда перед постановкой ML-задачи (машинное обучение) спрашивайте себя: принесет ли решение значимую выгоду? Если нет, не беритесь за нее.
➡️Определите, к какому результату должна стремиться модель, какие ошибки критичны, а какими можно пренебречь.
➡️Если вы знаете конечную цель оптимизации (деньги, время), сосредоточьтесь сразу на ней. Так весь процесс будет проще и прозрачнее.
​​Основным понятием в Spark является RDD (Resilient Distributed Dataset), который представляет собой Dataset, над которым можно делать преобразования двух типов (и, соответственно, вся работа с этими структурами заключается в последовательности этих двух действий).