Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
631 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Экосистема Hadoop
#Hadoop

Обзор: Apache Hadoop — это платформа с открытым исходным кодом, предназначенная для облегчения взаимодействия с большими данными. Однако для тех, кто не знаком с этой технологией, возникает вопрос: что такое большие данные? Большие данные — это термин, присваиваемый наборам данных, которые не могут быть эффективно обработаны с помощью традиционной методологии, такой как RDBMS. Hadoop занял свое место в отраслях и компаниях, которым необходимо работать с большими наборами данных, которые являются чувствительными и требуют эффективной обработки. Hadoop — это структура, которая позволяет обрабатывать большие наборы данных, которые находятся в форме кластеров. Будучи основой, Hadoop состоит из нескольких модулей, которые поддерживаются большой экосистемой технологий.
Искусственный интеллект снимает маски с омона
Никто не останется безнаказанным.
Белорусский художник и разработчик игр Андрей Максимов опубликовал видео, как нейросеть устанавливает силовиков на фотографиях и «срывает с них маски». Видео было опубликовано в Youtube.
«Все ваши лица будут возвращены на фото и видео ваших противозаконных действий, сколько бы носков вы ни наматывали себе на голову», — заявил автор видео.
«У вас есть последняя возможность уйти», — говорит Максимов на видео.
За неполный день видео набрало более 265 тысяч просмотров в YouTube.
Скала | Сопоставление с образцом
#Scala

Сопоставление с образцом — это способ проверки заданной последовательности токенов на наличие определенного образца. Это наиболее широко используемая функция в Scala. Это метод проверки значения по шаблону.
Здесь вместо ключевого слова используется ключевое слово « match ». «Match» всегда определяется в корневом классе Scala, чтобы сделать его доступным для всех объектов. Это может содержать последовательность альтернатив. Каждая альтернатива будет начинаться с ключевого слова case . Каждый оператор case содержит шаблон и одно или несколько выражений, которые оцениваются, если указанный шаблон соответствует. Чтобы отделить шаблон от выражений, используется символ стрелки (=>) .
Модуль datetime
#Python

Модуль datetime предоставляет классы для обработки времени и даты разными способами. Поддерживается и стандартный способ представления времени, однако больший упор сделан на простоту манипулирования датой, временем и их частями.
Анонимная функция в Go Language
#GO

Язык Go предоставляет специальную функцию, известную как анонимная функция. Анонимная функция — это функция, которая не содержит никакого имени. Это полезно, когда вы хотите создать встроенную функцию. В языке Go анонимная функция может образовывать замыкание. Анонимная функция также известна как  литерал функции .
Котлин пока петля
#Kotlin
В программировании цикл используется для многократного выполнения определенного блока кода, пока не будет выполнено определенное условие. Если вам нужно распечатать счет от 1 до 100, то вы должны написать оператор печати 100 раз. Но с помощью цикла вы можете сэкономить время и вам нужно написать только две строки.
Три самых редких явления на планете:

1. Девушки в сфере IT.
2. Блог девушки про IT.
3. Интересный блог девушки про IT.

Программистка — это авторский блог девушки с 7-летним стажем программирования. 

Она в простых словах рассказывает даже самые сложные вещи и создаёт полезный контент как для новичков, которые с компьютером на «вы», так и для опытных прогеров.

👾 Вэлкомt.me/programmistkas
Модуль bisect
#Python

Модуль bisect - обеспечивает поддержку списка в отсортированном порядке с помощью алгоритма деления пополам.
Набор функций:
bisect.insort(list, elem), он же bisect.insort_right(list, elem) - вставка элемента в отсортированный список, при этом elem располагается как можно правее (все элементы, равные ему, остаются слева).
Изучение языков программирования – отличная пища для Вашего ума. Особенно, если это Javanoscript или php. Осваивайте инструменты веб-разработки и получайте новые знания с каналом @drbrain4web.

Каждый день:

1. актуальные статьи,
2. тренды,
3. примеры кода,
4. интересные задачи.

Front & Back. Ждем Вас на канале @drbrain4web
Карта Уменьшить в Hadoop
#Hadoop

Одним из трех компонентов Hadoop является Map Reduce. Первый компонент Hadoop — распределенная файловая система Hadoop (HDFS) — отвечает за хранение файла. Второй компонент, Map Reduce, отвечает за обработку файла.

Предположим, есть файл слов, содержащий текст. Давайте sample.txt этот файл как sample.txt . Обратите внимание, что мы используем Hadoop для работы с большими файлами, но для простоты объяснения здесь мы берем текстовый файл в качестве примера. Итак, давайте предположим, что этот файл sample.txt содержит несколько строк в виде текста. Содержание файла выглядит следующим образом:
Скала | Функции — Основы
#Scala

Функция представляет собой набор операторов, которые выполняют определенную задачу. Можно разделить код на отдельные функции, помня, что каждая функция должна выполнять определенную задачу. Функции используются для помещения некоторых общих и повторяющихся задач в одну функцию, поэтому вместо того, чтобы снова и снова писать один и тот же код для разных входных данных, мы можем просто вызвать функцию. Scala считается функциональным языком программирования, поэтому они играют важную роль. Это облегчает отладку и изменение кода. Функции Scala являются первоклассными значениями .
Kotlin Do-while цикл
#Kotlin


Как и в Java, цикл do- while является оператором потока управления, который выполняет блок кода по крайней мере один раз без проверки условия, а затем многократно выполняет блок или нет, он полностью зависит от логического условия в конце do-while блок. Это контрастирует с в то время цикла , потому что в то время как цикл выполняется блок только тогда , когда условие становится истинным , но делать-то время цикл выполняет код , а затем выражение или испытание условие вычисляется.
Разница между ключевым словом var и оператором короткого объявления в Golang
#GO

Переменная — это место хранения или заполнитель, используемый для хранения значения. Это позволяет нам манипулировать и извлекать хранимую информацию. Есть два способа объявить переменные на Голанах:

Использование ключевого слова var
Использование оператора короткого объявления ( : = )
​​Ok, google-шпион

Разработчик сервиса разведки утечек DLBI Ашот Оганесян поведал журналистам о том, что голосовые помощники в круглосуточном режиме осуществляют прослушку пространства в ожидании будущих команд от пользователя. Большинство приложений передают полученные в результате «шпионажа» данные на серверы разработчиков, где они могут храниться без срока давности.
Ни для кого не секрет, что голосовые помощники не только реагируют на команды, но и прослушивают разговоры. Разработчики объясняют этот факт ошибками системы: помощники реагируют на ключевые слова, похожие на часто вводимые запросы. Но это еще пол беды.
Кроме того, голосовые помощники собирают данные об операционной системе гаджета. По словам Огнесяна, рядовой пользователь ОС не может предугадать алгоритм действия такого «помощника». Например, если помощник интегрирован с системой домовой сигнализации, то ему вполне по силам без ведома хозяина оставить дом без охраны или отключить отопление.
«Нераспознанные голосовым помощником записи изучают специалисты, которые участвуют в разработке нейросетей. Однако такие люди не состоят в штате компаний и не придерживаются правил конфиденциальности. Как итог — некоторые звуковые файлы могут оказаться в сети», — заявил эксперт корреспондентам издания «Prime».
Разработкой голосовых ассистентов сегодня занимаются все ведущие IT-компании: у Google — это Google-ассистент, у Microsoft — Cortana, у Apple — Siry, у Amazon — Alexa. В нашей стране разработкой голосовых ассистентов занимаются в Yandex (Алиса) и Mail (Маруся).
This media is not supported in your browser
VIEW IN TELEGRAM
Голова кругом от новостей?

Подписывайся на самый старый телеграм-канал о финтехе и современном банкинге - @Finveritas.

Ежедневный авторский дайджест актуальных новостей и инфо-поводов из мира финансовых технологий, банков, стартапов и инвестиций.

📌 Да, не забудь добавить канал в закреп!
Модуль collections
#Python

Модуль collections - предоставляет специализированные типы данных, на основе словарей, кортежей, множеств, списков.
Первым рассматриваемым типом данных будет Counter.
collections.Counter
collections.Counter - вид словаря, который позволяет нам считать количество неизменяемых объектов (в большинстве случаев, строк). Пример:
Введение в распределенную файловую систему Hadoop (HDFS)
#Hadoop


С ростом скорости передачи данных размер данных легко превышает предел хранения машины. Решением было бы хранить данные в сети компьютеров. Такие файловые системы называются распределенными файловыми системами . Поскольку данные хранятся в сети, возникают все сложности сети.
Вот тут и вступает Hadoop. Он предоставляет одну из самых надежных файловых систем. HDFS (распределенная файловая система Hadoop) — это уникальный дизайн, который обеспечивает хранение чрезвычайно больших файлов с потоковой схемой доступа к данным и работает на обычном оборудовании . Давайте разработаем условия:
Понимающие алгоритмы: зачем бизнесу нужны боты с распознаванием эмоций

Голосовые боты уже достигли той стадии эволюции, когда им недостаточно распознавать и воспроизводить речь. Они должны обладать не только базовым, но и эмоциональным интеллектом. Современные сервисы считывают настроение пользователя, чтобы предлагать ему более релевантные услуги, оценивать его психологическое состояние и оказывать поддержку. 
Основатель компании Twin Игорь Калинин рассказывает, какие эмоции уже можно распознать с высокой точностью и как бизнесу извлечь максимум из технологии даже на раннем этапе ее развития.
Понимающие алгоритмы: зачем бизнесу нужны боты с распознаванием эмоций
Модуль array. Массивы в python
#Python

Модуль array определяет массивы в python. Массивы очень похожи на списки, но с ограничением на тип данных и размер каждого элемента.
Размер и тип элемента в массиве определяется при его создании и может принимать следующие значения:
​​СОСТОЯЛАСЬ ПРЕЗЕНТАЦИЯ “ТЕХНОЛОГИИ ЧИМЭГЭ”
Особенность меропрятия в том, что презентацию проводила технология, а не человек.
2020.09.30. В Улаанбаатаре состоялась официальная презентация "Технологии Чимэгэ”, которая распознав звук монгольского языка, переводит речь или аудиофайлы в текст и наоборот через любое цифровое устройство и даже в интернете. Особенность меропрятия в том, что презентацию проводила технология, а не человек. Для этого был создан первый в Монголии робот-ведущий с искусственным интеллектом - “Марал Эй Ай”. На церемонии было объявлено, что будут официально представлены три новых продукта, созданных с использованием этой технологии: Чимэгэ бичээч, Чимэгэ уншигч, Чимэгэ гар. «Чимэгэ бичээч» — это система для преобразования речи в текст, которую можно использовать в двух форматах: веб-сайт и мобильное приложение. В зависимости от качества записи человеку потребуется в среднем 3-8 часов, чтобы напечатать и прослушать часовую запись, а «Чимэгэ бичээч» способна перевести одну часовую речь в текст за 4 минуты и сэкономит в 75–120 раз больше времени, обеспечивает 97-процентную точность записи, а также установлена программа редактирования текста, что позволяет снизить затраты, облегчить труд и повысить производительность. Технологию Чимэгэ можно использовать в госучреждении для составления какого-либо протокола, в медицине для записи истории болезни или написания рецептов лекарств, в журналистике, в сфере образования и во многом другом.
Наследование в Скала
#Scala

Наследование является важной опорой ООП (объектно-ориентированного программирования). Это механизм в Scala, с помощью которого одному классу разрешается наследовать свойства (поля и методы) другого класса.
Важная терминология:

Суперкласс : класс, свойства которого наследуются, называется суперклассом (или базовым классом, или родительским классом).
Подкласс : Класс, который наследует другой класс, известен как подкласс (или производный класс, расширенный класс или дочерний класс). Подкласс может добавлять свои собственные поля и методы в дополнение к полям и методам суперкласса.