Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20K subscribers
621 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Состояние дел в области синтеза речи на конец мая 2021 года

Представляем вашему вниманию большой обзор научных публикаций о синтезе речи, вышедших до конца мая 2021 года. Если вы хотите иметь представление о состоянии дел в этой области, постарайтесь его не пропустить.

Читать...
​​В США по грин-карте, назад в Украину и снова в США. Украинский IT-специалист о непростых решениях и релокации

Среди эмигрантов, которые живут в США, популярна одна фраза: «Приехав в Штаты, ты сделал одну из самых больших ошибок в своей жизни. Но есть еще одна ошибка, побольше — уехать из США обратно»

Читать...
​​Семантика и технология Word2Vec

Сегодня поговорим о NLP-методах векторизации слов - Word Embeddings. Векторы слов лежат в основе многих систем обработки естественного языка и повсеместно используются в современном мире. Рассмотрим работу Word Embeddings на примере нейронной сети Word2Vec.

Читать...
​​⚡️Открыта регистрация на конкурсы-сателлиты Up Great ПРО//ЧТЕНИЕ
 
ПРО//ЗНАНИЯ — выбор наилучшего решения для автоматического распознавания типа ошибки.
 
ПРО//ОЦЕНКИ — выбор наилучшего решения для автоматического определения балла ЕГЭ за эссе или сочинение.
 
ПРО//ФАКТЫ — выбор наилучшего решения для автоматического выявления фактических ошибок в текстовых документах.
 
💸Призовой фонд для каждого сателлита — 1 000 000 рублей!
 
🤖Подать заявки можно до 3 декабря на сайте Технологических конкурсов Up Great: https://ai.upgreat.one/satellites/ 
 
Конкурсы-сателлиты — это отличная возможность попробовать свои силы для начинающих. А если вы или ваша команда уже работали над проектами по обработке естественного языка (NLP), то для вас проходит основной конкурс Up Great «Про//Чтение». Для участия в нем необходимо зарегистрироваться и пройти квалификацию до 6 ноября.
 
Удачи!
​​Инструменты для быстрого овладения наукой о данных

Наука о данных — очень популярная область, которая прельщает многих высокими доходами и возможностью работать на дому. Однако кто-то должен помочь вчерашнему выпускнику стать специалистом по обработке данных, причем незамедлительно. Имея за плечами более десяти лет академического и отраслевого опыта, автор может предложить быстрое решение, которое поможет всем претендентам достичь своей цели.

Читать...
Валентин Малых, эксперт конкурса ПРО//ЧТЕНИЕ, старший научный сотрудник в Huawei Noah's Ark lab, к.т.н.:

«В статье ученые обнаружили, что современные языковые модели (ЯМ), такие как GPT-3, с хорошим качеством могут предсказать активацию определенных зон мозга при чтении или прослушивании текстов. Этот результат можно интерпретировать, как то, что современные ЯМ уже сейчас во многом напоминают в своей работе работу нашего мозга, который занимается обработкой речи. Этот результат позволяет осторожно предположить, что ЯМ в недалеком будущем смогут качественно поддерживать диалог, то есть понимать, что человек хочет без большого количества уточняющих вопросов и вести в целом адекватный диалог. Пока же мы предлагаем вам применить эти ЯМ и их умение работать с текстами к задачам, которые сейчас под силу только человеку — к проверке школьных сочинений. Учитель, читая сочинение и отмечая ошибки, активно задействует зоны своего мозга, связанные с речью. Давайте вместе посмотрим, смогут ли языковые модели воспроизвести труд учителя. Может быть, в недалеком будущем, они смогут снять с учителей часть нагрузки. Попробуем приблизить будущее вместе!»

Подробнее о конкурсе ПРО//ЧТЕНИЕ.
​​Как мы собираем данные для аналитики с помощью Apache NiFi

Команда мониторинга и анализа данных биотехнологической компании BIOCAD расскаывает о том, как собирают данные для аналитики из практически всех сервисов компании и при этом вполне успешно справляются без полноценного дата-инженера. Пост будет интересен как тем, кто только ищет решение для ETL, так и тем, кто уже работает с NiFi или другими аналогичными инструментами и желает познакомиться с наработками, идеями и опытом других команд.

Читать...
Data Science что это? Стоит ли начинать учить Data Science?

Что такое Data Science? Насколько перспективна наука о данных и стоит ли ее изучать и как это можно понять? Разберем также практические примеры, чтобы понять, что это за направление, а также обсудим зарплаты и какими навыками должен обладать специалист по анализу данных.

Смотреть видео...
​​Хакатон для специалистов по DataScience 

Московский кредитный банк (МКБ) организует онлайн хакатон для молодых специалистов по Data Science. Если ты студент последних курсов или начинающий специалист прояви свои таланты и выиграй отличные призы! 

В хакатоне предстоит построить модель оценки вероятности выполнения обязательств клиентом банка при получении банковской гарантии.

Победителей определяем в два этапа:
1️⃣ Шортлист из 10 решений будет выбран по специальной метрике с помощью искусственного интеллекта. 
2️⃣ Тройку победителей выберет комиссия экспертов. 

Что на кону:
MacBook Pro, MacBook Air или Iphone. 
Предложение присоединиться к уникальному коллективу одного из крупнейших банков России. 

Старт Хакатона – 01.11.2021
Финиш – 31.11.2021 

Подробности: ➡️ по этой ссылке 

Попробуй свои силы в новом хакатоне от МКБ!
​​Люди массово увольнялись. Теперь они просят, чтобы их взяли обратно

Этим летом около половины сотрудников думали о том, чтобы уволиться — если верить исследованию, проведенному Microsoft. И чем сотрудники моложе, тем сильнее у них желание уйти со своей работы (это планируют 54% людей до 25 лет). Но даже среди старшего поколения 38-41% собирались подать заявление в ближайшие полгода.

Причины у всех разные. Хорошо ли это или плохо, описано в этой статье

Читать...
​​⁉️Зачем и как использовать язык запросов SQL в аналитике?

🔥Расскажем на открытом уроке «SQL для работы с данными» 11 ноября в 20:00. Занятие проведет Алина Красавина, python-разработчик с 10-летним опытом. Алина разберет с вами основные SQL запросы и на практике покажет, как их использовать для формирования выгрузок и витрин.

✔️Занятие бесплатное и позволяет протестировать обучение на онлайн-курсе «Python для аналитики» от OTUS. Курс рассчитан на аналитиков, менеджеров и маркетологов, которые работают с данными.

👉Регистрируйтесь на занятие: https://otus.pw/wdnj/
​​«Футбол в цифрах»: как аналитика может улучшить ситуацию с футболом в России

Автоп поста - создатель проекта «Футбол в цифрах». В нём он собирает футбольную статистику, анализирует данные, выводит закономерности и рассказывает аудитории о самом интересном в виде коротких заметок и подробных статей. Данные — его хобби, и он собрал их достаточно, чтобы сделать выводы об основных проблемах российского футбола и предложить решения.

Статья
🔥Оффер от Яндекса за два дня

Всего за выходные вы можете получить оффер от Яндекса!
13-14 ноября Яндекс организует Weekend offer для middle/senior backend разработчиков. Ждут всех, кто пишет на С++/Java/Python/C#/Go/Kotlin/Scala.

Что требуется?
1) Зарегистрироваться и продемонстрировать свои навыки на этапе отбора до 7-го ноября включительно.
2) Принять участие в 2-ух технических интервью и решить задачи на код и алгоритмы.
3) Показать достойный результат и почти сразу получить оффер.

Ловите ссылку на регистрацию, которая уже открыта.
​​7 простых советов для программиста, которые сберегут его зрение

Усталость глаз, их покраснение, сухость и плохое зрение — 4 всадника работы программистом. Даже одного симптома достаточно, чтобы взять во внимание следующие рекомендации. В этой статье собрано несколько простых советов, которые предотвратят ухудшение вашего зрения. Берите блокнот и ручку, записывайте:

Читать...
​​Тимлид в 20 или 50 оттенков выгорания

История обычного разработчика, который слишком рано получил то, к чему стремился. Он пишет эту статью с целью, чтобы юные ребята, которые хотят пойти в программирование, понимали, что не все так радужно. Деньги, удаленка, свободное время, востребованность - все это манит, однако у этой медали есть вторая, не самая приятная, сторона, о которой он и рассказывает.

Читать...
Все говорят: данные — новая нефть.

Объём рынка Big Data составил $208 млн в прошлом году, по данным Expert Market Research. Прогнозируют, что через пять лет эта цифра вырастет до $450 млн.

Какой вклад у искусственного интеллекта (ИИ) в этом процессе?
Узнаем на 📍AI Journey 2021.

Это международная конференция по искусственному интеллекту и анализу данных, которая пройдёт 10–12 ноября в онлайн-формате. Запланированы выступления более 250 keynote-спикеров.

Среди заявленных тем👇
• Big Data пайплайн для большого распределённого ИИ.
• Моделирование параллельных процессов с помощью 3D-технологий визуализации. Интеграция Big data, AI.
• Прогнозирование движения в роботизированных задачах.

А ещё: самые популярные искусственные нейронные сети, автоматическое визуальное распознавание, передача музыкального стиля при помощи ИИ, технологии ИИ в хирургии, применение ML подходов в медицинской генетике – смотрите всё это на одной площадке, не отходя от экрана монитора.

🔗Регистрироваться бесплатно сейчас: ai-journey.ru

#AI #ИИ #artificialintelligence #искусственныйинтеллект #AIJourney2021 #AIJ2021
🇬🇧 Перестать "учить" английский и начать на нем говорить: 
- чтобы общаться с иностранными коллегами
- чувствовать себя увереннее на рынке труда
- не упускать выгодные проекты
- перестать избегать созвонов и встреч на английском!

Как это сделать - в канале “Гапонова и её английский” @gaponova:

Автор - Лена Гапонова, практик с опытом преподавания более 14 лет. Специализируется на английском для взрослых и уже стала проводником для многих в эффективном обучении английскому.

Что вас ждет на канале @gaponova:

🎓 Собеседование на английском - как понять, что от вас вообще хотят

🎓 Английские слова, которые должны знать все, кто работает в IT

🎓 Типичная грамматическая ошибка

🎓 Problem VS Issue VS Trouble

А также:
• короткие и мегаполезные видео с фишками языка
• подборки лексики для разных ситуаций
• нюансы произношения
• ссылки на проверенные ресурсы 
• разборы грубых ошибок

Все просто и понятно!
Подписывайтесь: @gaponova
​​Решение алгоритмических проблем: Поиск повторяющихся элементов в массиве

Проблема: Найти дубликат в массиве
В этой статье описано несколько решений этой проблемы

Читать...
​​6 упущений в курсе науки о данных

Наука о данных — обширная тема. Для ее понимания требуется много времени, не говоря уже о полном овладении. Неудивительно, что многие учебные заведения, в отличие от традиционных курсов, разрабатывают специализированные программы по науке о данных. Эти программы, как правило, находятся на стыке информатики, математики и статистики. Студентов учат понимать и решать задачи с использованием данных и статистики. Однако программированию и практическому использованию решений уделяется недостаточно внимания.

https://nuancesprog.ru/p/14470/