🤔Хороший, плохой, злой: как Яндекс использует нейросети для борьбы со спамом и матом
Разработчики Яндекса автоматизировали борьбу со спамом и матом в своих сервисах. Рассказываем, какие инструменты они для этого использовали.
[ Статья ]
Разработчики Яндекса автоматизировали борьбу со спамом и матом в своих сервисах. Рассказываем, какие инструменты они для этого использовали.
[ Статья ]
Библиотека программиста
Хороший, плохой, злой: как Яндекс использует нейросети для борьбы со спамом и матом
Разработчики Яндекса автоматизировали борьбу со спамом и матом в своих сервисах. Рассказываем, какие инструменты они для этого использовали.
🎥 Делаем DeepFake на коленке: пошаговое практическое руководство.
Хотите собственноручно сделать видеоролик DeepFake с помощью простых инструментов? Наше пошаговое практическое руководство позволит вам пошутить над друзьями или создать забавный ролик для соцсетей, не углубляясь в программирование
Статья
Хотите собственноручно сделать видеоролик DeepFake с помощью простых инструментов? Наше пошаговое практическое руководство позволит вам пошутить над друзьями или создать забавный ролик для соцсетей, не углубляясь в программирование
Статья
DataOps — инженер будущего, который выстраивает инфраструктуру для работы с данными.
👉🏻Если вы Data Engineer, администратор или DevOps с опытом, и хотите узнать больше об управлении данными, 15 июля OTUS приглашает на demo-занятие «Практики Data Governance»:
На этом открытом уроке вы узнаете:
- Почему обработка данных - это не только написание ETL-процедур.
- Как не превратить Data Lake в Data Swamp.
- Что в себя включают практики Data Governance.
Занятие дает возможность предварительно попробовать новый онлайн-курс «DataOps Engineer» и познакомиться с преподавателем.
📍Для регистрации пройдите вступительный тест: https://otus.pw/XwXH/
👉🏻Если вы Data Engineer, администратор или DevOps с опытом, и хотите узнать больше об управлении данными, 15 июля OTUS приглашает на demo-занятие «Практики Data Governance»:
На этом открытом уроке вы узнаете:
- Почему обработка данных - это не только написание ETL-процедур.
- Как не превратить Data Lake в Data Swamp.
- Что в себя включают практики Data Governance.
Занятие дает возможность предварительно попробовать новый онлайн-курс «DataOps Engineer» и познакомиться с преподавателем.
📍Для регистрации пройдите вступительный тест: https://otus.pw/XwXH/
⚕ Какие специалисты по Data Science требуются в медицинских проектах и что им нужно знать?
Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.
Статья
Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.
Статья
5 неожиданных мест работы дата-сайентиста: от йоги до борьбы с deepfakes
Специалисты в области Data Science за последние пять лет стали особенно востребованными. Так, в 2019 году вакансий для них стало почти в 1,5 раза больше, чем в 2018, и почти в 10 раз больше, чем в 2015. Главные заказчики — финансовый сектор и IT-компании. Однако хорошие дата-сайентисты нужны не только в этих отраслях...
Статья
Специалисты в области Data Science за последние пять лет стали особенно востребованными. Так, в 2019 году вакансий для них стало почти в 1,5 раза больше, чем в 2018, и почти в 10 раз больше, чем в 2015. Главные заказчики — финансовый сектор и IT-компании. Однако хорошие дата-сайентисты нужны не только в этих отраслях...
Статья
6 сентября стартует новый поток курса о данных в энтерпрайзе. Это первая подобная программа в стране. Ее разработали создатели MDM- и CDI-решений из компании HFLabs.
🧑💻 Для кого
Подойдет всем, кто работает или будет работать с клиентскими данными в крупной компании. Специальность не имеет значения.
📚 Программа
Пять дней, пять преподавателей, пять модулей:
1. Предпосылки создания MDM-системы. Проектирование модели данных.
2. Построение MDM-системы: структура и правила работы с данными.
3. Добавление новых источников в MDM-систему.
4. Получение данных из эталонной клиентской базы. Обратное распространение.
5. Управление качеством данных в MDM-системе.
🧙♂️ Преподаватели
Эти специалисты работают с клиентскими данными в ВТБ, «Открытии», «Росгосстрахе», МТС. Каждый «закрыл» минимум десяток проектов для крупного бизнеса.
🏃♀️ Студенты уже регистрируются
До 1 августа цены ниже на 4 000—6 000 ₽. Мест всего 16, разлетаются быстро.
Узнать больше https://bit.ly/3r5b0yd
🧑💻 Для кого
Подойдет всем, кто работает или будет работать с клиентскими данными в крупной компании. Специальность не имеет значения.
📚 Программа
Пять дней, пять преподавателей, пять модулей:
1. Предпосылки создания MDM-системы. Проектирование модели данных.
2. Построение MDM-системы: структура и правила работы с данными.
3. Добавление новых источников в MDM-систему.
4. Получение данных из эталонной клиентской базы. Обратное распространение.
5. Управление качеством данных в MDM-системе.
🧙♂️ Преподаватели
Эти специалисты работают с клиентскими данными в ВТБ, «Открытии», «Росгосстрахе», МТС. Каждый «закрыл» минимум десяток проектов для крупного бизнеса.
🏃♀️ Студенты уже регистрируются
До 1 августа цены ниже на 4 000—6 000 ₽. Мест всего 16, разлетаются быстро.
Узнать больше https://bit.ly/3r5b0yd
🐍Скрапинг сайта с помощью Python: гайд для новичков.
В этой статье мы разберемся, как создать HTML скрапер на Python, который получает неофициальный доступ к коду сайта и позволяет извлечь необходимые данные.
Статья
В этой статье мы разберемся, как создать HTML скрапер на Python, который получает неофициальный доступ к коду сайта и позволяет извлечь необходимые данные.
Статья
Tproger
Скрапинг сайта с помощью Python: гайд для новичков
Пишем простой скрапер на Python для сайта с объявлениями о недвижимости. Получаем готовый очищенный готовый к экспорту датасет.
Подборка полезных инструментов для повседневной работы от специалиста по Data Science.
Обзор инструментов для Data Scientist и ML-инженеров, которые упрощают ежедневную работу, повышают продуктивность и просто делают опыт использования разных сервисов приятнее...
Статья
Обзор инструментов для Data Scientist и ML-инженеров, которые упрощают ежедневную работу, повышают продуктивность и просто делают опыт использования разных сервисов приятнее...
Статья
Tproger
Подборка полезных инструментов для повседневной работы от специалиста по Data Science
Специалист по Data Science поделился списком проверенных инструментов и сервисов, которые помогают ему решать разные задачи.
⭐️ Актуальные новости и интересные материалы о регулировании и других аспектах искусственного интеллекта (ИИ) — в Telegram-фиде База знаний AI
Команда ICT.Moscow собирает самые заметные новости о технологиях машинного обучения, компьютерного зрения и обработке естественного языка; публикует данные из отраслевых исследований, правового регулирования, мнения экспертов рынка, статьи, интервью и другие полезные материалы об ИИ, а каждое утро начинается с обзора главных ИИ-новостей.
Вот несколько постов из их фида:
📌 В России утвержден первый стандарт в области больших данных
📌 Регуляторы ЕС против использования ИИ для распознавания признаков человека в общедоступных местах
📌 Зачем нужны транспортные полигоны для «умных» машин
***
👉🏻 Подписаться на фид @ICT_Moscow_AI
Команда ICT.Moscow собирает самые заметные новости о технологиях машинного обучения, компьютерного зрения и обработке естественного языка; публикует данные из отраслевых исследований, правового регулирования, мнения экспертов рынка, статьи, интервью и другие полезные материалы об ИИ, а каждое утро начинается с обзора главных ИИ-новостей.
Вот несколько постов из их фида:
📌 В России утвержден первый стандарт в области больших данных
📌 Регуляторы ЕС против использования ИИ для распознавания признаков человека в общедоступных местах
📌 Зачем нужны транспортные полигоны для «умных» машин
***
👉🏻 Подписаться на фид @ICT_Moscow_AI
Профессия будущего в мехмате МГУ — теперь в онлайн-формате
МГУ и SkillFactory запускают онлайн-магистратуру "Искусственный интеллект и цифровые технологии". Для тех, кто хочет двигать Россию и мир в будущее.
Приходите к нам, чтобы получить:
▪️ Глубокое понимание принципов анализа данных и машинного обучения
▪️ Математическую базу мехматского уровня
▪️ Навыки решения исследовательских и практических задач с помощью ML-моделей и нейросетей
▪️ Практику и стажировку от корпоративных партнеров программы
И все это — онлайн. Материалы для обучения доступны на платформе 24/7. Вы можете сами выбрать группу с оптимальным временем практических занятий и семинаров. Гибкий график позволяет совмещать обучение с работой.
За 2 года вы успеете погрузиться в сферу, получить практический опыт в разработке ИИ и собрать 7+ проектов в портфолио. А по окончании обучения вас ждет диплом МГУ им. М.В. Ломоносова.
Узнайте, какие бонусы вас ждут как студента МГУ и как будет проходить ваше обучение, на сайте программы:
https://u.to/-DV4Gw
МГУ и SkillFactory запускают онлайн-магистратуру "Искусственный интеллект и цифровые технологии". Для тех, кто хочет двигать Россию и мир в будущее.
Приходите к нам, чтобы получить:
▪️ Глубокое понимание принципов анализа данных и машинного обучения
▪️ Математическую базу мехматского уровня
▪️ Навыки решения исследовательских и практических задач с помощью ML-моделей и нейросетей
▪️ Практику и стажировку от корпоративных партнеров программы
И все это — онлайн. Материалы для обучения доступны на платформе 24/7. Вы можете сами выбрать группу с оптимальным временем практических занятий и семинаров. Гибкий график позволяет совмещать обучение с работой.
За 2 года вы успеете погрузиться в сферу, получить практический опыт в разработке ИИ и собрать 7+ проектов в портфолио. А по окончании обучения вас ждет диплом МГУ им. М.В. Ломоносова.
Узнайте, какие бонусы вас ждут как студента МГУ и как будет проходить ваше обучение, на сайте программы:
https://u.to/-DV4Gw
Яндекс вместе с учеными Оксфорда и Кембриджа проводит соревнование среди исследователей ML на базе самого большого в мире открытого датасета по беспилотным авто.
Зачем? Повысить осведомленность о проблеме “сдвига данных” в машинном обучении.
Когда? Сейчас, в рамках NeurIPS 2021 - крупнейшей ML конференции в в мире.
В чем фишка? Машинное обучение сталкивается с испытанием – реальный мир почти бесконечно разнообразен, поэтому очень сложно просчитать все ситуации, в которые попадает алгоритм. Оказываясь в незнакомой среде, он начинает справляться с задачами хуже (например, модель машинного перевода классической литературы вдруг возьмется переводить твиты).
Важно, чтобы алгоритмы, попадая в реальный мир, были готовы справляться со сдвигом, который их там ждет. Беспилотникам Яндекса удалось собрать уникальный по наличию разных условий датасет – их авто набирались опыта и собирали данные в трех странах с разными особенностями манеры вождения, дорожных правил и погоды.
Что требуется? Разработать алгоритмы для предсказания поведения участников автомобильного движения, погоды или машинного перевода текстов.
Обучить их на предоставленных данных. Для этого Яндекс открыл доступ к трем датасетам с реальными данными из Погоды, Переводчика и по беспилотным автомобилям.
Проверить качество работы алгоритмов в условиях сдвига. Кстати, авторы самых успешных получат деньги, а решения можно будет применять и в других сферах, где есть проблема сдвига данных.
Хотели бы попробовать себя?
Зачем? Повысить осведомленность о проблеме “сдвига данных” в машинном обучении.
Когда? Сейчас, в рамках NeurIPS 2021 - крупнейшей ML конференции в в мире.
В чем фишка? Машинное обучение сталкивается с испытанием – реальный мир почти бесконечно разнообразен, поэтому очень сложно просчитать все ситуации, в которые попадает алгоритм. Оказываясь в незнакомой среде, он начинает справляться с задачами хуже (например, модель машинного перевода классической литературы вдруг возьмется переводить твиты).
Важно, чтобы алгоритмы, попадая в реальный мир, были готовы справляться со сдвигом, который их там ждет. Беспилотникам Яндекса удалось собрать уникальный по наличию разных условий датасет – их авто набирались опыта и собирали данные в трех странах с разными особенностями манеры вождения, дорожных правил и погоды.
Что требуется? Разработать алгоритмы для предсказания поведения участников автомобильного движения, погоды или машинного перевода текстов.
Обучить их на предоставленных данных. Для этого Яндекс открыл доступ к трем датасетам с реальными данными из Погоды, Переводчика и по беспилотным автомобилям.
Проверить качество работы алгоритмов в условиях сдвига. Кстати, авторы самых успешных получат деньги, а решения можно будет применять и в других сферах, где есть проблема сдвига данных.
Хотели бы попробовать себя?
Shifts Challenge: Robustness and Uncertainty under Real-World Distributional Shift
We invite researchers and machine learning practitioners from all over the world to participate in our NeurIPS 2021 Shifts Challenge on robustness and uncertainty under real-world distributional shift.
🛠 Сложноструктурные аналитические отчеты с Python и LaTeX
В руководстве подробно рассматривается пример использования Python-библиотеки облачного представления приложений Streamlit и системы компьютерной вёрстки LaTeX для подготовки сложных аналитических отчетов с математическими, программными и графическими вставками.
Статья
В руководстве подробно рассматривается пример использования Python-библиотеки облачного представления приложений Streamlit и системы компьютерной вёрстки LaTeX для подготовки сложных аналитических отчетов с математическими, программными и графическими вставками.
Статья
✅ Хотим обратить ваше внимание на полезный telegram-канал для обучения высокоуровневому языку программирования Python
На канале ежедневно публикуются задачи по Python и Machine Learning: алгоритмы, функции, классы, регулярные выражения, итераторы, генераторы, ООП, исключения, numpy, pandas, matplotlib, scikit-learn, TensorFlow и многое другое!
✔️Станьте специалистом по Python вместе с каналом "Задачи по Python и машинному обучению"
На канале ежедневно публикуются задачи по Python и Machine Learning: алгоритмы, функции, классы, регулярные выражения, итераторы, генераторы, ООП, исключения, numpy, pandas, matplotlib, scikit-learn, TensorFlow и многое другое!
✔️Станьте специалистом по Python вместе с каналом "Задачи по Python и машинному обучению"