Big Data Science – Telegram
Big Data Science
3.74K subscribers
65 photos
9 videos
12 files
637 links
Big Data Science channel gathers together all interesting facts about Data Science.
For cooperation: a.chernobrovov@gmail.com
💼https://news.1rj.ru/str/bds_job — channel about Data Science jobs and career
💻https://news.1rj.ru/str/bdscience_ru — Big Data Science [RU]
Download Telegram
Media is too big
VIEW IN TELEGRAM
Дизайн-студия Артемия Лебедева заявила, что создала «искусственный дизайнерский интеллект» и больше года выдавала его за реального человека. За это время нейросеть якобы разработала больше 20 логотипов для разных заказчиков. Никто из них не знал, что заказ выполнила машина.
Подробнее в видео.

Источник: YouTube канал Артемия Лебедева
👍Уникальная возможность поучаствовать в хакатоне Sigma-Thon 1.0. от HackerEarth!

Data Hackathons — это идеальное поле битвы для начинающих Data Scientist'ов. Организации постоянно ищут различные модели и идеи, чтобы поставлять нужные продукты в нужное время. Розничная торговля является одной из таких отраслей.

Что необходимо сделать: создать data-driven решение для предприятий розничной торговли, чтобы обновить свои каналы розничной торговли с помощью моделей данных, механизмов рекомендаций и многого другого. Можно участвовать командой до 4-х человек.

Дедлайн подачи заявок и решений: 12 июля, 2020

Ссылка: https://www.hackerearth.com/ru/challenges/hackathon/sigma-thon-v1/#overview
This media is not supported in your browser
VIEW IN TELEGRAM
🎞Лучшая подборка видео о Machine Learning:

1. Введение в машинное обучение https://youtu.be/ukzFI9rgwfU
2. Базовые знания об обработке естественного языка (Natural language processing)https://youtu.be/d4gGtcobq8M
3. О работе компьютерного зренияhttps://www.youtube.com/watch?v=OcycT1Jwsns&feature=youtu.be
4. Многоагентная система (Multi-agent) игры в прятки https://youtu.be/kopoLzvh5jY
5. Машинное обучение видеоигрhttps://youtu.be/qv6UVOQ0F44

Приятного просмотра!
SimCLR - простая база для сравнительного обучения (одно из направлений самообучения) визуальным представлениям.

Результаты, описанные в этой статье, могут быть использованы для повышения точности в любом приложении компьютерного зрения, где намного дороже и труднее маркировать дополнительные данные, нежели обучать большие модели.

Github: https://github.com/google-research/simclr

Статья: https://arxiv.org/abs/2006.10029
🔥3 простых совета, чтобы быть успешным в Data Science
LeanDS — канал об управлении проектами и продуктами в Data Science

@LeanDS — канал сообщества LeanDS. Коллеги проводят бесплатные митапы по методам управления в Data Science, публикуют статьи и видео.

Если вам интересна тема менеджмента в DS, вы хотите знать, как применять Agile/Scrum в DS и задумывались над тем, как сделать создание ML продуктов более эффективным — присоединяйтесь.
7 лучших фреймворков AutoML в 2020 году

Предположим, есть набор данных, по которому мы хотим получить прогнозную модель. Традиционный подход к машинному обучению требует следующей последовательности действий:
⁃ предварительная обработка данных;
⁃ определение характерных особенностей построения новых функций;
⁃ выбор правильной модели обучения;
⁃ оптимизация гиперпараметров;
⁃ тренировка с оптимальными параметрами.

Процесс может быть долгим и, следовательно, дорогим. Действительно, для лучшего результата необходимо многократно проверять гипотезу, более того, на каждом шаге она может уточняться дальше.
Задача автоматического машинного обучения (AutoML) состоит в том, чтобы автоматизировать все или хотя бы некоторые из этих шагов без потери точности прогнозирования. Идеальная стратегия AutoML предполагает, что любой пользователь может брать необработанные данные, строить на них модель и получать прогнозы с максимально возможной (для доступной выборки) точностью.

Лучшие фреймворки собрали для вас:

1. MLBox хорошо решает следующие задачи:
⁃ Подготовка данных (самая развитая часть библиотеки)
⁃ Выбор модели
⁃ Поиск гиперпараметров

2. Auto Sklearn Framework построен на основе популярной библиотеки машинного обучения scikit-learn. Что может он может делать:
⁃ Выбор модели
⁃ Гипер Настройки

3. TPOT позиционируется как структура, в которой пайплайн машинного обучения полностью автоматизирован. Много различных моделей строятся с выбором лучших в прогнозирующей точности.

4. H2O AutoML поддерживает как традиционные модели машинного обучения, так и нейронные сети. Особенно подходит для тех, кто ищет способ автоматизировать глубокое обучение.

5. Auto Keras использует классический API, как в scikit-learn, но при этом использует мощный поиск нейронной сети для параметров модели с использованием Keras.

6. Cloud AutoML использует архитектуру нейронной сети. Этот продукт Google имеет простой пользовательский интерфейс для изучения и развертывания моделей.

7. Auto-WEKA представляет собой пакет множества различных алгоритмов машинного обучения с открытым исходным кодом. Однако каждый из этих алгоритмов имеет свои собственные гиперпараметры, которые могут радикально изменить их производительность. Auto-WEKA рассматривает проблему одновременного выбора алгоритма обучения и установки его гиперпараметров, выходя за рамки предыдущих методов, которые решают эти проблемы изолированно, и использует полностью автоматизированный подход.
This media is not supported in your browser
VIEW IN TELEGRAM
❤️Полный мэтч: машинное обучение в дейтинге

Сайты знакомств и дейтинговые приложения – одни из самых интересных и в тоже время абсолютно типичных применений современных алгоритмов машинного обучения. В этой статье рассмотрены основные задачи и принципы работы дейтинговых систем с точки зрения Data Science, а также приведены оригинальные примеры пользовательских попыток «хакнуть».

Ссылка на статью:
https://chernobrovov.ru/articles/polnyj-metch-mashinnoe-obuchenie-v-dejtinge.html
☄️BREAK INTO NLP
Еще одно классное (бесплатное!) онлайн-мероприятие, организованное deeplearning.ai, с участием выдающихся экспертов по NLP, которые поделятся своими мыслями о текущих тенденциях и применениях NLP.

Событие будет транслироваться на YouTube с 20:00 до 21:30 по московскому времени 29 июля. Если вы не сможете посмотреть вживую, обязательно зарегистрируйтесь, чтобы получить ссылку для записи.

Ссылка на событие и регистрацию — Break into NLP.

Всем продуктивных выходных!
Forwarded from Karim Iskakov - канал (Vladimir Ivashkin)
This media is not supported in your browser
VIEW IN TELEGRAM
BREAKING NEWS! (sound on)

Our iOS app Avatarify is #1 in Russian App Store, and today we release it worldwide.

Vivify any photo with your face in real time: celebrity, your boss or even pet. Record video and share it to amaze your friends.

NN works completely on the device in zero-shot mode. Check it out!

📱 App Store
🌐 avatarify.ai
📉 @loss_function_porn
🇷🇺Россия, вперед! Согласно исследованию Coursera, наша страна возглавила мировой рейтинг по компетенциям в области технологий и Data Science. Наиболее сильные компетенции показали студенты ВУЗов Москвы, Петербурга, Томска и Новосибирска.
💰После выхода выпуска у Дудя про Кремниевую Долину наверняка каждый подумал о том, как бы туда попасть.
Предлагаем посмотреть довольно интересную статью про детальный разбор структуры зарплат IT-специалистов в Кремниевой долине, а также на то, сколько в совокупности можно было бы получать в год в топовых компаниях США.

https://habr.com/ru/post/512598/

Хорошая мотивация?
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Netflix’s Polynote is a New Open Source Framework to Build Better Data Science Notebooks

Polynote is an experimental polyglot notebook environment. Currently, it supports Scala and Python, SQL, and Vega.

https://www.kdnuggets.com/2020/08/netflix-polynote-open-source-framework-better-data-science-notebooks.html

Project page: https://polynote.org/

Github: https://github.com/polynote/polynote

@ai_machinelearning_big_data
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть GPT-3 от OpenAI пишет стихи, музыку и код.
Алгоритм выдаёт текст, который лишь кажется осмысленным, и на самом деле просто связывает уже созданные людьми данные.

В мае 2020 года OpenAI представила третью версию языковой модели GPT, которая позволяет генерировать текст, который не всегда можно отличить от того, что написал бы человек.

GPT-3 генерирует текст на основе 175 миллиардов параметров — это значение отражает её вычислительную мощность. В зависимости от количества параметров система лучше или хуже оценивает данные и придаёт каким-то из них большее значение, а каким-то меньшее.

GPT-3 нельзя(!) cвободно использовать: пока OpenAI даёт доступ только отдельным разработчикам и исследователям в рамках закрытого бета-теста :(
⚙️Что же такое QA и как овладеть профессией тестировщика ПО,чтобы реализовать себя в IT-отрасли?

Советуем обратить внимание на канал про радости и боли, преподавание и рефлексию на тему работы в IT, который ведёт Анастасия Шарикова, QA Lead в Bookmate.
И если вам также интересна тема тестинга, или вы хотите узнать больше классных вещей из мира Data Science, которые с каждым годом только развиваются, то делимся ссылкой на канал - https://news.1rj.ru/str/yetanotherqa
Mail.ru Group и hh.ru составили портреты российских специалистов по анализу данных (Data Science) и машинному обучению (Machine Learning). Аналитики выяснили, где они живут и что умеют — а также чего ждут от них работодатели и как меняется спрос на таких профессионалов.

https://habr.com/ru/company/mailru/blog/511104/
💡В обучающей программе Learn with Google AI имеются бесплатные уроки Machine Learning Crash Course (MLCC). Курс помогает освоить машинное обучение и раньше был доступен только сотрудникам компании.
Раздел обучающей программы Learn with Google AI состоит из 25 уроков с более чем 40 заданиями. Лекции ведут исследователи из Google, объясняя принципы машинного обучения на реальных примерах. Прохождение всего курса занимает 15 часов.

Проведите свою неделю продуктивно - https://developers.google.com/machine-learning/crash-course
🧐Philosopher AI

Представленный недавно исследовательской организацией OpenAI генератор текста GPT-3 стал одной из самых обсуждаемых тем в сфере искусственного интеллекта (ИИ) за последнее время. Этот алгоритм может «умно» отвечать на многие вопросы, сочинять стихи, новостные статьи и финансовые отчеты и даже писать программный код. Предлагаем попробовать и вам.

Веб-сайт: https://philosopherai.com/philosopher/humanity-on-mars-73ac00
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Такой вот алгоритм из Макса Планка и Facebook Reality Lab, который позволяет через ре-рендеринг текстуры переодевать людей в новую одежду, и даже применять это к видео! Пока качество хромает (очень), но вот перспективы у последнего великие, только представьте, как легко и дешево можно будет генерить видео-демонстрацию одежды для e-commerce.
Жду с нетерпением.
Совсем недавно Google Research выпустила документ, посвященный проблеме NLP и представила новую аналитическую платформу: Language Interpretability Tool (LIT).

LIT - это набор инструментов и пользовательский интерфейс для браузера, чтобы понять модель NLP.

У него пять основных функций:
— Поддерживает локальное объяснение, включая карты значимости, внимание и богатую визуализацию прогнозов модели
— Поддерживает агрегированный анализ, включая метрики, места для встраивания и гибкую срезку
— Позволяет плавно переключаться между вышеперечисленным для проверки локальных гипотез и проверки набора данных
— Позволяет добавлять новые точки данных в любое время и сразу же визуализировать их эффект
— Позволяет визуализировать сравнения между двумя моделями или двумя точками данных в одном интерфейсе

Пользовательский интерфейс LIT написан на TypeScript и взаимодействует с серверной частью Python.

Статья находится на arXiv. Платформа имеет открытый исходный код на Github.