Машинное обучение RU – Telegram
Машинное обучение RU
17.7K subscribers
1.58K photos
209 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🔥Google VRDU

Google опубликовали в открытом доступе VRDU – датасет и модель, которая понимает документы.

Модель, которая может автоматически извлекать данные из документов, например, квитанций, страховых полисов и финансовых отчетов, потенциально может значительно повысить эффективность бизнес-процессов, избегая ручной работы, подверженной ошибкам.

Но академические датасеты не в состоянии охватить проблемы, наблюдаемые в реальных примерах использования. Как следствие, академические тесты показывают высокую точность существующих моделей, но плохо работают в реальных приложениях.

Исследователи Google сформулировали список особенностей задачи извлечения содержания из документов. Этот список включает использование различных форматов данных, которые могут являться обязательными или необязательными для заполнения в документе определенного шаблона, а также наличие различных форматов оформления, структур и связей между данными.

Датасет и бенчмарк Google VRDU (Visually-rich Document Understanding) были разработаны с учетом данных особенностей.

Датасет VRDU состоит из документов двух типов: регистрационных форм и форм для покупки рекламы. Датасет содержит более 2 000 документов, таких как счета-фактуры и квитанции. Документы являются текстовыми файлами, полученными путем преобразования в текст с помощью Google Cloud изображений, собранных в открытом доступе в Интернете. Затем документы были размечены вручную для сопоставления значений, встречающихся в данных, с их аннотацией (например, числового значения величины налога с названием поля «Налог»).

Github
Датасет

@machinelearning_ru
👍54🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
📊Diagramming AI — полезный инструмент для автоматизация создания UML и рабочих процессов с помощью ИИ

Это отличный помощник в мгновенном создании и обновлении диаграмм с использованием интуитивных ИИ-команд

Бесплатный сервис предлагает хранение и управление проектами, а также возможности для динамического редактирования.

#ИИ #UML

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Shell-AI: Your Intelligent Command-Line Companion

Shell-AI (shai) - это утилита CLI, которая позволяет использовать возможности понимания естественного языка в командной строке. Просто введите на естественном языке то, что вы хотите сделать, и shai предложит однострочные команды, которые реализуют ваш запрос.

pip install shell-ai

Github

@machinelearning_ru
👍8🔥32
Повысьте уровень своих навыков в области ИИ: Список бесплатных курсов Google Top 8.

1. Introduction to Generative AI - введение в генеративный ИИ Этот курс погрузит вас в основаы генеративного ИИ,

2. Introduction to Large Language Models
- в курсе вы узнаете о больших языковых моделях (LLM), которые представляют собой разновидность искусственного интеллекта, способного генерировать текст, переводить языки, писать различные виды креативного контента и информативно отвечать на ваши вопросы.

3. Introduction to Responsible AI - этот курс расскажет вам об этичном и ответственном использовании искусственного интеллекта. Вы узнаете о различных этических проблемах ИИ, таких как предвзятость, конфиденциальность и безопасность. Вы также узнаете о некоторых лучших практиках разработки ИИ.

4. Introduction to Image Generation - этот курс расскажет вам о генерации изображений, разновидности искусственного интеллекта, способного создавать изображения на основе текстовых описаний. Вы узнаете о различных типах алгоритмов генерации изображений, о том, как они работают, и о некоторых из их наиболее распространенных применений.

5. Encoder-Decoder Architecture -
этот курс расскажет вам об архитектуре модели кодера-декодера, которые представляют собой тип архитектуры нейронной сети, широко используемой для задач обработки естественного языка, таких как машинный перевод и резюмирование текста. Вы узнаете о различных компонентах архитектур энкодер-декодер, о том, как они работают, и о некоторых наиболее распространенных областях их применения.

6. Attention Mechanism - В этом курсе вы узнаете о механизме attention - технике, которая используется для повышения производительности нейронных сетей в задачах обработки естественного языка.

7. Transformer Models and BERT Model - В этом курсе вы изучите архитектуру трансформеров, которые представляют собой тип архитектуры нейронной сети, показавшей свою эффективность при решении задач обработки естественного языка.

8. Create Image Captioning Models -
Этот курс научит вас создавать модели автоматического описания изображений, которые представляют собой разновидность искусственного интеллекта, способного генерировать подписи к изображениям.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥5👍1
🔥Бесплатные сертификационные курсы по анализу данных, которые можно попробовать пройти в 2023 году:

🔸Data Analysis with Python (University of Helsinki)
https://classcentral.com/course/independent-data-analysis-with-python-204189

🔸Google Data Analytics
https://classcentral.com/course/google-data-analytics-36441

🔸Data Analyst Bootcamp
https://classcentral.com/course/youtube-data-analyst-bootcamp-204971

🔸The Analytics Edge (MIT University)
https://classcentral.com/course/mit-opencourseware-the-analytics-edge-spring-2017-40989

🔸Data Analysis with Python: Zero to Pandas
https://classcentral.com/course/jovian-data-analysis-with-python-zero-to-pandas-80422

🔸Data Analyst with Python
https://app.datacamp.com/learn/career-tracks/data-analyst-with-python

🔸Full Excel Data Analysis Basics
https://classcentral.com/course/youtube-full-excel-data-analysis-basics-class-e-dab-data-analysis-bi-made-easy-with-excel-power-tools-10-videos-204970

🔸Julia for Data Analysis
https://manning.com/books/julia-for-data-analysis

🔸Data Analysis with Python
https://classcentral.com/course/freecodecamp-data-analysis-with-python-34066

🔸Data Analysis (Harvard University)
http://pll.harvard.edu/course/data-analysis-life-sciences-4-high-dimensional-data-analysis

🔸PowerBI (Microsoft)
http://learn.microsoft.com/users/collinschedler-0717/collections/m14nt4rdwnwp04

🔸Excel (Microsoft)
http://learn.microsoft.com/training/paths/modern-analytics/

@machinelearning_ru
👍83🔥3🥰1
🔥 Дайджест полезных материалов из мира : Машинное обучение за неделю

Почитать:
Пережевывая Матрицу Несоответствий — Confusion Matrix
Устранение галлюцинаций в LLM
Раскладываем по полочкам тезисы из видео «Из голоса банка — в фильмы 18+»
YandexGPT тоже провалил тест на ручник
Шпаргалка по Seaborn. Делаем матрицы красивыми
7 советов, как сделать чат-бота похожим на настоящего человека
Генерация паспортных данных для обучения моделей
Классификация грибов методами ML
Наш опыт внедрения платформы чат-ботов в помощь команде поддержки
Определение токсичности комментариев с помощью глубокого обучения
Simple Weather notification project built with python in mobile.
Why Java Is an Object-Oriented Programming Language?
Elastic D&D - Week 2 - Streamlit & the Login Page
Supervised Learning
Understand the request - response cycle of Django.
Guide to Data Cleaning and Preparation for Analysis using Pandas library in Python
Unveiling the Power of the Proxy Design Pattern with a Remote API Example in Python
"Which job sectors are witnessing a surge in demand for AI and Data Science professionals?"
Data Science with Python and Java: A Dynamic Duo for Modern Analytics
Comment ajouter des hyperliens à Excel avec Python

Посмотреть:
🌐 AI in a Minefield: Learning from Poisoned Data - Johnathan Roy Azaria ( 37:07)
🌐 Orchestrating Data Assets instead of Tasks, with Dagster - Sandy Ryza ( 31:06)

Хорошего дня!

@machinelearning_ru
👍52🥰1
🖥 Полный курс по библиотеке Numpy. Матрицы.

Видео
Код из видео
Упражнения по Numpy

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4🔥1
🖥 Полный курс по библиотеке Numpy. Урок 2 Полезные функции.

Видео
Упражнения

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥1
🖥 Полный курс по библиотеке Numpy. Урок 3. Практика

Видео
Код из видео

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥1
🖥 Полный курс по библиотеке Numpy. Урок 4: Создание матриц из файла.

Видео
Код из видео

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52👎1🔥1
Примите участие в AI Challenge - международном конкурсе по искусственному интеллекту для молодежи от Сбера

Это отличная возможность для школьников и выпускников до 18 лет получить знания и навыки в области искусственного интеллекта, а также приобрести друзей со всего мира.

Участники будут соревноваться в пяти направлениях: от медицины до креативных индустрий.

Отбор пройдет в 4 этапа: регистрация, командная работа, финальный этап с защитой перед экспертами и награждение. Призовой фонд разделят победители в каждом направлении.

Зарегистрироваться можно прямо сейчас на сайте конкурса.
🦙TinyLlama-1.1B

Проект TinyLlama для предварительно обученых моделей Llama 1,1 млрд- 3 трлн. токенов.

TinyLlama использует точно такую же архитектуру и токенизатор, как и в Llama 2. Это означает, что TinyLlama может быть подключена и работать во открытых проектах, построенных на базе Llama. Ее компактность позволяет использовать модель во множестве приложений, с ограниченным объемом вычислений и памяти.

Github

@machinelearning_ru
🔥102👍1
🖥 Python анализ данных с Pandas.Урок 1: Введение.

Видео
Код из видео

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍1🔥1
🔥 Дайджест полезных материалов из мира Машинного обучения за неделю

Почитать:
Machine Learning: хорошая подборка книг для начинающего специалиста
Как понять, что клиента пора реактивировать?
Книга «Математика в машинном обучении»
Что нового в Pandas 2.1
Готовые скрипты Python
Влад Грозин о PhD в США, философии в Data Science, пузыре рекомендаций и голодающих геймерах
Руководство по масштабированию MLOps
Чем мы можем заменить тест Тьюринга
Как (быстро) сделать русский локальный ChatGPT
«SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)
LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?
YandexGPT 2 — большое обновление языковой модели Яндекса
Deploying Apps on Render
Mastering ZIP File Handling in Python: Reading and Creating Zip Archives
The Minion Game - HackerRank Solution Python
Iterables and Iterators - HackerRank Solution Python
Regex Substitution - HackerRank Solution Python
How to Solve the "No Idea!" Challenge in Python
🌐 UN Goals : Education & Gender Equity ⚖️
Starting my Journey in Open Source
Created a toggle_state_button with PyQt5
Accelerating Releases with Pulumi: My Proxy Project Journey

Посмотреть:
🌐 Lightning Interview “Beyond the Code: How AI Is Disrupting the Programmer's Role” ( 58:40)
🌐 Introduction to Generative Art with Stable Diffusion, presented by HP Inc - Hunter Kempf ( 43:48)
🌐 Emerging Approaches to AI Governance: Tech-Led vs Policy-Led - Ilana Golbin ( 44:36)

Хорошего дня!

@machinelearning_ru
👍91
Анализ данных и машинное обучение в облаке

Если вам не хватает мощностей собственного компьютера для разработки модели машинного обучения, у вас краткосрочный проект, для которого нецелесообразно покупать мощные видеокарты, или вы хотели бы собрать небольшую платформу обработки данных, используйте Data Analytics Virtual Machine.

В чем преимущества Data Analytics Virtual Machine в @Selectel:

Это виртуальные серверы с предустановленным набором инструментов для анализа данных, BI и машинного обучения. Решение подойдет для небольших команд и стартапов и поможет с хранением, обработкой, анализом и визуализацией данных.

Вам не придется тратить время на установку драйверов для видеокарты, Python и библиотек для работы с ML. Все компоненты предустановлены, сервер разворачиватся из образа и сразу готов к работе.

Отсутствие vendor lock-in. Решение построено на базе Open Source инструментов: Jupyter, Prefect, Apache Superset. Вы платите только ресурсы облака по модели pay-as-you-go.

Арендовать готовый сервер и узнать больше о решении можно по ссылке: https://slc.tl/nh4l6

Реклама ООО «Селектел» 2VtzquuEHM2
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 pyvis: визуализация графов

Библиотека, которая позволяет создавать графы, настраивать размер нодов, их цвет и прочие характеристики:

Если вам необходимо создать интерактивный граф в нескольких строках кода на языке Python, используйте Pyvis.

Github
Docs

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍132🔥1
CodeFuse-MFTCoder - это проект CodeFuse с открытым исходным кодом для многозадачной Code-LLMs (large language model for code tasks), включающий модели, наборы данных, код и руководства по работе.

Github

@machinelearning_ru
3👍3🔥2
FlexiTech.ai — российская команда профессионалов по разработке решений на базе AI и ML, применяющая инновационные технологии. В портфолио вы найдете задачи любой сложности, среди них: внедрение рекомендательных систем, атрибуция товара, распознавание и классификация изображений, изменение фона на изображении с товаром, предсказание спроса, а также обработка текстов на естественном языке.

Команда обладает большим опытом интеграции AI решений непосредственно в ваш pipeline с учетом вашего технологического стека.

🌐 Специалисты FlexiTech.ai обладают широкой экспертизой в разных сферах и всегда в курсе мировых тенденций,
💡Используемые передовые алгоритмы, делают сложные задачи быстрыми и легкими.
🏆 Реализованные интеллектуальные рабочие процессы увеличивают производительность и снижают издержки крупнейших предприятий в eCommerce, Retail, FinTech, EdTech и других отраслях.

Обращайтесь к @Flexitech_ai и сделайте свою команду больше, быстрее и эффективнее!
🔥52👍1
Efficient Controllable Generation for SDXL with T2I-Adapters

T2I-Adapter - это эффективная подключаемая модель, которая обеспечивает дополнительные настройки для предварительно обученных моделей "текст-изображение".

В этом вопросе T2I-адаптеры имеют конкурентное преимущество перед ControlNets. T2I-адаптеры имеют меньший размер, и, в отличие от ControlNets, T2I-адаптеры запускаются всего один раз.

Руководство

@machinelearning_ru
👍54🔥1