NEW BOT Телеграм, страница

📖 A Data-Centric Introduction to Computing

Огромная бесплатная книга: Введение в науку о данных: основы вычислений!

🔗 Читать: *клик*

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

13.3K viewsedited 19:04

📚Python Books

Problem Solving with Algorithms and Data Structures

🔗

Book

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

12.9K views14:16

📚Python Books

👩‍💻 Pythonic Data Structures and Algorithms: algorithms

🖥

Github

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

14.3K viewsedited 22:01

📚Python Books

Python с нуля: от новичка до собственных игр и программ

🖥 book

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

15.6K views17:09

📚Python Books

Python's pathlib module

🖥 book

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

19.3K views08:51

📚Python Books

C O M P U T E R V I S I O N : F O U N D AT I O N S A N D A P P L I C AT I O N S

🖥 book

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

11.9K views10:01

📚Python Books

Forwarded from Machinelearning

📌Книга "Обучение с подкреплением: Основы"

Хороших книг по обучению с подкреплением (Reinforcement Learning, RL) уже выпущено достаточно, однако есть пробел между продвинутыми учебниками, в которых основное внимание уделяется одному или нескольким аспектам, и более общими книгами, в которых предпочтение отдается удобочитаемости, а не сложности.

Авторы книги, люди с опытом работы в CS и инжиниринга, подают тему RL в строгом и академическом стиле. Книга основана на конспектах лекций для углубленного курса бакалавриата, который преподается авторами в Тель-Авивском университете.

К этой книге дополнительно идет брошюра с упражнениями и экзаменационными вопросами, которые помогут освоить материал книги на практике. Эти упражнения разрабатывались на протяжении нескольких лет.

Математическая модель книги - Марковский процесс принятия решений (Markov Decision Process, MDP). Основное внимание уделяется: последовательному принятию решений, выбору действий, долгосрочному эффекту от этих действий и разница между немедленным вознаграждением и долгосрочной выгодой.

Тематически книга состоит из двух частей – "Планирование" и "Обучение".

▶️

Раздел "Планирование" - основы принятия оптимальных решений в условиях неопределенности в соответствии с MDP.

🟢Глава 2. Обоснование модели MDP и ее связь с другими моделями.
🟢Глава 3. Основные алгоритмические идеи в детерминированной постановке.
🟢Глава 4. Цепи Маркова, на которых основана MDP.
🟢Глава 5. Модель MDP с конечным горизонтом и фундаментальный подход к динамическому программированию.
🟢Глава 6. Дисконтированная настройка с бесконечным горизонтом.
🟢Глава 7. Эпизодическая настройка.
🟢Глава 8. Альтернативный подход к решению MDP с использованием формулировки линейного программирования.

▶️

Раздел "Обучение" - принятие решений, когда модель MDP неизвестна заранее.

🟠Глава 9. Описание и мотивация модели обучения и ее связь с альтернативами при принятии решений.
🟠Глава 10. Подход, основанный на моделях, при котором агент явно изучает модель MDP на основе своего опыта и использует ее для принятия решений по планированию.
🟠Глава 11. Альтернативный подход без использования моделей, при котором решения принимаются без явного построения модели.
🟠Глава 12. Изучение приблизительно оптимальных решений крупных задач с использованием аппроксимации функции стоимости.
🟠Глава 13 Решение крупных задач с использованием методов градиентной политики.
🟠Глава 14. Особый случай на примере игровых автоматов, как MDP с единым состоянием и неизвестными наградами, и онлайн-характер принятия решений.

🟡

Сайт учебника

🟡

Читать

@ai_machinelearning_big_data

#AI #ML #RL #MDP #Book

Please open Telegram to view this post

VIEW IN TELEGRAM

13.8K views15:20

📚Python Books

Forwarded from Математика Дата саентиста

Конспект лекции Гонконгского университета прикладной линейной алгебры и дифференциальных уравнений

📌 Лекции

@data_math

15.7K views19:25

📚Python Books

Python for Everyone

🖥 book

@pythonlbooks

Please open Telegram to view this post

VIEW IN TELEGRAM

15.6K views11:01

📚Python Books

Data Structures and Information Retrieval in Python

📓 Книга

@datascienceiot

16.4K views10:29

📚Python Books

PythonMastery (1).pdf

4.1 MB

Advanced Python Mastery

@datascienceiot

16.7K views10:58

📚Python Books

Artificial Intelligence for Beginners - A Curriculum

📚 Course

@pythonlbooks

15.5K views12:03

📚Python Books

Forwarded from Machinelearning

📌Монография "Reinforcement Learning: An Overview"

Исчерпывающий материал по обучению с подкреплением (Reinforcement Learning, RL), в котором подробно описываются различные модели среды, задачи оптимизации, исследуется определение компромисса между теорией и практической эксплуатаций RL.

Отдельно рассматриваются смежные темы: распределенное RL, иерархическое RL, обучение вне политики и VLM.

В работе представлен обзор алгоритмов RL:

🟢SARSA;
🟢Q-learning;
🟢REINFORCE;
🟢A2C;
🟢TRPO/PPO;
🟢DDPG;
🟢Soft actor-critic;
🟢MBRL.

Автор - Kevin Murphy, главный научный сотрудник и руководитель команды из 28 ресечеров и инженеров в Google Deepmind. Группа работает над генеративными моделями (диффузия и LLM), RL, робототехникой, байесовским выводом и другими темами.

Кевин опубликовал более 140 статей на рецензируемых конференциях и в журналах, а также 3 учебника по ML, опубликованных в 2012, 2022 и 2023 годах издательством MIT Press. (Книга 2012 года была удостоена премии ДеГроота как лучшая книга в области статистической науки).

🔜

Монография опубликована в открытом доступе 9 декабря 2024 года.

@ai_machinelearning_big_data

#AI #ML #Book #RL

Please open Telegram to view this post

VIEW IN TELEGRAM

16.8K views11:02

About

Blog

Apps

Platform