Есть известный (но слегка устаревший) обзор от Robin Burke, где в основном рассматриваются методы на основе пред- или пост-обработки коллаборативных моделей и многое объясняется именно на пальцах, формул почти нет:
http://josquin.cs.depaul.edu/~rburke/pubs/burke-umuai02.pdf
Более продвинутыми являются объединенные модели, где процесс обучения не бьется на фазы и вся информация учитывается сразу при обучении. В прикрепленных постах к этому каналу есть описание нескольких таких подходов, основанных на матричной факторизации. В дополнение к тем моделям можно добавить еще несколько (тоже на основе матричной факторизации):
Feature transformation, где латентные факторы подвергаются всевозможным линейным преобразованиям, основанным на признаковом описании.
Recommending New Movies: Even a Few Ratings Are More Valuable Than Metadata
http://moscow.sci-hub.bz/85febb4cfda627ca8aa98805f9cacda0/pilszy2009.pdf
Latent factor representations for cold-start video recommendation
http://twin.sci-hub.bz/bbd822117f87d17a0f40de3fda12740c/roy2016.pdf
Cold-start item and user recommendation with decoupled completion and transduction (чем-то напоминает coupled factorization)
http://www.egr.msu.edu/waves/people/iman_files/recsys2015_coldstart.pdf
https://www.cse.msu.edu/~forsati/cold-recsys2015.pdf
Feature aggregation (в дополнение к SLIM модели в прошлом посте):
FHSM: Factored Hybrid Similarity Methods for Top-N Recommender Systems
http://link.springer.com/chapter/10.1007/978-3-319-45817-5_8
Feature augmentation, где каждый признак становится "фиктивным объектом" , например, новым айтемом и добавляется в основную матрицу рейтингов для обучения
Predicting User Preference Based on Matrix Factorization by Exploiting Music Attributes
http://twin.sci-hub.bz/1b97bbe14b4e9b959d9944b591fffe83/nabizadeh2016.pdf
Probabilistic approaches
A Unified Approach to Building Hybrid Recommender Systems
http://moscow.sci-hub.bz/b322d362e8bdb6b73b202b83e2fb1376/gunawardana2009.pdf
Bayesian Matrix Factorization with Side Information and Dirichlet Process Mixtures
https://www.ics.uci.edu/~welling/publications/papers/bpmfpp.pdf
Feature-related regularization, где добавляются всевозможные регуляризационные слагаемые, тоже на основе признаковых описаний (сюда же можно отнести и пример из презентации яндекса, о котором вы с @hushpar говорили)
Content-boosted Matrix Factorization Techniques for Recommender Systems
https://arxiv.org/pdf/1210.5631.pdf
Leveraging High-Dimensional Side Information for Top-N Recommendation
https://arxiv.org/pdf/1702.01516.pdf
http://josquin.cs.depaul.edu/~rburke/pubs/burke-umuai02.pdf
Более продвинутыми являются объединенные модели, где процесс обучения не бьется на фазы и вся информация учитывается сразу при обучении. В прикрепленных постах к этому каналу есть описание нескольких таких подходов, основанных на матричной факторизации. В дополнение к тем моделям можно добавить еще несколько (тоже на основе матричной факторизации):
Feature transformation, где латентные факторы подвергаются всевозможным линейным преобразованиям, основанным на признаковом описании.
Recommending New Movies: Even a Few Ratings Are More Valuable Than Metadata
http://moscow.sci-hub.bz/85febb4cfda627ca8aa98805f9cacda0/pilszy2009.pdf
Latent factor representations for cold-start video recommendation
http://twin.sci-hub.bz/bbd822117f87d17a0f40de3fda12740c/roy2016.pdf
Cold-start item and user recommendation with decoupled completion and transduction (чем-то напоминает coupled factorization)
http://www.egr.msu.edu/waves/people/iman_files/recsys2015_coldstart.pdf
https://www.cse.msu.edu/~forsati/cold-recsys2015.pdf
Feature aggregation (в дополнение к SLIM модели в прошлом посте):
FHSM: Factored Hybrid Similarity Methods for Top-N Recommender Systems
http://link.springer.com/chapter/10.1007/978-3-319-45817-5_8
Feature augmentation, где каждый признак становится "фиктивным объектом" , например, новым айтемом и добавляется в основную матрицу рейтингов для обучения
Predicting User Preference Based on Matrix Factorization by Exploiting Music Attributes
http://twin.sci-hub.bz/1b97bbe14b4e9b959d9944b591fffe83/nabizadeh2016.pdf
Probabilistic approaches
A Unified Approach to Building Hybrid Recommender Systems
http://moscow.sci-hub.bz/b322d362e8bdb6b73b202b83e2fb1376/gunawardana2009.pdf
Bayesian Matrix Factorization with Side Information and Dirichlet Process Mixtures
https://www.ics.uci.edu/~welling/publications/papers/bpmfpp.pdf
Feature-related regularization, где добавляются всевозможные регуляризационные слагаемые, тоже на основе признаковых описаний (сюда же можно отнести и пример из презентации яндекса, о котором вы с @hushpar говорили)
Content-boosted Matrix Factorization Techniques for Recommender Systems
https://arxiv.org/pdf/1210.5631.pdf
Leveraging High-Dimensional Side Information for Top-N Recommendation
https://arxiv.org/pdf/1702.01516.pdf
Lessons Learned from Building Real-Life Recommender Systems
by Xavier Amatriain (Quora, USA) and Deepak Agarwal (LinkedIn, USA)
https://www.youtube.com/watch?v=VJOtr47V0eo
http://www.slideshare.net/dipu1025/recsys2016-tutorial-by-xavier-and-deepak
https://www.slideshare.net/xamat/recsys-2016-tutorial-lessons-learned-from-building-reallife-recommender-systems
by Xavier Amatriain (Quora, USA) and Deepak Agarwal (LinkedIn, USA)
https://www.youtube.com/watch?v=VJOtr47V0eo
http://www.slideshare.net/dipu1025/recsys2016-tutorial-by-xavier-and-deepak
https://www.slideshare.net/xamat/recsys-2016-tutorial-lessons-learned-from-building-reallife-recommender-systems
YouTube
RecSys 2016: Tutorial on Lessons Learned from Building Real-life Recommender Systems
Xavier Amatriain, Deepak Agarwal
https://doi.org/10.1145/2959100.2959194
In 2006, Netflix announced a \$1M prize competition to advance recommendation algorithms. The recommendation problem was simplified as the accuracy in predicting a user rating measured…
https://doi.org/10.1145/2959100.2959194
In 2006, Netflix announced a \$1M prize competition to advance recommendation algorithms. The recommendation problem was simplified as the accuracy in predicting a user rating measured…
Эвристика 90-9-1, кривая Лоренца и коэффициент Джинни в качестве единой метрики для сообществ.
https://community.khoros.com/t5/Building-Community-the-Platform/The-90-9-1-Rule-in-Reality/ba-p/5463
https://community.khoros.com/t5/Building-Community-the-Platform/The-Economics-of-90-9-1-The-Lorenz-Curve/ba-p/5465
https://community.khoros.com/t5/Science-of-Social-Blog/The-Economics-of-90-9-1-The-Gini-Coefficient-with-Cross/ba-p/5466
https://community.khoros.com/t5/Building-Community-the-Platform/The-90-9-1-Rule-in-Reality/ba-p/5463
https://community.khoros.com/t5/Building-Community-the-Platform/The-Economics-of-90-9-1-The-Lorenz-Curve/ba-p/5465
https://community.khoros.com/t5/Science-of-Social-Blog/The-Economics-of-90-9-1-The-Gini-Coefficient-with-Cross/ba-p/5466
Khoros Atlas
The 90-9-1 Rule in Reality - Atlas
Dr. Michael Wu, Ph.D. is Lithium's Principal Scientist of Analytics,
digging into the complex dynamics of social interaction and online
communities. He's a regular blogger on the Lithosphere and prev…
digging into the complex dynamics of social interaction and online
communities. He's a regular blogger on the Lithosphere and prev…
Commonsense Transformers for Automatic Knowledge Graph Construction
https://www.aclweb.org/anthology/P19-1470
https://www.aclweb.org/anthology/P19-1470
ACL Anthology
COMET: Commonsense Transformers for Automatic Knowledge Graph Construction
Antoine Bosselut, Hannah Rashkin, Maarten Sap, Chaitanya Malaviya, Asli Celikyilmaz, Yejin Choi. Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. 2019.
Вот, например: ERNIE: Enhanced Language Representation with Informative Entities. В этой работе освещают использование графов знаний поверх языковой модели BERT. Это позволяет получить лучшие результаты на таких задачах, как определение типа сущности (Entity Typing) и классификация взаимосвязей (Relation Classification).
https://arxiv.org/abs/1905.07129
https://paperswithcode.com/task/relation-classification
https://arxiv.org/abs/1905.07129
https://paperswithcode.com/task/relation-classification
arXiv.org
ERNIE: Enhanced Language Representation with Informative Entities
Neural language representation models such as BERT pre-trained on large-scale corpora can well capture rich semantic patterns from plain text, and be fine-tuned to consistently improve the...
Examining Menstrual Tracking to Inform the Design of Personal Informatics Tools
Daniel A. Epstein, Nicole B. Lee, Jennifer H. Kang, Elena Agapie, Jessica Schroeder, Laura R. Pina, James Fogarty, Julie A. Kientz, Sean A. Munson
http://depstein.net/assets/pubs/depstein_chi17.pdf
http://medium.com/hci-design-at-uw/what-can-we-learn-from-period-tracking-23d98e544255
https://medium.com/@nkkl/five-things-to-think-about-when-designing-a-period-tracking-app-9a79ac7cf446
Daniel A. Epstein, Nicole B. Lee, Jennifer H. Kang, Elena Agapie, Jessica Schroeder, Laura R. Pina, James Fogarty, Julie A. Kientz, Sean A. Munson
http://depstein.net/assets/pubs/depstein_chi17.pdf
http://medium.com/hci-design-at-uw/what-can-we-learn-from-period-tracking-23d98e544255
https://medium.com/@nkkl/five-things-to-think-about-when-designing-a-period-tracking-app-9a79ac7cf446