Machinelearning – Telegram
383K subscribers
4.45K photos
859 videos
17 files
4.89K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📖 LongBench: A Bilingual, Multitask Benchmark for Long Context Understanding

LongBench includes 14 English tasks, 5 Chinese tasks, and 2 code tasks, with the average length of most tasks ranging from 5k to 15k, and a total of 4,750 test data.

LongBench - первый двуязычный, бенчмарк понимания длинных контекстов, позволяющий проводить тщательную оценку контекстов.
LongBench включает 21 датасет по 6 категориям задач на английском и китайском языках.


🖥 Github: https://github.com/thudm/longbench

📕 Paper: https://arxiv.org/abs/2308.14710v1

🤗 HF: https://huggingface.co/datasets/THUDM/LongBench

⭐️ Dataset: https://paperswithcode.com/dataset/youtube-vis-2021-validation

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍4🔥2😐1
🖥 When Do Program-of-Thoughts Work for Reasoning?

An Easy-to-use Instruction Generation Framework for LLMs.

EasyInstruct - это пакет Python для обучения больших языковых моделей (LLM), таких как
GPT-3, Llama, ChatGLM, в ваших исследовательских экспериментах. Он прост в использовании и легко расширяемый.

pip install easyinstruct -i https://pypi.org/simple

🖥 Github: https://github.com/zjunlp/easyinstruct

📕 Paper: https://arxiv.org/abs/2308.15452v1

⭐️ Dataset:https://paperswithcode.com/dataset/svamp

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍41
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Scaling up GANs for Text-to-Image Synthesis

1B-parameter GigaGAN, achieving lower FID than Stable Diffusion v1.5, DALL·E 2, and Parti-750M.

GigaGAN - 1B модель генерации изображений из текста. Высокая скорость генерации изображений 0.13 сек в разрешении 512px, на порядки быстрее других моделей.

🖥 Github: https://github.com/mingukkang/GigaGAN/tree/main/evaluation

Project: https://mingukkang.github.io/GigaGAN/

🎞 Video: https://www.youtube.com/watch?v=UyoXmHS-KGc

📕 Paper: https://arxiv.org/abs/2303.05511

⭐️ Dataset:https://paperswithcode.com/dataset/svamp

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥32
🎧 AudioLDM 2, but faster ⚡️

Read to the end to find out how to generate a 10 second audio sample in just 1 second!

В этом посте показано, как использовать AudioLDM 2 c Hugging Face 🧨 Diffusers, исследуя ряд оптимизаций для сокращения времени генераций более чем в 10 раз при минимальном снижении качества выходного аудио.

🤗 HH: https://huggingface.co/blog/audioldm2

🖥 Github: https://github.com/huggingface/blog/blob/main/audioldm2.md

🖥 Colab: https://mingukkang.github.io/GigaGAN/

🎧 Paper: https://arxiv.org/abs/2308.05734

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3🔥2
🔥 CRATE (Coding RAte reduction TransformEr)

CRATE (is a white-box transformer architecture, where each layer performs a single step of an alternating minimization algorithm to optimize the sparse rate reduction objective

Алгоритм оптимизации сегментации с помощью архитектуры white-box трансформеров.

🖥 Github: https://github.com/ma-lab-berkeley/crate

🖥 Colab: https://colab.research.google.com/drive/1rYn_NlepyW7Fu5LDliyBDmFZylHco7ss

📕 Paper: https://arxiv.org/abs/2308.16271v1

⭐️ Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍134🔥2
SAM-Med2D

SAM-Med2D, the most comprehensive studies on applying SAM to medical 2D images.

🏆 Самая большая на сегодняшний день база данных по сегментации медицинских изображений (4,6 млн. изображений и 19,7 млн. масок) для обучения моделей.
🏆 Модель файнтюнинга Segment Anything Model (SAM).
🏆 Бенчмарк SAM-Med2D на крупномасштабных наборах данных.

🖥 Github: https://github.com/uni-medical/sam-med2d

🖥 Colab: https://colab.research.google.com/github/uni-medical/SAM-Med2D/blob/main/predictor_example.ipynb

📕 Paper: https://arxiv.org/abs/2308.16184

⭐️ Dataset: https://paperswithcode.com/dataset/sa-1b

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥12🥰3🤔1🕊1
📷Improving Lens Flare Removal with General Purpose Pipeline and Multiple Light Sources Recovery

Новое решение по эффективному удаления бликов на изображениях и восстановления источников света.

🖥 Github: https://github.com/yuyanzhou1/improving-lens-flare-removal

🖥 Pre-trained Model: https://drive.google.com/drive/folders/1ngjUh6UzA99-XLi6esK9OdP7ORhU6i8R?usp=sharing

📕 Paper: https://arxiv.org/abs/2308.16460v1

⭐️ Dataset: https://paperswithcode.com/dataset/flare7k

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥2🍾2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
👨‍🎓Data Science: Machine Learning

Build a movie recommendation system and learn the science behind one of the most popular and successful data science techniques.

Гарвардский университет предлагает курс "Машинное обучение" БЕСПЛАТНО!

В рамках этого курса вы создадите систему рекомендаций по фильмам и узнаете, что лежит в основе методов машинного обучения.

📌Course

ai_machinelearning_big_data
🔥316👍6🐳4🥴1
✅️ Point-Bind & Point-LLM: Aligning 3D with Multi-modality

Point-Bind is a 3D multi-modality model with a joint embedding space among 3D point cloud, image, language, audio, and video.

Point-LLM - это первая мультимодальная большая языковая модель, которая не требует ввода трехмерных объектов и учитывает мультимодальный ввод для генерации🌟

🖥 Github: https://github.com/ziyuguo99/point-bind_point-llm

Demo: http://imagebind-llm.opengvlab.com/

📕 Paper: https://arxiv.org/abs/2309.00615v1

⭐️ Dataset: https://paperswithcode.com/dataset/esc-50

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍6🔥5👀1
🔥Master Data Science for free

Вторая большая подборка бесплатных курсов для получения степени в области Data Science.

📂 Computer Science 101
https://online.stanford.edu/courses/soe-ycscs101-computer-science-101

📂 Machine Learning Specialization
https://coursera.org/specializations/machine-learning-introduction

📂 Artificial Intelligence for Robotics
https://udacity.com/course/artificial-intelligence-for-robotics--cs373

📂 Designing Your Career
https://online.stanford.edu/courses/tds-y0003-designing-your-career

📂 Stanford: Теория игр
https://online.stanford.edu/courses/soe-ycs0002-game-theory

📂 Machine Learning with Python
https://www.freecodecamp.org/learn/machine-learning-with-python/

📂 Probability and Statistics: To P or Not To P? (Coursera)
https://www.coursera.org/learn/probability-statistics

📂 Numpy полный бесплатный курс
https://www.youtube.com/playlist?list=PLysMDSbb9Hcz3Gdi9oV-btohZ9zhths-r

📂Углубленное машинное обучение
https://www.kaggle.com/learn/intro-to-machine-learning

📂 Stat 110: Harvard University (YouTube)
https://www.youtube.com/watch?v=KbB0FjPg0mw&list=PL2SOU6wwxB0uwwH80KTQ6ht66KWxbzTIo&index=1

📂 The Open Source Data Science Masters
https://github.com/datasciencemasters/go

📂 Google - искусственный интеллект для всех
https://edx.org/learn/artificial-intelligence/google-google-ai-for-anyone

📂Microsoft - ИИ для начинающих
https://microsoft.github.io/AI-For-Beginners

📂 IBM - AI for Everyone: Освоить основы
https://edx.org/learn/artificial-intelligence/ibm-ai-for-everyone-master-the-basics

📂 Гарвард - Введение в искусственный интеллект с помощью Python
https://cs50.harvard.edu/ai/2023

📂 Введение в генеративный ИИ
https://cloudskillsboost.google/journeys/118

📂 Deep Learning - Finetuning Large Language Models
https://deeplearning.ai/short-courses/finetuning-large-language-models/

📂Microsoft - Основы ИИ в Azure
https://learn.microsoft.com/en-us/training/paths/create-no-code-predictive-models-azure-machine-learning/

📂Linux Foundation - Основы работы с данными и искусственным интеллектом
https://edx.org/learn/computer-programming/the-linux-foundation-data-and-ai-fundamentals

📂12 linux курсов:
https://news.1rj.ru/str/linuxkalii/538

📂 Alison - 13 бесплатных курсов по ИИ
https://alison.com/tag/artificial-intelligence

📂 Проекты по искусственному интеллекту
https://mygreatlearning.com/academy/learn-for-free/courses/artificial-intelligence-projects

📂 Introduction to Internet of Things:
https://online.stanford.edu/courses/xee100-introduction-internet-things

📂 Graph Search, Shortest Paths, and Data Structures
https://coursera.org/learn/algorithms-graphs-data-structures

📂 Python:
http://cs50.harvard.edu/python/2022/

📂 Machine Learning:
http://developers.google.com/machine-learning/crash-course

📂 Deep Learning
http://introtodeeplearning.com

📂 Data Analysis
http://pll.harvard.edu/course/data-analysis-life-sciences-4-high-dimensional-data-analysis

📂 Линейная Алгебра
http://pll.harvard.edu/course/data-analysis-life-sciences-2-introduction-linear-models-and-matrix-algebra

📂 Algebra basics
https://www.khanacademy.org/math/algebra-basics

📂 Excel и PowerBI
http://learn.microsoft.com/training/paths/modern-analytics/

📂 Визуализация данных:
http://pll.harvard.edu/course/data-science-visualization

📂 PowerBI
http://learn.microsoft.com/users/collinschedler-0717/collections/m14nt4rdwnwp04

📂 Tableau:
http://tableau.com/learn/training

📂 Statistics:
http://cognitiveclass.ai/courses/statistics-101

📂 SQL:
http://online.stanford.edu/courses/soe-ydatabases0005-databases-relational-databases-and-sql

ai_machinelearning_big_data
👍28🔥138👏2🥱1
🌐 Сервис GigaChat от Сбера имеет большие перспективы как в России, так и в других странах мира

Об этом заявил директор Российской ассоциации электронных коммуникаций (РАЭК) Сергей Гребенников.

По словам эксперта, сегодня с текстом и изображениями работают многие диджитал-специалисты — сервис позволит им повысить скорость работы и вдохновит новые идеи. При этом Гребенников отметил, что сервис, благодаря пользователям, и сам сможет быстрее развиваться.

«Здорово, что инновационные инструменты становятся доступны широкой аудитории: как показывает практика, пользователи помогают компаниям совершенствовать продукты и генерировать новые подходы к их развитию. Это крайне важно в современной гонке технологий. Уверен, что Сбер продолжит и дальше развивать функционал GigaChat, а также создавать новые продукты на основе технологий ИИ», — подчеркнул он.

📌 Источник

ai_machinelearning_big_data
🤣31👍13🗿42🌭2🤪2🔥1🥴1😐1🖕1