NEW BOT Телеграм, страница - 102061699

Machinelearning

@ai_machinelearning_big_data

348K subscribers

4.54K photos

914 videos

17 files

4.99K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

348K subscribers

Machinelearning

🔎 Датасет для анализа русскоязычных отзывов на организации

Яндекс опубликовал крупнейший русскоязычный датасет, в котором содержится 500 тысяч отзывов, собранных с января по июнь 2023 года. Туда входят адреса и названия организаций, список рубрик, оценки пользователей и отзывы. Датасет позволяет, к примеру, производить сентимент-анализ и лингвистический анализ.

Github: https://github.com/yandex/geo-reviews-dataset-2023
Habr: https://habr.com/ru/companies/yandex/articles/763832/

@ai_machinelearning_big_data

👍24🔥8❤4

10K viewsedited 15:25

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

✨ DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation

A novel 3D content generation framework that achieves both efficiency and quality simultaneously.

DreamGaussian - новый фреймворк для генерации 3D-контента, позволяющий достичь одновременно эффективности и высокого качества генераций.

Работает на безе алгоритма преобразования трехмерных гауссианов в текстурированные сетки с применения файнтюнинга для улучшения деталей. Обширные эксперименты демонстрируют высокую эффективность и конкурентоспособное качество генерации предложенного подхода.

🖥

Github: https://github.com/dreamgaussian/dreamgaussian

☑️

Image-to-3D: https://colab.research.google.com/drive/1sLpYmmLS209-e5eHgcuqdryFRRO6ZhFS?usp=sharing

☑️

Text-to-3d: https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb

📕

Paper: https://arxiv.org/abs/2309.16653v1

⭐️

Dataset: https://paperswithcode.com/dataset/nerf

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥6❤4

9.2K views09:32

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🔊

Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation

Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ.

git clone git@github.com:guyyariv/TempoTokens.git

🖥

Github: https://github.com/guyyariv/TempoTokens

📕

Paper: https://arxiv.org/abs/2309.16429v1

⭐️

Dataset: https://paperswithcode.com/dataset/audioset

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤6🔥6😁1

9.4K views16:16

Machinelearning

✅

Demystifying CLIP Data

MetaCLIP takes a raw data pool and metadata and yields a balanced subset over the metadata distribution.

Новый масштабируемый алгоритм MetaCLIP, работающий в конвейере обработки данных. MetaCLIP, примененная к CommonCrawl с 400 млн. пар данных "изображение-текст", превосходит данные CLIP по многим стандартным показателям. В классификации ImageNet точность MetaCLIP составляет 70,8%, что превосходит точность CLIP в 68,3% на моделях ViT-B.

🖥

Github: https://github.com/facebookresearch/metaclip

📕

Paper: https://arxiv.org/pdf/2309.16671v1.pdf

⭐️

Dataset: https://paperswithcode.com/dataset/laion-400m

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥7❤4

10.1K views09:25

Machinelearning

🤖

AutoAgents: A Framework for Automatic Agent Generation

Generate different roles for GPTs to form a collaborative entity for complex tasks.

AutoAgents, инновационный фреймворк, который адаптивно генерирует и координирует множество специализированных агентов для создания ИИ-команды в соответствии с различными задачами.

🖥

Github: https://github.com/LinkSoul-AI/AutoAgents

📕

Paper: https://arxiv.org/abs/2309.17288v1

⭐️

Demo: https://huggingface.co/spaces/LinkSoul/AutoAgents

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍21❤3🔥3

10.6K viewsedited 12:24

Machinelearning

Яндекс опубликовал плейлист с докладами конференции Practical ML.

Вот некоторые из них:

— Алексей Морозов, руководитель группы модернизации нейронных сетей Яндекса. Про то, как можно полностью инкапсулировать от ML’щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU

— Юлий Шамаев, Data Science Team Lead, Банк ВТБ. Про про геоэмбеддинги – векторное представление контекста в пространственной аналитике. Они помогают определить лучшее расположение для банкоматов и банковских отделений.

— Евгений Сидоров, Head of AI, Third Opinion. Про то, как компенсировать недостаток трёхмерной информации на основе множественных проекций при анализе медицинских снимков.

@ai_machinelearning_big_data

👍21❤3🔥3😁1

9.39K viewsedited 16:04

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Memory Gym: Partially Observable Challenges to Memory-Based Agents in Endless Episodes

Среда для обучения, тестирования и запуска агентов основе памяти.

🖥

Github: https://github.com/marcometer/endless-memory-gym

🖥

Colab: https://colab.research.google.com/drive/1LjlUOEer8vjGrz0rLM8pP5UyeNCsURkY?usp=sharing

📕

Paper: https://openreview.net/forum?id=jHc8dCx6DDr

⭐️

Dataset: https://paperswithcode.com/dataset/arcade-learning-environment

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍19🔥5❤3

9.19K views18:09

Machinelearning

☑️

Efficient Streaming Language Models with Attention Sinks

StreamingLLM, an efficient framework that enables LLMs trained with a finite length attention window to generalize to infinite sequence length without any fine-tuning.

Фреймворк для развертывания больших языковых моделей в потоковых приложениях, таких как многораундовые диалоги, где ожидается длительное взаимодействие, является настоятельной необходимостью, но сопряжено с двумя серьезными проблемами. StreamingLLM позволяет Llama-2, MPT, Falcon и Pythia стабильно и эффективно выполнять моделирование общения с количеством лексем до 4 млн. и более.

🖥

Github: https://github.com/mit-han-lab/streaming-llm

📕

Paper: http://arxiv.org/abs/2309.17453

⭐️

Dataset: https://paperswithcode.com/dataset/pg-19

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13❤3🔥1

9.59K views09:01

Machinelearning

🦅

Jury: A Comprehensive Evaluation Toolkit

Комплексный набор инструментов для оценки НЛП-экспериментов, предлагающий различные автоматизированные метрики. Jury предлагает удобный и простой в использовании интерфейс.

pip install jury

🖥

Github: https://github.com/obss/jury

📕

Paper: https://arxiv.org/abs/2310.02040v1

🖥

Colab: https://colab.research.google.com/github/obss/jury/blob/main/examples/jury_evaluate.ipynb

⭐️

Demos: https://github.com/Parskatt/DeDoDe/blob/main/demo

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤2🔥1

9.63K views15:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🤖

GenSim: Generating Robotic Simulation Tasks via Large Language Models

Фреймворк для генерации и моделирования симуляций для роботов с помощью больших языковых моделей.

🖥

Github: https://github.com/liruiw/gensim

✔️

Project: https://liruiw.github.io/gensim

📕

Paper: https://arxiv.org/abs/2310.01361v1

✅

Dataset: https://huggingface.co/datasets/Gen-Sim/Gen-Sim

⭐️

Demos: https://huggingface.co/spaces/Gen-Sim/Gen-Sim

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20🔥4🗿2❤1

9.57K viewsedited 11:13

Machinelearning

✅

DSPy: Programming—not prompting—Foundation Models

DSPy - это фреймворк от Stanfordnlp для решения сложных задач с помощью языковых моделей и поисковых моделей. DSPy объединяет методы промпт-инжиниринга и тонкой настройки ЛМ, а также подходы к рассуждениям, самосовершенствованию и дополнению поисковых моделей и инструментов. Все это выстроено в модулях, которые компонуются и обучаются.

DSPy представляет автоматический компилятор, который учит LM, как выполнять декларативные шаги в вашей программе. В частности, компилятор DSPy осуществляет внутреннюю трассировку вашей программы и затем составляет высококачественные пропиты для больших ЛМ.

pip install dspy-ai

🖥

Github: https://github.com/stanfordnlp/dspy

⏩

Tutorial: https://github.com/stanfordnlp/dspy/blob/main/intro.ipynb

🖥

Colab: https://colab.research.google.com/github/stanfordnlp/dspy/blob/main/intro.ipynb

📕

Paper: https://arxiv.org/abs/2308.05734

⭐️

Dataset: https://paperswithcode.com/dataset/hotpotqa

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16❤3🥰1🤩1

9.63K views11:23

Machinelearning

✅

Ключевой ML-специалист HuggingFace Ahsen Khaliq опубликовал статью о Kandinsky

Khaliq в своем Twitter (X) поделился статьей Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent Diffusion, которая в разделе DailyPapers заняла первое место, обогнав статьи и Deepmind, и Carnegie Mellon.

В статье рассказывается о диффузионной модели Kandinsky для генерации изображений по тексту.

🕊

X: https://twitter.com/_akhaliq/status/1710106706569478573?s=52&t=hSNPltUk1ZT1M605JGLRnA

📕

Paper: https://huggingface.co/papers

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍26🔥11❤7🥴4🎉3

9.96K views16:01

Machinelearning

✅️

T3Bench: Benchmarking Current Progress in Text-to-3D Generation

T3Bench - это новый фреймворк преобразования текста в трехмерное изображение, содержащий разнообразные текстовые промпты трех уровней комплексности, специально разработанные для 3D-генерации. Для оценки качества и выравнивания текста содержит две автоматические метрики, основанные на многоракурсных изображениях, создаваемых 3D-контентом.

🖥

Github: https://github.com/THU-LYJ-Lab/T3Bench

📕

Paper: https://arxiv.org/abs/2310.02977v1

⭐️

Dataset: https://paperswithcode.com/dataset/nerf

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥2❤1

11K viewsedited 09:42

Machinelearning

Guideline following Large Language Model for Information Extraction

Новая модель для извлечения информации, обученная следовать рекомендациям по аннотированию. GoLLIE превосходит предыдущие подходы по извлечению информации без использования обучающих примеров .

🖥

Github: https://github.com/hitz-zentroa/gollie

⏩

Tutorial: https://github.com/stanfordnlp/dspy/blob/main/intro.ipynb

⭐️

Project: https://hitz-zentroa.github.io/GoLLIE/

📕

Paper: https://arxiv.org/abs/2310.03668v1

⭐️

Dataset: https://paperswithcode.com/dataset/harveyner

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤7🔥2

11.3K views09:02

Machinelearning

💸

Enhancing Financial Sentiment Analysis via Retrieval Augmented Large Language Models: Open Source Code

Новый фреймворк больших языковых моделей с поисковым дополнением, предназначенный для анализа финансовых настроений и обеспечивающий точные и обоснованные прогнозы.
Метод настройки промптов обеспечивает точные прогнозы на поставленные пользователем задачи анализа финансовых новостей.
Проведя обширные оценки, показано, что подход значительно превосходит как традиционные модели анализа настроений, так и известные LLM общего назначения.

git clone https://github.com/AI4Finance-Foundation/FinGPT.git

🖥

Github: https://github.com/AI4Finance-Foundation/FinGPT/tree/master/fingpt/FinGPT-RAG

📕

Paper: https://arxiv.org/abs/2310.04027v1

⭐️

FinNLP: https://github.com/ai4finance-foundation/finnlp

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13🔥6❤1

11.1K views11:17