Machinelearning – Telegram
383K subscribers
4.46K photos
863 videos
17 files
4.9K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Introducing BERTopic Integration with the Hugging Face Hub

BERTopic provides a powerful tool for users to uncover significant topics within text collections, thereby gaining valuable insights.

BERTopic - это современная библиотека Python, которая упрощает процесс моделирования тем, используя различные трансформеры и c-TF-IDF для создания кластеров на основе плотности, позволяющих легко интерпретировать темы, сохраняя при этом важные слова в описаниях тем.

pip install bertopic

🤗 Hugging face: https://huggingface.co/blog/bertopic

🖥 Github: https://github.com/MaartenGr/BERTopic

Colab: https://colab.research.google.com/#fileId=https://huggingface.co/spaces/davanstrien/blog_notebooks/blob/main/BERTopic_hub_starter.ipynb

📌 Docs: https://maartengr.github.io/BERTopic/getting_started/quickstart/quickstart.html

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍7🔥2
В последнее время только и разговоров, что о нейросетях. Кто-то боится, что AI заберёт у них работу, а кто-то с его помощью повышают свою эффективность. Каждый, кто использует нейронки, уже немного приблизился к новой профессии. Мы ещё не знаем, как она будет называться. Но никто не мешает проявить фантазию: лид продуктового направления по ML ВКонтакте Иван Самсонов дал ей кодовое название — погонщик нейросетей.

Заглядывайте в статью и узнайте, как поймать волну перемен: вас ждёт большая подборка инструментов и небольшой туториал, как уже сейчас можно использовать их в работе.

📌Хабр: https://habr.com/ru/companies/vk/articles/738776/

ai_machinelearning_big_data
👎10👍5👨‍💻2🔥1🤣1🗿1
Positive Hack Days, новые железки и покупки

Новое видео на YouTube-канале Yandex Cloud 😎

Вместе с гостями из «ЛитРес», EORA и архитектором Yandex Cloud Евгением Парфёновым обсуждаем много интересного в регулярном выпуске Monthly Cloud News Maу:

— форум по кибербезопасности Positive Hack Days;
— сделку Microsoft и Activision Blizzard;
— сканер уязвимости контейнерных образов;
— историю DNS и лазейки в WAF;
— повседневные новости Yandex DataSphere и Yandex SpeechKit.

Хотите узнать больше? Смотрите видео и делитесь им с друзьями 😉
👍71🔥1😨1
Hiera: A Hierarchical Vision Transformer without the Bells-and-Whistles

Hiera is a hierarchical vision transformer that is fast, powerful, and, above all, simple. It outperforms the state-of-the-art across a wide array of image and video tasks while being much faster.

Hiera - это быстрый, мощный и, прежде всего, простой метод иерархической перегруппировки информации.

Он превосходит современные методы в широком спектре задач, связанных с изображениями и видео.

pip install hiera-transformer

🖥 Github: https://github.com/facebookresearch/hiera

Paper: https://arxiv.org/abs/2306.00989v1

📌 Dataset: https://paperswithcode.com/dataset/inaturalist

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥32
🔥 Подборка полезных папок с каналами для датасаентисов

Папки, где вы найдете каналы с разбором лучших практик написания кода на Python и Golang до каналов по машинному обучению и нейросетям (папки работают на последних версиях тг).

https://news.1rj.ru/str/addlist/2Ls-snqEeytkMDgy - Машинное обучение

https://news.1rj.ru/str/addlist/8vDUwYRGujRmZjFi - Python

https://news.1rj.ru/str/addlist/MUtJEeJSxeY2YTFi - Golang
🔥8👍2👎2🥰21🤓1
Wuerstchen: Efficient Pretraining of Text-to-Image Models

Novel technique for text-to-image synthesis that unites competitive performance with unprecedented cost-effectiveness and ease of training on constrained hardwar

Würstchen - это новый фреймворк для обучения моделей преобразования текста в изображения путем перемещения затратного вычислительно этапа текстового преобразования в сильно сжатое латентное пространство


🖥 Github: https://github.com/dome272/wuerstchen

Paper: https://arxiv.org/abs/2306.00637v1

📌 Colab: https://colab.research.google.com/drive/1UTP9Xn2UIrVbAXyL-SKEvyLmgVWdw-Vy

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍144🔥3🌭1
Generative AI learning path

This learning path guides you through a curated collection of content on Generative AI products and technologies.

10 бесплатных курсов от Googel, которые помогут вам погрузиться в технологии генеративного ИИ: от основ больших языковых моделей до создания и развертывания решений генеративного ИИ в Google Cloud.

Introduction to Generative AI

Introduction to Large Language Models

Introduction to Responsible AI

Introduction to Image Generation

Encoder-Decoder Architecture

Attention Mechanism

Transformer Models and BERT Model

Create Image Captioning Models

Introduction to Generative AI Studio

Generative AI Explorer - Vertex AI

https://www.cloudskillsboost.google/paths/118

ai_machinelearning_big_data
👍16🔥53🤔2
🔭 GRES: Generalized Referring Expression Segmentation

New benchmark (GRES), which extends the classic RES to allow expressions to refer to an arbitrary number of target objects.

Новый метод
и датасет расширяющий классический RES, который принимает изображение и тектовое описание в качестве входных данных для сегментации и обнаружения множественных объектов.

🖥 Github: https://github.com/henghuiding/ReLA

Paper: https://arxiv.org/abs/2306.00968

🔎 Project: https://henghuiding.github.io/GRES/

📌 New dataset: https://github.com/henghuiding/gRefCOCO

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥1
🦍 Gorilla: Large Language Model Connected with Massive APIs

Gorilla a finetuned LLaMA-based model that surpasses the performance of GPT-4 on writing API calls.

Gorilla — это модель, обученная на основе LLaMA, для вызова 1600+ сторонних API. На вход подается запрос на естественном языке, модель находит семантически и синтаксически правильное API для настройки модели мо. Производительность настроенной модели превосходит GPT-4 на трех масштабных наборах данных.

🖥 Github: https://github.com/ShishirPatil/gorilla

📕 Paper: https://arxiv.org/abs/2305.15334

🔗 Demo: https://drive.google.com/file/d/1E0k5mG1mTiaz0kukyK1PdeohJipTFh6j/view?usp=share_link

👉 Project: https://shishirpatil.github.io/gorilla/

⭐️ Colab: https://colab.research.google.com/drive/1DEBPsccVLF_aUnmD0FwPeHFrtdC0QIUP?usp=sharing

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍213🔥3🫡3❤‍🔥2
Segment Anything 3D

SAM-3D: A toolbox transfers 2D SAM segments into 3D scene-level point clouds.

Новый фреймворк, который может предсказывать маски объектов в трехмерных сценах, используя модель
"Segment-Anything" (SAM) в RGB изображениях без дополнительного обучения или настройки.

🖥 Github: https://github.com/pointcept/segmentanything3d

Paper: https://arxiv.org/abs/2306.03908v1

📌 Dataset: https://paperswithcode.com/dataset/scannet

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍8🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
📹 Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

LLaMA is working on empowering large language models with video and audio understanding capability.

Video-LLaMA - мультимодальная система, которая расширяет возможности больших языковых моделей (LLM) для понимания как визуального, так и аудио контента в видео.

🖥 Github: https://github.com/damo-nlp-sg/video-llama

📕 Paper: https://arxiv.org/abs/2306.02858

Demo: https://huggingface.co/spaces/DAMO-NLP-SG/Video-LLaMA

📌 Model: https://modelscope.cn/studios/damo/video-llama/summary

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥21
🐼 PandaLM: ReProducible and Automated Language Model Assessment

Judge large language model, named PandaLM, which is trained to distinguish the superior model given several LLMs. PandaLM's focus extends beyond just the objective correctness of responses, which is the main focus of traditional evaluation datasets.

PandaLM - обеспечивает автоматизированные сравнения между различными большими языковыми моделями (LLM). Задавая одинаковый контекст, PandaLM может сравнивать ответы различных LLM и предоставлять причину решения вместе с эталонным ответом.


🖥 Github: https://github.com/weopenml/pandalm

📕 Paper: https://arxiv.org/abs/2306.05087v1

🔗 Dataset: https://github.com/tatsu-lab/stanford_alpaca#data-release

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍183🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
📹 Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models

It is a multimodal model that merges a video-adapted visual encoder with a LLM.

Video-ChatGPT - это новая модель, способная генерировать осмысленные разговоры о видео.

🖥 Github: https://github.com/mbzuai-oryx/video-chatgpt

⭐️ Demo: https://www.ival-mbzuai.com/video-chatgpt

📕 Paper: https://arxiv.org/abs/2306.05424v1

🔗 Dataset: https://paperswithcode.com/dataset/activitynet-qa

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍104
Топ-210 технологических решений представили на фестивале «Лидеры цифровой трансформации»

Мероприятие стало финалом самого масштабного одноименного хакатона. ИТ-специалисты со всего мира вышли в офлайн, чтобы представить свои разработки для города и бизнеса. 210 команд ждут итоги и уже завтра жюри назовут имена победителей.

Центральной локацией фестиваля стал брендированный корнер Tada․team с интерактивными задачами и лаунж-зоной. Участники могут выиграть мерч, пройдя квест, сканируя qr-код и запуская приложение чат-бота «История технологий».

Сегодня на сцене выступили научно-популярные спикеры, которые рассказали участникам о последних трендах в ИТ, о квантовых информационных технологиях, эволюции мозга, инновациях в персональных ДНК-тестах и синтетическом дизайне как инструменте для стартапов. Завершился день концертом от 4NN4 (экс- Cream Soda) и группы «Винтаж».
👍185👎5🔥4🤷‍♂1
🏔️ Large Language Model for Geoscience

We introduce K2 (7B), an open-source language model trained by firstly further pretraining LLaMA on collected and cleaned geoscience literature, including geoscience open-access papers and Wikipedia pages, and secondly fine-tuning with knowledge-intensive instruction tuning data (GeoSignal).

Применение базовой языковой модели для понимания и использования знаний в области геонаук

git clone https://github.com/davendw49/k2.git
cd k2
conda env create -f k2.yml
conda activate k2


🖥 Github: https://github.com/davendw49/k2

⭐️ Demo: https://huggingface.co/daven3/k2_fp_delta

📕 Paper: https://arxiv.org/abs/2306.05064v1

🔗 Dataset: https://huggingface.co/datasets/daven3/geosignal

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥54💅1
💲 FinGPT: Open-Source Financial Large Language Models

Unlike proprietary models, FinGPT takes a data-centric approach, providing researchers and practitioners with accessible and transparent resources to develop their FinLLMs.

Большая языковая модель с открытым исходным кодом FinGPT для финансового сектор. Полный пайплайн для обучения и доработки LLM в области финансов.

🖥 Github: https://github.com/ai4finance-foundation/fingpt

⭐️ FinNLP: https://github.com/ai4finance-foundation/finnlp

📕 Paper: https://arxiv.org/abs/2306.06031v1

🔗 Project: https://ai4finance-foundation.github.io/FinNLP/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥54😱1👌1