🦙 LLM-Pruner: On the Structural Pruning of Large Language Models
Compress your LLMs to any size;
LLM-Pruner: модель прунинга для больших языковых моделей.
🖥 Github: https://github.com/horseee/llm-pruner
⏩ Paper: https://arxiv.org/abs/2305.11627v1
📌 Dataset: https://paperswithcode.com/dataset/piqa
ai_machinelearning_big_data
Compress your LLMs to any size;
LLM-Pruner: модель прунинга для больших языковых моделей.
📌 Dataset: https://paperswithcode.com/dataset/piqa
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Mask-Free Video Instance Segmentation
MaskFreeVIS, achieving highly competitive VIS performance, while only using bounding box annotations for the object state.
Новый высокопроизводительный фреймворк для сегментации видео.
🖥 Github: https://github.com/SysCV/maskfreevis
⏩ Paper: https://arxiv.org/pdf/2303.15904.pdf
📌 Project: http://www.vis.xyz/pub/maskfreevis/
ai_machinelearning_big_data
MaskFreeVIS, achieving highly competitive VIS performance, while only using bounding box annotations for the object state.
Новый высокопроизводительный фреймворк для сегментации видео.
📌 Project: http://www.vis.xyz/pub/maskfreevis/
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥7❤1
📎 Instruction-tuning Stable Diffusion with InstructPix2Pix
InstructPix2Pix training strategy to follow more specific instructions related to tasks in image translation (such as cartoonization) and low-level image processing (such as image deraining).
В этом посте рассматривается настройка промптов для обучения Stable Diffusion. С помощью этого метода мы сможем легко настраивать Stable Diffusion на обработку изображений, используя входное изображение, в качестве промпта, например - Применить фильтр мультфильма к изображению.
🖥 Post: https://huggingface.co/blog/instruction-tuning-sd
⭐️ Training and inference code: https://github.com/huggingface/instruction-tuned-sd
📌 Demo: https://huggingface.co/spaces/instruction-tuning-sd/instruction-tuned-sd
⏩ InstructPix2Pix: https://huggingface.co/timbrooks/instruct-pix2pix
🔍Datasets and models from this post: https://huggingface.co/instruction-tuning-sd
ai_machinelearning_big_data
InstructPix2Pix training strategy to follow more specific instructions related to tasks in image translation (such as cartoonization) and low-level image processing (such as image deraining).
В этом посте рассматривается настройка промптов для обучения Stable Diffusion. С помощью этого метода мы сможем легко настраивать Stable Diffusion на обработку изображений, используя входное изображение, в качестве промпта, например - Применить фильтр мультфильма к изображению.
📌 Demo: https://huggingface.co/spaces/instruction-tuning-sd/instruction-tuned-sd
🔍Datasets and models from this post: https://huggingface.co/instruction-tuning-sd
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥3❤1
Media is too big
VIEW IN TELEGRAM
🆕 Yandex Cloud добавила новый режим работы в Yandex DataSphere — Dedicated
Yandex DataSphere — это сервис для полного цикла машинного обучения, в котором есть все необходимые инструменты для разработки и интеграции с другими облачными сервисами.
Что открывает выделенный режим Dedicated:
— возможность зарезервировать виртуальную машину в облаке под свой проект и работать с ней сколько нужно;
— ускорение работы моделей машинного обучения для задач по анализу данных.
Что ещё изменилось в Yandex DataSphere:
— режим Serverless остаётся, вы также можете его выбрать и оплачивать вычислительные мощности только во время реального обучения;
— появилась новая версия Jupyter Notebook, это популярный редактор кода для ML-разработки. Обновили интерфейс и добавили предустановленные расширения.
Все подробности можете узнать по ссылке, а обсудить в сообществе разработчиков и аналитиков Yandex DataSphere➡️
Yandex DataSphere — это сервис для полного цикла машинного обучения, в котором есть все необходимые инструменты для разработки и интеграции с другими облачными сервисами.
Что открывает выделенный режим Dedicated:
— возможность зарезервировать виртуальную машину в облаке под свой проект и работать с ней сколько нужно;
— ускорение работы моделей машинного обучения для задач по анализу данных.
Что ещё изменилось в Yandex DataSphere:
— режим Serverless остаётся, вы также можете его выбрать и оплачивать вычислительные мощности только во время реального обучения;
— появилась новая версия Jupyter Notebook, это популярный редактор кода для ML-разработки. Обновили интерфейс и добавили предустановленные расширения.
Все подробности можете узнать по ссылке, а обсудить в сообществе разработчиков и аналитиков Yandex DataSphere➡️
👎6🔥6🥱4❤2🤷♂1👍1🤔1
Interactive Data Synthesis for Systematic Vision Adaptation via LLMs-AIGCs Collaboration
GPT-4 can do anything even in visual tasks——Label anything just all in one-pipeline.
Аннотирование чего угодно в визуальных задачах - все в одном конвейере с GPT-4.
🖥 Github: https://github.com/yuqifan1117/labal-anything-pipeline
⏩ Paper: https://arxiv.org/abs/2305.12799v1
ai_machinelearning_big_data
GPT-4 can do anything even in visual tasks——Label anything just all in one-pipeline.
Аннотирование чего угодно в визуальных задачах - все в одном конвейере с GPT-4.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤3🔥2
EfficientSpeech: An On-Device Text to Speech Model
It generates mel spectrogram at a speed of 104 (mRTF) or 104 secs of speech per sec on an RPi4.
EfficientSpeech, или сокращенно ES, - это мощная нейронная модель преобразования текста в речь (TTS). I
🖥 Github: https://github.com/roatienza/efficientspeech
⏩ Paper: https://arxiv.org/abs/2305.13905v1
📌 Dataset: https://paperswithcode.com/dataset/ljspeech
ai_machinelearning_big_data
It generates mel spectrogram at a speed of 104 (mRTF) or 104 secs of speech per sec on an RPi4.
EfficientSpeech, или сокращенно ES, - это мощная нейронная модель преобразования текста в речь (TTS). I
📌 Dataset: https://paperswithcode.com/dataset/ljspeech
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13👍5❤1
Как построить систему геоаналитики с применением ML
Решать аналитические бизнес-задачи с большим количеством значимых признаков помогает машинное обучение. Новая статья на Хабре предлагает рассмотреть примеры работы сервисов геоаналитики VK Predict и демонстрирует, какие модели машинного обучения используются при построении таких систем.
Читать статью: https://habr.com/ru/companies/vk/articles/734102/
ai_machinelearning_big_data
Решать аналитические бизнес-задачи с большим количеством значимых признаков помогает машинное обучение. Новая статья на Хабре предлагает рассмотреть примеры работы сервисов геоаналитики VK Predict и демонстрирует, какие модели машинного обучения используются при построении таких систем.
Читать статью: https://habr.com/ru/companies/vk/articles/734102/
ai_machinelearning_big_data
🔥5🥱5👍2
QLoRA: Efficient Finetuning of Quantized LLMs
Model name Guanaco, outperforms all previous openly released models on the Vicuna benchmark, reaching 99.3% of the performance level of ChatGPT while only requiring 24 hours of finetuning on a single GPU.
QLoRA - эффективный метод файнтюнинга, который позволяет сократить использование памяти, чтобы произвести файнтюнинг модели с 65B параметрами на одном GPU 48 ГБ.
🖥 Github: https://github.com/artidoro/qlora
⏩ Paper: https://arxiv.org/abs/2305.14314
⭐️ Demo: https://huggingface.co/spaces/uwnlp/guanaco-playground-tgi
📌 Dataset: https://paperswithcode.com/dataset/ffhq
ai_machinelearning_big_data
Model name Guanaco, outperforms all previous openly released models on the Vicuna benchmark, reaching 99.3% of the performance level of ChatGPT while only requiring 24 hours of finetuning on a single GPU.
QLoRA - эффективный метод файнтюнинга, который позволяет сократить использование памяти, чтобы произвести файнтюнинг модели с 65B параметрами на одном GPU 48 ГБ.
📌 Dataset: https://paperswithcode.com/dataset/ffhq
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥6❤4
🦖 Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data Curation
Dynosaur, a large-scale instruction tuning dataset obtained automatically with significantly lower generation costs.
Новый фреймворк для широкого спектра NLP задач для instruction tuning и генерации датсетов, при низких высчислительных затратах и высоком качетсве данных.
🖥 Github: https://github.com/wadeyin9712/dynosaur
🔎 Project: https://dynosaur-it.github.io/
⏩ Paper: https://arxiv.org/abs/2305.14327
📌 Dataset: https://paperswithcode.com/dataset/ffhq
ai_machinelearning_big_data
Dynosaur, a large-scale instruction tuning dataset obtained automatically with significantly lower generation costs.
Новый фреймворк для широкого спектра NLP задач для instruction tuning и генерации датсетов, при низких высчислительных затратах и высоком качетсве данных.
🔎 Project: https://dynosaur-it.github.io/
📌 Dataset: https://paperswithcode.com/dataset/ffhq
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍9🥰1🌭1
Prompt-Free Diffusion: Taking "Text" out of Text-to-Image Diffusion Models
The performance of Text2Image is largely dependent on text prompts. In Prompt-Free Diffusion, no prompt is needed, just a reference images.
Prompt-Free Diffusion - это модель диффузии, которая принимает визуальные данные для генерации изображений без ввода текстовых промптов.
🖥 Github: https://github.com/shi-labs/prompt-free-diffusion
🔎 Demo: https://huggingface.co/spaces/shi-labs/Prompt-Free-Diffusion
⏩ Paper: https://arxiv.org/abs/2305.16223v1
📌 Dataset: https://paperswithcode.com/dataset/ffhq
ai_machinelearning_big_data
The performance of Text2Image is largely dependent on text prompts. In Prompt-Free Diffusion, no prompt is needed, just a reference images.
Prompt-Free Diffusion - это модель диффузии, которая принимает визуальные данные для генерации изображений без ввода текстовых промптов.
🔎 Demo: https://huggingface.co/spaces/shi-labs/Prompt-Free-Diffusion
📌 Dataset: https://paperswithcode.com/dataset/ffhq
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥3🥰1
Large Language Models as Tool Makers
In this work, we take an initial step towards removing this dependency by proposing a closed-loop framework, referred to as LLMs A s Tool Makers (LATM), where LLMs create their own reusable tools for problem-solving.
Фреймворк для работы с большими языковыми моделями для создатния инструментов и скриптов на Python.
🖥 Github: https://github.com/ctlllll/llm-toolmaker
⏩ Paper: https://arxiv.org/pdf/2305.17126v1.pdf
📌 Dataset: https://paperswithcode.com/dataset/big-bench
ai_machinelearning_big_data
In this work, we take an initial step towards removing this dependency by proposing a closed-loop framework, referred to as LLMs A s Tool Makers (LATM), where LLMs create their own reusable tools for problem-solving.
Фреймворк для работы с большими языковыми моделями для создатния инструментов и скриптов на Python.
📌 Dataset: https://paperswithcode.com/dataset/big-bench
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥2
Стань лучшим на онлайн-хакатоне PROFBUH HACKATHON | JUNE 🏆
Открыта регистрация на онлайн-хакатон от компании Профбух и Акселератора Возможностей!
Кейс:
🔹Автоматическое создание текстовых публикаций на основе записанного видео.
Даты хакатона:
23 – 25 июня 2023 года
Дедлайн регистрации:
19 июня 23:59
Регистрация и подробности - https://clck.ru/34WoFU
Кому подходит хакатон?
🔸Студентам, разработчикам, дизайнерам, продакт-менеджерам и аналитикам.
Что нужно будет сделать?
🔸Разработать web-систему для автоматического создания уникальных статей на основе видео из YouTube.
Что тебя ждёт?
🔹2 дня в онлайн-формате
🔹встречи с экспертами, мастер-классы и питчи
🔹крутой командный проект и интересный кейс в резюме
🔹призовой фонд – 300.000₽
Регистрируйся, решай кейс и выигрывай призы!🏆
Открыта регистрация на онлайн-хакатон от компании Профбух и Акселератора Возможностей!
Кейс:
🔹Автоматическое создание текстовых публикаций на основе записанного видео.
Даты хакатона:
23 – 25 июня 2023 года
Дедлайн регистрации:
19 июня 23:59
Регистрация и подробности - https://clck.ru/34WoFU
Кому подходит хакатон?
🔸Студентам, разработчикам, дизайнерам, продакт-менеджерам и аналитикам.
Что нужно будет сделать?
🔸Разработать web-систему для автоматического создания уникальных статей на основе видео из YouTube.
Что тебя ждёт?
🔹2 дня в онлайн-формате
🔹встречи с экспертами, мастер-классы и питчи
🔹крутой командный проект и интересный кейс в резюме
🔹призовой фонд – 300.000₽
Регистрируйся, решай кейс и выигрывай призы!🏆
❤2👍2
Multilingual/multidomain question generation datasets, models, and python library for question generation.
lmqg - это библиотека python для генерации вопросов и ответов (QAG) с помощью языковых моделей (LM).
📌 Dataset: https://paperswithcode.com/dataset/squad
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍4🔥3
Нейронки уже безвозвратно изменили айти. В этом году только ленивый не написал, что вставьте название профессии сюда скоро заменит ChatGPT.
Как реально ИИ отразится на работе программиста и как в системе, где нейросеть за секунды может сгенерировать простой код, выживать джунам, пишут в телеграм-канале Skolkovo LIVE.
А еще они объясняют базу для стартаперов и рассказывают про нестыдные российские проекты, подпишитесь.
Как реально ИИ отразится на работе программиста и как в системе, где нейросеть за секунды может сгенерировать простой код, выживать джунам, пишут в телеграм-канале Skolkovo LIVE.
А еще они объясняют базу для стартаперов и рассказывают про нестыдные российские проекты, подпишитесь.
Telegram
Skolkovo LIVE
Как нейросети меняют программирование? 🤖
ChatGPT заставил многих специалистов всерьез переживать о будущем своей профессии — в том числе, и программистов. Ведь ИИ может без труда сгенерировать код. Как это повлияет на ИТ?
Спросим у Алексея Каленчука, директора…
ChatGPT заставил многих специалистов всерьез переживать о будущем своей профессии — в том числе, и программистов. Ведь ИИ может без труда сгенерировать код. Как это повлияет на ИТ?
Спросим у Алексея Каленчука, директора…
👍8😁1
🦙 BigTrans 🚀
BigTrans which adapts LLaMA that covers only 20 languages and enhances it with multilingual translation capability on more than 100 languag
Предварительные эксперименты по многоязычному переводу показывают, что BigTrans сравним с ChatGPT и Google Translate на многих языках и даже превосходит ChatGPT в 8 языковых парах.
🖥 Github: https://github.com/ZNLP/BigTrans/tree/main
⏩ Paper: https://arxiv.org/abs/2305.18098v1
📌 Dataset: https://paperswithcode.com/dataset/flores-200
ai_machinelearning_big_data
BigTrans which adapts LLaMA that covers only 20 languages and enhances it with multilingual translation capability on more than 100 languag
Предварительные эксперименты по многоязычному переводу показывают, что BigTrans сравним с ChatGPT и Google Translate на многих языках и даже превосходит ChatGPT в 8 языковых парах.
📌 Dataset: https://paperswithcode.com/dataset/flores-200
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 GPT4Tools: Teaching LLM to Use Tools via Self-instruction
GPT4Tools is a centralized system that can control multiple visual foundation models. It is based on Vicuna (LLaMA), and 71K self-built instruction data.
GPT4Tools - это интеллектуальная система, которая может автоматически принимать решения, управлять и использовать различные визуальные модели, позволяя пользователю взаимодействовать с изображениями во время диалога с Chatgpt.
🖥 Github: https://github.com/stevengrove/gpt4tools
⏩ Paper: https://arxiv.org/abs/2305.18752v1
📌 Project: https://gpt4tools.github.io/
ai_machinelearning_big_data
GPT4Tools is a centralized system that can control multiple visual foundation models. It is based on Vicuna (LLaMA), and 71K self-built instruction data.
GPT4Tools - это интеллектуальная система, которая может автоматически принимать решения, управлять и использовать различные визуальные модели, позволяя пользователю взаимодействовать с изображениями во время диалога с Chatgpt.
📌 Project: https://gpt4tools.github.io/
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍6🔥2