📌 SNARE (a multimodal alignment probing benchmark)
Scale multimodal alignment probing benchmark, to detect the vital linguistic components, e.g., lexical, semantic, and syntax knowledge,
Новый крупномасштабный мультимодальный бенчмарк, позволяющий обнаружить важные лингвистические компоненты в предварительно обученных моделях "vision-language ".
🖥 Github: https://github.com/wangfei-2019/snare
📕 Paper: https://arxiv.org/abs/2308.12898v2
⭐️ Dataset: https://paperswithcode.com/dataset/aro
ai_machinelearning_big_data
Scale multimodal alignment probing benchmark, to detect the vital linguistic components, e.g., lexical, semantic, and syntax knowledge,
Новый крупномасштабный мультимодальный бенчмарк, позволяющий обнаружить важные лингвистические компоненты в предварительно обученных моделях "vision-language ".
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤4👍2
🧑 FaceChain
Deep-learning toolchain for generating your Digital-Twin.
FaceChain — это набор инструментов машинного обучения для создания собственного цифрового двойника.
Всего из одной портретной фотографию, вы можете создать своего собственного цифрового двойника и начать генерировать персональные портреты с различными настройками.
🖥 Github: https://github.com/modelscope/facechain
📕 Paper: https://arxiv.org/abs/2308.14256v1
🖥 Colab: https://colab.research.google.com/drive/1cUhnVXseqD2EJiotZk3k7GsfQK9_yJu_?usp=sharing
⭐️ Dataset: https://paperswithcode.com/dataset/fairface
ai_machinelearning_big_data
Deep-learning toolchain for generating your Digital-Twin.
FaceChain — это набор инструментов машинного обучения для создания собственного цифрового двойника.
Всего из одной портретной фотографию, вы можете создать своего собственного цифрового двойника и начать генерировать персональные портреты с различными настройками.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤7🔥6
📖 LongBench: A Bilingual, Multitask Benchmark for Long Context Understanding
LongBench includes 14 English tasks, 5 Chinese tasks, and 2 code tasks, with the average length of most tasks ranging from 5k to 15k, and a total of 4,750 test data.
LongBench - первый двуязычный, бенчмарк понимания длинных контекстов, позволяющий проводить тщательную оценку контекстов.
LongBench включает 21 датасет по 6 категориям задач на английском и китайском языках.
🖥 Github: https://github.com/thudm/longbench
📕 Paper: https://arxiv.org/abs/2308.14710v1
🤗 HF: https://huggingface.co/datasets/THUDM/LongBench
⭐️ Dataset: https://paperswithcode.com/dataset/youtube-vis-2021-validation
ai_machinelearning_big_data
LongBench includes 14 English tasks, 5 Chinese tasks, and 2 code tasks, with the average length of most tasks ranging from 5k to 15k, and a total of 4,750 test data.
LongBench - первый двуязычный, бенчмарк понимания длинных контекстов, позволяющий проводить тщательную оценку контекстов.
LongBench включает 21 датасет по 6 категориям задач на английском и китайском языках.
🤗 HF: https://huggingface.co/datasets/THUDM/LongBench
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍4🔥2😐1
An Easy-to-use Instruction Generation Framework for LLMs.
EasyInstruct - это пакет Python для обучения больших языковых моделей (LLM), таких как
GPT-3, Llama, ChatGLM, в ваших исследовательских экспериментах. Он прост в использовании и легко расширяемый.pip install easyinstruct -i https://pypi.org/simpleai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Scaling up GANs for Text-to-Image Synthesis
1B-parameter GigaGAN, achieving lower FID than Stable Diffusion v1.5, DALL·E 2, and Parti-750M.
GigaGAN - 1B модель генерации изображений из текста. Высокая скорость генерации изображений 0.13 сек в разрешении 512px, на порядки быстрее других моделей.
🖥 Github: https://github.com/mingukkang/GigaGAN/tree/main/evaluation
⏩ Project: https://mingukkang.github.io/GigaGAN/
🎞 Video: https://www.youtube.com/watch?v=UyoXmHS-KGc
📕 Paper: https://arxiv.org/abs/2303.05511
⭐️ Dataset:https://paperswithcode.com/dataset/svamp
ai_machinelearning_big_data
1B-parameter GigaGAN, achieving lower FID than Stable Diffusion v1.5, DALL·E 2, and Parti-750M.
GigaGAN - 1B модель генерации изображений из текста. Высокая скорость генерации изображений 0.13 сек в разрешении 512px, на порядки быстрее других моделей.
🎞 Video: https://www.youtube.com/watch?v=UyoXmHS-KGc
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥3❤2
Read to the end to find out how to generate a 10 second audio sample in just 1 second!
В этом посте показано, как использовать AudioLDM 2 c Hugging Face 🧨 Diffusers, исследуя ряд оптимизаций для сокращения времени генераций более чем в 10 раз при минимальном снижении качества выходного аудио.
🤗 HH: https://huggingface.co/blog/audioldm2
🎧 Paper: https://arxiv.org/abs/2308.05734
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍3🔥2
CRATE (is a white-box transformer architecture, where each layer performs a single step of an alternating minimization algorithm to optimize the sparse rate reduction objective
Алгоритм оптимизации сегментации с помощью архитектуры white-box трансформеров.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤4🔥2
SAM-Med2D ➕
SAM-Med2D, the most comprehensive studies on applying SAM to medical 2D images.
🏆 Самая большая на сегодняшний день база данных по сегментации медицинских изображений (4,6 млн. изображений и 19,7 млн. масок) для обучения моделей.
🏆 Модель файнтюнинга Segment Anything Model (SAM).
🏆 Бенчмарк SAM-Med2D на крупномасштабных наборах данных.
🖥 Github: https://github.com/uni-medical/sam-med2d
🖥 Colab: https://colab.research.google.com/github/uni-medical/SAM-Med2D/blob/main/predictor_example.ipynb
📕 Paper: https://arxiv.org/abs/2308.16184
⭐️ Dataset: https://paperswithcode.com/dataset/sa-1b
ai_machinelearning_big_data
SAM-Med2D, the most comprehensive studies on applying SAM to medical 2D images.
🏆 Самая большая на сегодняшний день база данных по сегментации медицинских изображений (4,6 млн. изображений и 19,7 млн. масок) для обучения моделей.
🏆 Модель файнтюнинга Segment Anything Model (SAM).
🏆 Бенчмарк SAM-Med2D на крупномасштабных наборах данных.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥12🥰3🤔1🕊1
Новое решение по эффективному удаления бликов на изображениях и восстановления источников света.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤4🔥2🍾2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
👨🎓Data Science: Machine Learning
Build a movie recommendation system and learn the science behind one of the most popular and successful data science techniques.
Гарвардский университет предлагает курс "Машинное обучение" БЕСПЛАТНО!
В рамках этого курса вы создадите систему рекомендаций по фильмам и узнаете, что лежит в основе методов машинного обучения.
📌Course
ai_machinelearning_big_data
Build a movie recommendation system and learn the science behind one of the most popular and successful data science techniques.
Гарвардский университет предлагает курс "Машинное обучение" БЕСПЛАТНО!
В рамках этого курса вы создадите систему рекомендаций по фильмам и узнаете, что лежит в основе методов машинного обучения.
📌Course
ai_machinelearning_big_data
🔥31❤6👍6🐳4🥴1
Point-Bind is a 3D multi-modality model with a joint embedding space among 3D point cloud, image, language, audio, and video.
Point-LLM - это первая мультимодальная большая языковая модель, которая не требует ввода трехмерных объектов и учитывает мультимодальный ввод для генерации🌟
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍6🔥5👀1