Generative Ai – Telegram
Generative Ai
3.63K subscribers
289 photos
117 videos
7 files
830 links
Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT

По рекламе писать @miralinka,
Created by @life2film
Download Telegram
Forwarded from AI для Всех (Artemii)
🚀 Keynote: Следующее поколения ИИ для разработчиков

На докладе был продемонстрирован ряд новых интересных инструментов для работы с искусственным интеллектом и облачными вычислениями, что подчеркивает стремление компании интегрировать искусственный интеллект в свои основные сервисы.

- Microsoft Cloud и Copilot Stack: Интеграция искусственного интеллекта в каждое облачное решение, преобразующее работу разработчиков с Azure, которая теперь предлагает платформу для приложений, данных и искусственного интеллекта.

- Copilot для Microsoft 365: Использование больших языковых моделей (LLM) OpenAI и Microsoft Graph, обеспечивающих улучшенный пользовательский опыт.

- Security Copilot: Предлагает специализированные знания для обеспечения безопасности организации.

- Microsoft Copilot Studio: No/low code решение без кода с тысячами готовых плагинов, упрощающее создание новых приложений Copilot.

- GitHub Copilot: Теперь более мощный, с такими возможностями, как объяснение кода в Visual Studio Code и быстрое исправление ошибок.

- Синергия данных и ИИ: Признавая важность данных, Microsoft подчеркнула успех ChatGPT, работающего на базе Azure Cosmos DB, и представила Microsoft Fabric для расширенной аналитики данных.

- Инновационные функции: Векторный поиск в Azure AI Search и полный доступ к лучшим моделям OpenAI.

- Партнерство с NVidia: Продвижение NeMO для расширения возможностей ИИ.

- Chat Studio: Интуитивно понятная платформа для создания и настройки решений для чатов с легкой интеграцией поиска Azure AI и озер данных.

- PromptFlow: Визуальный интерфейс для создания цепочек промптов, Python и RAG, развертываемый как Azure endpoint.

- Azure Content Safety: Внедрение фильтров контента и настраиваемых параметров допустимости для более безопасного контента.

Выводы
Акцент Microsoft на простоте использования, безопасности и надежной аналитике данных указывает на значительный сдвиг в сторону ИИ-ориентированных решений, упрощающих сложные задачи и стимулирующих инновации среди разработчиков.
🔥4👍2
idea2movie (VideoGPT) на OpenAI Store.

🎬 idea2movie (VideoGPT) - это готовое решение в мире создания видео. Просто напишите в чате запрос, описывая видео, которое вы хотите создать.

После отправки запроса, вам нужно будет немного подождать. Всего через 5-10 минут вы получите ссылку на скачивание вашего персонализированного видео, полностью сгенерированного с помощью нейронных сетей.

Инструмент для авторов, маркетологов, образовательных учреждений и всех, кто ищет уникальный способ для воплощения своих идей в видео.

👀Посетите idea2movie (VideoGPT) прямо сейчас!
🔥7👍31
Forwarded from ML for Value / Ваня Максимов (Ivan Maksimov)
GPT-4 не особо впечатлил меня

Весь прошлый год хайповали LLM-ки и GenAI. Которые вроде крутые, но в массовое внедрение в бизнесы пока не вошли. Шок, но даже массовой замены поддержки на ChatGPT пока не случилось

В это же время мимо меня прошел релиз DINO-v2 🦕
И вот он уже очень меня очень удивил

Self Supervised Learning на картинках
Вдумайтесь: мы просто показали нейронке картинки без лейблов, аннотации текста и вообще чего-то еще, и получилось выучить SOTA фичи! Бьет даже OpenCLIP в zero-shot сетапе

Широта применения
Работает для классификации, сегментации, оценки карты глубины и кучи других задач

В общем, я бы ставил на подобные self-supervised encoder модели для применения в бизнесе, чем на gpt-like (вспомните бум BERT). Ну а пока можете потыкать демо DINO-v2

P.S. К посту прикреплены скрины оценки карты глубины, сегментации объектов и матчинга точек между 2умя картинками
👍11🥴4🔥3
Forwarded from Machinelearning
🎉 Release Code Llama 70B!

Вышла Code Llama 70B: новая, более производительная версия LLM для генерации кода - доступная по той же лицензии, что и предыдущие модели Code Llama.

- Base https://hf.co/codellama/CodeLlama-70b-hf
- Python https://hf.co/codellama/CodeLlama-70b-Python-hf
- Instruct https://hf.co/codellama/CodeLlama-70b-Instruct-hf

CodeLlama-70B-Instruct достигает 67,8 балла в HumanEval, что делает ее одной из самых высокопроизводительных открытых моделей на сегодняшний день.

CodeLlama-70B - это самая производительная база для тонкой настройки моделей генерации кода.

Разрешено коммерческое использование

➡️Скачать модели

@ai_machinelearning_big_data
2🔥2👍1
Forwarded from Kali Novskaya (Tatiana Shavrina)
Media is too big
VIEW IN TELEGRAM
OpenAI только что выпустили SORA— text2video модель

Генерация видео по текстовому описанию наступила!

Сегодня обещают статью

Промпт: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

🟣https://openai.com/sora#research
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Forwarded from Технологии | Нейросети | Боты
🥳 Stable Diffusion 3.0

Компания Stability AI выпустила предварительную версию Stable Diffusion 3.0, своей следующей флагманской модели text2image.

Улучшено качество изображений, улучшено написание текста
(?! смотрим прикреплённую пикчу), более высокая производительность и тд.

На данный момент доступ через лист ожидания.

• Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Forwarded from SuperDuperAi
This media is not supported in your browser
VIEW IN TELEGRAM
Hey, friends!
We've made SuperDuperAI so you can make some really cool videos just by using text. https://superduperai.co/

All you need to do is describe the video you want to create, and our AI will create a fully generated video for you, crafting scenes, music, voiceovers, and much more!
👍3
Друзья, очень всем советую запись вебинара CB Insights по Generative AI - https://www.cbinsights.com/research/briefing/webinar-generative-ai-predictions-2024/recording/

кому лень - суммирую 2 словами:
1. ХАЙП
2. НЕОПРЕДЕЛЕННОСТЬ

https://news.1rj.ru/str/shoifot 🦄🐳🐅
👍1
Forwarded from Machinelearning
🔥 SOTA: Stable Diffusion 3:вышла! 🔥

Stable Diffusion 3 - это новая технология преобразования текста в изображение SOTA.

Новая архитектура Multimodal Diffusion Transformer (MM Bit) использует отдельные наборы весов для изображений и языка, улучшая возможности понимания текста / правописания.

Новая масштабируемая архитектура для синтеза текста в изображение
Двунаправленное смешивание потоков токенов текста и изображений
Самые крупные модели превосходят открытые модели SOTA, такие как SDXL

Blog: https://stability.ai/news/stable-diffusion-3-research-paper
Paper: https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf

ai_machinelearning_big_data
3👍2🔥1
Сейчас очень много сервисов, позиционирующих себя, как сервисы генерации видео из текста с помощью ИИ. Обычно у многих написано Text2Video. И когда начинаешь с кем-то говорить на эту тему, обычно всегда говорят, что полно аналогов.

На самом деле, многие сервисы позиционируют себя одинаково, но под капотом спрятано совершенно другое.

Подборка сервисов создания видео из текста

https://vc.ru/964837
👍2🔥1
Forwarded from Сиолошная
Google открыли для всех доступ к Gemini 1.5 Pro с 1М токенов контекста: https://aistudio.google.com/app/prompts/new_chat

Можно загрузить видео или целую папку с файлами для анализа

Го тестировать
🔥8
Forwarded from эйай ньюз
Интро в Трансформеры для чайников

3Blue1Brown, популярный математический ютубер, начал выпускать серию видео о том, как работает трансформер. Первое видео посвящено эмбеддингам и тому, как моделька определяет, какой токен ей выдать. Вышло лучшее объяснение темы "для чайников", с анимациями и довольно простым языком. Обещает ещё две части: одну посвящённую Attention, другую MLP.

Если после просмотра возникнет желание погрузиться в детали:
- У Андрея Карпатого есть видео где он имплементирует и объясняет как саму GPT, так и её токенизатор.
- Лекция Интро в большие языковые модели (LLM), тоже от Карпатого.

#ликбез
@ai_newz
🔥43👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла Ллама 3.

8B, 70B. (8192 tokens)
После тестиков в ближайшее время узнаем что в реальности по бенчам.

Веса (придется формочку заполнить)
https://huggingface.co/collections/meta-llama/meta-llama-3-66214712577ca38149ebb2b6

Код
https://github.com/meta-llama/llama3

Обещают 400B+ модельку. Марк Цукерберг все еще тренирует её. (на видео)
👍2🔥2😁2
Forwarded from Технологии | Нейросети | Боты
🗒 Стэнфордский университет выпустил ежегодный доклад об ИИ-индустрии. Главное:

— Из-за дороговизны обучения нейросетей, частные компании значительно обгоняют научные организации по выпуску ИИ;
— ИИ стали чаще использовать в науке: GNoME помог открыть 380 тыс. новых стабильных материалов для производства технологий, а AlphaDev — представил более быстрые алгоритмы сортировки;
— ИИ влияет на повышение качества труда: люди выполняют задачи быстрее и лучше, используя нейросети;
— Открытого кода стало больше. Из 149 нейросетевых моделей 98 с исходным кодом. Однако закрытые модели остаются более производительными;
— Автоматизированных рейтингов для оценки генеративных моделей уже не хватает, поэтому всё более важным становится мнение людей об ИИ. Например, та же Chatbot Arena Leaderboard;
— Люди стали больше думать о нейросетях. Процент тех, кто считает, что ИИ серьезно повлияет на их жизнь, выросла с с 60% до 66%.

• Полный доклад

@aiaiai
Please open Telegram to view this post
VIEW IN TELEGRAM
SuperDuperAI - сервис генерации видео с помощью ИИ. Предназначен для упрощения создания наративного видеоконтента с помощью генеративного ИИ для маркетинга.

Мы используем Stable Diffusion для генерации изображений и видео и различные LLM через Langchain (OpenAi, Mixtral).

Наша архитектура разработана для масштабируемости в облаке, при поддержке Microsoft для Ai стартапов, что позволяет нам развертывать узлы OpenAI в Azure.

Безопасное управление данными: использование Okta Auth0 для безопасного хранения данных.

Система построена на основе Kubernetes, Airflow ETL и Python для асинхронной обработки тысяч заказов.

Про сервис👇

https://vc.ru/tribuna/1141585
👍2😁1
Forwarded from Machinelearning
⚡️ llamafile — утилита для быстрого запуска ИИ-моделей

Инструмент llamafile от Mozilla даёт возможность упаковать веса LLM в исполняемый файл, который без установки можно запустить практически на любой современной платформе. Поддерживаются архитектуры x86-64 и ARM64, а также системы macOS, Windows, Linux, FreeBSD, OpenBSD и NetBSD.

llamafile работает практически со всеми LLM, недавно была добавлена поддержка модели Phi-3 Mini 4k, а также LLaMA3, Grok, Mixtral 8x22b и Command-R.

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥32
Forwarded from AI для Всех (Kirill)
Gazelle - первая open source VoiceToLLM модель

TincansAI объявил о выпуске Gazelle v0.2, инновационной речевой модели, которая может может обрабатывать устные запросы и длинные аудиофайлы напрямую, без их транскрипции или распознавания речи.

Благодаря прямой обработке аудио данных, модель быстрее, точнее, а также способна интерпретировать эмоции и даже сарказм в речи.

Код "из коробки", с абсолютно нулевой оптимизацией и работающий с полной точностью, достигает скорости 120 миллисекунд до первого токена, что значительно быстрее, чем любой другой сопоставимый подход. По оценкам авторов, задержка более сложной системы с синтезом составит менее 300 миллисекунд, что меньше воспринимаемой человеком задержки в реальном времени

Насколько известно авторам, данная модель является первой и единственной open source моделью, способной вести диалог в реальном времени. Кроме того, разработчики публично проводят оценку безопасности и сообщают об успешных атаках на речевую модель. Наконец, это первая речевая модель, в которой применяется мультимодальная оптимизация предпочтений.

Производительность Gazelle оптимизирована для реальных приложений, таких как поддержка клиентов, телефонные звонки и общение в чате.

🌐 Сайт
🤗 HuggingFace
👨‍💻Демо1
✖️ Демо2
Please open Telegram to view this post
VIEW IN TELEGRAM
41👍1
Forwarded from Denis Sexy IT 🤖
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах.

– GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали.

– GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.

– Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок).

– Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран.


Дополнительные мелочи:

— Заявленные фичи выкатят через пару недель.
— Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим);

— Во время демки ассистент тормозил хехе.

А вот что я предсказывал в посте выше и что сбылось или не сбылось:

Демку ассистента как из фильма Her
Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте
Размер контекстного окна в 1М (мы не знаем пока)
Новую архитектуру к новой модели, у которой сразу будут все фишки выше
GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны)
Новую версию Dalle 3, с улучшенным фотореализмом
👍3