Generative Ai – Telegram
Generative Ai
3.63K subscribers
289 photos
117 videos
7 files
830 links
Анонсы интересных библиотек и принтов в сфере AI, Ml, CV для тех кто занимается DataScience, Generative Ai, LLM, LangChain, ChatGPT

По рекламе писать @miralinka,
Created by @life2film
Download Telegram
Forwarded from Denis Sexy IT 🤖
– Показали GPT4-4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах.

– GPT4-4o это «Омнимодель» натренированная сразу на тексте, фото и видео — то есть та самая мультимодальность которую мы ждали.

– GPT4-4o уже доступна через API и стоит в два раза дешевле, и работает в 2 раза быстрее.

– Показали улучшенную версию аудио-чата через ассистента — она теперь шутит, понимает ваши эмоции; теперь ассистента можно перебивать своим голосом и сам ассистент говорит с эмоциями, и вы можете просить ее менять эти эмоции (даже петь). Переводчик с помощью GPT4-4o просто работает как в Sci-Fi кино (не путаясь и не требуя дополнительных нажатий кнопок).

– Запустят десктопные приложение наконец-то, чтобы не в вебе сидеть; в десктопном приложении ей можно показывать экран целиком и просить ее подправить код, что-то рассказать и тп. То есть это ассистент, который всегда видит ваш экран.


Дополнительные мелочи:

— Заявленные фичи выкатят через пару недель.
— Теперь через приложение можно просто ей показывать видео фид и она будет давать советы как решить какую-то задачу (не нужно фоткать ничего, работает как стрим);

— Во время демки ассистент тормозил хехе.

А вот что я предсказывал в посте выше и что сбылось или не сбылось:

Демку ассистента как из фильма Her
Полную мультимодальность: модель будет обучена сразу на видео, аудио, картинках и тексте
Размер контекстного окна в 1М (мы не знаем пока)
Новую архитектуру к новой модели, у которой сразу будут все фишки выше
GPT4 обновление с лучшим написанием кода, или 4.5 или 4.1 (с названиями, они, конечно, не консистентны)
Новую версию Dalle 3, с улучшенным фотореализмом
👍3
Forwarded from e/acc
Сегодня твиттер взорвался. Экс-сотрудник OpenAI из команды Superalignment опубликовал 165-страничный документ о будущем ИИ.

Там много деталей, фактов, индукции и вполне разумных прогнозов, поэтому прежде чем строчить гневные и безумные комментарии крайне советую прочитать сам документ.

- AGI к 2027 году более чем вероятен.
- После AGI переход к ASI (сверхинтеллекту) за счет самообучения будет очень быстрым, почти мгновенным
- AGI — это самый существенный геополитический ресурс, куда важнее, чем ядерное оружение и страны пойдут на многое, чтобы получить его первым. В статье приводятся примеры того как китайцы шпионят за ИИ-компаниями в США.
- сегодня большой дата-центр это единицы или десятки мегаватт, но с ИИ потребность вырастет на, как минимум, 4 порядка (x 10,000)
- мы увидим единый вычислительный кластер стоимостью в триллион долларов в течении пяти лет. самая рациональная инвестиция со стороны state actors и big tech — это compute, атомная энергия и инфраструктура для первых двух.
- NVIDIA, MSFT, AMZN, GOOG уже сегодня планируют капекс в $100B в квартал на датацентры только для ИИ
- к 2030 году ежегодно и глобально будет инвестироваться $8T в ИИ (включая чипы и компьют), а так же только для ИИ будет потребляться больше чем 100% э/э генерируемой в США сегодня
- к 2026 году выручка одной из big tech компаний от ИИ превысит $100B
- это не безумно, и сравнимые расходы и сдвиги происходили во время Манхеттенского проекта или Промышленной революции и строительства ж/д

Завтра продолжу со второй частью

Если вам лень читать, то можете послушать вышедший сегодня 4-часовой подкаст о том же самом: https://www.dwarkeshpatel.com/p/leopold-aschenbrenner
👍5🔥4🐳4🥴21
Forwarded from Machinelearning
⚡️ Qwen2 - самый крутой релиз откртых LLM со времен Llama 3!

Alibaba только что выпустили свое новое семейство мультиязычных моделей, которых превосходят по производительности Llama 3 по многим параметрам.

🤯 Qwen2 выпущен в 5 размерах, обучен на 29 языках!

5️⃣ Размеры: 0.5B, 1.5B, 7B, 57B-14B (MoE), 72B.
Контекст: 32k для 0.5B & 1.5B, 64k для 57B MoE, 128k для 7B и 72B
Поддерживает 29 языков.
📜 Выпущены под лицензией Apache 2.0, за исключением версии 72B.

📖 BLOG: https://qwenlm.github.io/blog/qwen2/
🤗 HF collection: https://huggingface.co/collections/Qwen/qwen2-6659360b33528ced941e557f
🤖 https://modelscope.cn/organization/qwen
💻 GitHub: https://github.com/QwenLM/Qwen2

@ai_machinelearning_big_data
👍7🔥31
Сергей Марков дописал свою большую двухтомную книгу про ИИ «Охота на электроовец: большая книга искусственного интеллекта»! Поздравляем!

Я читал ранние версии и знаю, что Сергей проделал огромную работу по сбору исторического материала. Абсолютно разумно и без хайпа, с технически достоверными обзорами архитектур. Рекомендую.

Полные электронные версии книги (epub, docx, pdf) можно скачать с сайта бесплатно:

https://markoff.science
2
Forwarded from Machinelearning
🌟 Stability AI опубликовала открытую модель Stable Audio для генерации музыки

Stability AI опубликовала в открытом доступе модель Stable Audio, предназначенную для генерации музыки, звуковых эффектов и окружения.

Stable Audio Open — открытая модель в формате Text-to-Audio, которая генерирует 47-секундные музыкальные семплы и звуковые эффекты. К примеру, можно попросить нейросеть создать партию на фортепиано, барабанный бит, гитарный риф, пение соловья или шум дождя. Для генерации надо отправить текстовый запрос. Примечательно, что пользователи могут генерировать музыку на своих данных. К примеру, барабанщик может загрузить записи своих битов и на их основе создавать новые.

В блоге компании рассказали, что открытая модель отличается от одноимённой коммерческой. Закрытая версия Stable Audio может генерировать трёхминутные треки с проработанной структурой. Также поддерживается режим Audio-to-Audio, в котором в качестве запроса можно передать уже готовый трек.

Открытую модель Stable Audio Open обучили на данных сервисов FreeSound и Free Music Archive, что позволило соблюсти все требования к авторским правам. При этом для доступа к нейросети всё равно необходимо ознакомиться с лицензией использования.

🤗 Модель и веса опубликованы на Hugging Face.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥1
Forwarded from Machinelearning
Flash Diffusion — ускорение любой диффузионной модели генерации изображений в несколько шагов

Так называется работа, которую на днях опубликовали Clément Chadebec, Onur Tasar и их коллеги.
Это метод дистилляции для создания быстрых диффузионных моделей.
При обучении модели таким методом на наборах данных COCO2014 и COCO2017 показатели FID и CLIP-Score достигают хороших значений; при этом требуется всего несколько часов обучения на GPU и меньшее количество параметров модели, чем требуют существующие методы.

🟡 Страничка Flash Diffusion
🖥 GitHub

🤗 Flash SD
🤗 Flash SDXL

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1
Forwarded from эйай ньюз
🔥Веса SD-3 Medium уже доступны!

Stability релизнули Stable Diffusion 3 Medium. Она бесплатна для некоммерческого пользования. За коммерческое использование придётся платить: $20 в месяц для индивидуальных пользователей и небольших бизнесов, для бизнесов побольше - энтерпрайз лицензия.

Блогпост
Веса

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Последние новости в области ИИ

Stable Diffusion 3

Stability AI анонсировала запуск третьей версии своей модели генерации изображений по тексту, Stable Diffusion 3 (SD3). Основные улучшения включают повышенное качество изображения, лучшее понимание сложных запросов и улучшенную генерацию текста на изображениях. Новая модель использует архитектуру мультимодального диффузионного трансформера, что позволяет ей обрабатывать сложные задачи, такие как реалистичное отображение рук и повторяющихся узоров. SD3 также обеспечивает высокую производительность, создавая изображения разрешением 1024x1024 пикселей за 35 секунд на GPU Nvidia RTX 4090

Apple представила iOS 18 с нейросетями, новой Siri:

Apple представила Apple Intelligence, AI . Это система искусственного интеллекта, которая будет выполнять роль помощника. Она анализирует действия пользователя, запоминает информацию и помогает владельцу Айфона.

* Siri получила значительные улучшения, теперь она лучше понимает ошибки в речи, поддерживает контекст диалога и может принимать текстовые команды. Siri также интегрирована с функцией просмотра контента на экране и может обращаться к ChatGPT для получения более точных ответов.

Генераторы текста в видео

Разработка генераторов текста в видео стремительно развивается. Новые модели способны преобразовывать текстовые описания в видеоролики, создавая их с высоким уровнем реализма. Эти технологии находят применение в различных областях, от создания контента для социальных сетей до профессиональной кинематографии. Одним из стал
Luma Labs, которые выкатили свой text2video и дают создать 30 видео в месяц бесплатно. Качество на уровне SORA

https://lumalabs.ai/dream-machine/creations
Кто уже тестил? Как вам?

Подпишись Generative Ai
🔥7👍2
Искусственный интеллект уже давно перестал быть чем-то фантастическим и стал неотъемлемой частью нашей повседневной жизни. Подготовили для вас небольшую подборку из разных областей применения ИИ.

Здесь собраны последние важные новости в области Generativ AI.

Ответ на один из самых частых вопросов, который волнует людей в последний год. Стоит ли бояться, что ИИ лишит вас вашей работы.
Спойлер «жизнь женщин станет только лучше»

Для тех, кто ведет свои телеграм-каналы, полезный пост о том, как помогает ChatGPT в работе над каналом

Здесь подробно о том, как QA используют ИИ и где он реально необходим

Коммуникационный агент - инструмент саморазвития, помогающий общаться, быть в контакте со своим будущим Я.

Умер ли SEO в 2024? Как ИИ изменил правила игры в SEO и что делать, чтобы оставаться на вершине.

ИИ стремительно меняет правила игры, и только те, кто готов учиться и меняться, смогут оставаться на вершине в этом новом мире.

Готовы ли вы к вызовам будущего?
👍1
Forwarded from Алина Салаватова 💎 (Alina)
Вам тоже кажется, что сервисы генерации видео появляются со всех сторон и одновременно.

Уже хоть каждый день можно сидеть и тестировать новые. Сегодня небольшой обзор нового сервиса.

Затестила https://haiper.ai. Сервис генерации видео из текста. Есть заготовки, С чего я собственно и начала. Для теста считаю этого достаточно, чтобы понять о чем это и зачем это.

Видео делается примерно 5 минут. Можно выбрать длину видео 2 или 4 секунды, в будущем обещают и 8 сек. Доступны разные форматы видео, под тик-ток и горизонтальные. Есть несколько вариантов. В целом результат не плохой, если не обращать внимания, что в конце видео у единорога появляется пятая нога. Есть бесплатный тариф. Запутить генерацию видео можно без регистрации, но увидеть результат можно только авторизовавшись. На бесплатном тарифе доступно создание 10 видео в день. Запускать в работу можно 3 видео одновременно. Видео с водяным знаком, можно сразу скачать, а также есть прямая ссылка, поделиться в соцсетях. На выбор 2 соцсети - X и facebook.

Итак, что у меня получилось за 10 минут пользования сервисом.

1. A Unicorn is Running in The Cloud City , realistic, fine details, natural colors, lifelike textures, precise shading, accurate proportions style

2. Make me video about superduperai
Интересно увидеть, как нейронка воспринимает SuperDuperAI. Повеселило.

3. Watercolour style), blending of colours, soft gradient, John Singer Sargent, Edward Hopper, (((highly dynamic))), big movements, ((black and white movie style)), retro, 1960s, grayscale layers,

Если интересно, попробуйте https://haiper.ai.

Какие сервисы тестили вы? Что еще хотели бы затестить? Пишите, давайте тестить вместе.
👍3