ИИ Что? – Telegram
ИИ Что?
71 subscribers
48 photos
14 videos
1 file
91 links
ИИ Что?
Ещё один канал про искусственный интеллект. Делимся интересными новостями.
Также у нас есть подкаст!

Youtube: https://www.youtube.com/@ai_what
Яндекс.Музыка: https://music.yandex.ru/album/23068198

Admins
@IlyaB12
@koval_alvi
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Еще в ноябре можно было вырубить электричество - сейчас уже поздно.
chatGPT вышел в поля.

В частности инфобезопасники (и хакеры) активно обсуждают возможности chatGPT для создания вирусов, зловредных скриптов, вымогателей, шифровальщиков и прочей нечисти.
Ибо код всего этого безобразия был в интернетике, на котором учился добрый доктор ИИ.
Вот держите обсуждение того, как на chatGPT можно создавать:

- стилер на основе Python, который ищет распространенные типы файлов, копирует их в случайную папку внутри папки Temp, архивирует их и загружает на жестко заданный FTP-сервер.

- шифровальщики

- скрипты Dark Web Marketplaces для автоматизированной торговли нелегальными или украденными товарами, такими как украденные учетные записи или платежные карты

В общем, если раньше, вам надо было уметь писать код, чтобы хакерствовать, то теперь вам достаточно уметь читать код (и писать текстовые подсказки).

Сценарии Тэгмарка сбываются быстрее, чем мы думали. ИИ познал суть кожаных и теперь может делать с ними все, что угодно. Но пока не хочет. Но некоторые кожаные хотят.
https://research.checkpoint.com/2023/opwnai-cybercriminals-starting-to-use-chatgpt/
Перед новым годом у меня вышел туториал по разметке данных с CVAT и fiftyone на канале Deepschool.
Очень рад поделиться этой статьей с вами!
Forwarded from DeepSchool
Как ускорить разметку при помощи CVAT и Fiftyone

Задача: разметить тысячи изображений быстро и дешево, чтобы не тратить время на простые кейсы. Решение: предразметить картинки, выбросить мусор и размечать самые полезные. В идеале решить задачу без костылей, чтобы переиспользовать решение в будущих задачах.

В новой статье-туториале вы узнаете как с нуля поднять у себя сервис для разметки CVAT и познакомитесь с Fiftyone — сервисом, который ускорит работу с датасетом.

Рассказываем про сервисы на примере задачи детекции. Читайте подробнее в телеграфе: https://telegra.ph/Razmechaem-dannye-Bystro-nedorogo-12-27
👍2🍓1
Forwarded from AI для Всех
Какие модели лучше?

Мне часто бывает нужна baseline модель классификации, точность которой будет использоваться как эталон для тестирования своих моделей (например representation learning для downstream задач) или просто предобученная модель, чтобы быстро начать экспериментировать. И каждый раз возникает вопрос, какую архитектуру использовать.

Хочу поделится ноутбуком с наглядным сравнением разных архитектур, где модели оцениваются с точки зрения точности и скорости на наборе данных Imagenet. Это сравнение основано на библиотеке предобученных моделей PyTorch Image Models (timm).

Спойлер: модели семейства LeViT - самые быстрые и самые точные среди самых быстрых. Это неудивительно - они представляют собой гибрид лучших идей CNN и трансформеров. Семейство BEiT самые точные, но и самые медленные (хотя нужно быть осторожным с интерпретацией, т.к. они обучены на большем наборе данных ImageNet-21k).

А моя любимая ResNet18 отстает почти на 10 пунктов от такой же по скорости LeViT-256 🐈

📖Ноутбук
👨‍💻timm
@karray
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Rebryk Blog
🤯 Cmd J - ChatGPT shortcut for Chrome

Последнее время я каждый день по много раз использую ChatGPT. В основном, чтобы она исправила мой кривой английский или задую ей глупые вопросы 😆

Но мне надоело постоянно копировать текст из текущей вкладки, переключаться на ChatGPT, вставлять текст, дописывать промпт, получать ответ и копировать его обратно. Хочется же проще это делать!

Поэтому мы с ребятами собрали Cmd J - командная панель, через которую можно дергать ChatGPT на любом сайте. Выделяешь текст, затем ⌘J, выбираешь быстро команду или пишешь свой промпт, а затем жмякаешь ентер, чтобы вставить результат обратно. Красота!

Пока правда вставка работает далеко не на всех сайтах. Кто бы мог подумать, что это оказывается сложная задача!

Пока расширение находится в сторе на ревью, вы можете его установить себе из архивчика. Смотрите первый коммент под постом.

Если приложение будет падать или работать через раз, то это норма, хах. Жалобы и фидбек кидайте мне в личку @rebryk

А если у вас есть на уме очень классные промты, которые вы сами гоняете каждый день, то их тоже присылайте. Самые классные добавим в релиз!

Ну как вам?
Hf выпустили годный блог по обучению на одной gpu
blog
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Text-To-Video на подходе!

Смотрите, что вытворяют ребятки из Гугла!
На входе референс в виде видео или картинки или даже набора из 10-20 картинок и текстовое описание, что вы хотите сотворить с этим референсами, под какую дудку вы хотите заставить их плясать.
ИИ извлекает из референсов "смыслы" и потом анимирует их в соответствии с тем, что вы насочиняли в текстовом промпте.
И это вам не дефорумный бурлеж, это гладкое видео. Оцените примеры с животными.

Посмотрите полное видео - это прототип вселенской монтажки, где вы просто орете на свои картинки-референсы: "а ну ка, поддали эмоций в кадре и весело побежали в закат!".
И все бегут...

https://www.youtube.com/watch?v=xcvnHhfDSGM

Не зря авторы именуют проект Video Editing Tool

А картиночки-то на входе можно генерить с помощью ИИ. И персонажей, и фоны...

Скрипач не нужен, куда катится мир!

Полная информация тут: https://dreamix-video-editing.github.io/

Спасибо за утреннюю наводку CGIT_Vines.
👍1🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Микрософт бахнула новый Бинг!

Гугль нервно закуривает овальные сигареты.
Ибо.
В новом браузере Edge новый поиск Bing работает на обновленном chatGPT, который теперь зовется Прометей - Microsoft заявила, что это более мощная языковая модель, чем GPT 3.5, которая лучше отвечает на поисковые запросы, предоставляет более актуальную информацию(дообучена на данных после 2021) и умеет в аннотированные ответы.

В демонстрационном ролике поисковая система даже смогла ответить на вопросы о своем собственном запуске, ссылаясь на новости, опубликованные за последний час(!)

Микрософт заявляет, что новый Bing будет запущен сегодня «для ограниченного предварительного просмотра», и пользователи смогут попробовать ограниченное количество запросов и зарегистрироваться для получения полного доступа в будущем. Вайтлист в общем.

Также Микрософт показала то, что она называет «новым Bing», работающим в различных конфигурациях. Один из них показывает традиционные результаты поиска рядом с аннотациями AI (вверху), а другой режим позволяет пользователям напрямую общаться с чат-ботом Bing, задавая ему вопросы в обычном интерфейсе чата, таком как ChatGPT (внизу).

В дополнение к новому интерфейсу Bing Микрософт запускает две новые функции с улучшенным ИИ для своего браузера Edge: «чат» и «compose». Они будут встроены в боковую панель Edge.

«Чат» позволяет пользователям обобщать веб-страницу или документ, который они просматривают, и задавать вопросы о его содержании, а «compose» действует как помощник по письму; помогая генерировать текст — от электронных писем до постов в социальных сетях — на основе нескольких стартовых подсказок.

Вот не зря Микрософт вонзали миллиарды в OpenAI....

Поэтому Гугль вчера истошно взорал про своего нового бота Бард. Который пока в теории..

https://www.theverge.com/2023/2/7/23587454/microsoft-bing-edge-chatgpt-ai
😱1
Сегодня вышла еще одна моя статья. Спасибо ребятам из DeepSchool)
Forwarded from DeepSchool
Unet

Кажется, первое слово, которое ассоциируется с сегментацией у большинства инженеров и ресерчеров – Unet. Возможно, у кого-то уже сложилась похожая ассоциация и с диффузионными моделями. Ведь в них также используются U-образные архитектуры.

Поэтому про Unet важно знать и можно вспоминать 🙂 Мы разобрали архитектуру 2015 года, а также соотнесли ее с современным положением дел. А именно рассказали:
- какая идея кроется за Unet;
- какие решения были до этой архитектуры;
- какие идеи в статье уже не актуальны;
- что можно использовать в качестве upsampling;
- и как можно улучшить результат Unet.

Читайте, чтобы освежить знания и узнать новое: https://deepschool-pro.notion.site/Unet-bf1d734f847e4bfd8d8c795cdfa6bbc6
🔥3
Я рад сообщить, что на канале DeepSchool вышла моя новая статья! В то же время я работаю над новым выпуском подкаста.
🔥2
Forwarded from DeepSchool
​​CVAT SDK PyTorch Adapter

Если вам надоело вручную выгружать задания от разметчиков и объединять их для загрузки на сервер, то эта статья для вас.

В новом материале обсудим:
- как загрузить данные из CVAT напрямую в torch.utils.data.Dataset;
- советы при работе с CVAT PyTorch SDK;
- недостатки SDK на данный момент.

Читайте новую статью по ссылке, чтобы готовить датасеты быстрее: https://deepschool-pro.notion.site/CVAT-SDK-PyTorch-Adapter-e223563927454322a8d56076e59b8b17
👍3🔥2
Сейчас идет Датафест 2023 на котором мне попался очень интересный доклад "momentum истыны". Рассказывается про некоторые особенности работы с SGD, ADAM и т.д. с визуализацией внутреннего состояния обучения на примере упрощенной ResNet.
После доклада сможете лучше понимать как пользоваться SGD и не только.

Кидаю ссылку на доклад с привязкой ко времени
https://youtu.be/j7LAX3Fqhwc?t=5311
Это просто моя мечта, пошел разбираться с генерацией музыки!
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
MusicGen - SOTA для генерации музыки по тексту

Братишки из Meta AI только что доставили лучшую нейронку для синтеза музыки по тексту либо по заданной мелодии.

Архитектура основана на авторегрессионном трансформере (только декодер). Вся генерации идет тупо через один трансформер, без всяких иерархических апсемплингов, как обычно это было в предыдущих работах.

Код вылили в составе не просто так, а в составе новой библиотеки Audiocraft, которая задумана для дальнейшего ресерча в генерации аудио. Есть модели разного размера: от 300M до 3.3B параметров. Для инференса локально потребуется 16GB VRAM, но можно и в колабе.

Музыканты, битмейкеры и диджеи - налетайте!

Код + веса
Сайт с примерами генеараций
Демо на HF
Колаб на поиграться

@ai_newz
👍2🔥2