{AI} love you | Нейросет – Telegram
{AI} love you | Нейросет
245 subscribers
89 photos
16 videos
88 links
Авторский канал о prompt-gramming.
Гайды, разборы, ревью, рекомендации и личные инсайты о нейросетях.

Автор — @troclap
____________
Курс "ChatGPT в работе"
на Stepik: https://stepik.org/a/200358
на GetCourse: https://ailoveyou.getcourse.ru/gpt-assistant
Download Telegram
Что плохо в мемах об AI — они очень быстро устаревают.

Этот, кажется, уже неактуален, а я его только сейчас увидел.


Курс «Бизнес на нейронных сетях» https://chatgpt.aiacademy.me/
😁2
В подкастах на выходных подводят итоги огненной недели. Несмотря на то, что релизы OpenAI случились в понедельник, их не перестают обсуждать и даже клеят ярлык "second big thing" после релиза ChatGPT год назад.

Самые глубокие рассуждения я нашел в подкасте от двух топовых CMO (Hubspot и Zapier): от критики убогого названия "GPT-store" или "GPTs" до ясного проговаривания шанса, который открылся для малых бизнесов, и сравнения с 2009-м, когда только появился AppStore. Я выдерну из их разговора несколько мыслей, часть слышу повторно, часть впервые:
1. GPTs = Промптинг + Данные + Внешние действия. Из этой формулы главным компонентом являются данные / датасет, именно они будут определять успешность GPTs. Полностью согласен с этим.
2. GPTs — это надстройка на естественном языке над классическим программным обеспечением. Вскоре наступит момент, когда пользователи перестанут обращаться к веб-интерфейсу SaaS-решений. Но! Сам программный код никуда не денется, он будет долго отрабатывать свои задачи под капотом AI-ассистента.
3. Наступил момент, когда в цифровом мире исчезли языковые барьеры (между топ-10 мировыми языками точно, с малыми языками еще нет). Исчезновение языковых границ ведет к новой эпохе глобализации. Например, онлайн-курс, записанный на русском языке, может быть недорого и быстро переведен на индонезийский или португальский. В какой-то момент идея сделать что-то зарубежом может стать более простой, чем на родине.

#openai #gpt #podcast
👍2
Выпустил на волю первого кастомного GPT внутри ChatGPT. Он умеет объяснить материал из трех статей по теме (всего 25 страниц), привести пример из реальной жизни, создать иллюстрацию концепта при помощи DALL-E, протестировать знания пользователя и кое-что еще.

На создание ушло 3 минуты, на отладку — 20 минут (из-за мультифункциональности). Всё как все и пишут. Главное открытие, что я не понял в прошлый понедельник, что GPTs создаются прямо внутри платного ChatGPT и там же работают, а ссылку на своего GPT можно прислать, не дожидаясь GPT-store. Уже есть первый каталог GPTs.

Пишите в лс, готов наваять и вам кастомного GPT (только нужен ChatGPT Plus).

#gpt #case
👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
В text-to-image произошел важный релиз. Вышла LoRA (до-обученная надстройка к базовой нейросети), которая ускоряет генерацию картинок в 5-10 раз в зависимости от железа. Благодаря этому наиболее мощное пользовательское (не-серверное) железо Nvidia 4090 ушло в subsecond интервал (меньше 1 секунды на генерацию). Если же использовать серверное железо, то возникает real-time редактирование при помощи текста (см. видео) 🔥

Источник

#release #image #gpu
👍2😱1🙏1
Развитие предыдущего поста. Технологию LCM LoRA быстро утилизировали креативными способами.
This media is not supported in your browser
VIEW IN TELEGRAM
KREA теперь налету генерирует картинки по наброскам в Blender, Photoshop, Figma и других редакторах.


Курс «Бизнес на нейронных сетях» https://chatgpt.aiacademy.me/
Мыльная опера вокруг OpenAI закончилась. Вы следили за ней?
Anonymous Poll
7%
Да, съел тонны попкорна
48%
Да, в пол-глаза
22%
Нет, пропустил
22%
О чем вообще речь??
Summary того, что произошло 😆
Forwarded from Kirill A
👆 Кратко перескажу без внутряка

OpenAI — это исследовательское НКО, инвесторы которого (Microsoft и венчурные фонды) могут помножить свои вложения лишь на небольшой мультипликатор в случае успеха (который уже фактически случился). Основатели в свое время обратились за большими деньгами, потому что осознавали масштаб инженерного проекта по созданию AGI (искусственного интеллекта уровня среднего работника), но в качестве противовеса Совет директоров состоял из независимых людей, в основном, не из бизнес-среды.

В прошлую пятницу Совет директоров поднял бунт (до сих пор по неизвестной причине, заговорщики так и не выстроили своего нарратива). Поводом очевидно стал в коммерческом смысле сверх-успешный DevDay (6 ноября), объявленные новинки уже вторую неделю обрушивают сервера OpenAI. Пишут также про другие поводы, одним из которых называют новую прорывную модель Q*, которая должна была научиться решать математические задачи, а судя по утечкам, может порождать генерацию нового знания.

В общем, причины бунта не установлены, но сам бунт был подавлен за несколько дней усилиями инвесторов и сотрудников компании (возможно государство тоже сыграло свою роль). В итоге Совет директоров почти полностью ушел в отставку, а руководство OpenAI вернулось в полном составе. Считается, что фундаментально конфликт лежит в плоскости акселерации внедрения ИИ-продуктов (DevDay был мощным прорывом в этом смысле) и надежности / безопасности AI (GPT продолжает порождать галлюцинации / ошибки / вредный контент). Победили первые, но как это часто бывает, реализовывать будут скорее программу проигравших. Можно ожидать замедление потока релизов от OpenAI.

А также точно по событиям этих 4 дней снимут кино 😆

#summary #openai
👍4
Более подробно про слухи вокруг модели Q*, которая нацелена на создание "среднего" ученого.
Forwarded from Сиолошная
Так вот, к чему была эта прелюдия. В Reuters пишут, что якобы катализатором увольнения Альтмана стало письмо сотрудников OpenAI совету директоров. В нём говорится о прорыве в исследовании ИИ, которое, «может угрожать человечеству».

Правда, Reuters не смогло ознакомиться с копией письма. А автор(ы) не ответили на запросы о комментариях. Так что особо почвы у теории под ногами нет.

Масла в огонь подливает тот факт, что за сутки до увольнения Sam Altman на оффлайн-саммите сказал следующее:
— Четыре раза за всю историю OpenAI, и последний раз был вот несколько недель назад, я присутствовал в комнате, когда мы как бы отодвигаем завесу невежества и подталкиваем границу открытий вперед. Сделать это — профессиональная честь на всю жизнь.

Что он там такого увидел?

Согласно новости, модель (система?) Q* смогла решить некоторые математические задачи, сообщил источник на условиях анонимности. Это само по себе выглядит странно — ведь даже в примере выше пример куда сложнее, это конец средней школы. И как будто никакого прорыва и нет. Возможно, журналисты всё перепутали — ну или история выдумка.

Теперь о том, как на это смотреть и чего ждать:
1) OpenAI точно занимается разработкой модели, которая будет осуществлять научные исследования. Они про это пишут открыто.
2) Для того, чтобы это произошло, нужно, чтобы модель-учёный умела решать сложные задачи и планировать исследования. Часть этой работы уже сделана — см. статью из поста выше.
3) Вся концепция заключается в том, что модель будет генерировать тысячи неправильных кусочков решений, иногда выдавая верные — главное, чтобы их можно было отранжировать в списке гипотез выше, чем мусорные (вспоминайте модель-оценщика из поста выше).
4) Для этого нужно огромное количество мощностей. Поэтому деньги тут решают. OpenAI пока привлекли больше всех инвестиций, и моё видение такое, что через 2 года это станет большим препятствием для входа. Останется 5-10 игроков, кто готов столько денег сжигать.
5) Вопрос в том, насколько большим будет следующий скачок. Сможет ли модель писать решения на уровне магистра? PhD? Постдока? Доктора наук? Будет ли она ограничена 2-3 доменами, или же обобщится на любую научную область, где есть вычисления?
6) Однажды вы проснётесь, и слух из новости станет правдой: появится модель, которая будет хотя бы частично (>50%) заменять одного учёного в лаборатории. С этих пор прогресс начнёт двигаться гораздо быстрее — потому что нанять 100 учёных за день нельзя, а запустить 100500 моделей на кластере за день — можно.

Более подробно с моим видением дальнейшей стратегии OpenAI и направлениями, в которых они будут копать, вы можете ознакомитсья в моей недавней лекции «What's next for OpenAI?». Там я, конечно, не предсказал шумиху с увольнением CEO, но много говорю про агентов-исследователей и подход OpenAI.

А почитать больше спекуляций по поводу Gemini и Q* можно на LessWrong.
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть для генерации песен недавно пробила предыдущий порог качества, и теперь на свет появляются виртуальные Youtube-музыканты. Комбо из ChatGPT + Midjourney + D-ID + Suno.

Еще летом появились AI-инфлюенсеры с миллионами подписчиков в запрещенной соцсети. Сейчас продолжается интеграция виртуального персонажа.

#music #metaverse
🤯2👎1🔥1
На неделе зарелизили новую open-source языковую нейросеть. Это происходит почти каждую неделю, и обычно я не пишу об этом. В этот раз случилось нечто особенное.

Учёные из Беркли до-обучили языковую модель на синтетическом датасете, сгенерирован в GPT-4 - теперь такое делают повсеместно. Но они пошли на шаг дальше и попросили GPT-4 также оценить пары ответов своей модели (выбрать лучший ответ из двух), после чего ещё до-обучили ее.

На выходе получилась лёгкая (7В) open-source модель Starling, которая по некоторым бенчмаркам обыгрывает gpt-3.5 (20B параметров). По идее настолько лёгкую модель можно установить на локальном компьютере со скромной видеокартой и иметь бесплатный ChatGPT без VPN и блэкджека.

И речь даже не про конкретную модель, а про подход, что платная GPT-4 порождает бесконечное множество бесплатных и лёгких GPT-3.5. GPT-5 соответственно сделает то же самое с GPT-4.

#text #open_source #llm
🔥1
Подписываюсь под каждым словом. В нескольких проектах, которые реализую, у GPT возникает пробел именно в отсутствии инициативы. Он работает исключительно по вашему триггеру (триггером является любое ваше сообщение), в этом смысле его поведение импульсивно и рефлекторно. Хотя каждому бы иметь такие рефлексы 😆

#text #gpt #opinion
Forwarded from AI Happens (Alexey Hahunov)
👨‍🎨В чем проблема GPT или какая разница бытовых и бизнес разговоров.

GPT отлично отвечает на вопросы и следует инструкциям. Он действительно хорош в этом, потому что он обучен большому количеству разговоров. Но, как говорится, есть нюанс: он на самом деле не «общается»🌝. Он не задает вопросы, чтобы убедиться, что понимает, чего вы хотите. И на это у него есть весовая причина - модель обучалась на диалогах людей, где обычно на любой наш вопрос следует ответа, а не идет встречный вопрос - точно ли мы имели ввиду вот это?

Вы можете подумать, что я считаю GPT тупым. Нет-нет, мы лишь сами его так научили.

Большая часть обучения GPT проходит в режиме вопросов и ответов. Он не привык задавать уточняющие вопросы или брать на себя инициативу в разговоре. Но именно этой инициативы не хватает рядовому пользователю, которому сложно описывать каждый раз инструкции, по которой модель понимает, что нужна помощь в тексте или создании презентации. И связано это с тем, что чаще всего мы сами не до конца понимаем, а что вообще мы хотели сделать и с этим нам нужна такая же помощь как и с решением самой задачи.

Чтобы сделать GPT более подходящим для бизнеса, а не обычных чатов, ему необходимо учить, когда просто отвечать, а когда задавать больше вопросов. И я думаю в 2024 году модели будут обучаться делать именно это. Сначала слушать и понимать, а потом уже давать решение.

@aihappens
🤔1
Среди LLM новый царь горы — Gemini от Google. По ключевой метрике MMLU эта языковая нейросеть обгоняет среднего человека. Сегодня и в ближайшие дни будет много-много-много слов о Gemini в СМИ.

#text #gemini #benchmark
GenAI-сервисы часто используют метафору магии в пользовательском интерфейсе, типа Magic Tool c иконкой волшебной палочки. Это наивно и отражает живой восторг пользователей в первый раз, но мне кажется, что эта метафора вполне уместна и даже точна. Вот почему.

Самый близкий аналог магии в реальной жизни — это сновидение. В принципе, во сне возможно всё. Всё то, чему мешают законы физики наяву. Метафора сновидения применительно к языковым нейросетям расхожа. Andrej Karpathy (не-последний человек из OpenAI) активно апеллирует к ней, даже споря о том, галлюцинирует ли языковая нейросеть? Он считает, что нет, потому что каждый ответ LLM — это продукт сновидения умной машины, не только те ответы, которые люди маркируют как "галлюцинации".

Кто-то прочитает в этом, что языковые нейросети оторваны от реальности и поэтому бесполезны. Но это оторванное от реальности суждение 😀. Так можно договориться, что и сновидения бесполезны. Нет, скорее нейросети существуют в магической реальности нулей и единиц, где нет привычного трения и бесконечного притяжения малых тел большими. В нашем мире всё состоит из материи с жесткими (по энергии) законами ее преобразования, в их мире всё состоит из данных с мягкими (по энергии) законами их преобразования. Тут и начинается магия, когда становятся возможны преобразования, которые нарушают наши ощущения логики и здравого смысла. А такие преобразования возможны уже сейчас. Например, по одной картинке вы можете получить 3д-модель объекта (в нашем мире нельзя увидеть обратную сторону объекта, не обойдя его вокруг).

Еще одна "большая" мысль (last). Революцию ГенИИ часто сравнивают с промышленной революцией XIX века. Переложу это на метафору магии. В эпоху классической промышленной революции тоже создавались чудеса — изобретались физические машины, кратно превосходящие человеческую силу в преобразовании материи (например, создание изделий из сырья или добыча сырья из недр). Эпоха ГенИИ (именно генеративного) создает программные машины, способные кратко превосходить человека в преобразовании данных (например, суммировать текст или воплотить идею в рисунке). Способность найти наиболее магический путь преобразования одних данных в другие (например, сочинить песню одной силой мысли) — это в-общем квинтэссенция процесса. И пока нейросети не заземлены в физических роботов (которые подчиняются законам физики), то всё возможно.

#opinion
🔥1
Midjourney почти успели уступить лидерство в визуальных нейросетях, но еще поборятся.

#image #release
Forwarded from Ai molodca (Dobrokotov)
Отцы из #Midjourney выкатили альфа-версию V6! 🚬
Айда тестировать!

Чтобы активировать её, выберите V6 в меню настроек (/settings) или введите --v 6 после вашего запроса.

Что нового, дословно, от комманды Midjourney:

Нововведения базовой модели V6:


- Точное следование промту.
- Улучшенная согласованность, знания модели.
- Улучшенная обработка изображений и ремикс.
- Небольшая возможность рисования текста (вводите текст в "кавычках", --style raw или ниже --stylize может помочь).
- Улучшенные увеличители изображений в режимах 'subtle' и 'creative' (увеличение разрешения в 2 раза).
- Поддерживаемые функции на старте: --ar, --chaos, --weird, --tile, --stylize, --style raw, Vary (subtle), Vary (strong), Remix, /blend, /describe (только версия v5).
- Не поддерживаемые функции, которые появятся в ближайший месяц: Pan, Zoom, Vary (region), /tune, /describe (новая версия v6).
Стиль и запросы для V6:


- Запросы для V6 сильно отличаются от V5. Нужно 'переучиться'.
- V6 более чувствительна к запросам. Избегайте 'мусора' типа "award winning, photorealistic, 4k, 8k".
- Будьте конкретны в запросах. Менее атмосферно, но точнее.
- Для более фотографичных, нейтральных, буквальных результатов используйте --style raw.
- Нижние значения --stylize (по умолчанию 100) лучше понимают запросы, высокие (до 1000) - улучшают эстетику.
- Общайтесь в ⁠prompt-chat, чтобы научиться использовать v6
Важно:


- Это альфа-тест. Будут частые изменения без уведомлений.
- Не рассчитывайте на постоянство этой модели в будущем.
- Скорость, качество изображений, согласованность, следование за запросами и точность текста улучшатся.
- V6 медленнее и дороже V5, но ускорится с оптимизацией. Поддерживается режим Relax!
Please open Telegram to view this post
VIEW IN TELEGRAM
Возвращаюсь.

В конце прошлого года почувствовал кризис жанра, случился разрыв между повесткой гиков и новичков, слишком многое произошло за 2023 год. Первоначально я собирался ориентировать канал для GenAI-новичков, но со временем сдвинулся в сторону cutting-edge. В 2024-м невозможно быть GenAI-новичком, точнее придется пересказывать массу фактов, которые уже стали общим местом. Отсюда выработал новый срединный фокус — prompt-gramming, или программирование на естественном языке. Со временем я осознал, что GenAI нынешнего поколения не прямо для всех и каждого, а скорее для тех, кто по жизни структурирует реальность вокруг и "программирует" процессы (пусть даже без использования формальных языков). Для prompt-gramming не нужно быть технарем (с пониманием, как устроена компьютерная инфраструктура), но и без стремления управлять энтропией не обойтись.

Программирование на естественном языке стало возможно благодаря высокой надежности в имитации формальных, программных языков в GenAI (особенно Python / Javanoscript / Markdown / HTML / CSV). Имитация тегирования как формального языка описания изображений тоже доведена до совершенства, поэтому визуальные нейросети уже отвоевали себе место под солнцем. Мне кажется, люди ценят их даже выше, чем языковые нейросети. Ловите тест от The New York Times, где вы не сможете отличить настоящее лицо человека от сгенерированного нейросетью (причем не новейшей).

#promptgramming #image
7