Борис опять – Telegram
Борис опять
15.1K subscribers
1.43K photos
72 videos
30 files
1.47K links
life = curiosity + irreducible noise

Whois: https://news.1rj.ru/str/boris_again/3400

Лс: @btseytlin
Download Telegram
Уже завтра я буду на AMA стриме в Вастрик.Клубе.

1 августа в 19:00 по Москве
Тема: "Нейросети для Троечников"

Трансляция будет доступна для членов клуба, а для всех остальных позже будет запись.

Моя цель пояснить за нейросети и машинное обучение так, чтобы поняли даже люди, которые вообще ничего не понимают.

Будем рассуждать через призму идей, а не душной математики. Какие задачи решают нейросетки? Как они учатся? Что умеют, а чего не умеют? Что у них в голове?

Для этого я сейчас судорожно готовлюсь: нужно сжать весь свой опыт в короткое выступление, но не потерять ничего важного.

Описание из поста в клубе:
Поговорим с @btseytlin о том, как работают модели искусственного интеллекта, которые менее модно называются машинным обучением.
Здесь не будет ничего о том как заработать на нейросетях без вложений, как составить промпт для лечения рака и какие топ 10 нейросетей нужно использовать в маркетинге. Не будет и спекуляций на тему того, как ИИ уже завтра изменит всю планету.

👌 Вместо этого постараемся найти баланс между верхнеуровневым пониманием и деталями, чтобы действительно разобраться что и почему происходит. Разберемся где магия, где предсказание следующего слова и что о нашем мире знает SORA.


Подключайтесь!

Ссылка для тех, кто платит Вастрику:
https://vas3k.club/event/25114/
13🔥3👍1
Борис опять pinned «Уже завтра я буду на AMA стриме в Вастрик.Клубе. 1 августа в 19:00 по Москве Тема: "Нейросети для Троечников" Трансляция будет доступна для членов клуба, а для всех остальных позже будет запись. Моя цель пояснить за нейросети и машинное обучение так, чтобы…»
10718🔥6🤔2
Типичное утро машинлернера

Правильный ответ: gradient clipping
8043
ПЕРВЫЙ МУЛЬТИМОДАЛЬНЫЙ ДАТАСЕТ ЗАДАЧ ПО ФИЗИКЕ?

Контрибьютеры в вихре варят очень сложные датасеты - рецепт простой: краулим 10 гб html-pdf_ок, прогоняем через кучу ocr, latex конверторов, парсим текстовый слой и картинки. Потом обмазываем все это регулярками для вязкости и получаем вероятно один из самых сложных для LLM датасетов - physics_big.

Почему он сложный? Потому что это мультимодальная физика с олимпиад. В отилчие от геометрии или алгебры для физики все сильно хуже с солверами, авто решаторами и индукцией ее тоже не решишь


Заливать в test в train можно здесь hf


Над релизом работали:
@suro4ekgg - вообще почти сделал
@mlunderground
@lovedeathtransformers

поддержать в X
🔥30👍1122
Играюсь тут с новой моделью для генерации изображений Flux

Забавное: модели мира у неё ломаются при добавлении в промпт "upside down."

Больше интересных находок буду скидывать в комментарии.

Но в целом прогресс супер, эта модель гораздо лучше умеет в композицию и хорошо понимает промпт. К тому же модели ОЧЕНЬ быстрые. Маленькая генерирует изображение за чуть больше секунды.

Поиграть можно тут: https://replicate.com/black-forest-labs/flux-schnell

Или с полноценной моделью тут:
https://fal.ai/models/fal-ai/flux-pro
Но там ограниченные деньги, много не попробуешь
👍5🔥41😢1
Но это достойно поста в канале.

Приходите в наш массажный салон.

В большой модели вроде бы всё нормально, но у меня кончились кредиты и не потестить особо.

UPD: нет, в большой тоже самое
613
Массаж может быть новым тестом для генераторов изображений, так как с руками вроде бы разобрались в больших моделях
🔥363241
Кстати на платформе https://fal.ai/models/fal-ai/flux-pro у создателей вообще никакой цензуры, модель генерит что угодно. Кого-то ждет PR disaster
4
Ранее я спрашивал подписчиков интересно ли сделать на базе канала мини-сообщество в виде живого чата. Заинтересовались почти двести человек. Давайте делать!

Создаем уютный чат про любопытство. Ограничений по темам нет, но в основном обсуждаем машинное обучение, науку, карьеру, жизнь и мемы. Фокус на качественные дискуссии и обмен личным опытом. Лично я планирую отправлять в чат то, что мне интересно, но по каким-то причинам не пойдет в канал.

В качестве приманки: я недавно менял работу и опишу свой опыт в нескольких постах в чате.

Ссылка на чат:
https://news.1rj.ru/str/+Q8wZrzGl4ZY3MjZi

Это НЕ чат привязанный к каналу для комментариев, не ошибитесь кнопкой.

Правила:
1. Не будь мудаком.
2. Чат это не фронт войны за продвижение своих идей в какой-либо плоскости, особенно политической.
3. Недопустимы оскорбления и отсутствие уважения к собеседникам, систематически низкокачественный контент, переборы с самопиаром и спам.

Нормы:
- В дискуссии в первую очередь исходи из вазимного уважения. Предполагай, что собеседник искренен и уважает тебя, пока он не доказал обратного.
- Не будь слишком серьезен. Особенно по отношению к себе.
- Выражать своё мнение нормально, если вы готовы услышать мнение собеседника, но постоянное насаждаение совего мнения приведет к быстрому бану.
- Исповедуем гуманизм.

Модерация будет на основе моей диктатуры и votekick.

В процессе посмотрим, что из этого получится!
26👍6
Когда занимаешься интерпретацией нейросеток

Шутка украдена у него
25👍851
Вышло!

Запись моего выступления + AMA в Вастрик.Клубе про "Нейросети для троечников"

https://www.youtube.com/watch?v=b3XogyyXgUs&feature=youtu.be

Я постарался сделать максимально доступное и одновременно полное описание того как работают нейросети. Посмотрев первый час вы поймете всё про машинлернинг ну почти

Внутри:
* Показываю как за несколько слайдов перейти от сложения и умножения к ChatGPT.
* По каким принципам работает весь AI/ML.
* Что мы знаем про внутренние репрезентации нейросетей и почему это круто.

В видео три блока:
1. От школьной математики к нейросетям.
2. Как нейросети понимают сложные вещи.
3. Модели мира.

Самый важный, как я считаю, первый. Видео длинное, но этот блок идет примерно до 01:05. В конце блока слайд, где я постарался собрать всё машинное обучение.

Смотрите и пишите как по вашему мнению получилось 🚶‍♀️
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍55🔥295😢2👎1
Forwarded from Сиолошная
Пара новостей от OpenAI (чтобы замять исход команды лидеров, кек):
1) теперь есть не просто JSON-режим, когда модель отвечает вам в машино-читаемом формате, а структурированная генерация. Первый (представленный в прошлом году) просто повышает надежность модели для создания синтаксически валидных JSON, а второй гарантирует, что ответ модели будет соответствовать определенной схеме. Вот если вы пишете "мне нужно, чтобы были такие-то и такие-то поля, и никаких больше" - теперь в 100% случаев будет исполняться. Можно указывать сложные вложенные структуры (см. картинку).
2) вышла новая gpt-4o, gpt-4o-2024-08-06, но об улучшениях в метриках и качестве работы ничего не говорят
3) зато она дешевле в 2 раза! не знаю, что там делают внутри компании - роняют маржинальность или дистиллируют более качественно (или на самом деле новая модель хуже..), но вот, теперь новая цена $2.50/$10 за миллион токенов на входе и на выходе (против $5/$15).

Напомню, что у OpenAI ещё есть BatchAPI (это когда нужно ждать ответа до 24 часов - подходит для разных несрочных задач), который делит цену на два. Совсем копеешно получается!
🔥18👍75