ML physicist – Telegram
ML physicist
2.38K subscribers
134 photos
11 videos
1 file
79 links
Download Telegram
* Yandex Speech kit может отвечать голосом любого человека "обучившись" за ~20 секунд записи его голоса. Разумеется это не технологический прорыв, такие модельки были уже давно, но теперь FakeVoice as a Service в яндекс облаке даст огромный буст к возможностям телефонным мошенников итп
🤯7
Прошу прощения, снова про Yandex cloud. Под натиском посетителей конфы, сайт на котором должно быть написано что у облака аптайм 100% - лёг
😁3🔥2
Сейчас видел как тестировали ADAS (недоавтопилот помощник водителю) - это просто нечто невероятное 🤯🤯🤯- если это будет серийно во всех машинах - я возможно даже перестану бояться ездить на такси и переходить улицу без светофоров. Она Сама реагирует на препятствия, выбегающих пешеходов, резкие перестроения, может очень умно подстраивать подвеску на поворотах.

Жалко что хайп на беспилотные машины сменился хайпом на сети просто выплевывающие буквы.....
👍3👏1
Пару дней недель назад увидел просто бомбический пост от Бориса Цейтлина - “LLM это статистические попугаи или все-таки нет.”

Что бы это проверить, на вход к моделям подавали названия различных мест нашей планеты (города, достопремечательности итп). Оказалось что, пониженные через PCA до двумера эмбединги этих событий образуют карту земли - события произошедшие в европе находятся в компактном кластере, чуть "южнее" кластер африки, сборку северная и южная америка, а в другую сторону азия и в далеке океания - прям настоящая карта! (лучше чекните картинку в посте)

Разумеется тут есть небольшое читерство - это все верно с точностью до линейного преобразования - (их проще представлять как кобинация двух поворотов и растяжения) - но все равно)

Я решил посмотреть какую информацию содержат в себе эмбединги кода моделей - выкачал задачек по некоторым с архива codeforces, а так же их решения. Проделав аналогичные действия (но с моделью попроще - codebert), я обнаружил, что:


* Задачи их их решения разделились на 2 больших неоднородных кластера - ну это вроде очевидно
* Для задач внутри одной темы, вектор идущий от эмбединга решения к эмбедингу кода - плюс минус постоянный, а для задач разных тем он отличается на небольшой поворот. Получается что внутри модельки существует "вектор решения", прибавление которого к описанию задачи - дает его решение

Ссылка на исходную статью
🔥7
2
Кстати супер интересный кейс - в нем gpt3.5 показывает себя лучше на русском, чем на английском. А почему - домашнее задание
Отличный сервис который сделали ML-щики и урбанисты что бы показать как бы выглядела ваша улица, находись она в Нидерландах. Просто вводите адрес (можно на русском) и ИИ сам строит изображение. Например на фото выше всем известная физтехам Первомайская - улица напротив МФТИ.

Если этот пост наберет хотябы одну эмодзи с варламовым <или Гершманым или кем то еще> (или стикер в коменты) - сделаю подробный пост как это работает и как они обучали свою модельку.
👀5
Прост оставлю это здесь
😁3🤣2
Школа анализа данных (ШАД) и ФПМИ МФТИ приглашают вас принять участие в уникальном интенсиве, посвященном разработке и изучению GPT!

🚀 Что вас ждет на этом интенсиве? Вы погрузитесь в мир генеративных моделей, узнаете все о YandexGPT, его предобучении и alignment, а также о вызовах, связанных с сбором гигантских датасетов. Будет много практической работы и возможностей задать вопросы экспертам из команды YandexGPT.

🧠 Этот курс идеально подходит для тех, кто уже имеет базовые знания в области машинного обучения и хочет углубить свои знания в ML.

📅 Интенсив пройдет онлайн с 27 ноября по 1 декабря.

Регистрация открыта до 23 ноября. Тык <-----


А еще вы бесплатно получите доступ к датасфере - это как Google colab - но есть возможность выбрать значительно более мощные конфигурации с большим числом A100
👍42🔥1
Краткий пересказыватель встречи, встроенный в зум работает довольно забавно на русском языке))
😁8🔥1
Если этот пост наберет 5 реакций генерю более лакшери лагман (см коментарии)
👍19
Сори за еще одно уведомление, необходимое число реакций есть, более лакшери лагман в коментариях, там же условие на следующую картинку
Как то идея с лагманом очень зашла, мы собирали необходимое число реакции быстрее чем дифузия успевала генерировать картинки - что бы не засоряь этот канал - буду выкладывать посты в отдельном треде - подписывайтесь что бы не потерять (больше постов про лагманы в этом канале не будет, он продолжит быть серьезным))))

https://news.1rj.ru/str/lagmanlux/7
😎5