Love. Death. Transformers. – Telegram
Love. Death. Transformers.
22.5K subscribers
4.26K photos
499 videos
76 files
2.79K links
❤️☠️🤗

Указанные действия не являются ресерчем, поскольку:
а) Мы не ученые;
б) Оно работает.
@transformerslovedeatch по всем вопросам
Все ситуации вымышлены, любые совпадения с реальности плот вашей фантазии.
Download Telegram
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Началось - роботы воруют детей у кожаных!
🔥37🌚8😁1
Forwarded from Эта нейросеть обучалась 37 лет (Катерина Бек)
День 18. DRIVE.
💩24🔥13🤔4❤‍🔥11
1😁159🔥31😢13❤‍🔥21
есть что то грустное в том что за 5 минут простая кластера он сожрал денег больше чем ты за неделю
62😢39👍5💯4💅4🍌1😘1
Love. Death. Transformers.
https://www.pjreddie.com/ cv авторы yolo выглядит так, а ты и дальше верстай свои LaTexи и будь как все
Продолжу тред людей которых я бы нанимал за ноль секунд
😁14345🔥20💯14🌚5🥴3
Forwarded from MWS AI
🔓 Открываем код: Cotype Nano

Представляем Cotype Nano – открытую большую языковую модель, которая создана для решения бизнес-задач на русском языке. Модель работает локально на персональных устройствах и отлично подходит для разработки чат-ботов и виртуальных помощников.

Что умеет:
🔴Обрабатывать большие объемы данных — до 32,000 токенов (около 45 страниц текста) за раз
🔴Создавать контент и выполнять быстрый и точный перевод между русским и английским языками
🔴Анализировать и классифицировать данные для улучшения клиентского сервиса

Как устроена:
Модель основана на архитектуре трансформера Qwen 2.5, содержит 1,5 млрд параметров и совместима с популярными фреймворками: VLLM, OpenVINO и Hugging Face.

По бенчмаркам Ru Arena Hard Cotype Nano лидирует в своем классе (30.2). Доступна бесплатно, в том числе для коммерческого использования.

Узнать больше и скачать модель можно тут.

💻 Подробные технические характеристики на Хабре.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡32🔥23👎3😁3🥴3💊3👍2🤮1
Forwarded from Vikhr models
Мы в Вихрях часто делаем модели в стол или оставляем их на время полежать. Собственно в этот раз ребята из MTSa опередили нас с релизом на несколько дней.

Выложили vikhr-qwen2.5-1.5b.

Для обучения использовали GranMaster.

По арене чуть чуть хуже чем Cotype, вознможно потом полирнем SMPO и будет лучше)

model
👍23🔥4😁2🤮1
Ко мне пришли такие люди, набирают кандидатов.

🎓 Стипендиальная программа Impact Academy для технических исследователей безопасности ИИ

Мы — сообщество Unitaware. Ищем амбициозных и талантливых людей в области ML/AI для участия в стипендиальной программе Impact Academy по безопасности ИИ. Это шанс проводить исследования и работать с лидерами индустрии — и получить от них приглашения в топовые AI safety лабы и проекты (например, Center for Human-Compatible Artificial Intelligence, FAR AI и Mila AI Institute)

💼 Что вас ждет?

• Оффлайн программа (3-6 месяцев с марта) в Сингапуре, Англии или США.
• Исследования и коучинг в сфере AI safety.
• Стипендия ~$5000/мес.
• Перспектива работы в ведущих AI-проектах.

👤 Кого мы ищем?

• Отличный английский и опыт в ML/DL (публикации, стажировки, проекты).
• Программирование на уровне ведущей техкомпании.
• Достижения: олимпиады или учеба на топовых кафедрах.
• Интерес к снижению рисков от продвинутых AI-систем.

Срок подачи: до 31 декабря (лучше до первой недели декабря).

Если заинтересовались или знаете подходящего кандидата, напишите @vakondyrev, это максимизирует шансы при прочих равных. За рекомендацию подходящего кандидата также предусмотрено вознаграждение
9💩23👍6🔥3
Love. Death. Transformers.
Video
This media is not supported in your browser
VIEW IN TELEGRAM
На кейсах со сложным движением нескольких объектов выглядит слегка лучше gen3 и прочих. Вероятно за счёт 4о и прочего будет лучше.

Забейте эта модель все ещё текущего поколения, откровений по качеству генераций не будет.
👍187😁2❤‍🔥1🔥1
Forwarded from Vikhr models
благодаря автору @plotquot теперь вихри стали ОЧЕНЬ быстрыми для мака

забрать для M серии мака тут
🔥35😁12🍓5🤮1
мл конспект.pdf
22.9 MB
Вероятно лучший конспект по reinforcement learning который я видел и неожиданно на русском (!)
90🔥46🐳8👍7😍2❤‍🔥1😁1
😁188👍12🎉5🔥3🐳1
Загадка на тему инфры: допустим у нас есть Nvidia gb200 nvl72. Ака стойка на 72 карты. И вот вопрос: а как на нем запускатся? Как на 18 отдельных нодах или как на одной? Если как на одной то как это реализовано системно?


Аппаратно это 18 нод по 4 карты, у них есть обычное количество маршрутиризаторов.
😁25👍4🌭2💯2🔥1
Если вам хочется time scaling_a то у нас есть Mcts lib
👍26🔥4🤡2🤔1
Шаг1 пишем свой фреймворк на jax
Шаг2 учим хуевую LLM со своей архитектурой. Данные? А зачем их чистить?
Шаг3 сосем у oss моделей(тут можно поднять 1б USD пол обещание что мы молодцы)
Шаг4 вы прекрасны, Феррари доставят на следующей неделе
Please open Telegram to view this post
VIEW IN TELEGRAM
61😁25🤔6👍1🔥1
Адаптация для языков шагает по планете

В самом начале вихрей у нас была амбиция делать модели в том числе для казахского, но мы отказались от этой идеи в связи с трудоемкостью и отсутствием ресурсов. А один из подписчиков решил делать хорошо, позвал друзей, сели и напереводили датасетов на казахский!

kz mmlu

gsm8k
constituion похож на наш датасет из шлепы Law mc
Вопросы к книгам

Обучили роберту

Ждем свои llm для казахского, рад что наш проект вдохновляет других людей делать что то!


linkedln post
автор @stringersolo
👍41🔥199🥱1