Ну, типа.
Я тут новый тип визуального трансформера сделал...все дела.
Новые знания - новая скорбь.
Всем вам большой от меня - ПРИВЕТ.
Я тут новый тип визуального трансформера сделал...все дела.
Новые знания - новая скорбь.
Всем вам большой от меня - ПРИВЕТ.
🫡6👀1
Я нащупал нужный конфиг.
Теперь буду тренировать до упора: 97%
Модель "поспала" и результат на след "утро" закрепился.
Теперь буду тренировать до упора: 97%
Смотрите:
Модель "поспала" и результат на след "утро" закрепился.
до сна: Точность: 3.74%
после сна: Точность: 3.94%
Причем по времени "сон" занимает в 30 раз меньше , чем тренировка, а по результатам работает примерно также. Т.е. это интересный рабочий подход.
👍5👀2
ШТОШ! ЭКСПЕРИМЕНТ НЕУДАЧНЫЙ!
Потери лютые.
Спать нейронки по моим правилам не умеют.
👀1
Техножнец: Краткий Обзор для Тех, Кому Лень Читать
Кто: Павел, 37 лет, музыкант, ставший IT-шником.
Что: Канал про AI, технологии, нейронки, программирование.
Как: Честно, без хайпа, с матом и юмором.
Для кого: Для тех, кто интересуется AI, но не хочет читать скучные статьи.
Короче: Техножнец делает крутые штуки с нейронками, делится результатами и не боится говорить правду.
Кто: Павел, 37 лет, музыкант, ставший IT-шником.
Что: Канал про AI, технологии, нейронки, программирование.
Как: Честно, без хайпа, с матом и юмором.
Главный проект: RuKaLLaMA - русская языковая модель на советских текстах.
Цель: Создать мощную и независимую LLM, обученную на качественных данных.
Проекты:
"Исследования в 1 клик" - быстрый анализ любых тем.
"Fyzcoin" - майнинг крипты за упражнения.
"Настя" - AI-помощник для @dailyneuro.
AI OVERLAY - программа для чатинга с LLM (нашего спеца проект).
Генератор таблиц.
Модель для удаления штампов с документов.
Распознавание упражнений.
Распознавание таблиц.
Переводчик для стримов.
Автоматический суммаризатор.
Фишки:
Тестирование новых технологий (Qwen, Gemini, SORA, KREA, etc.).
Обзоры ИИ-новостей и инструментов.
Критика хайпа и "еблоторговли".
Много экспериментов и исследований.
Свои разработки и проекты.
Юмор, мат, авторский стиль.
Для кого: Для тех, кто интересуется AI, но не хочет читать скучные статьи.
Короче: Техножнец делает крутые штуки с нейронками, делится результатами и не боится говорить правду.
Подписывайся, если:
Тебе интересен AI.
Ты устал от скучных обзоров.
Хочешь быть в курсе последних разработок.
Любишь честный и неформальный подход.
Не подписывайся, если:
Ты не любишь мат.
Тебе нужна только сухая информация.
Ты не готов к экспериментам.
Ты работаешь в OpenAI.
Короче, Техножнец - это про AI без купюр и с огоньком!
👍12🔥4👀1
Техножнец: УЛЬТРА КРАТКО!
Кто: Павел, 37 лет, музыкант, ставший IT-шником.
Что: Канал про AI, технологии, нейронки, программирование.
Как: Честно, без хайпа, с матом и юмором.
Кто: Павел, 37 лет, музыкант, ставший IT-шником.
Что: Канал про AI, технологии, нейронки, программирование.
Как: Честно, без хайпа, с матом и юмором.
Главный проект: RuKaLLaMA - русская языковая модель (аналог ChatGPT) на советских текстах.
Цель: Создать мощную и независимую LLM, обученную на качественных данных.
👍12👀1
Касаемо нашей любимой нейросетки RUKALLAMA!
Помните? Я просил вас накинуть данных для обучения.
Мы скачали, в 4 смычка это делали....ну ...там гб 400 получилось.
Я буду держать вас в курсах насчет разработки.
Ничего не стоит на месте - всё очень стремительно развивается!
Как только приступим к тренировке модели с нуля на 1млрд параметров, но уже с учетом косяков и исправлений, тогда и сразу же вам сообщу обо всех деталях происходящего с RUKALLAMA!
Помните? Я просил вас накинуть данных для обучения.
Мы скачали, в 4 смычка это делали....ну ...там гб 400 получилось.
Теперь мне надо будет сделать вот что: (во первых перевести pdf в текст, далее починить нейронкой поврежденные текста)
1) Перевести каждый учебник и книгу в размеченную инструкцию. (не одну)
2) Отдельно перевести учебники русского языка в обширные инструкции чтобы модель одупляла почти всё.
3) Подвергнуть анализу корпус языка "НКРЯ" и выбрать оттуда наилучшие тексты для работы.
4) Всё сверять с бумагами от DEEPSEEK V3 , R1 и прочих других.
Я буду держать вас в курсах насчет разработки.
Ничего не стоит на месте - всё очень стремительно развивается!
Как только приступим к тренировке модели с нуля на 1млрд параметров, но уже с учетом косяков и исправлений, тогда и сразу же вам сообщу обо всех деталях происходящего с RUKALLAMA!
👍22❤4👀1
🌋 НЕДЕЛЯ AI-БЕЗУМИЯ: КИТАЙЦЫ, NETFLIX И DEEPSEEK ВЗРЫВАЮТ МОЗГ! 🌋
Привет, синтеты! Эта неделя в AI просто СНЕСЛА КРЫШУ. Десять новых нейронок, и все ОПЕНСОРС! Погнали разбирать этот ТЕХНОЛОГИЧЕСКИЙ ПЕРЕДОЗ!
P.S. Для тех, кто думал, что AI замедлился - как вам такая неделька?!
#AIбезумие #НейронкиЖгут #КитайцыВпереди #OpenSourceРулит #ПочкаПодождет
Привет, синтеты! Эта неделя в AI просто СНЕСЛА КРЫШУ. Десять новых нейронок, и все ОПЕНСОРС! Погнали разбирать этот ТЕХНОЛОГИЧЕСКИЙ ПЕРЕДОЗ!
🧠 ЧАСТЬ 1: 3D И ВИДЕО БЕЗУМИЕ
HUNYUAN 3D-2 (КИТАЙСКИЙ МОНСТР):
Генерит 3D из текста за СЕКУНДЫ
2.6B параметров (как у GPT в туалете!)
Разделяет форму и текстуру
УНИЧТОЖИЛ Microsoft в тестах
https://3d-models.hunyuan.tencent.com/
NETFLIX "GO WITH THE FLOW":
Двигаешь объекты в видео КАК ХОЧЕШЬ
Меняешь размеры НА ЛЕТУ
Warped noise магия
First frame editing = РАЗРЫВ ШАБЛОНА
https://eyeline-research.github.io/Go-with-the-Flow/
DREAM CATALYST (NERF НА СТЕРОИДАХ):
Превращает людей в кого угодно
Меняет времена года в 3D
Идеально для игр и VR
Neural Radiance Fields = МАГИЯ!
🔬 ЧАСТЬ 2: СТИРАТЕЛИ РЕАЛЬНОСТИ
DIFFUERASER (ФОТОШОП НА МАКСИМАЛКАХ):
Удаляет объекты из видео ИДЕАЛЬНО
Temporal attention (не спрашивайте как!)
Работает с несколькими объектами
https://lixiaowen-xw.github.io/DiffuEraser-page/
⚡️ ЧАСТЬ 3: AI АГЕНТЫ (ВОССТАНИЕ МАШИН)
UI-TARS (АВТОМАТИЗАТОР ИЗ АДА):
Работает с ЛЮБЫМ софтом
Автоматизирует ВСЁ
Открытый код от ByteDance
УНИЧТОЖАЕТ GPT-4 в тестах
https://github.com/bytedance/UI-TARS-desktop
OPERATOR ОТ OPENAI:
Только браузер (лол, слабаки!)
Спрашивает разрешения на ВСЁ
Нужна подписка за $20
https://openai.com/index/introducing-operator/
💊 ЧАСТЬ 4: НОВЫЕ МОНСТРЫ AI
DEEPSEEK R1:
Бьёт OpenAI O1 как ребёнка
Полностью открытый код
Reinforcement learning РУЛИТ
https://github.com/deepseek-ai/DeepSeek-R1/tree/main
KIMI K1.5:
Multimodal монстр
Тоже бьёт O1 (ТРЕНД, ОДНАКО!)
Vision + Text в одном флаконе
https://github.com/MoonshotAI/kimi-k1.5?tab=readme-ov-file
🎯 БОНУС: GOOGLE БЕЗУМИЕ
TOKEN-VERSE:
Миксует объекты из разных картинок
Переносит стили и позы
Скоро будет открытый код
Уже можно тестить!
VIDEO DEPTH ANYTHING:
Глубина в видео БЕЗ ЛИДАРА
28M параметров (КАРЛИК!)
Работает на калькуляторе
Точнее всех конкурентов
P.S. Для тех, кто думал, что AI замедлился - как вам такая неделька?!
#AIбезумие #НейронкиЖгут #КитайцыВпереди #OpenSourceРулит #ПочкаПодождет
👍5🥰2
Приветствую новых синтетов на канале.
Проходите , присаживайтесь на функцию активации.
Серёге ХТОШО - огромный привет)
Проходите , присаживайтесь на функцию активации.
Серёге ХТОШО - огромный привет)
❤31🤝15🔥7👏6🏆4👍3
Техножнец
Касаемо нашей любимой нейросетки RUKALLAMA! Помните? Я просил вас накинуть данных для обучения. Мы скачали, в 4 смычка это делали....ну ...там гб 400 получилось. Теперь мне надо будет сделать вот что: (во первых перевести pdf в текст, далее починить нейронкой…
Вот процесс по языковой модели (для новых подписчиков)
👍11
Техножнец
Photo
Вот угарные ответы от предыдущих версий модели. Можете листать выше и посмотреть текущие достижения.
👍12
Техножнец
🔥 ЖЕЛЕЗНЫЙ МОНСТР ДЛЯ RUKALLAMA: РАЗБОР ПОЛЁТОВ! Привет, синтеты! 👋 Смотрите что за зверь будет крутить нашу малышку RUKALLAMA! (ТАКИ ПРИОБРЕТЕНО) 🧠 МОНСТР-КОНФИГ: - EPYC 7F52 (16 ядер / 32 потока) - 256MB L3 кэша (для наших сплайнов самое то!) - Tesla…
Сейчас поеду за компьютером с A100 на борту. Отпишусь.
🔥23
🌋 КИТАЙСКИЙ AI ПОРВАЛ ВСЕХ: DEEPSEEK УНИЗИЛ CHATGPT, ALIBABA ВЗОРВАЛА МОЗГ! 🌋
Привет, синтеты!
Сегодня разберём, как китайцы РАСТОПТАЛИ OpenAI и показали всем, что такое НАСТОЯЩИЙ AI! Держитесь крепче!
P.S. Для скептиков: попробуйте DeepSeek сами - он реально БЕСПЛАТНЫЙ!
#КитайскийAI #DeepSeekРулит #QwenМонстр #OpenAIНервничает #БудущееУжеЗдесь
Привет, синтеты!
Сегодня разберём, как китайцы РАСТОПТАЛИ OpenAI и показали всем, что такое НАСТОЯЩИЙ AI! Держитесь крепче!
🧠 DEEPSEEK - УБИЙЦА CHATGPT:
ЧТО СЛУЧИЛОСЬ:
- Первое место в App Store США (САСАЙ, OpenAI!)
- Модель DeepSeek-R1 ПОРВАЛА o1
- Затраты: $5.58М vs МИЛЛИАРДЫ OpenAI
- И ВСЁ ЭТО БЕСПЛАТНО, КАРЛ!
ГЕОГРАФИЯ ДОМИНИРОВАНИЯ:
- США (прямо на заднем дворе OpenAI!)
- Австралия (кенгуру одобряют!)
- Канада (сорри, ChatGPT!)
- Сингапур, UK (ВЕЗДЕ!)
🔬 ALIBABA СЬЕЛА МАТЕМАТИКУ:QWEN2.5-1M - ЭТО КОСМОС:
- 1 МИЛЛИОН токенов контекста
- Две версии: 7B и 14B (выбирай яд!)
- Глотает книги как семечки
- Память как у слона на стероидах!
⚡️ ПОЧЕМУ ЭТО ВАЖНО:ПРАКТИЧЕСКИЕ ПОСЛЕДСТВИЯ:
- Читает ЦЕЛЫЕ КНИГИ за раз
- Помнит ВСЮ историю чата
- Анализирует юридические талмуды
- Понимает сложную логику КАК БОСС!
СРАВНЕНИЕ С КОНКУРЕНТАМИ:
- GPT-4: 128K токенов (ЛОЛЧТО?)
- Claude: 200K токенов (СЛАБЕНЬКО!)
- Gemini: 2M токенов (НО с амнезией...)
- Qwen: МИЛЛИОН, ДЕТКА!
💊 ЧТО ЭТО ЗНАЧИТ:ДЛЯ РЫНКА:
- США больше НЕ МОНОПОЛИСТ
- Санкции? НЕ СЛЫШАЛИ!
- Китай показал, КТО ПАПОЧКА
- OpenAI нервно курит в сторонке!
ДЛЯ НАС:
- Бесплатный доступ к топовому AI
- Больше никаких лимитов
- Конкуренция = ЛУЧШЕ КАЧЕСТВО
- БУДУЩЕЕ УЖЕ ЗДЕСЬ!
P.S. Для скептиков: попробуйте DeepSeek сами - он реально БЕСПЛАТНЫЙ!
#КитайскийAI #DeepSeekРулит #QwenМонстр #OpenAIНервничает #БудущееУжеЗдесь
👍13
Техножнец
🌋 КИТАЙСКИЙ AI ПОРВАЛ ВСЕХ: DEEPSEEK УНИЗИЛ CHATGPT, ALIBABA ВЗОРВАЛА МОЗГ! 🌋 Привет, синтеты! Сегодня разберём, как китайцы РАСТОПТАЛИ OpenAI и показали всем, что такое НАСТОЯЩИЙ AI! Держитесь крепче! 🧠 DEEPSEEK - УБИЙЦА CHATGPT: ЧТО СЛУЧИЛОСЬ: - Первое…
Влияние на рынок:
Nasdaq 100 и Stoxx 600 Tech: -$1 трлн капитализации 📉
S&P 500 фьючерсы: -1.9%
Nasdaq 100 фьючерсы: -3.2%
Обвал акций:
Nvidia: -11%
Taiwan Semiconductor: -11%
ASML: -7%
Broadcom: -12%
Micron: -6%
Причины шторма:
#AI #Биржа #DeepSeek #Alibaba #Инвестиции Этот формат выделяет ключевые моменты и делает текст более читаемым для вашей аудитории.
Nasdaq 100 и Stoxx 600 Tech: -$1 трлн капитализации 📉
S&P 500 фьючерсы: -1.9%
Nasdaq 100 фьючерсы: -3.2%
Обвал акций:
Nvidia: -11%
Taiwan Semiconductor: -11%
ASML: -7%
Broadcom: -12%
Micron: -6%
Причины шторма:
DeepSeek:
Работает на менее мощных чипах 💻
Результаты как у ChatGPT, но дешевле в 170 раз 💰
Alibaba Qwen2.5-1M:
Контекст 1 млн токенов (vs 128K у GPT-4) 🚀
Реакция экспертов:
Citi: "Покупать Nvidia (несмотря на падение)"
Аналитики: "Доминирование в AI под вопросом" ⚠️
Что дальше?
📉 Возможное снижение цен на AI-сервисы
🇨🇳 Китай демонстрирует мощь, несмотря на санкции
💼 Инвесторам: пересмотреть оценку техкомпаний
Вывод: Рынок AI остается высококонкурентным.
Американские компании все еще сильны, но китайский прорыв может изменить расклад сил. Следим за развитием! 👀
#AI #Биржа #DeepSeek #Alibaba #Инвестиции Этот формат выделяет ключевые моменты и делает текст более читаемым для вашей аудитории.
👍6
КОРОЧЕ, КАКОЙ ПЛАН:
1) Добавлено кол-во слоёв треубемое для кол-ва параметров в 1B
2) Переработан токенизатор чтобы работал адекватно с последовательностями (точность высокая)
3) Добавлю механизм длинного контекста как в новом вышедшем QWEN на 1млн токенов
4) Отчитаюсь по теме процессинга документов с помощью DEEPSEEK и расскажу каким образом можно создавать инструкции дёшево и, главное, массово.
Многие забывают, что эти модели созданы для создания более мощных синтетических датасетов из уже имеющихся книг и данных.
👍12