Forwarded from Dan Okhlopkov - канал
В 2020 стукнул ковид и я ушел в годовой саббатикал пилить свои проекты. Самый успешный из них — этот тг канал.
Еще до появления ChatGPT мы с @lovedeathtransformers и @malakhovdm рисерчили проект под кодовым названием Алан: тг профиль, который не выглядит как бот, но автоматически добавляется и отвечает на сообщениях в чатах. Никакого спама, но имитация цифровой жизни.
Вся мощь NLP той эпохи была бессильна отвечать хоть как-то понятно.
Спустя 5 лет новую попытку делаем уже с @metakrotov - сделали бота, которого ты добавляешь в чат, а он иногда развлекает народ.
Встречайте: @countdurovbot. Такая вот альтернатива всем chatgpt оберткам в тг. У него доступ ко всему контексту и есть долгосрочная память, бывает выдает веселые вещи.
В будущем мы добавим возможность создавать своих таких же ботов по промпту. Стартаните бота, чтобы он прислал вам анонс, когда это запрогаем.
Кстати, моделька под капотом — deepseek, которая, видимо, обучалась на всем подряд, поэтому выдает сообщения, хоть как-то похожие на мессенджер, а не на corporative slur от openai.
Добавьте бота к себе в чат с кентами по ссылке — не забудьте дать права админа, чтобы он видел сообщения.
🔗 t.me/countdurovbot?startgroup=true
Еще до появления ChatGPT мы с @lovedeathtransformers и @malakhovdm рисерчили проект под кодовым названием Алан: тг профиль, который не выглядит как бот, но автоматически добавляется и отвечает на сообщениях в чатах. Никакого спама, но имитация цифровой жизни.
Вся мощь NLP той эпохи была бессильна отвечать хоть как-то понятно.
Спустя 5 лет новую попытку делаем уже с @metakrotov - сделали бота, которого ты добавляешь в чат, а он иногда развлекает народ.
Встречайте: @countdurovbot. Такая вот альтернатива всем chatgpt оберткам в тг. У него доступ ко всему контексту и есть долгосрочная память, бывает выдает веселые вещи.
В будущем мы добавим возможность создавать своих таких же ботов по промпту. Стартаните бота, чтобы он прислал вам анонс, когда это запрогаем.
Кстати, моделька под капотом — deepseek, которая, видимо, обучалась на всем подряд, поэтому выдает сообщения, хоть как-то похожие на мессенджер, а не на corporative slur от openai.
Добавьте бота к себе в чат с кентами по ссылке — не забудьте дать права админа, чтобы он видел сообщения.
🔗 t.me/countdurovbot?startgroup=true
🥴70💩9🔥7😁4🥱3
https://huggingface.co/flymy-ai/qwen-image-edit-inscene-lora
Братва рвется к gpt4o в опенсурсе
Слева до Лоры справа после
Братва рвется к gpt4o в опенсурсе
Слева до Лоры справа после
👏54👍6❤🔥4🔥3🍓1
https://www.reddit.com/r/ArtificialInteligence/comments/1mw7i5e/zuckerberg_freezes_ai_hiring_amid_bubble_fears/
Oh no... No more money???
Oh no... No more money???
😁81 38🐳1🌚1
Forwarded from X5 Tech
Я вижу ML, а ты? Проверь 27 августа в «Сфере X5» Парк Горького
Мы в X5 Tech | AI следим за тем, что двигает технологии вперёд. А ICML — это место, где формируются тренды машинного обучения, которые завтра будут менять индустрии. В этом году конференция прошла в Ванкувере и представила работы топовых специалистов, занимающихся машинным обучением — от исследователей до инженеров.
Мы предлагаем посмотреть и обсудить несколько ML-новинок — в «Сфере X5» в Парке Горького.
Помогут не упустить важные моменты новых подходов открытия международной конференции по машинному обучению (ICML 2025) под другим углом:
🧑💻 Артём Ерохин, ведущий инженер нейронных сетей в X5 Tech | AI
👩💻 Дарья Андреева, старший инженер нейронных сетей в X5 Tech | AI
Программа вечера:
• разобрать, на наш взгляд, наиболее актуальные доклады ICML 2025;
• обсудить, как эти технологии можно внедрить в бизнес;
• оценить их потенциал, плюсы, минусы и особенности.
Поделиться мнением мы пригласили:
• Максима Павлова, руководителя управления продуктивизации искусственного интеллекта в X5 Tech | AI;
• Петра Лукьянченко, Head of AI in Mathematical Finance Laboratory, HSE;
• Даниила Гаврилова, руководителя Research-команды AI-Центра Т-Банка;
• Александру Мурзину, руководителя AI-проектов в AI Marvel, Яндекс.
📆 Когда: в среду, 27 августа, 19:00 Где: «Сфера X5», Парк Горького
👉 Регистрация по ссылке.
Для ИИ-инженеров, аналитиков, исследователей и всех, кто живёт технологиями. Регистрируйся, приходи и вместе с нами разгадай новую ML-головоломку!
Мы в X5 Tech | AI следим за тем, что двигает технологии вперёд. А ICML — это место, где формируются тренды машинного обучения, которые завтра будут менять индустрии. В этом году конференция прошла в Ванкувере и представила работы топовых специалистов, занимающихся машинным обучением — от исследователей до инженеров.
Мы предлагаем посмотреть и обсудить несколько ML-новинок — в «Сфере X5» в Парке Горького.
Помогут не упустить важные моменты новых подходов открытия международной конференции по машинному обучению (ICML 2025) под другим углом:
🧑💻 Артём Ерохин, ведущий инженер нейронных сетей в X5 Tech | AI
👩💻 Дарья Андреева, старший инженер нейронных сетей в X5 Tech | AI
Программа вечера:
• разобрать, на наш взгляд, наиболее актуальные доклады ICML 2025;
• обсудить, как эти технологии можно внедрить в бизнес;
• оценить их потенциал, плюсы, минусы и особенности.
Поделиться мнением мы пригласили:
• Максима Павлова, руководителя управления продуктивизации искусственного интеллекта в X5 Tech | AI;
• Петра Лукьянченко, Head of AI in Mathematical Finance Laboratory, HSE;
• Даниила Гаврилова, руководителя Research-команды AI-Центра Т-Банка;
• Александру Мурзину, руководителя AI-проектов в AI Marvel, Яндекс.
📆 Когда: в среду, 27 августа, 19:00 Где: «Сфера X5», Парк Горького
👉 Регистрация по ссылке.
Для ИИ-инженеров, аналитиков, исследователей и всех, кто живёт технологиями. Регистрируйся, приходи и вместе с нами разгадай новую ML-головоломку!
🥴30👍4😡1
приходит сычев в парк горького а там гигачат ероха рассказывает как надо на ICML статьи возить, а у сычева две публикации на диаоге и воркшоп b*, hi маленький пиздец (7) микрохиршия короче, хотя уже 5 лет в ресерче работает RL делает на Jaxе....
😁50👍1😢1🍓1 1
интересно что в целях безопасности из современных ллм повыпиливали байесы и теперь не работают (почти) угрозы и "ты эксперт в X"
🤔58 17😁14 3👍2
Forwarded from black_samorez
Сегодня в 22:00 мск (через час) будем презентовать нашу статью
Quartet: Native FP4 Training Can Be Optimal for Large Language Models
на GPU MODE. Залетайте.
Quartet: Native FP4 Training Can Be Optimal for Large Language Models
на GPU MODE. Залетайте.
🔥34 5💊4🥴3 2🍓1
black_samorez
Сегодня в 22:00 мск (через час) будем презентовать нашу статью Quartet: Native FP4 Training Can Be Optimal for Large Language Models на GPU MODE. Залетайте.
YouTube
Live Quartet 4 bit training
Speakers: Roberto Castro and Andrei Panferov
https://arxiv.org/abs/2505.14669
https://github.com/IST-DASLab/Quartet
https://github.com/isT-DASLab/qutlass
https://arxiv.org/abs/2505.14669
https://github.com/IST-DASLab/Quartet
https://github.com/isT-DASLab/qutlass
1❤🔥11👍5😁3
#промо #промо #промо
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
-🍴 100-500к USD
Вакансии:
1. FullStack Engineer
Typenoscript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. DevOps Engineer
AWS / GCP, Terraform, k8s, Kafka, ClickHouse, Prometheus, Grafana, DataDog, HPC
3. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
-
Вакансии:
1. FullStack Engineer
Typenoscript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. DevOps Engineer
AWS / GCP, Terraform, k8s, Kafka, ClickHouse, Prometheus, Grafana, DataDog, HPC
3. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👏11💩9💊7🥱3🎉2
Forwarded from Сиолошная
Результаты — GPT-5 на первом месте с большим отрывом, но финальное качество всё равно меньше 50%. Модель от OpenAI также набрала больше всех в каждом домене, кроме, внезапно, Browser Automation, где немного выбился вперёд Grok 4.
Лучшая опенсурс-модель — GLM-4.5, хотя я думал бы на Kimi-K2, ведь они так описывали свой процесс дообучения использованию MCP.
Лучшая опенсурс-модель — GLM-4.5, хотя я думал бы на Kimi-K2, ведь они так описывали свой процесс дообучения использованию MCP.
🎉12👍5🔥1💩1
был с одним уважаемым человеком спор: является ли китайский опенсурс фронтриром или нет, выходит так что glm4.5 на произвольном бенчмарке не сильно хуже чем 2.5pro, а dsv3 где то между 4o и о3.
Что это значит? В душе не ебу
Что это значит? В душе не ебу
1😁77👍7🍓2🔥1💯1🆒1
https://aella.substack.com/p/my-birthday-gangbang
А прикиньте чо будет когда до верхнего интеренета доберется инфа про Aella?
А прикиньте чо будет когда до верхнего интеренета доберется инфа про Aella?
Substack
My Birthday Gangbang
a slutistical breakdown
Forwarded from Den4ik Research
Наш русскоязычный датасет для TTS опубликован!
Сегодня выкладываем открытые корпуса на 4000+ часов речи, а еще синтезатор речи ESpeech-TTS-1
Наш датасет содержит больше 4000 часов русской речи. Статистика по корпусам:
Многоголосые:
ESpeech-podcasts - 3200 часов
ESpeech-webinars - 850 часов
Одноголосые:
ESpeech-igm - 220 часов
ESpeech-buldjat - 54 часа
ESpeech-upvote - 296 часов
ESpeech-tuchniyzhab - 306 часов
Данные лежат вот тут: https://huggingface.co/ESpeech
Техрепорт датасета доступен тут: https://github.com/Den4ikAI/ESpeech/blob/main/ESpeech_techreport.pdf
Также, мы решили провести некоторые эксперименты с TTS. Получилось обучить F5-TTS на 10000 часов речи и сделать одну из лучших по нашим замерам моделей в опенсурсе для русского языка.
Какие модели доступны?
ESpeech-TTS-1 [RL] V1 - Первая версия модели с RL
ESpeech-TTS-1 [RL] V2 - Вторая версия модели с RL
ESpeech-TTS-1 PODCASTER [SFT] - Модель обученная только на подкастах, лучше генерирует спонтанную речь
ESpeech-TTS-1 [SFT] 95K - чекпоинт с 95000 шагов (на нем основана RL V1)
ESpeech-TTS-1 [SFT] 265K - чекпоинт с 265000 шагов (на нем основана RL V2)
Лайкайте модель которая больше понравится чтобы мы понимали есть ли смысл запускать RL.
Послушать модели без скачивания можно вот здесь:
https://huggingface.co/spaces/Den4ikAI/ESpeech-TTS
Совместно с @speech_recognition_ru ещё сделали лидерборд русского ТТС, где можно глянуть метрики:
https://huggingface.co/spaces/ESpeech/open_tts_leaderboard_ru
Задать вопросы по поводу данных и модели можно в наших телеграм каналах:
https://news.1rj.ru/str/den4ikresearch
https://news.1rj.ru/str/voice_stuff_chat
Вы можете мне задонатить, чтобы у меня были ресурсы делать более крутые модели и датасеты:
USDT (TRC20): TEpEM4VVmGmqKHn4Xz1FxM7qZiXjWtUEUB
BTC: bc1qw5lq7fc455e47hggax6zp8txw4ru7yvsxvawv3
https://www.tbank.ru/cf/7WKnNMqWtOx
Сегодня выкладываем открытые корпуса на 4000+ часов речи, а еще синтезатор речи ESpeech-TTS-1
Наш датасет содержит больше 4000 часов русской речи. Статистика по корпусам:
Многоголосые:
ESpeech-podcasts - 3200 часов
ESpeech-webinars - 850 часов
Одноголосые:
ESpeech-igm - 220 часов
ESpeech-buldjat - 54 часа
ESpeech-upvote - 296 часов
ESpeech-tuchniyzhab - 306 часов
Данные лежат вот тут: https://huggingface.co/ESpeech
Техрепорт датасета доступен тут: https://github.com/Den4ikAI/ESpeech/blob/main/ESpeech_techreport.pdf
Также, мы решили провести некоторые эксперименты с TTS. Получилось обучить F5-TTS на 10000 часов речи и сделать одну из лучших по нашим замерам моделей в опенсурсе для русского языка.
Какие модели доступны?
ESpeech-TTS-1 [RL] V1 - Первая версия модели с RL
ESpeech-TTS-1 [RL] V2 - Вторая версия модели с RL
ESpeech-TTS-1 PODCASTER [SFT] - Модель обученная только на подкастах, лучше генерирует спонтанную речь
ESpeech-TTS-1 [SFT] 95K - чекпоинт с 95000 шагов (на нем основана RL V1)
ESpeech-TTS-1 [SFT] 265K - чекпоинт с 265000 шагов (на нем основана RL V2)
Лайкайте модель которая больше понравится чтобы мы понимали есть ли смысл запускать RL.
Послушать модели без скачивания можно вот здесь:
https://huggingface.co/spaces/Den4ikAI/ESpeech-TTS
Совместно с @speech_recognition_ru ещё сделали лидерборд русского ТТС, где можно глянуть метрики:
https://huggingface.co/spaces/ESpeech/open_tts_leaderboard_ru
Задать вопросы по поводу данных и модели можно в наших телеграм каналах:
https://news.1rj.ru/str/den4ikresearch
https://news.1rj.ru/str/voice_stuff_chat
Вы можете мне задонатить, чтобы у меня были ресурсы делать более крутые модели и датасеты:
USDT (TRC20): TEpEM4VVmGmqKHn4Xz1FxM7qZiXjWtUEUB
BTC: bc1qw5lq7fc455e47hggax6zp8txw4ru7yvsxvawv3
https://www.tbank.ru/cf/7WKnNMqWtOx
4🔥109👍18 17🍓3💩1
пока единственный плюс от гпт5 в ней реально не бесполезный поиск и он быстрый. Модель правда все еще вне thinking оч тупая, а с thinking имеет тот же набор болячек что и о3 и прочие
1🍓54💯9🔥2