This media is not supported in your browser
VIEW IN TELEGRAM
#полезное
🤓 Gemini 2.0 Flash Thinking теперь БЕСПЛАТНАЯ —
новейшую нейронку от Google могут юзать в Colab абсолютно все.
🚩 Что умеет
🟠 Она читает и обрабатывает текст из блокнота.
🟠 Советует, как улучшить код.
🟠 Работает шустро — отвечает на вопросы за секунду.
🟠 Не требует ВПН и других дополнительных настроек.
Попробуй тут
👉 Новости 👉 Платформа
новейшую нейронку от Google могут юзать в Colab абсолютно все.
Попробуй тут
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😊 Фиксим баги в ЛЮБОМ коде и заставляем его работать на раз-два. Теперь постоянно указывать ИИ на ошибки — хватит одного промпта, и все прога заработает без проблем:
Промпт универсальный, работает в любой нейронке и ИИ-среде — от ChatGPT до Cursor.
Мучения закончились. Тестируем.
👉 Новости 👉 Платформа
Reflect on 5-7 different possible source of the problem, distill those down to 1-2 most likely sources, and the add logs to validate your assumptions before we move onto the implementing the actual code fix
Промпт универсальный, работает в любой нейронке и ИИ-среде — от ChatGPT до Cursor.
Мучения закончились. Тестируем.
Please open Telegram to view this post
VIEW IN TELEGRAM
#полезное
😊 Sourcegraph Cody
Это открытый AI-ассистент для программирования, который помогает разработчикам быстрее писать, понимать и исправлять код!
🟠 Он интегрируется с популярными редакторами, такими как VS Code и JetBrains, предоставляя поддержку при разработке на основе локального и удалённого контекста кодовой базы. Cody использует современные языковые модели, включая GPT-4 и Claude 3.5, для предоставления рекомендаций, анализа API, поиска символов и шаблонов использования.
🟠 Cody позволяет использовать продвинутые функции поиска по кодовой базе, чтобы получать контекст и советы прямо в IDE. Он поддерживает гибкое масштабирование для работы с большими проектами, обеспечивая помощь в исправлении ошибок, создании новых функций и улучшении структуры кода.
Гитхаб
👉 Новости 👉 Платформа
Это открытый AI-ассистент для программирования, который помогает разработчикам быстрее писать, понимать и исправлять код!
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#новости
😊 Native Sparse Attention - революция в механизмах внимания от Deepseek.
NSA (Natively Sparse Attention) — новый механизм внимания, предложенный на заменуFull Attention, который значительно ускоряет обработку длинных последовательностей текста без потери качества модели.
NSA использует динамическую иерархическую стратегию, которая сочетает сжатие токенов на грубом уровне с точным отбором ключевых токенов. Это позволяет сохранить глобальное понимание контекста и локальную точность. NSA поддерживает сквозное обучение, совместим с GQA и MQA, что делает его пригодным не только для инференса, но и для обучения.
Модели, обученные с использованием NSA показали 9х ускорение при прямом распространении и 6х при обратном для последовательностей длиной 64к токенов относительно Full Attention. В декодировании - 11х.
arxiv.org
👉 Новости 👉 Платформа
NSA (Natively Sparse Attention) — новый механизм внимания, предложенный на заменуFull Attention, который значительно ускоряет обработку длинных последовательностей текста без потери качества модели.
NSA использует динамическую иерархическую стратегию, которая сочетает сжатие токенов на грубом уровне с точным отбором ключевых токенов. Это позволяет сохранить глобальное понимание контекста и локальную точность. NSA поддерживает сквозное обучение, совместим с GQA и MQA, что делает его пригодным не только для инференса, но и для обучения.
Модели, обученные с использованием NSA показали 9х ускорение при прямом распространении и 6х при обратном для последовательностей длиной 64к токенов относительно Full Attention. В декодировании - 11х.
arxiv.org
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
#новости
👍 MedRAX: новаторский ИИ-агент, разработанный для медицинских задач!
Что такое MedRAX?
MedRAX - это первый универсальный ИИ-агент, который объединяет современные инструменты для анализа рентгеновских снимков грудной клетки и мультимодальные большие языковые модели в единую структуру, позволяющую динамически обосновывать сложные медицинские запросы без дополнительного обучения.
✅ Чем хорош именно MedRAX?
Хотя специализированные модели ИИ отлично справляются с конкретными задачами рентгенографии грудной клетки, они часто не справляются с комплексным анализом и могут выдавать неточные рекомендации . Многим медицинским работникам нужна единая, надежная система, способная обрабатывать сложные запросы, сохраняя при этом точность. MedRAX призван стать таким инструментом
Ключевые особенности
🟢 Бесшовная интеграция специализированных медицинских инструментов с мультимодальными рассуждениями на основе больших языковых моделей.
🟢 Динамическая оркестровка: Интеллектуальный выбор и координация инструментов для сложных запросов.
🟢 Клиническая направленность: Разработан для реальных медицинских процессов.
ChestAgentBench
Разработчики также выпустили ChestAgentBench, комплексный эталон медицинского агента, созданный на основе 675 клинических случаев, проверенных экспертами, и включающий 2500 сложных медицинских запросов по 7 категориям.
Результаты говорят сами за себя
🟠 63,1% точности на ChestAgentBench
🟠 Sota результативность на CheXbench
🟠 Превосходит как универсальные, так и специализированные медицинские модели
Гитхаб
👉 Новости 👉 Платформа
Что такое MedRAX?
MedRAX - это первый универсальный ИИ-агент, который объединяет современные инструменты для анализа рентгеновских снимков грудной клетки и мультимодальные большие языковые модели в единую структуру, позволяющую динамически обосновывать сложные медицинские запросы без дополнительного обучения.
Хотя специализированные модели ИИ отлично справляются с конкретными задачами рентгенографии грудной клетки, они часто не справляются с комплексным анализом и могут выдавать неточные рекомендации . Многим медицинским работникам нужна единая, надежная система, способная обрабатывать сложные запросы, сохраняя при этом точность. MedRAX призван стать таким инструментом
Ключевые особенности
ChestAgentBench
Разработчики также выпустили ChestAgentBench, комплексный эталон медицинского агента, созданный на основе 675 клинических случаев, проверенных экспертами, и включающий 2500 сложных медицинских запросов по 7 категориям.
Результаты говорят сами за себя
Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤝3
#новости
🤯 Физики приблизили ИИ к "бесконтрольному обучению"
Исследователи из Университета технологий Сиднея представили новый алгоритм Torque Clustering (TC), который умеет находить закономерности в данных без участия человека. Вдохновленный процессом слияния галактик, этот метод позволяет ИИ учиться самостоятельно, кратно сокращая необходимость в ручной разметке данных. Алгоритм уже показал высокие результаты, достигнув точности в 97,7% на 1 тыс. датесетах.
В отличие от традиционного ИИ, который требует огромного количества размеченных данных, TC работает по принципу естественного наблюдения, подобно тому, как животные изучают окружающий мир.
studyfinds.org
👉 Новости 👉 Платформа
Исследователи из Университета технологий Сиднея представили новый алгоритм Torque Clustering (TC), который умеет находить закономерности в данных без участия человека. Вдохновленный процессом слияния галактик, этот метод позволяет ИИ учиться самостоятельно, кратно сокращая необходимость в ручной разметке данных. Алгоритм уже показал высокие результаты, достигнув точности в 97,7% на 1 тыс. датесетах.
В отличие от традиционного ИИ, который требует огромного количества размеченных данных, TC работает по принципу естественного наблюдения, подобно тому, как животные изучают окружающий мир.
studyfinds.org
Please open Telegram to view this post
VIEW IN TELEGRAM
Study Finds
No more hand-holding: Physicists bring AI closer to 'unsupervised learning'
Explore the future of artificial intelligence with unsupervised learning, allowing AI to learn independently from data.
#Собес
🤔 Чем PyTorch отличается от других фреймворков глубокого обучения, таких как TensorFlow?
PyTorch и TensorFlow отличаются архитектурой вычислений: PyTorch использует динамическую вычислительную графику, что позволяет изменять граф во время выполнения, в то время как TensorFlow использует статичный граф, который требует предварительного определения. Это делает PyTorch более интуитивным и удобным для отладки, но TensorFlow может обеспечивать лучшую производительность благодаря оптимизации вычислений. Также PyTorch более дружелюбен к Python- разработчикам, поскольку поддерживает структуру управления Python, в то время как TensorFlow абстрагирует многие детали.
👉 Новости 👉 Платформа
PyTorch и TensorFlow отличаются архитектурой вычислений: PyTorch использует динамическую вычислительную графику, что позволяет изменять граф во время выполнения, в то время как TensorFlow использует статичный граф, который требует предварительного определения. Это делает PyTorch более интуитивным и удобным для отладки, но TensorFlow может обеспечивать лучшую производительность благодаря оптимизации вычислений. Также PyTorch более дружелюбен к Python- разработчикам, поскольку поддерживает структуру управления Python, в то время как TensorFlow абстрагирует многие детали.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#новости
🤑 Alibaba планирует инвестировать 52 млрд долларов в ИИ т и облачную инфраструктуру в следующие 3 года.
ИИ гонка становища все жарче , а инвестиции стремительно растут.
🟠 Проект «Звездные врата»: 500 млрд долларов на создание AGI/ASI (из которого кстати недавно отвалился Microsoft)
🟠 Apple: ИИ-инфраструктура стоимостью 500 млрд долларов
🟠 Инфраструктура искусственного интеллекта стоимостью 200 млрд долларов США в ЕС
🟠 Alibaba: инфраструктура искусственного интеллекта и облака стоимостью 52 млрд долларов
👉 Новости 👉 Платформа
ИИ гонка становища все жарче , а инвестиции стремительно растут.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Media is too big
VIEW IN TELEGRAM
#новости
😊 Helix - локальный AI на роботе
Из-за этой модели Figure разорвала сделку с OpenAI, заявив что им удалось совершить прорыв. Все действия роботов на видео - результат работы модельки, работающей полностью на роботе. Модель управляет верхней половиной тела, позволяет двум роботам работать вместе и поднимать любые мелкие предметы.
Состоит Helix из двух компонентов - отвечающей за планирование System 2, основанная на неназванной опенсорсной 7B VLM и работающая на скорости 7-9 Hz. Исполняет планы System 1 - encoder-decoder на 80 миллионов параметров, работающая на скорости в 200 Hz, что позволяет точнее двигаться и быстрее реагировать. System 1 и System 2 работают на отдельных GPU, чтобы не мешать друг другу.
Натренировали это всего на 500 часах данных, что доступно множеству стартапов. Это крайне ранняя стадия и нас ждёт очень быстрое масштабирование.
Блогпост
👉 Новости 👉 Платформа
Из-за этой модели Figure разорвала сделку с OpenAI, заявив что им удалось совершить прорыв. Все действия роботов на видео - результат работы модельки, работающей полностью на роботе. Модель управляет верхней половиной тела, позволяет двум роботам работать вместе и поднимать любые мелкие предметы.
Состоит Helix из двух компонентов - отвечающей за планирование System 2, основанная на неназванной опенсорсной 7B VLM и работающая на скорости 7-9 Hz. Исполняет планы System 1 - encoder-decoder на 80 миллионов параметров, работающая на скорости в 200 Hz, что позволяет точнее двигаться и быстрее реагировать. System 1 и System 2 работают на отдельных GPU, чтобы не мешать друг другу.
Натренировали это всего на 500 часах данных, что доступно множеству стартапов. Это крайне ранняя стадия и нас ждёт очень быстрое масштабирование.
Блогпост
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#Собес
🤔 Объясните, чем TensorFlow отличается от других платформ машинного обучения
TensorFlow отличается гибкостью и масштабируемостью. Он поддерживает широкий спектр нейронных сетей и алгоритмов, что делает его универсальным для различных задач. Благодаря модели вычислительных графов TensorFlow можно эффективно обрабатывать вычисления параллельно, что улучшает производительность на крупных системах. Также TensorFlow предоставляет инструменты для отладки и оптимизации моделей, такие как TensorBoard, и поддерживает развертывание на мобильных устройствах и вебе.
👉 Новости 👉 Платформа
TensorFlow отличается гибкостью и масштабируемостью. Он поддерживает широкий спектр нейронных сетей и алгоритмов, что делает его универсальным для различных задач. Благодаря модели вычислительных графов TensorFlow можно эффективно обрабатывать вычисления параллельно, что улучшает производительность на крупных системах. Также TensorFlow предоставляет инструменты для отладки и оптимизации моделей, такие как TensorBoard, и поддерживает развертывание на мобильных устройствах и вебе.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#новости
😊 Alibaba Wan 2.1 - новая SOTA опенсорс видео модель
Скорее всего это та самая загадочная модель, которая уже месяц доступна в Qwen Chat. На лидерборде VBench она занимает первое место, но там нет нескольких сильных конкурентов, вроде Veo 2 от гугла. Больше бенчей никаких нет, так что ждём полноценного техрепорта и тем временем вайбчекаем модель по генерациям). По ним, например, видно что модель очень хорошо генерирует текст, как на английском, так и на китайском, с чем другие модели справляются куда хуже.
Идёт в двух размерах — 1.3B и 14B и в нескольких разных вариантах для разных разрешений (поддерживаются 480p и 720p). Маленькой 1.3B модели нужно всего 8,2 гигабайта VRAM для запуска, а на генерацию видео уходит всего 4 минуты на 4090.
Большая моделька потребляет заметно больше — вплоть до 77 гигабайт. Но модели совсем не оптимизированные (замеры по памяти делали с fp32 моделями), так что есть много простора для оптимизации. Посмотрите на тот же Hunyuan, который при ~таком же количестве параметров неплохо запускается на консьюмерских видяхах. Умельцы за пару недель ещё оптимизируют эти модели, чтобы запускалось на каждом холодильнике.
Код
wanxai.com
👉 Новости 👉 Платформа
Скорее всего это та самая загадочная модель, которая уже месяц доступна в Qwen Chat. На лидерборде VBench она занимает первое место, но там нет нескольких сильных конкурентов, вроде Veo 2 от гугла. Больше бенчей никаких нет, так что ждём полноценного техрепорта и тем временем вайбчекаем модель по генерациям). По ним, например, видно что модель очень хорошо генерирует текст, как на английском, так и на китайском, с чем другие модели справляются куда хуже.
Идёт в двух размерах — 1.3B и 14B и в нескольких разных вариантах для разных разрешений (поддерживаются 480p и 720p). Маленькой 1.3B модели нужно всего 8,2 гигабайта VRAM для запуска, а на генерацию видео уходит всего 4 минуты на 4090.
Большая моделька потребляет заметно больше — вплоть до 77 гигабайт. Но модели совсем не оптимизированные (замеры по памяти делали с fp32 моделями), так что есть много простора для оптимизации. Посмотрите на тот же Hunyuan, который при ~таком же количестве параметров неплохо запускается на консьюмерских видяхах. Умельцы за пару недель ещё оптимизируют эти модели, чтобы запускалось на каждом холодильнике.
Код
wanxai.com
Please open Telegram to view this post
VIEW IN TELEGRAM
#Собес
🤔 Как использование графов потока данных в TensorFlow помогает в разработке моделей машинного обучения?
Графы данных в TensorFlow позволяют эффективно выполнять вычисления, улучшать параллельность и обеспечивать переносимость. Графы представляют вычисления как узлы, соединенные ребрами, что позволяет TensorFlow распределять вычисления по нескольким процессорам и GPU, повышая эффективность. Кроме того, абстракция графов упрощает создание моделей без необходимости учитывать аппаратные особенности.
👉 Новости 👉 Платформа
Графы данных в TensorFlow позволяют эффективно выполнять вычисления, улучшать параллельность и обеспечивать переносимость. Графы представляют вычисления как узлы, соединенные ребрами, что позволяет TensorFlow распределять вычисления по нескольким процессорам и GPU, повышая эффективность. Кроме того, абстракция графов упрощает создание моделей без необходимости учитывать аппаратные особенности.
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
😵💫 Наконец-то и Яндекс выложили модель в опенсорс
На растерзание энтузиастам отдали YandexGPT 5 Lite на 8B параметров, это базовая модель до пост-трейна. Перфоманс по бенчам чуть лучше, чем у LLaMA и Qwen тех же размеров, и значительно лучше в русском языке.
Интересно, что если Lite обучали с нуля, то Pro обучали гибридно - инициализировали веса с чекпоинта Qwen 2.5 32B Base, а поверх него уже запустили полноценный претрейн пайплайн на своих данных. Это не просто файнтюн, потому что включает в себя все этапы тренировки модели и использует сильно больше токенов. ИМХО это хороший способ сэкономить ресурсы и ускорить обучение, если архитектура как-то кардинально не меняется.
Тренили Lite на датасете в 15 триллионов токенов (прямо как Llama 3), он включал в себя 30% русского и 70% английского. При этом из них только 15% — код, 10% — математика, поэтому в этих задачах она проигрывает тому же Qwen. В базовой модели, которую выложили в опенсорс, нет никакой цензуры.
А вот старшая модель PRO уже доступна в чатике с Алисой. Так что виртуальный ассистент теперь совсем умный) Почти 4o, lol. Пишут, что PRO сильна в кодинге. И хоть среди англоязычных разрабов все топят за Клод в работе с кодом, последняя моделька Яндекса, по моему опыту, тоже неплохо справляется, особенно с русскоязычными промтами. PRO доступна через API, и к ней даже можно прикрутить RAG.
В блог-посте на Хабре расписаны детали про тренировку модели.
👉 Новости 👉 Платформа
На растерзание энтузиастам отдали YandexGPT 5 Lite на 8B параметров, это базовая модель до пост-трейна. Перфоманс по бенчам чуть лучше, чем у LLaMA и Qwen тех же размеров, и значительно лучше в русском языке.
Интересно, что если Lite обучали с нуля, то Pro обучали гибридно - инициализировали веса с чекпоинта Qwen 2.5 32B Base, а поверх него уже запустили полноценный претрейн пайплайн на своих данных. Это не просто файнтюн, потому что включает в себя все этапы тренировки модели и использует сильно больше токенов. ИМХО это хороший способ сэкономить ресурсы и ускорить обучение, если архитектура как-то кардинально не меняется.
Тренили Lite на датасете в 15 триллионов токенов (прямо как Llama 3), он включал в себя 30% русского и 70% английского. При этом из них только 15% — код, 10% — математика, поэтому в этих задачах она проигрывает тому же Qwen. В базовой модели, которую выложили в опенсорс, нет никакой цензуры.
А вот старшая модель PRO уже доступна в чатике с Алисой. Так что виртуальный ассистент теперь совсем умный) Почти 4o, lol. Пишут, что PRO сильна в кодинге. И хоть среди англоязычных разрабов все топят за Клод в работе с кодом, последняя моделька Яндекса, по моему опыту, тоже неплохо справляется, особенно с русскоязычными промтами. PRO доступна через API, и к ней даже можно прикрутить RAG.
В блог-посте на Хабре расписаны детали про тренировку модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
#новости
🛞 Alexa наконец-то станет умной
Теперь внутри Alexa будут полноценные агентные LLM (Claude и Amazon Nova), которые смогут взаимодействовать с десятками тысяч интеграций Alexa. Кто не в курсе, там есть всё — от управления умным домом, до заказов еды и покупки билетов. Слухи о такой интеграции ходили давно, но заставить работать такое количество тулов в одном месте до них ещё никому не удавалось, поэтому времени ушло порядочно.
Это будет интегрировано с новой памятью, а-ля ChatGPT, где Alexa будет запоминать инфу вроде диетических предпочтений, фактов о вас и так далее. Помимо этого она всё ещё будет иметь доступ ко всем персональным данным к которым имела доступ старая Alexa, типа истории покупок. Для более удобного взаимодействия Amazon сделали новое мобильное приложение и добавили возможность взаимодействовать с Alexa через сайт.
Продвинутые фичи Alexa будут доступны всем подписчикам Amazon Prime в следующие несколько месяцев. Чисто теоретически существует ещё и отдельная подписка Alexa+, за $20 в месяц, но существует она явно чтобы больше людей подписалось на Prime, который стоит на 5 долларов дешевле.
👉 Новости 👉 Платформа
Теперь внутри Alexa будут полноценные агентные LLM (Claude и Amazon Nova), которые смогут взаимодействовать с десятками тысяч интеграций Alexa. Кто не в курсе, там есть всё — от управления умным домом, до заказов еды и покупки билетов. Слухи о такой интеграции ходили давно, но заставить работать такое количество тулов в одном месте до них ещё никому не удавалось, поэтому времени ушло порядочно.
Это будет интегрировано с новой памятью, а-ля ChatGPT, где Alexa будет запоминать инфу вроде диетических предпочтений, фактов о вас и так далее. Помимо этого она всё ещё будет иметь доступ ко всем персональным данным к которым имела доступ старая Alexa, типа истории покупок. Для более удобного взаимодействия Amazon сделали новое мобильное приложение и добавили возможность взаимодействовать с Alexa через сайт.
Продвинутые фичи Alexa будут доступны всем подписчикам Amazon Prime в следующие несколько месяцев. Чисто теоретически существует ещё и отдельная подписка Alexa+, за $20 в месяц, но существует она явно чтобы больше людей подписалось на Prime, который стоит на 5 долларов дешевле.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
#новости
🫡 Игра через Grok
Пользователь X создал эту онлайн игру, используя только возможности Cursor и Grok 3!
Попробовать здесь
Пользователь X создал эту онлайн игру, используя только возможности Cursor и Grok 3!
Попробовать здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
#Собес
🤔 Какие случаи использования имеет API tf.data в TensorFlow?
API tf. data в TensorFlow используется для создания сложных конвейеров обработки данных. Он позволяет эффективно работать с большими объемами данных, поддерживает различные форматы и трансформации. Благодаря поддержке параллельной обработки и предвыборки данных, tf. data ускоряет обучение моделей и позволяет гибко управлять процессом.
👉 Новости 👉 Платформа
API tf. data в TensorFlow используется для создания сложных конвейеров обработки данных. Он позволяет эффективно работать с большими объемами данных, поддерживает различные форматы и трансформации. Благодаря поддержке параллельной обработки и предвыборки данных, tf. data ускоряет обучение моделей и позволяет гибко управлять процессом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2