NEW BOT Телеграм, страница

🌟

ИИ поможет Apple минимизировать углеродный след и позаботиться об экологии

⏩К 2030 году Apple планирует организовать полностью замкнутый цикл производства и стать одной из самых экологичных технологических компаний в мире — не в последнюю очередь из-за регуляторных требований в некоторых странах. В этом компании должны помочь передовые разработки в области искусственного интеллекта.

⏩

«Мы заметно продвинулись в этом направлении, и на пути к цели нам предстоит применить новаторские решения», — сказал глава Apple Тим Кук на «Китайском форуме развития 2024». По его словам, «искусственный интеллект предоставляет огромные возможности для компаний, стремящихся значительно снизить углеродный след, вплоть до нулевого». ИИ позволяет рассчитать индивидуальный углеродный след каждого человека, а также подобрать материалы и методы их переработки.

⏩

«Для создания лучших продуктов нам нужны партнёры, разделяющие приверженность новаторству и защите планеты», — похвалил Кук поставщиков в лице BYD, Lens Technology и Shenzhen Everwin Precision Technology.

⏩Apple уже много лет использует специальных роботов для разборки и переработки бывших в употреблении iPhone. По данным компании, один такой робот может разобрать 1,2 млн устройств год. Даже не оснащённые искусственным интеллектом роботы справляются с разборкой и переработкой устройств лучше людей, не говоря уж о возможности работать с опасными для здоровья материалами. Одним из достижений Apple на пути к полному отсутствию углеродного следа стал выход «углеродно-нейтральных» Apple Watch, да и последняя модель MacBook Air наполовину состоит из переработанного сырья.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

😁25👍13🤣4❤3🔥3🤨1

9.07K views18:01

Machinelearning

⚡️ LLocalSearch: completely locally running meta search engine using LLM Agents

Это полностью локально работающая система метапоиска, использующая LLM-агентов.

Пользователь может задать вопрос, и система будет использовать цепочку ИИ-агентов для поиска ответа. Пользователь может видеть прогресс работы и окончательный ответ. Ключи OpenAI или Google API не требуются.

▪Github

@ai_machinelearning_big_data

👍25🔥12❤2

8.95K views09:08

Machinelearning

🦖 DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video

👉 Институт Вейцмана только что выпустил код для новой SOTA для отслеживания объектов.

▪Github: https://github.com/AssafSinger94/dino-tracker
▪Project: https://dino-tracker.github.io/
▪Paper: https://arxiv.org/abs/2403.14548

@ai_machinelearning_big_data

👍12❤8🔥8

9.7K views17:03

Machinelearning

⚡️

Google наносит ответный удар по совместному проекту Microsoft и OpenAI

⏩Недавно Microsoft и OpenAI объявили о своем грандиозном совместном проекте стоимостью $100 млрд, цель которого - создание сверхмощного ИИ-суперкомпьютера и гигантского центра обработки данных для обучения суперумных моделей ИИ. Этот амбициозный план обещает совершить настоящий прорыв в области ИИ и укрепить позиции Microsoft и OpenAI как лидеров индустрии.

⏩Но в игру решил вступить Google DeepMind с довольно дерзким ходом: обесценить инвестиции конкурентов созданием открытой, распределённой по всему миру системы обучения сверхумных ИИ - DiPaCo (Distributed Path Composition).

⏩Суть DiPaCo заключается в распределенном обучении нейронных сетей, используя все доступные вычислительные ресурсы по всему миру. Эта технология позволит масштабировать нейронные сети до невероятных размеров без ограничений, присущих централизованным системам. Это как торрент в мире нейронок.

⏩Успех DiPaCo может не только поставить под сомнение эффективность многомиллиардных инвестиций Microsoft и OpenAI, но и изменить саму парадигму развития искусственного интеллекта. Этот проект способен демократизировать доступ к обучению сверхумных моделей и в целом разрушить монополию этих гигантов в области нейросетей, что может привести к стремительному прогрессу в области ИИ.

⏩Более того, DiPaCo может усложнить задачу правительствам (в особенности, США и Китаю), стремящимся контролировать развитие ИИ путем регулирования крупнейших центров обучения моделей. Распределенная природа DiPaCo делает такой контроль гораздо более сложным и менее эффективным.

⏩С тем, как это работает, можно ознакомиться в исследовании Google DeepMind. А посмотреть на исследование в картинках можно в посте ведущего автора проекта Артура Дуйяра.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍45🔥27❤5

12.5K views09:03

Machinelearning

🔥

Opera стал первым крупным браузером со встроенным доступом к локальным моделям искусственного интеллекта

⏩Opera Software представила функцию в Opera, позволяющую загружать и использовать большие языковые модели (LLM) локально на своих ПК. Опция доступна пользователям Opera One, которые получают обновления для разработчиков. В браузере можно воспользоваться более чем 150 моделями из 50 семейств, включая Llama от Meta, Gemma от Google, Vicuna, Mistral AI и другие.

⏩Opera Software указывает, что новые функции стали частью AI Feature Drops Program. Компания пообещала хранить данные пользователей локально на их устройствах, что позволит использовать генеративный ИИ без необходимости отправлять информацию на сервер и обеспечить конфиденциальность.

⏩Чтобы воспользоваться новыми функциями Opera, нужно обновить браузер до последней версии Opera Developer и активировать локальные LLM на своём устройстве. После этого модели заменят Aria, пока пользователь не начнёт общение с чат-ботом или не включит его снова.

📎

Подробнее

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥31👍13❤7

9.37K views16:07

Machinelearning

1:38

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Camera control for text-to-video.

CameraCtrl - модель, котороая обеспечивает точное управление положением камеры, что позволяет точно контролировать ракурсы и движения камеры при генерации виде.

▪Github: https://github.com/hehao13/CameraCtrl
▪Paper: http://arxiv.org/abs/2404.02101
▪Project: https://hehao13.github.io/projects-CameraCtrl/
▪Weights: https://huggingface.co/hehao13/CameraCtrl/tree/main

@ai_machinelearning_big_data

❤13👍6🔥6

9.08K views19:07

Machinelearning

🔥 RAG From Scratch🔥

RAG (Retrieval Augmented Generation) — метод работы с LLM, при котором пользователь пишет свой вопросы, а разработчик программно дополняет информацию из внешних источников и подает все целиком на вход языковой модели. Другими словами, в контекст запроса к языковой модели добавляется информация, на основе которой языковая модель может дать пользователю более полный и точный ответ.

Это огромный список материалов, который помогут вам лучше понять RAG с нуля, начиная с основ индексации, поиска и генерации. В плелисте короткие видео (5-10 минут) и блокноты с кодом.

📌 Rag с нуля.
▪Репозиторий:
https://github.com/langchain-ai/rag-from-scratch
▪Плейлист с видео:
https://youtube.com/playlist?list=PLfaIDFEXuae2LXbO1_PKyVJiQ23ZztA0x&feature=shared

📌 Как RAG может измениться с помощью LLMS с длинным контекстом.
▪Видео: https://youtube.com/watch?v=SsHUNfhF32s

📌Адаптивный Rag
▪Видео:
https://youtu.be/04ighIjMcAI
▪Код:
https://github.com/langchain-ai/langgraph/blob/main/examples/rag/langgraph_adaptive_rag_cohere .ipynb
▪Статья: https://arxiv.org/abs/2403.14403

📌 Проверки актуальности документов и возврата к поиску.
▪Видео:
https://youtube.com/watch?v=E2shqsYwxck
▪Код:
https://github.com/langchain-ai/langgraph/blob/main/examples/rag/langgraph_crag.ipynb
▪Статья: https://arxiv.org/pdf/2401.15884.pdf

📌 Исправление ошибок в RAG:
▪Код: https://github.com/langchain-ai/langgraph/blob/main/examples/rag/langgraph_self_rag.ipynb
Статья: https://arxiv.org/abs/2310.11511.pdf

📌Различные подходы для направления вопросов к нужному источнику данных:
▪Видео: https://youtu.be/pfpIndq7Fi8
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_10_and_11.ipynb

📌 Структурирование запросов
▪Видео: https://youtu.be/kl6NwWYxvbM
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_10_and_11.ipynb
▪Блог: https://blog.langchain.dev/query-construction/
2/ Глубокое погружение в graphDBs
: https://blog.langchain.dev/enhancing-rag-based-applications-accuracy-by-constructing-and-leveraging-knowledge-graphs/
3/ Структурирование запросов: https://python.langchain.com/docs/use_cases/query_analysis/techniques/structuring
4/ Самостоятельный поиск запросов: https://python.langchain.com/docs/modules/data_connection/retrievers/self_query

📌 Multi-Representation Indexing
▪Видео: https://youtu.be/gTCU9I6QqCE
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_12_to_14.ipynb
▪Статья: https://arxiv.org/pdf/2312.06648.pdf

📌 Группировка документов по схожести.
▪Видео: https://youtu.be/z_6EeA2LDSw
▪Код: https://github.com/langchain-ai/langchain/blob/master/cookbook/RAPTOR.ipynb
▪Статья: https://arxiv.org/pdf/2401.18059.pdf

📌 ColBERT
▪Видео: https://youtu.be/cN6S0Ehm7_8
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_12_to_14.ipynb
▪Статья: https://arxiv.org/abs/2004.12832

📌 Query Translation -- Multi Query
▪Видео: https://youtube.com/watch?v=JChPi0CRnDY
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_5_to_9.ipynb
▪Статья: https://arxiv.org/pdf/2305.14283.pdf

📌RAG Fusion
▪Видео: https://youtube.com/watch?v=77qELPbNgxA
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_5_to_9.ipynb
▪Код: https://github.com/Raudaschl/rag-fusion

📌 Query Translation -- Decomposition
▪Видео: https://youtube.com/watch?v=h0OPWlEOank
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_5_to_9.ipynb
▪Статьи: https://arxiv.org/pdf/2205.10625.pdf https://arxiv.org/pdf/2212.10509.pdf

📌 Query Translation -- Step Back
▪Видео: https://youtube.com/watch?v=xn1jEjRyJ2U
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_5_to_9.ipynb
▪Статья: https://arxiv.org/pdf/2310.06117.pdf

📌 Query Translation -- HyDE
▪Видео:
https://youtube.com/watch?v=SaDzIVkYqyY
▪Код: https://github.com/langchain-ai/rag-from-scratch/blob/main/rag_from_scratch_5_to_9.ipynb
▪Статья: https://arxiv.org/abs/2212.10496

@ai_machinelearning_big_data

🔥38👍13❤5🥰1

11.1K viewsedited 09:03

Machinelearning

🚀 Yandex Cloud запустил программу сертификации по облачным технологиям, соответствующую российским и международным стандартам. Экзамен на сертификат включает вопросы из 6 доменов: облачные технологии, хранение данных, DevOps, безсерверные вычисления, информационная безопасность и биллинг.

💼 Специалисты по облачным технологиям смогут подтвердить свои знания и получить преимущество при найме, а компании — проверить компетенции сотрудников.

🔍 Экзамен проводится онлайн и состоит из 65 вопросов. Для получения сертификата нужно ответить правильно на 70%. Процесс контролируется ИИ-прокторингом (чтобы все было честно и никто не списывал).

📅 Первый экзамен назначен на 11 апреля. Для подготовки можно пройти курс "Инженер облачных сервисов".

🌟 В дальнейшем Yandex Cloud планирует расширять линейку сертификаций для облачных профессий. У компании уже запущены обучающие программы по DevOps, информационной безопасности и другим специализациям.

👍10❤4🔥3

9.21K views13:04

Machinelearning

⚡️ Awesome CVPR 2024 Papers, Workshops, Challenges, and Tutorials!

На конференцию 2024 года по компьютерному зрению и распознаванию образов (CVPR) поступило 11 532 статей, из которых только 2 719 были приняты, что составляет около 23,6% от общего числа.

Ниже приведен список лучших докладов, гайдов, статей, семинаров и датасетов с CVPR 2024.

▪Github

@ai_machinelearning_big_data

👍14🔥7❤6

27K viewsedited 15:44

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 Open-Sora-Plan v1.0.0, which significantly enhances video generation quality and text control capabilities.

Open-Sora-Plan версии 1.0.0 - модель генерации, которая может генерировать 10-секундное видео с разрешением 1024 × 1024 со скоростью 24 кадра в секунду.

Кроме того, она способна генерировать изображения с высоким разрешением.

▪Github

@ai_machinelearning_big_data

🔥48👍8⚡3❤1

10.5K viewsedited 10:59

Machinelearning

0:51

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ MiniGPT4-Video: Advancing Multimodal LLMs for Video Understanding with Interleaved Visual-Textual Tokens

➡️ MiniGPT4-Video: новый мультимодальный LLM для понимания видео с помощью чередующихся визуально-текстовых токенов.

В MiniGPT4 учитывается не только визуальный контент, но и диалоги в видео, это позволяет модели эффективно отвечать на запросы, включающие как визуальные, так и текстовые компоненты.

Модель превосходит существующие современные модели, достигаяв 4,22%, 1,13%, 20,82% и 13,1% в тестах MSVD, MSRVTT, TGIF и TVQA соответственн

Во время логического вывода для создания субтитров к видео используется модель преобразования речи в текст - Whisper model. Затем и видео, и субтитры подаются на вход в модель MiniGPT4-Video с промптами, и модель выводит ответы на ваш запрос.

git clone https://github.com/Vision-CAIR/MiniGPT4-video.git

▪code: https://github.com/Vision-CAIR/MiniGPT4-video
▪page: https://vision-cair.github.io/MiniGPT4-video/
▪paper: https://arxiv.org/abs/2404.03413
▪jupyter: https://github.com/camenduru/MiniGPT4-video-jupyter

ai_machinelearning_big_data

👍17❤4🔥4🥰1

9.57K views10:02

Machinelearning

🦾 Made With ML: Learn how to combine machine learning with software engineering to design, develop, deploy and iterate on production-grade ML applications.

100% бесплатный курс , который поможет вам научиться писать код производственного уровня MLOps.

Курс научит вас всему, начиная с проектирования, моделирования, тестирования, работу с моделями обучения и многому другому бесплатно!

Более 35 тысяч звезд на Github

Узнайте, как проектировать, разрабатывать, развертывать и работать с ML приложеними производственного уровня.

▪Course
▪Overview
▪ Jupyter notebook

ai_machinelearning_big_data

❤21👍15🔥7👏2

16.5K viewsedited 18:26

Machinelearning

🏆 MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding

Большая мультимодальная модель с расширенной памятью для понимания контекста длинных видео.

Модель позволяет использовать длинный контекст за счет существенного сокращения использования памяти графического процессора.

Вместо того, чтобы пытаться обрабатывать больше кадров одновременно, как в большинстве существующих моделей, MA-LMM обрабатывает видео онлайн с сохранением прошлой информации в банк памяти.

Это позволяет модели ссылаться на прошлые события из видео для его анализа, не превышая ограничений по длине контекста LLM или объема памяти графического процессора.

Банк памяти может быть легко интегрирован в существующие мультимодальные LLM в готовом виде.

Обширные эксперименты по различным задачам понимания видео, таким как понимание длинного видео, ответы на вопросы по видео и создание субтитров, позволяют достичь самых современных результатов в различных бенчмарках.

▪proj: https://boheumd.github.io/MA-LMM/
▪repo: https://github.com/boheumd/MA-LMM
▪abs: https://arxiv.org/abs/2404.05726

@ai_machinelearning_big_data

👍17🔥6❤3

8.74K viewsedited 08:00

About

Blog

Apps

Platform