🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
470 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ OpenAI недавно выпустили Canvas — мощнейший инструмент для кодинга прямо в ChatGPT и работы с текстами.

Основные фишки для кодинга:

— Моментально переносит код на другой язык программирования;
— Возможность улучшать, редактировать и фиксить полученный код в окне ответа;
— Код-ревью от алгоритма, исправление ошибок и комментирование.

При работе с текстом в Canvas можно:

— Регулировать стиль и сложность текста прямо на ходу;
— Проверять текста на ошибки, понятность и логическую последовательность;
— Редактировать длину текста без нового промта.

Платным подписчикам доступ уже открыт, а владельцы бесплатных аккаунтов смогут попробовать «холсты», когда закончится бета-тест.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👎87🦄3🎃2👍1🎉1
🏆 Data Feeling | AI
Уже 6 месяцев пользуюсь и активно подсаживаю людей на copilot-like расширения. 🧑‍💻 Мой любимчик - это Codeium для VS Code. 🤯 Я уже настолько преисполнился в его использовании, что умудряюсь с одного Tab’а писать по 45 строк кода. Или даже закрываю длинные…
Media is too big
VIEW IN TELEGRAM
Еще одна мощная штука для фанатов Jupyter Notebook

Codeium можно как расширение установить в среду и повысить эффективность работы в несколько раз.

🔛 Если накидайте бустов до 10-го уровня, то скину видео-пример, как автокомплитеть код для обучения catboost’а по фолдам для любой таблицы или train loop’а для текстового датасета при обучение transformer’ов.

👾 Как же я кайфую от того, что застал этот AI бум 🧠
Please open Telegram to view this post
VIEW IN TELEGRAM
35👍195🔥3🎃2🦄2
Пересмотрел доклад с прошедшего Practical ML Conf 2024 про сервис «Нейро» Яндекса.

Несколько ключевых вещей, на которые я обратил внимание в их решении:

Снижают дисперсию (разнообразие) текстов разметки за счет инструкций.
И фишка в том, что модель таким образом не учит второстепенную информацию (стиль асессора), а фокусируется на извлечении информации из инфо-контекста (нагугленных ссылок.)

Подбирают оптимальную архитектуру и находят баланс между количеством необходимых данных и необходимыми мощностями при запуске в продакшен

Взяли Encoder-Decoder полегче вместо более «жирного» Decoder’а - потому что у ED архитектуры каждый токен аккумулирует всю информацию из инфоконтеста, в том время как у D архитектуры матрица между токенами треугольная и информация теряется.

Добавлена метрика «подверженность» - чтоб максимально фокусировать и тюнить модель на извлечении информации вместо фантазерства (галлюцинаций).

Остальные доклады с конфы можно посмотреть здесь.
👍1811👎1
Получил сегодня вот такое пуш-уведомление про сервис Gtpaid.

Пишут, работает для приема иностранных платежей. Звучит интересно.

Сам еще сервис не пробовал, но думаю потестить. Напишите в комментах, если пользовались Gtpaid, как вам?
8
🖥 Идеальный фоторедактор, работающий прямо в браузере.

Online Image Tools превращает черно-белые фото в цветные, прокачивает их качество, удаляет фон и многое другое.

🎚️ Регистрация не нужна, ссылка вот.
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍13
🚀 GraphRAG теперь Open source!

GraphRAG от Microsoft использует большие языковые модели для создания подробных графов знаний из текстовых документов, помогая выполнять сложные запросы к данным.

Этот инструмент превосходит традиционный RAG, предлагая комплексный структурированный поиск информации.  

GraphRAG можно легко развернуть в Azure с помощью предоставленного ускорителя решений.

👨‍💻 Блог
🐙 GitHub
🎚️ @datafeeling
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥264
Федеративное машинное обучение: новый подход для безопасного сотрудничества в ИИ

Яндекс, ИСП РАН и Сеченовский Университет опробовали федеративное машинное обучение для задач медицины - технологию, которая позволяет организациям вместе обучать нейросети, не обмениваясь чувствительными данными.

Проект реализовал Центр технологий для общества Yandex Cloud, специалисты которого разрабатывают решения для образования, науки, культуры и здравоохранения.

Как это работает

Федеративный подход позволяет участникам коллективно обучать модели, никому не передавая свои данные. Модель обучается на каждом из датасетов участников проекта, а на центральный сервер передаются не сами датасеты, а результаты их обработки - к примеру, изменения в весах модели. Именно на них затем обучается глобальная модель.

С федеративного сервера на клиенты отправляются задания, которые включают в себя код модели и конфигурации. При этом не каждый пользователь может отправить такое задание, есть четкое разделение ролей. После создания задания проводится проверка на стороне сервера и на стороне клиентов. Те задания, которые прошли проверку, выполняются на клиентах. Далее запускается еще одна проверка на стороне клиентов - можно ли отправить обратно на сервер результат обучения. За счет таких многофакторных проверок обеспечивается безопасность данных.

Преимущества федеративного машинного обучения в том, что организации могут безопасно сотрудничать в проектах, связанных с чувствительной информацией. А в перспективе технология позволит создать более точные модели, используя данные от нескольких источников.
👍22😁41👎11
📚 AI контент лучше заходит, чем человеческий

Вышло исследование по 1,2 миллиона постов, из которого выяснили, что публикации с использованием нейросетей получают больше охватов, чем без нейронок. В среднем на несколько по всем соцсетям.

Дело скорее не в качестве, а в количестве и скорости. Чем больше постов — тем больше шансов зацепить аудиторию по алгоритмам. А также и регулярность получится соблюдать. Моему каналу с 3 постами, кхе-кхе, за месяц этого не понять.

Хотя работа алгоритмов подойдёт для твитера или инсты, но не применимо для Telegram, поскольку канал быстро может надоесть от однотипности и частоты.

Кто и как экспериментировал с AI в создании контента? Есть успехи?

🤖@datafeeling
🔥115🏆3👍2
🏆 Т-Банк запускает библиотеку Turbo Alignment для разработки ИИ-приложений

Т-Банк объявил о запуске бесплатной библиотеки инструментов Turbo Alignment для обучения больших языковых моделей (LLM), доступной для бизнеса. Впервые решение было представлено на форуме Finopolis 2024. Ожидается, что это поможет компаниям быстро создавать ИИ-продукты без необходимости разрабатывать их с нуля.

Преимущества Turbo Alignment:

- Комплексный подход: Доступ к языковой модели T-lite, оптимизированной для бизнес-задач на русском языке.
- Снижение затрат: Готовые инструменты уменьшают расходы на разработку и вычислительные ресурсы.
- Экономия времени: Ускорение разработки в 4 раза.
- Улучшение клиентского опыта: Более персонализированное взаимодействие с пользователями.

Библиотека также поддерживает небольшие команды, предлагая набор готовых инструментов и возможности для исследований. Turbo Alignment доступен на GitHub с подробной документацией.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🎉87👎3🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
💡 Лайфхак для тех, кто пишет научные работы: сервис вместо вас расставит все ссылки.

SciSpace с помощью ИИ и на основе открытых материалов сделает расстановку цитат внутри текста.

Инструмент поддерживает более 85 языков, включая русский.

Работает бесплатно, ссылка вот.

🎚️@datafeeling
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥28👍7
⚡️ В сеть попала информация, что #OpenAI может представить новую модель Orion уже в декабре — её производительность будет превосходить GPT-4 аж в 100 раз ‼️

Но, для широкой аудитории #Orion сразу не будет доступен — сначала доступ получат партнёры, которые будут создавать продукты на её основе 😎

Однако, Сэм Альтман отрицает скорый выход новой модели 😉

🎚️ @datafeeling
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12😁7👍5👎321