Машинное обучение RU – Telegram
Машинное обучение RU
17.7K subscribers
1.58K photos
209 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь вы можете запускать популярные LLM HF Space локально.

Для работы не требуется GPU, только обычные процессоры

https://github.com/neuralmagic/examples/tree/main/demos/sparse-mpt-7b-gsm8k

@machinelearning_ru
👍8🔥42
🚀Если вам интересно узнать, как люди создают искусство с помощью AI, то этот курс для вас.

В нем, вы познакомитесь со стабильной диффузией на практике.

Вы узнаете, как обучить свою модель работать в определенном художественном стиле.

📌 Курс

@machinelearning_ru
👍52🥰1
Идеальная шпаргалка для промпт-инжиниринга
👍12🔥32👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Personal Copilot: Train Your Own Coding Assistant.

В постоянно развивающейся сфере программирования и разработки программного обеспечения стремление к эффективности и производительности привело к появлению замечательных инноваций.
Одной из таких инноваций является появление моделей генерации кода, таких как Codex, StarCoder и Code Llama. Эти модели продемонстрировали широкие возможности по генерации рабочих скриптов, тем самым показав огромный потенциал в качестве помощников кодера.

Однако, несмотря на то, что эти предварительно обученные модели могут демонстрировать впечатляющие результаты при выполнении целого ряда задач, за горизонтом маячит интересная возможность: возможность адаптировать модель генерации кода к вашим конкретным потребностям. Подумайте о персонализированных помощниках кодинга, которые можно было бы использовать в масштабах предприятия.

В этой статье показано пошаговое создание HugCoder 🤗, кодовый LLM, обученной из публичных репозиториев huggingface GitHub.
В статье показан процесс сбора данных, экспериментах по обучению и некоторых интересных результатах. Это позволит вам создать свой личный Copilot на основе собственной кодовой базы.

@machinelearning_ru
👍72
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Популярные алгоритмы машинного обучения наглядно

@machinelearning_ru
👍103🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🦠 Google DeepMind AI только что представила значительное обновление AlphaFold, которое должно произвести революцию в разработке лекарств в будущем.

Теперь ИИ может предсказывать структуру не только белков, но и различных молекул.

Исследователи ожидают, что модернизация AlphaFold может вывести на новый уровень исследования заболеваний, разработку лекарств, синтетическую биологию и многое другое.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
13🔥6👍3
🖥 Теперь вы можете безопасно хранить свои закрытые ключи, такие как huggingface или kaggle API-токены, в Colab!

Ключи, хранящиеся в Secrets, являются скрытыми и видны только вам и выбранным вами блокнотам.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍131🔥1
💊 Определение диабета при помощи машинного обучения в 60 строк кода.

📌 Видео
📌 Код

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥31🤬1
🚀 Курс из 12 уроков, обучающий всему, что необходимо знать для создания приложений генеративного ИИ.

Полностью бесплатный и находится на GitHub:

https://github.com/microsoft/generative-ai-for-beginners

@machinelearning_ru
👍102🔥1
Представляем DeepSpeed-FastGen 🚀

Обслуживание LLM и генеративных моделей ИИ с
- 2,3-кратное увеличение пропускной способности
- В 2 раза меньшая средняя задержка

Автоматическое TP, балансировка нагрузки с линейным масштабированием, а также простой в использовании API.

https://github.com/microsoft/DeepSpeed/tree/master/blogs/deepspeed-fastgen

@machinelearning_ru
👍5🔥21
🚀 Реализация MetNet-3, нейронной модели погоды SOTA из Google Deepmind, в #Pytorch

https://github.com/lucidrains/metnet3-pytorch

#machinelearning #ml #ai #neuralnetworks #datascience #deeplearning

@machinelearning_ru
👍4🔥21
Forwarded from Machinelearning
This media is not supported in the widget
VIEW IN TELEGRAM
5👍1🔥1
👉 Awesome Data Labeling

Коллекция инструментов для аннотирования изображений, аннотирования видео, семантической сегментации и маркировки данных для машинного обучения.

🔗 https://github.com/HumanSignal/awesome-data-labeling

@machinelearning_ru
👍72
📌 Существует три основных способа обучения LLM: естественный язык, классификация предложений и классификация лексем.

👉 Приведенная картинка дает представление о каждом из них!

#llms #largelanguagemodel #generativeai

@machinelearning_ru
👍51🔥1
🔥 ИИ-агент, использующий GPT-4V(ision), способный использовать, cv, мышь/клавиатуру для взаимодействия с веб-интерфейсом.

GPT-4V-ACT:
https://github.com/ddupont808/GPT-4V-Act
GPT-V-on-Web: https://github.com/Jiayi-Pan/GPT-V-on-Web
vimGPT: https://github.com/ishan0102/vimGPT

@machinelearning_ru
👍91🔥1
Глубокое погружение в режим Copy-on-Write в pandas. Часть 2

Мы используем технику, применяемую внутренними средствами pandas, чтобы избежать копирования всего DataFrame, когда в этом нет необходимости, и тем самым повысить производительность.

Удаление защитных копий
Начнем с наиболее значимого улучшения. Многие методы pandas выполняли защитное копирование, чтобы избежать побочных эффектов и защититься от последующих модификаций в памяти.

df = pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
df2 = df.reset_index()
df2.iloc[0, 0] = 100


В reset_index нет необходимости копировать данные, но возврат представления привел бы к побочным эффектам при модификации результата (к примеру, также обновился бы df). Поэтому в reset_index выполняется защитное копирование.

При включении Copy-on-Write всех этих защитных копий уже нет. Такое действие затрагивает многие методы (с полным списком можно ознакомиться здесь).

Кроме того, при выборе столбцового подмножества DataFrame теперь всегда будет возвращаться представление, а не копия, как раньше.

Посмотрим, как все это выглядит с точки зрения производительности, когда мы комбинируем некоторые из этих методов:

import pandas as pd
import numpy as np

N = 2_000_000
int_df = pd.DataFrame(
np.random.randint(1, 100, (N, 10)),
columns=[f"col_{i}" for i in range(10)],
)
float_df = pd.DataFrame(
np.random.random((N, 10)),
columns=[f"col_{i}" for i in range(10, 20)],
)
str_df = pd.DataFrame(
"a",
index=range(N),
columns=[f"col_{i}" for i in range(20, 30)],
)

df = pd.concat([int_df, float_df, str_df], axis=1)

Создается DataFrame с 30 столбцами, 3 разными типами данных и 2 миллионами строк. Выполним следующую цепочку методов для этого DataFrame:

Смотреть
Часть 1.

@machinelearning_ru
👍41🔥1
👉 Awesome TensorFlow

Список awesome учебников по TensorFlow, моделей/проектов, библиотек, инструментов/утилит, видео, докладов, статей, сообществ, книг и многого другого.

🔗 https://github.com/jtoy/awesome-tensorflow

@machinelearning_ru
8👍3🔥2😁1