Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
🤔 В чём различия между Data Science, машинным обучением, ИИ, глубоким обучением и Data Mining

Эта статья поможет вам не только понять, какие исследования и опыт позволяют извлекать знания из данных, чтобы делать машины умнее, но и как конкретно это происходит.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 42 секунды и 5 запросов: как взламывают генеративные ИИ-модели

Ты знал, что злоумышленникам для взлома генеративных ИИ достаточно всего 42 секунды и пяти запросов? В этой статье мы разберем, как это происходит, какие уязвимости существуют и как защитить свои системы от подобных атак.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🎓 5 задач для подготовки к собеседованию по Python

Используем алгоритмы Манакера и заметающей прямой, определяем границы окна с k-элементами, вычисляем площадь участков разного цвета и находим наибольшую увеличивающуюся подпоследовательность.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ 6 основных алгоритмов машинного обучения: руководство для начинающих

В этой статье мы расскажем о шести основных алгоритмах машинного обучения и их практическом применении в различных отраслях.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔈 От звука к смыслу: распознавание речи в видеоконтенте

В данной статье мы рассмотрим проект по распознаванию речи из видео, преимущества и недостатки данной разработки, а также посмотрим на то, как ее внедрение помогло ускорить работу аналитиков и разработчиков на проекте.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ Построим GPT: с нуля и шаг за шагом

В этой статье я построил GPT архитектуру на данных из произведений Шекспира и получил достаточно впечатляющие результаты.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Транскрибируем аудио и создаём субтитры для видео с помощью Whisper, FFmpeg и Python

В этом пошаговом гайде вы узнаете, как быстро автоматизировать процесс транскрибации и добавления субтитров к видео за считанные минуты.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Как Лента формирует эффективный ассортимент на основе данных

В этой статье расскажу про путь к управлению ассортиментом на основе данных и наш флагман – приложение Deli – рабочее место, в котором менеджер анализирует матрицу своих категорий и вносит в нее изменения на основе рекомендаций алгоритма.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
😎 Искусство аугментации: как улучшить модели компьютерного зрения без сбора новых данных

В статье рассказывается о методе аугментации данных для улучшения работы моделей компьютерного зрения. Вы узнаете, как с помощью этого метода увеличить количество данных, повысить точность модели и избежать типичных ошибок.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ AILink для Wolfram и плагины для ChatGPT

Статья расскажет, как с помощью Wolfram Language создать ассистента на базе OpenAI API и добавить плагины. Также рассматривается удобство работы в интерактивном блокноте и обход региональных блокировок OpenAI. (197 символов)

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
➡️ Как мы перенесли распознавание на базе ИИ в веб и изменили веб-банкинг? В Markswebb оценили

Статья расскажет о ежегодном рейтинге лучших веб-версий банковских приложений 2024 года от Markswebb. Лидеры рейтинга использовали ИИ-решения Smart Engines для улучшения клиентского опыта и достижения рекордов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Метрологический дефицит в бигдате: что это такое и как с ним бороться

Статья объяснит, почему данные, используемые в ИИ и машинном обучении, часто искажаются преобразованиями. Обсудим измерительные приборы, их влияние на производственные процессы и важность понимания этого эффекта.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🛠 4 полезных инструмента для работы с ИИ: RAGFlow, The Pipe, UFO и SWE-agent

В этой статье мы рассмотрим 4 ИИ-инструмента, которые расширяют возможности разработчика: от платформ для работы с документами до агентов, способных исправлять ошибки в коде.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🧩 Реализация паттерна «Одиночка» на Python

Мечтаешь о коде, который работает как швейцарские часы? Паттерн «Одиночка» может стать тем самым механизмом, который заставит все шестеренки крутиться идеально.

Читать...
👀 Анализ тональности текста: зачем он нужен и как его использовать? Объясняем за 7 минут

Как компании выявляют эмоции в тысячах отзывов и комментариев? Почему одни маркетинговые кампании становятся невероятным успехом, а другие — провалом? Сегодня мы подробно разберем, как анализ тональности работает в реальных кейсах, и покажем, как вы можете внедрить его для достижения своих бизнес-целей.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️ От Павлова до ChatGPT: как LLM перевернули наше понимание мышления

В этой статье мы отправимся в захватывающее путешествие от классических теорий Павлова до передовых разработок в области ИИ. Мы раскроем тайны человеческого мышления, узнаем, как работают современные языковые модели, и поразмышляем о том, сможет ли искусственный интеллект когда-нибудь по-настоящему "понимать" нас.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 LLaMator: Red Teaming фреймворк для тестирования уязвимостей LLM

В статье команда LLaMaстеры (студенты ИТМО AI Talent Hub) расскажет о создании LLaMator — фреймворка для тестирования уязвимостей интеллектуальных систем на базе больших языковых моделей, который победил на AI Product Hack.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🌞 Автоэнкодеры простыми словами

Автоэнкодеры являются базовой техникой машинного обучения и искусственного интеллекта, на основе которой строятся более сложные модели, например, в диффузионных моделях, таких как Stable Diffusion. Что же такое автоэнкодер?

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
↗️ Как я с помощью нейросетей обогнала инфляцию

В статье рассказывается, как использовать нейросети для оптимизации работы, если ваш доход в рублях, а расходы — в валюте. Спойлер: полное делегирование задач ИИ — миф, но с его помощью можно значительно упростить рутину и повысить продуктивность. Поделены реальные кейсы из жизни автора.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👩‍💻 Задачка по Python

Создайте Python-приложение, которое принимает путь к CSV-файлу с историческими данными о ценах акций (дата, цена закрытия) и предсказывает, будет ли цена акций расти или падать на следующий день, используя простую линейную регрессию. Программа должна выводить прогноз в консоль и сохранять модель в файл model.pkl.

➡️ Пример:

python app.py predict_stock prices.csv — предсказывает изменение цены акций на следующий день.

Решение задачи ⬇️

import sys
import pandas as pd
from sklearn.linear_model import LinearRegression
import pickle

def predict_stock(file):
data = pd.read_csv(file)
X = data.index.values.reshape(-1, 1)
y = data['Close'].values

model = LinearRegression()
model.fit(X, y)

next_day = [[len(X)]]
prediction = model.predict(next_day)

with open('model.pkl', 'wb') as f:
pickle.dump(model, f)

print(f'Прогноз на следующий день: {"Рост" if prediction > y[-1] else "Падение"}')

if __name__ == "__main__":
if len(sys.argv) != 3 or sys.argv[1] != 'predict_stock':
print('Использование: python
app.py predict_stock <файл.csv>')
else:
predict_stock(sys.argv[2])
Please open Telegram to view this post
VIEW IN TELEGRAM
🔎 Подборка вакансий для джунов

Junior Data Engineer
🟢Python (Pandas), SQL (Snowflake, Redshift), Git, CI/CD, Jenkins
🟢Уровень дохода не указан | 1–3 года

Junior Full Stack Analyst
🟢Jira, Confluence
🟢Уровень дохода не указан | Без опыта

Data Engineer/Стажер-разработчик DWH/ETL/Big Data
🟢DWH, Data Lake, ETL, SQL
🟢Уровень дохода не указан | Без опыта

Младший специалист отдела разработки (Python) / Специалист по парсингу данных
🟢Python 3, Django/Celery, PostgreSQL, HTML
🟢Уровень дохода не указан | 1–3 года

Junior AI Developer
🟢Python 3, LLM, ChatGPT
🟢от 50 000 до 80 000 ₽ | Без опыта
Please open Telegram to view this post
VIEW IN TELEGRAM