NEW BOT Телеграм, страница - 823985918

Data Science | Machinelearning [ru]

20.1K subscribers

682 photos

42 videos

29 files

3.56K links

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD

Download Telegram

About

Blog

Apps

Platform

Data Science | Machinelearning [ru]

20.1K subscribers

Data Science | Machinelearning [ru]

👩‍💻

Поиск наиболее часто встречающегося слова в тексте

Напишите функцию, которая принимает текстовую строку и возвращает наиболее часто встречающееся слово и количество его вхождений. Игнорируйте регистр и знаки препинания.

Пример:

text = "Python is great, and Python is fun! Learning Python is rewarding."
result = most_common_word(text)
print(result)
# Ожидаемый результат: ('python', 3)

Решение задачи🔽

import re
from collections import Counter

def most_common_word(text):
words = re.findall(r'\b\w+\b', text.lower())
counter = Counter(words)
return counter.most_common(1)[0]

# Пример использования:
text = "Python is great, and Python is fun! Learning Python is rewarding."
result = most_common_word(text)
print(result)

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9❤1

3.16K views14:07

Data Science | Machinelearning [ru]

🔥

Самые интересные статьи за последние дни:

• Смарт-функции в Алисе: как LLM помогает понять, чего хочет пользователь

• Сбер выкладывает GigaChat Lite в открытый доступ

• История YOLO – самой известной архитектуры компьютерного зрения

• Магия простоты: как мы улучшили отображение общественного транспорта на карте

• Обучение и fine-tuning моделей простым языком: зачем, как, где

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍3🐳1

3.07K views18:07

Data Science | Machinelearning [ru]

🎁

Динамическая адаптация награды с помощью Pydantic

Статья рассказывает, как Pydantic помогает бизнесу гибко управлять наградами для пользователей. Описаны преимущества Pydantic в валидации и преобразовании данных по сравнению с dataclass.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

3K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Классификация данных с использованием k-Nearest Neighbors (kNN)

Напишите функцию на Python, которая принимает обучающий набор данных, тестовый набор данных и значение 𝑘, а затем использует алгоритм k-ближайших соседей (kNN) для классификации тестовых данных. Функция должна возвращать предсказанные метки для тестового набора данных.

Пример:

import numpy as np

X_train = np.array([[1, 2], [2, 3], [3, 4], [5, 5]])
y_train = np.array([0, 0, 1, 1])
X_test = np.array([[2, 2], [4, 4]])

predictions = knn_classification(X_train, y_train, X_test, k=3)
print(predictions)  # Ожидаемый результат: [0, 1]

Решение задачи🔽

from sklearn.neighbors import KNeighborsClassifier

def knn_classification(X_train, y_train, X_test, k=3):
model = KNeighborsClassifier(n_neighbors=k)
model.fit(X_train, y_train)
return model.predict(X_test)

# Пример использования:
import numpy as np

X_train = np.array([[1, 2], [2, 3], [3, 4], [5, 5]])
y_train = np.array([0, 0, 1, 1])
X_test = np.array([[2, 2], [4, 4]])

predictions = knn_classification(X_train, y_train, X_test, k=3)
print(predictions) # Ожидаемый результат: [0, 1]

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2👎1🐳1

3.2K views14:07

Data Science | Machinelearning [ru]

🔎

Подборка вакансий для джунов

Data-analyst (junior)
🟢SQL, Python, Pandas, Matplotlib, Numpy, статистика
🟢Уровень дохода не указан | Без опыта

Power BI разработчик
🟢Power BI, Python, PostgreSQL, Apache Airflow, Git
🟢от 120 000 ₽ | Опыт работы: 1–3 года

Junior Data Analyst
🟢SQL, DataLens, Power BI, Python, ETL
🟢Уровень дохода не указан | Опыт работы: 1–3 года

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

3.25K views18:07

Data Science | Machinelearning [ru]

🛍

Искусственный интеллект в ритейле: как он предсказывает вашу следующую покупку в приложении

Разбираем Next Basket Recommendation (NBR) — метод предсказания товаров, которые пользователь добавит в корзину. Рассмотрим метрики оценки, частотные и нейросетевые подходы в онлайн-ритейле.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

2.97K views10:07

Data Science | Machinelearning [ru]

⚙️

Что такое functools.partial в Python и зачем он нужен?

functools.partial позволяет создавать новые функции на основе существующих, фиксируя некоторые аргументы. Это полезно для упрощения кода, повышения читаемости и работы с колбэками.

➡️

Пример:

from functools import partial

def power(base, exponent):
    return base ** exponent

square = partial(power, exponent=2)  # Фиксируем степень = 2
cube = partial(power, exponent=3)  # Фиксируем степень = 3

print(square(5))  # 25
print(cube(2))    # 8

🗣️ partial() фиксирует аргумент exponent, создавая новые функции square и cube. Теперь square(5) эквивалентно power(5, 2), но код чище.

🖥

Подробнее тут

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2👎1

3.24K views14:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для мидлов

Data Scientist
• Python, BI
• Уровень дохода не указан | 1–3 года

Data Engineer
• PostgreSQL, Apache Airflow, Greenplum, DWH, ETL
• Уровень дохода не указан | 3–6 лет

AI Data Analysis Specialist
• Python, NLP, Power BI, Анализ данных, BI, Визуализация, Tableau, Английский язык
• Уровень дохода не указан | 1–3 года

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1🔥1

2.79K views18:07

Data Science | Machinelearning [ru]

🔧 ТОП-10 опенсорсных инструментов для работы с ИИ в 2025 году

Детальный разбор 10 самых перспективных инструментов для работы с ИИ в 2025 году. От создания умных ассистентов до построения мощных RAG-систем — разбираем возможности, сравниваем производительность, безопасность и простоту интеграции каждого решения.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

3.05K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Парсинг и подсчёт количества слов в текстовом файле

Напишите функцию на Python, которая принимает путь к текстовому файлу и возвращает словарь с подсчётом количества уникальных слов. Слова должны сравниваться без учёта регистра, а знаки препинания должны быть удалены.

Пример:

# Содержимое файла example.txt:
# "Hello, world! This is a test. Hello again."

result = count_words_in_file("example.txt")
print(result)
# Ожидаемый результат:
# {'hello': 2, 'world': 1, 'this': 1, 'is': 1, 'a': 1, 'test': 1, 'again': 1}

Решение задачи🔽

import string
from collections import Counter

def count_words_in_file(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
text = f.read().lower()
text = text.translate(str.maketrans('', '', string.punctuation))
words = text.split()
return dict(Counter(words))

# Пример использования
result = count_words_in_file("example.txt")
print(result)

Please open Telegram to view this post

VIEW IN TELEGRAM

👎3❤2👍1🔥1🐳1

3.1K views18:07

Data Science | Machinelearning [ru]

🧠

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц

Как машинное обучение помогает управлять ускорителями частиц? В статье раскрываются примеры применения нейронных сетей, обучения с подкреплением и байесовской оптимизации для стабилизации и настройки пучков частиц.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4

3.07K views10:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для сеньоров

Data Engineer
• Python, CI/CD, Apache Spark, Apache Hadoop
• от 250 000 до 320 000 ₽ | от 2 лет опыта

Data Scientist (E-com)
• Python, SQL
• Уровень дохода не указан | от 1 года опыта

Data Scientist (middle)
• Python, SQL, A/B тестирование, Математическая статистика
• Уровень дохода не указан | от 1 года опыта

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

3K views14:07

Data Science | Machinelearning [ru]

📈

Подборка статей для вашей карьеры

• «Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно

• Из учителя в QA: мой путь в IT

• Рынок дата-инженеров и прогноз на 2025

• Как сделать резюме, которое дойдёт до работодателя. Фильтры ATS в 2025 году

• Ошибайся смело: жизненные уроки из мира machine learning

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

2.94K views18:07

Data Science | Machinelearning [ru]

🤔

Топология в нейросетях?

Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4

2.91K views10:07

Data Science | Machinelearning [ru]

⚙️

Что такое logging в Python?

logging — это встроенный модуль Python для создания логов, которые помогают отлаживать и мониторить работу приложений.

➡️

Пример:

import logging

# Настройка базового уровня логирования
logging.basicConfig(level=logging.INFO)

# Создание лога
logging.info("Приложение запущено")
logging.warning("Это предупреждение!")
logging.error("Произошла ошибка")

🗣️ В этом примере модуль logging создаёт сообщения разного уровня важности. Логирование позволяет отслеживать работу приложений и находить проблемы в коде.

🖥

Подробнее тут

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥1

3.15K views14:07

Data Science | Machinelearning [ru]

❓

Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии

Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🔥1🐳1

3.24K views18:07

Data Science | Machinelearning [ru]

👩‍💻

Линейная регрессия и её регуляризация в Scikit-learn

Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤3🔥1🐳1

3.39K views10:07

Data Science | Machinelearning [ru]

💡 Пиши код так, чтобы не пришлось его объяснять

Тебя уже дважды спрашивали, как работает твой код, а ты сам еле вспоминаешь?

👉 Совет: если код требует объяснения — значит, его можно улучшить. Улучши имена переменных, избавься от хитрых решений, добавь комментарии только там, где действительно нужно. Хороший код читается, как книга, а не как зашифрованное послание.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤2🐳1

3.21K views14:07

Data Science | Machinelearning [ru]

➡️

Что такое технология TTS, как устроена и каких сферах используется синтез речи

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🐳1

3.21K views18:07

Data Science | Machinelearning [ru]

📨

Пример использования программы для парсинга e-mail адресов с сайтов, созданный ИИ

Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

3.07K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Задачка по Python

Создайте Python-приложение, которое принимает путь к CSV-файлу с историческими данными о ценах акций (дата, цена закрытия) и предсказывает, будет ли цена акций расти или падать на следующий день, используя простую линейную регрессию. Программа должна выводить прогноз в консоль и сохранять модель в файл model.pkl.

➡️ Пример:

• python app.py predict_stock prices.csv — предсказывает изменение цены акций на следующий день.

Решение задачи ⬇️

import sys
import pandas as pd
from sklearn.linear_model import LinearRegression
import pickle

def predict_stock(file):
data = pd.read_csv(file)
X = data.index.values.reshape(-1, 1)
y = data['Close'].values

model = LinearRegression()
model.fit(X, y)

next_day = [[len(X)]]
prediction = model.predict(next_day)

with open('model.pkl', 'wb') as f:
pickle.dump(model, f)

print(f'Прогноз на следующий день: {"Рост" if prediction > y[-1] else "Падение"}')

if __name__ == "__main__":
if len(sys.argv) != 3 or sys.argv[1] != 'predict_stock':
print('Использование: python app.py predict_stock <файл.csv>')
else:
predict_stock(sys.argv[2])

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2

3.04K views14:07