Генераторы — это функции в Python, которые возвращают значения по одному с помощью ключевого слова
yield, вместо полного возврата всех значений сразу. Они полезны для работы с большими объемами данных, так как сохраняют память, генерируя значения на лету.# Генератор для получения первых N чисел Фибоначчи
def fibonacci(n):
a, b = 0, 1
for _ in range(n):
yield a
a, b = b, a + b
# Используем генератор
for num in fibonacci(5):
print(num)
# Вывод: 0, 1, 1, 2, 3
🗣️ В этом примере генератор fibonacci вычисляет числа по запросу, вместо сохранения всех значений в памяти. Это делает генераторы особенно удобными для работы с потоками данных или бесконечными последовательностями.
Please open Telegram to view this post
VIEW IN TELEGRAM
Team Lead Data Scientist (кредитный скоринг)
• Python, SQL, Scikit-learn, Pandas, NumPy, XGBoost, LightGBM, Matplotlib, Seaborn, Plotly• Уровень дохода не указан | от 3 летВедущий аналитик
• Microsoft Excel, Pandas, Tableau, PowerBI, SQL, Python, NumPy, SQLAlchemy• от 100 000 ₽ | опыт не указанTeam Lead
• Java, Golang, Python, C++, .NET• Уровень дохода не указан | от 1,5 летQAA Lead в Сервис Транспорта
• Python, Linux, Git, Docker• Уровень дохода не указан | от 5 летPlease open Telegram to view this post
VIEW IN TELEGRAM
История о том, как за 6 лет я написал двухтомник, посвящённый искусственному интеллекту и машинному обучению.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Работаешь над багом или новым функционалом, но каждый раз стопоришься на чужом коде? Это не только твоя боль — многим сложно понять чужую логику.
Please open Telegram to view this post
VIEW IN TELEGRAM
Senior Data Engineer
Data Engineer AI (удаленно)
Senior Data Scientist
Junior Consultant / German AI consulting company
Please open Telegram to view this post
VIEW IN TELEGRAM
Статья предлагает подборку инструментов, платформ и шаблонов для работы с языковыми моделями и создания ИИ-ассистентов. Рассматриваются протестированные в МТС решения, упрощающие разработку и интеграцию.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Напишите функцию, которая принимает
pandas.DataFrame и нормализует все числовые столбцы в диапазон от 0 до 1.Пример:
import pandas as pd
data = pd.DataFrame({
'feature1': [10, 20, 30, 40],
'feature2': [1, 2, 3, 4],
'feature3': ['A', 'B', 'C', 'D'] # Не числовой столбец
})
result = normalize_dataframe(data)
print(result)
# Ожидаемый результат:
# feature1 feature2 feature3
# 0 0.0 0.0 A
# 1 0.333 0.333 B
# 2 0.667 0.667 C
# 3 1.0 1.0 D
Решение задачи
import pandas as pd
def normalize_dataframe(df):
df_normalized = df.copy()
for col in df.select_dtypes(include='number').columns:
min_val = df[col].min()
max_val = df[col].max()
df_normalized[col] = (df[col] - min_val) / (max_val - min_val)
return df_normalized
# Пример использования:
data = pd.DataFrame({
'feature1': [10, 20, 30, 40],
'feature2': [1, 2, 3, 4],
'feature3': ['A', 'B', 'C', 'D']
})
result = normalize_dataframe(data)
print(result)
Please open Telegram to view this post
VIEW IN TELEGRAM
• Реализация подобия Apple Vision Pro
• Почему LLM так плохо играют в шахматы (и что с этим делать)
• LLM будут врать вечно
• Как мы создали LLM-модель Cotype Nano
• Человек и LLM: как построить метрики для оценки моделей
Please open Telegram to view this post
VIEW IN TELEGRAM
В этой статье я рассказываю про основные концепции, типы обучения, типы задач в машинном обучении и также делаю постановку задачи машинного обучения (МО). Все это я рассказываю в своем стиле и понимании.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Напишите функцию, которая принимает список положительных чисел и возвращает число с наибольшей суммой цифр. Если таких чисел несколько, вернуть первое из них.
Пример:
numbers = [123, 456, 789, 234]
result = max_digit_sum(numbers)
print(result)
# Ожидаемый результат: 789 (7+8+9=24, это максимальная сумма)
Решение задачи
def max_digit_sum(numbers):
def digit_sum(n):
return sum(int(digit) for digit in str(n))
return max(numbers, key=digit_sum)
# Пример использования:
numbers = [123, 456, 789, 234]
result = max_digit_sum(numbers)
print(result) # Ожидаемый результат: 789
Please open Telegram to view this post
VIEW IN TELEGRAM
Junior Data Analyst
Junior AI Engineer
Python developer Junior+/Middle
Junior Data Analyst
Please open Telegram to view this post
VIEW IN TELEGRAM
Статья объясняет различия между физически обоснованными моделями и моделями, основанными на данных, с примерами задач машинного обучения. Рассматривается подход к обработке данных, выбору моделей и их обучению.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
collections в Python и как он используется?collections — это стандартный модуль Python, который предоставляет высокопроизводительные контейнеры данных, такие как Counter, deque, и defaultdict. Он используется для более удобной работы со структурами данных.from collections import Counter
data = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
counter = Counter(data)
print(counter) # Counter({'apple': 3, 'banana': 2, 'orange': 1})
🗣️ В этом примере Counter подсчитывает количество каждого элемента в списке data. Это полезно для анализа данных, работы с частотами или подсчёта элементов в коллекциях.
Please open Telegram to view this post
VIEW IN TELEGRAM
DevOps-инженер в Data Platform (Big Data)
• Linux, Kubernetes, CI/CD• Уровень дохода не указан | от 3 летData Analyst
• Python, Apache Spark, SQL, Apache Hadoop• Уровень дохода не указан | от 2 летML-инженер
• Python, TensorFlow, PyTorch, Keras• Уровень дохода не указан | от 1 годаMiddle Python Developer [Bridge]
• Python, REST, Apache Kafka, RabbitMQ, Asyncio, AIOHTTP, ООП• Уровень дохода не указан | от 1 годаPlease open Telegram to view this post
VIEW IN TELEGRAM
В этой статье я рассказываю про линейную регрессию, свойства, которыми должны обладать данные для модели, процесс обучения, регуляризацию, метрики качества. Кроме чистой теории я показываю как это все реализовать. Я рассказываю все в своем стиле и понимании - с инженерной точки зрения, с точки зрения того, как реализовывать с нуля.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Напишите функцию, которая принимает
pandas.DataFrame и возвращает два столбца с наибольшей корреляцией.Пример:
import pandas as pd
data = pd.DataFrame({
"A": [1, 2, 3, 4],
"B": [2, 4, 6, 8],
"C": [5, 3, 6, 2],
"D": [10, 20, 30, 40]
})
result = find_highest_correlation(data)
print(result)
# Ожидаемый результат: ('B', 'D')
Решение задачи
import pandas as pd
def find_highest_correlation(df):
corr_matrix = df.corr()
max_corr = 0
columns = (None, None)
for col1 in corr_matrix.columns:
for col2 in corr_matrix.columns:
if col1 != col2 and corr_matrix[col1][col2] > max_corr:
max_corr = corr_matrix[col1][col2]
columns = (col1, col2)
return columns
# Пример использования:
data = pd.DataFrame({
"A": [1, 2, 3, 4],
"B": [2, 4, 6, 8],
"C": [5, 3, 6, 2],
"D": [10, 20, 30, 40]
})
result = find_highest_correlation(data)
print(result)
Please open Telegram to view this post
VIEW IN TELEGRAM
Статья рассказывает о новой AI-модели DeepSeek-R1-Lite, созданной для логических рассуждений. Рассматриваются её возможности, тестирование и перспективы применения в задачах анализа и вычислений.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Этот пост предназначен для абсолютных новичков и предполагает НУЛЕВЫЕ предварительные знания машинного обучения. Мы разберемся, как работают нейронные сети, и реализуем одну из них с нуля на Python.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Аналитик данных / Data Analyst
• SQL (Clickhouse, Postgres, MS SQL), Python, статистика, A/B тестирование, Jupyter Notebook, GIT, BI-системы (Datalens, Superset), ML-подходы• от 300 000 до 400 000 ₽ | от 3 летSenior Data Scientist (Recsys)
• Python, PyTorch, машинное обучение, глубокое обучение, свёрточные нейросети, трансформеры• Уровень дохода не указан | Требуемый опыт не указанЭксперт по безопасности инфраструктуры Big Data
• Hadoop, Clickhouse, Kafka, Airflow, Zeppelin, Apache Ranger, IDM, k8s, деперсонализация данных, обфускация• Уровень дохода не указан | Требуемый опыт не указанSenior Python developer (Evolution Openstack)
• Python 3.10, PostgreSQL, SQLAlchemy, Linux, OpenStack, KVM, Ansible, RabbitMQ, Docker, Kubernetes• Уровень дохода не указан | от 3 летPlease open Telegram to view this post
VIEW IN TELEGRAM
• Как продакт-менеджеру учить английский: план, сроки, советы
• Иллюзия прогресса: почему мне не удалось дать студентам-айтишникам реальный опыт
• Interview copilots: как кандидаты используют ChatGPT на интервью
• Моя история входа в IT: как я ломал стены своих ограничений
• Как мы разработали систему грейдинга для системных аналитиков
Please open Telegram to view this post
VIEW IN TELEGRAM
Статья описывает разработку «умного» помощника для клиентской поддержки интернет-магазина. Рассматриваются проблемы, с которыми сталкивался клиент, и пути их решения с помощью ИИ.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM