محاضرات_أساسيات_علم_البيانات_مُترجم.zip
15.6 MB
━━━━━━━━━━━━━━━━━━━━━━━
جميع محاضرات الدكتوره منى مترررجمة موجوده بملف واحد👍
━━━━━━━━━━━━━━━━━━━━━━━
📚 المادة: #أساسيات_علم_البيانات
📂 النوع: #مرجع
📅 عام النشر: #عام_2025
━━━━━━━━━━━━━━━━━━━━━━━
كتب اللهُ أجرَ زمِيْلتَكُم...... على المشاركة.... 🌹
جميع محاضرات الدكتوره منى مترررجمة موجوده بملف واحد👍
━━━━━━━━━━━━━━━━━━━━━━━
📚 المادة: #أساسيات_علم_البيانات
📂 النوع: #مرجع
📅 عام النشر: #عام_2025
━━━━━━━━━━━━━━━━━━━━━━━
كتب اللهُ أجرَ زمِيْلتَكُم...... على المشاركة.... 🌹
❤6
إطمَئِن........ ❤️
الفشل ليس نهاية الطريق، بل هو جزء منه.
كل تجربة لم تنجح هي درس يضيف لك وعيًا لم يكن لديك من قبل.
لا أحد يصل فجأة؛ خلف كل نجاح محاولات متعثرة، وقرارات خاطئة، وتجارب مؤلمة صقلت العقل قبل أن ترفع النتيجة.
قد تفشل في دراسة، أو عمل... لكنك في الحقيقة تتعلّم كيف تختار بشكل أفضل في المرة القادمة.
لا تتوقف💪، غيّر أسلوبك إن لزم، غيّر محيطك، أعد ترتيب أهدافك، وواصل السير.
القوة ليست في العناد، بل في المرونة، ومن يفهم هذا يصل.
فثق أن القادم أجمل ما دمت تتقدم.
الفشل ليس نهاية الطريق، بل هو جزء منه.
كل تجربة لم تنجح هي درس يضيف لك وعيًا لم يكن لديك من قبل.
لا أحد يصل فجأة؛ خلف كل نجاح محاولات متعثرة، وقرارات خاطئة، وتجارب مؤلمة صقلت العقل قبل أن ترفع النتيجة.
قد تفشل في دراسة، أو عمل... لكنك في الحقيقة تتعلّم كيف تختار بشكل أفضل في المرة القادمة.
لا تتوقف💪، غيّر أسلوبك إن لزم، غيّر محيطك، أعد ترتيب أهدافك، وواصل السير.
القوة ليست في العناد، بل في المرونة، ومن يفهم هذا يصل.
فثق أن القادم أجمل ما دمت تتقدم.
❤4👍3🔥1
DS.pdf
215.7 KB
🚨هااااااااااااااااااااااااااام🚨
🔻توزيع الاختبارات للطلاب المختبرين يوم السبت.
🔻على الجميع الالتزام بمقاعدهم واماكنهم المحددة ووقتهم المحدد.
#ملتقى_الطالب_الجامعي_كلية_الحاسوب.
#نحن_في_خدمتكم🌹
🔻توزيع الاختبارات للطلاب المختبرين يوم السبت.
🔻على الجميع الالتزام بمقاعدهم واماكنهم المحددة ووقتهم المحدد.
#ملتقى_الطالب_الجامعي_كلية_الحاسوب.
#نحن_في_خدمتكم🌹
❤2
🔰اللجنة العلمية DS مستوى اول 🔰
💢الإختبار القادم💢 💻 أساسيات علم بيانات 📆 السبت 14 فبراير 2026 🕒 الفترة الخامسة (4:00_5:30) 📘 المقررات المطلوبة: 🔻 جميع ما أُخذ من محاضرات، وعددهم 10 بس لان وحده اختبرنا فيها والثانية ماعاد عوضناها. ونركز اكثر شي على الدوال صياغتها وعملها. 🔻قسم المادة، بتلاقوا…
⭕️ بالنسبة لأسئلة الاكواد ⭕️
بتجيب اكواد واحنا نختار الأصح من الاختيارات حسب عمل الكود والداله الموجوده بالكود نفسه، يعني نذاكر كل شي ونركز ع الدوال وعملهن اكثر.
والاختبار بيجي نفس صياغه النصفي وبسيط للفاهم.
هذا على ما سألتها، والله يعدي الاختبار ع خير.🌚✨
❤4🫡1
والله يامادة أنتي بنفسك لو تقري الكلام الي بتقوليه هذا ماتفهمي حاجة...
الخلاصة الذي معه ملخص او فاهم يلخص حتى نقاط ينفع غيرة ولو حتى Ai
يرسل للبوت او المندوب
#الله_يعيننا_على_هذة_المادة
الخلاصة الذي معه ملخص او فاهم يلخص حتى نقاط ينفع غيرة ولو حتى Ai
يرسل للبوت او المندوب
#الله_يعيننا_على_هذة_المادة
🫡4👍2🔥2❤1
سِرْ غداً واثقًا، واجعلْ طموحَكَ قائدًا
فبالعزيمةِ كلُّ مستحيلٍ يُوجَدُ
اجعلْ من الأرقامِ فكرًا نابضًا
فبها تُضاءُ الحقُّ حين تُرصَدُ
واقرأْ بياناتِ الزمانِ بتأنٍّ
فالسرُّ في تحليلِها يُستَقصَدُ
واربطْ معادلةَ العقلِ بالمنطقِ الهادي
فالعلمُ حين يُفهمُ يُعتَمَدُ
لا تيأسنَّ إن طالَ دربُ تعلُّمٍ
فالعلمُ بحرٌ صعبُهُ يُرتقى غدُ
ازرعْ جهدَ اليومِ معرفةً صادقةً
تحصدْ غدًا مجدًا… وعلمًا يُخلَّدُ
فبالعزيمةِ كلُّ مستحيلٍ يُوجَدُ
اجعلْ من الأرقامِ فكرًا نابضًا
فبها تُضاءُ الحقُّ حين تُرصَدُ
واقرأْ بياناتِ الزمانِ بتأنٍّ
فالسرُّ في تحليلِها يُستَقصَدُ
واربطْ معادلةَ العقلِ بالمنطقِ الهادي
فالعلمُ حين يُفهمُ يُعتَمَدُ
لا تيأسنَّ إن طالَ دربُ تعلُّمٍ
فالعلمُ بحرٌ صعبُهُ يُرتقى غدُ
ازرعْ جهدَ اليومِ معرفةً صادقةً
تحصدْ غدًا مجدًا… وعلمًا يُخلَّدُ
❤4🔥1
ملخصات أساسيات علم البيانات
م.محمد الشذني
م.محمد الشذني
❤7🥰1
اختبار_شامل_تجريبي_ل_اساسيات_علم_البيانات.html
41.2 KB
150 سؤال أساسيات علم البيانات
دعواتكم للجميع
وانا والبشمهندس:رامي اليعري 🌚
دعواتكم للجميع
وانا والبشمهندس:رامي اليعري 🌚
❤1🥰1🫡1
💢💢ملخص للدوال وأهم المفاهيم💢💢
1. Basic Python & Data Type Functions
print()
Used to display outputs and check variable values.
Type Conversion
int(), float(), str(), bool()
Used to define or convert the data type of a variable.
type()
Identifies the data type of a given value (Integer, Float, String, Boolean).
2. Exploratory & Distribution Functions
head()
Displays the first rows of a dataset for quick inspection.
unique()
Returns all distinct values in a categorical column.
nunique()
Counts the number of unique values in a column.
value_counts()
Counts the frequency of each unique value in a categorical variable.
3. Aggregation Functions
These functions operate on a column and return a single aggregated value.
sum()
Calculates the total of numeric values.
mean()
Computes the arithmetic average.
median()
Returns the middle value (50th percentile).
max() and min()
Identify the largest and smallest values (used to compute range).
count()
Counts non-missing (non-null) values.
std()
Computes the standard deviation, measuring data spread.
mode()
Returns the most frequent value (commonly used for categorical data).
var()
Calculates variance.
4. Data Processing & Transformation
groupby()
Splits the DataFrame into groups based on one or more columns.
It does not produce output by itself and must be followed by an aggregation function.
aggregate() / agg()
Applies multiple aggregation functions at once (e.g., min, max, mean).
map()
Used in feature engineering to transform or reclassify values.
abs()
Returns absolute values, useful when calculating measures like Mean Absolute Deviation (MAD).
5. Relationship & Statistical Functions
cov()
Calculates covariance to determine the direction of a relationship between two variables.
corr()
Calculates correlation by normalizing covariance, producing values between -1 and +1 to represent relationship strength and direction.
6. Visualization Functions
Used to visually analyze data distributions and relationships.
plot.pie()
Visualizes categorical distributions as pie charts.
plot.bar()
Displays categorical frequencies using bar charts.
plot.line()
Shows trends over continuous or ordered numeric data.
plot.scatter()
Visualizes relationships between two numeric variables.
Connections Between Functions
Grouping and Aggregation
groupby() prepares the data, while aggregation functions (mean, sum, count, etc.) produce the actual results.
Covariance vs Correlation
corr() is a standardized form of cov().
Covariance depends on measurement units, while correlation is unit-free.
Operation Chaining
Functions can be chained together, such as:
df.groupby(...).mean().plot.bar()
This allows data processing, aggregation, and visualization in a single workflow.
Categorical vs Numeric Analysis
Categorical data: unique(), nunique(), value_counts()
Numeric data: mean(), median(), std(), var()
❤5
💢 الترجمة 💢
أولاً: دوال بايثون الأساسية
Basic Python Functions
تُعد هذه الدوال مدمجة في لغة بايثون، وتُستخدم للتعامل الأولي مع المتغيرات والبيانات.
print()
تُستخدم لعرض المخرجات على الشاشة
Displays output to the screen
type()
تُستخدم لتحديد نوع المتغير مثل int, float, str
Determines the type of a variable
input()
تُستخدم لاستقبال مدخلات من المستخدم عبر لوحة المفاتيح
Gets user input from the keyboard
دوال تحويل النوع (Type Casting):
int(x)
تحويل القيمة إلى عدد صحيح
Converts x to an integer
float(x)
تحويل القيمة إلى عدد عشري
Converts x to a float
str(x)
تحويل القيمة إلى نص
Converts x to a string
bool(x)
تحويل القيمة إلى منطقية
Converts x to a boolean
ثانياً: دوال استكشاف البيانات في Pandas
Exploratory Data Analysis Functions
تُستخدم لفهم بنية ومحتوى الجداول (DataFrames).
df.head(n)
عرض أول صفوف من البيانات (الافتراضي 5)
Displays the first rows
df.tail(n)
عرض آخر صفوف من البيانات
Displays the last rows
df.dtypes
إظهار نوع البيانات لكل عمود
Returns column data types
df.describe()
إحصاءات وصفية مثل المتوسط، الانحراف المعياري، والقيم الرباعية
Generates summary statistics
df.shape
معرفة عدد الصفوف والأعمدة
Returns the number of rows and columns
df.unique()
إيجاد القيم الفريدة في عمود فئوي
Finds unique values
df.nunique()
حساب عدد القيم الفريدة
Returns number of unique values
ثالثاً: دوال التجميع والإحصاء
Aggregation & Statistical Functions
تُستخدم لتلخيص البيانات في قيمة رقمية واحدة.
sum()
حساب مجموع القيم
Computes the sum
mean()
حساب المتوسط الحسابي
Calculates the average
median()
حساب القيمة الوسيطة
Calculates the median
max()
إيجاد أكبر قيمة
Finds the maximum value
min()
إيجاد أصغر قيمة
Finds the minimum value
count()
حساب عدد القيم غير المفقودة
Counts non-missing values
std()
حساب الانحراف المعياري
Calculates standard deviation
mode()
إيجاد القيمة الأكثر تكراراً
Finds the most frequent value
value_counts()
حساب تكرار القيم الفئوية
Counts categorical value frequencies
رابعاً: دوال معالجة وتنظيف البيانات
Data Manipulation & Cleaning Functions
تُستخدم لإعداد البيانات قبل التحليل أو النمذجة.
fillna()
تعويض القيم المفقودة بقيمة محددة
Fills missing values
dropna()
حذف الصفوف أو الأعمدة التي تحتوي على قيم مفقودة
Drops missing values
pd.get_dummies()
تحويل المتغيرات الفئوية إلى متغيرات رقمية (0 و1)
Converts categorical variables into dummy variables
pd.crosstab()
إنشاء جدول تقاطعي بين متغيرين فئويين
Creates a cross-tabulation table
unstack()
تحويل البيانات من الشكل الطولي إلى العرضي
Reshapes hierarchical index levels
خامساً: دوال العلاقات الإحصائية
Relationship Functions
تُستخدم لدراسة العلاقة بين المتغيرات الرقمية.
df.cov()
حساب التباين المشترك لقياس اتجاه العلاقة
Calculates covariance
df.corr()
حساب معامل الارتباط لقياس قوة واتجاه العلاقة
Calculates correlation
سادساً: دوال التمثيل البياني
Visualization Functions
تُستخدم لتحويل البيانات إلى رسوم توضيحية.
plot.scatter()
مخطط تشتت بين متغيرين رقميين
Scatter plot
plot.bar()
مخطط أعمدة
Bar chart
plot.pie()
مخطط دائري
Pie chart
plot.line()
مخطط خطي
Line chart
الترابط بين الدوال
Relationships Between Functions
groupby() مع دوال التجميع
groupby() تُقسم البيانات فقط، ولا تُنتج نتائج فعلية إلا عند استخدامها مع دالة تجميعية مثل mean() أو sum().
aggregate() أو agg()
تُستخدم لتطبيق أكثر من دالة تجميعية في نفس الوقت بعد groupby().
العلاقة بين cov() و corr()
الارتباط (corr) هو نسخة معيارية من التباين المشترك (cov) وتتراوح قيمه بين -1 و +1.
التنظيف قبل التحليل
يجب استخدام fillna() أو dropna() قبل التحليل الإحصائي أو النمذجة لتجنب نتائج خاطئة.
سلسلة العمليات (Chaining)
يمكن ربط الدوال معاً في سطر واحد مثل:
df.groupby('A')['B'].mean().plot.bar()
❤5
🔰اللجنة العلمية DS مستوى اول 🔰 pinned «💢💢ملخص للدوال وأهم المفاهيم💢💢 1. Basic Python & Data Type Functions print() Used to display outputs and check variable values. Type Conversion int(), float(), str(), bool() Used to define or convert the data type of a variable. type() Identifies the data…»
⭕️أهم المفاهيم ⭕️
1. Data Science Foundations
Data Science
A multidisciplinary field that transforms raw data into useful knowledge. It focuses on discovering patterns and describing relationships using mathematics, computing, and domain knowledge.
The Cyclic Process of Data Science
A systematic and iterative workflow that typically includes:
Analytical Question → Data Acquisition → Data Preparation (cleaning and scrubbing) → Data Analysis and Modeling → Visualization and Reporting → Model Evaluation → Discussion and Refinement.
Prediction vs. Inference
Prediction is concerned with estimating future outcomes based on data, whereas inference focuses on understanding relationships and drawing knowledge-driven conclusions to support decision-making.
2. Data Structures and Variables
Tabular Data
Data organized in a table format consisting of rows (observations, objects, or events) and columns (attributes, features, or variables).
Variable Types
Categorical (Qualitative) Variables
Variables that take on a limited and usually fixed number of possible values or levels.
Numeric (Quantitative) Variables
Variables that represent measurable quantities. Their values are numeric, have units, and can be compared or computed.
Other Variable Types
Variables such as free text or names that have no fixed levels and are neither strictly categorical nor numeric.
Basic Python Data Types
These include Integers (whole numbers), Floats (decimal numbers), Strings (text data), and Booleans (True or False values).
Pandas Data Structures
Series are one-dimensional labeled arrays, while DataFrames are two-dimensional tabular data structures with rows and columns.
3. Exploratory Data Analysis (EDA)
Measures of Center
Statistical measures that describe a typical value in a dataset, including:
Mean (average), Median (the 50th quantile), and Mode (the most frequent value).
Measures of Spread
Metrics that describe how data values are distributed:
Range
The difference between the maximum and minimum values.
Quantiles
Values that divide the data into equal proportions (for example, the median is the 50th quantile).
Mean Absolute Deviation (MAD)
The average of the absolute differences between each data point and the mean.
Variance and Standard Deviation
Measures that quantify how much the data deviates from the mean.
Distribution Visualization
Graphical tools used to understand distributions and relationships, such as histograms, density plots, scatterplots, bar charts, and pie charts.
4. Relationships and Probabilities
Covariance
A measure that indicates the direction of the linear relationship between two numeric variables. Its value depends on the units of the variables.
Correlation
A normalized and unit-less version of covariance that ranges from -1 to +1, representing the strength and direction of a relationship.
Conditional Probability
The probability of an event occurring given that another event has already occurred.
Joint Probability Distribution
A probability distribution that represents the likelihood of two or more events occurring simultaneously.
5. Predictive Modeling and Machine Learning
Supervised Learning
A machine learning approach where models are trained using labeled data to make predictions.
Regression
A predictive task focused on estimating a numeric target variable, such as predicting house prices.
Linear Regression
A supervised learning algorithm that fits a best-fit line to the data by minimizing a cost function, commonly the Mean Squared Error (MSE).
Classification
A predictive task focused on assigning observations to categorical classes.
K-Nearest Neighbors (KNN)
A simple supervised algorithm that can be used for both classification and regression by relying on the closest data points.
Model Evaluation (Confusion Matrix)
A framework used to evaluate classification models by tracking True Positives (TP), True Negatives (TN), False Positives (FP), and False Negatives (FN).
❤3
Feature Engineering
A preprocessing step that transforms raw data into more informative features to improve model performance.
6. Data Operations
Selection
Filtering rows (observations) based on specified conditions.
Projection
Selecting or modifying columns (attributes) to focus on specific aspects of the data.
Aggregation
Operations that compute a single atomic value from a column of data, such as sum, mean, or count.
Grouping
Partitioning a dataset into subsets based on shared attributes before applying aggregation functions.
❤3
الترجمة👇
1. مفاهيم علوم البيانات الأساسية
Data Science Foundations
علم البيانات (Data Science)
مجال متعدد التخصصات يركز على اكتشاف الأنماط ووصف العلاقات واستخلاص المعرفة من البيانات. يجمع بين الرياضيات، الحوسبة، والإلمام بالمجال التطبيقي.
البيانات الضخمة (Big Data)
مجموعات بيانات كبيرة ومعقدة تتميز بثلاث خصائص رئيسية (3Vs):
الحجم (Volume)
السرعة (Velocity)
التنوع (Variety)
العملية الدورية لعلوم البيانات (Cyclic Process)
تمر علوم البيانات بعدة مراحل متكررة تشمل:
صياغة السؤال التحليلي، جمع البيانات، تحضير وتنظيف البيانات، التحليل أو النمذجة، التصوير البياني، ثم عرض النتائج وإعداد التقارير.
التنبؤ مقابل الاستدلال (Prediction vs. Inference)
الاستدلال يهدف إلى فهم العلاقات داخل البيانات، بينما يركز التنبؤ على استخدام البيانات لبناء نماذج تتوقع قيماً مستقبلية لدعم اتخاذ القرار.
2. أنواع البيانات وهياكلها
Data Types and Structures
البيانات المهيكلة (Structured Data)
بيانات ذات تنسيق منظم مسبقاً، غالباً في جداول مثل قواعد البيانات.
البيانات غير المهيكلة (Unstructured Data)
بيانات بلا هيكل رسمي مثل النصوص الحرة، الصور، والفيديوهات.
البيانات شبه المهيكلة (Semi-Structured Data)
بيانات لها بعض التنظيم دون التزام صارم بهيكل ثابت، مثل JSON وXML.
البيانات الجدولية (Tabular Data)
بيانات منظمة في صفوف تمثل الملاحظات، وأعمدة تمثل المتغيرات أو السمات.
أنواع المتغيرات (Variable Types)
المتغيرات الفئوية (Categorical / Qualitative): قيم محدودة تمثل فئات أو مستويات.
المتغيرات العددية (Numeric / Quantitative): قيم رقمية قابلة للقياس.
متغيرات أخرى: مثل النصوص التي لا تحتوي على مستويات عددية واضحة.
أنواع البيانات في بايثون (Basic Python Data Types)
تشمل الأعداد الصحيحة (Integers)، الأعداد العشرية (Floats)، النصوص (Strings)، والقيم المنطقية (Booleans).
3. تحليل البيانات الاستكشافي
Exploratory Data Analysis (EDA)
مقاييس النزعة المركزية (Measures of Center)
تشمل المتوسط الحسابي (Mean)، الوسيط (Median)، والمنوال (Mode).
مقاييس التشتت (Measures of Spread)
تشمل المدى (Range)، الانحراف المطلق للمتوسط (MAD)، التباين (Variance)، والانحراف المعياري (Standard Deviation).
التصوير البياني (Visualization)
يُستخدم لفهم البيانات بصرياً، مثل:
المخططات التشتتية لدراسة العلاقات بين المتغيرات
المدرجات التكرارية لتحليل توزيع القيم العددية
الاحتمالات (Probabilities)
تشمل الاحتمالات الهامشية، الاحتمالات الشرطية، وتوزيع الاحتمال المشترك (Joint Probability Distribution).
4. العلاقات بين المتغيرات
Relationships Between Variables
التباين المشترك (Covariance)
مقياس عددي يحدد اتجاه العلاقة بين متغيرين عدديين (موجب أو سالب).
الارتباط (Correlation)
مقياس معياري للتباين المشترك تتراوح قيمه بين -1 و +1، ويعبر عن قوة واتجاه العلاقة.
أنواع الارتباط
ارتباط موجب: زيادة متغير تؤدي إلى زيادة الآخر
ارتباط سالب: زيادة متغير تؤدي إلى نقصان الآخر
عدم وجود ارتباط: لا توجد علاقة واضحة بين المتغيرين
5. النمذجة التنبؤية والتعلم الآلي
Predictive Modeling and Machine Learning
التعلم الخاضع للإشراف (Supervised Learning)
نماذج تتعلم من بيانات تحتوي على متغير مستهدف معروف.
الانحدار (Regression)
يُستخدم للتنبؤ بقيم عددية مثل الأسعار أو الدرجات.
الانحدار الخطي (Linear Regression)
نموذج يبحث عن أفضل خط يصف العلاقة بين المتغيرات.
التصنيف (Classification)
يُستخدم للتنبؤ بفئات أو تسميات.
خوارزمية K-Nearest Neighbors (KNN)
خوارزمية تعتمد على أقرب الجيران لتصنيف أو تقدير القيم.
تقييم النموذج (Model Evaluation)
يشمل عدة مقاييس مثل:
مصفوفة الارتباك (Confusion Matrix): TP، TN، FP، FN
الدقة (Accuracy): نسبة التوقعات الصحيحة
متوسط مربع الخطأ (Mean Squared Error - MSE): مقياس شائع في الانحدار
6. الأدوات والعمليات البرمجية
Tools and Programming Operations
مكتبة Pandas
مكتبة تحليل بيانات في بايثون توفر هياكل مثل:
Series: بنية أحادية البعد
DataFrame: بنية ثنائية الأبعاد تشبه الجداول
عمليات البيانات (Data Operations)
الاختيار (Selection): تصفية الصفوف بناءً على شرط
الإسقاط (Projection): اختيار أعمدة محددة
التجميع (Aggregation): تلخيص البيانات في قيمة واحدة
التقسيم والتجميع (Grouping and Aggregation): تقسيم البيانات إلى مجموعات ثم إجراء الحسابات
بيئات التطوير (Environments)
Jupyter Notebook: بيئة تفاعلية لتحليل البيانات
Google Colab: بيئة سحابية مجانية تدعم بايثون وتحليل البيانات
❤4