🔰اللجنة العلمية DS مستوى اول 🔰 pinned «💢💢ملخص للدوال وأهم المفاهيم💢💢 1. Basic Python & Data Type Functions print() Used to display outputs and check variable values. Type Conversion int(), float(), str(), bool() Used to define or convert the data type of a variable. type() Identifies the data…»
⭕️أهم المفاهيم ⭕️
1. Data Science Foundations
Data Science
A multidisciplinary field that transforms raw data into useful knowledge. It focuses on discovering patterns and describing relationships using mathematics, computing, and domain knowledge.
The Cyclic Process of Data Science
A systematic and iterative workflow that typically includes:
Analytical Question → Data Acquisition → Data Preparation (cleaning and scrubbing) → Data Analysis and Modeling → Visualization and Reporting → Model Evaluation → Discussion and Refinement.
Prediction vs. Inference
Prediction is concerned with estimating future outcomes based on data, whereas inference focuses on understanding relationships and drawing knowledge-driven conclusions to support decision-making.
2. Data Structures and Variables
Tabular Data
Data organized in a table format consisting of rows (observations, objects, or events) and columns (attributes, features, or variables).
Variable Types
Categorical (Qualitative) Variables
Variables that take on a limited and usually fixed number of possible values or levels.
Numeric (Quantitative) Variables
Variables that represent measurable quantities. Their values are numeric, have units, and can be compared or computed.
Other Variable Types
Variables such as free text or names that have no fixed levels and are neither strictly categorical nor numeric.
Basic Python Data Types
These include Integers (whole numbers), Floats (decimal numbers), Strings (text data), and Booleans (True or False values).
Pandas Data Structures
Series are one-dimensional labeled arrays, while DataFrames are two-dimensional tabular data structures with rows and columns.
3. Exploratory Data Analysis (EDA)
Measures of Center
Statistical measures that describe a typical value in a dataset, including:
Mean (average), Median (the 50th quantile), and Mode (the most frequent value).
Measures of Spread
Metrics that describe how data values are distributed:
Range
The difference between the maximum and minimum values.
Quantiles
Values that divide the data into equal proportions (for example, the median is the 50th quantile).
Mean Absolute Deviation (MAD)
The average of the absolute differences between each data point and the mean.
Variance and Standard Deviation
Measures that quantify how much the data deviates from the mean.
Distribution Visualization
Graphical tools used to understand distributions and relationships, such as histograms, density plots, scatterplots, bar charts, and pie charts.
4. Relationships and Probabilities
Covariance
A measure that indicates the direction of the linear relationship between two numeric variables. Its value depends on the units of the variables.
Correlation
A normalized and unit-less version of covariance that ranges from -1 to +1, representing the strength and direction of a relationship.
Conditional Probability
The probability of an event occurring given that another event has already occurred.
Joint Probability Distribution
A probability distribution that represents the likelihood of two or more events occurring simultaneously.
5. Predictive Modeling and Machine Learning
Supervised Learning
A machine learning approach where models are trained using labeled data to make predictions.
Regression
A predictive task focused on estimating a numeric target variable, such as predicting house prices.
Linear Regression
A supervised learning algorithm that fits a best-fit line to the data by minimizing a cost function, commonly the Mean Squared Error (MSE).
Classification
A predictive task focused on assigning observations to categorical classes.
K-Nearest Neighbors (KNN)
A simple supervised algorithm that can be used for both classification and regression by relying on the closest data points.
Model Evaluation (Confusion Matrix)
A framework used to evaluate classification models by tracking True Positives (TP), True Negatives (TN), False Positives (FP), and False Negatives (FN).
❤3
Feature Engineering
A preprocessing step that transforms raw data into more informative features to improve model performance.
6. Data Operations
Selection
Filtering rows (observations) based on specified conditions.
Projection
Selecting or modifying columns (attributes) to focus on specific aspects of the data.
Aggregation
Operations that compute a single atomic value from a column of data, such as sum, mean, or count.
Grouping
Partitioning a dataset into subsets based on shared attributes before applying aggregation functions.
❤3
الترجمة👇
1. مفاهيم علوم البيانات الأساسية
Data Science Foundations
علم البيانات (Data Science)
مجال متعدد التخصصات يركز على اكتشاف الأنماط ووصف العلاقات واستخلاص المعرفة من البيانات. يجمع بين الرياضيات، الحوسبة، والإلمام بالمجال التطبيقي.
البيانات الضخمة (Big Data)
مجموعات بيانات كبيرة ومعقدة تتميز بثلاث خصائص رئيسية (3Vs):
الحجم (Volume)
السرعة (Velocity)
التنوع (Variety)
العملية الدورية لعلوم البيانات (Cyclic Process)
تمر علوم البيانات بعدة مراحل متكررة تشمل:
صياغة السؤال التحليلي، جمع البيانات، تحضير وتنظيف البيانات، التحليل أو النمذجة، التصوير البياني، ثم عرض النتائج وإعداد التقارير.
التنبؤ مقابل الاستدلال (Prediction vs. Inference)
الاستدلال يهدف إلى فهم العلاقات داخل البيانات، بينما يركز التنبؤ على استخدام البيانات لبناء نماذج تتوقع قيماً مستقبلية لدعم اتخاذ القرار.
2. أنواع البيانات وهياكلها
Data Types and Structures
البيانات المهيكلة (Structured Data)
بيانات ذات تنسيق منظم مسبقاً، غالباً في جداول مثل قواعد البيانات.
البيانات غير المهيكلة (Unstructured Data)
بيانات بلا هيكل رسمي مثل النصوص الحرة، الصور، والفيديوهات.
البيانات شبه المهيكلة (Semi-Structured Data)
بيانات لها بعض التنظيم دون التزام صارم بهيكل ثابت، مثل JSON وXML.
البيانات الجدولية (Tabular Data)
بيانات منظمة في صفوف تمثل الملاحظات، وأعمدة تمثل المتغيرات أو السمات.
أنواع المتغيرات (Variable Types)
المتغيرات الفئوية (Categorical / Qualitative): قيم محدودة تمثل فئات أو مستويات.
المتغيرات العددية (Numeric / Quantitative): قيم رقمية قابلة للقياس.
متغيرات أخرى: مثل النصوص التي لا تحتوي على مستويات عددية واضحة.
أنواع البيانات في بايثون (Basic Python Data Types)
تشمل الأعداد الصحيحة (Integers)، الأعداد العشرية (Floats)، النصوص (Strings)، والقيم المنطقية (Booleans).
3. تحليل البيانات الاستكشافي
Exploratory Data Analysis (EDA)
مقاييس النزعة المركزية (Measures of Center)
تشمل المتوسط الحسابي (Mean)، الوسيط (Median)، والمنوال (Mode).
مقاييس التشتت (Measures of Spread)
تشمل المدى (Range)، الانحراف المطلق للمتوسط (MAD)، التباين (Variance)، والانحراف المعياري (Standard Deviation).
التصوير البياني (Visualization)
يُستخدم لفهم البيانات بصرياً، مثل:
المخططات التشتتية لدراسة العلاقات بين المتغيرات
المدرجات التكرارية لتحليل توزيع القيم العددية
الاحتمالات (Probabilities)
تشمل الاحتمالات الهامشية، الاحتمالات الشرطية، وتوزيع الاحتمال المشترك (Joint Probability Distribution).
4. العلاقات بين المتغيرات
Relationships Between Variables
التباين المشترك (Covariance)
مقياس عددي يحدد اتجاه العلاقة بين متغيرين عدديين (موجب أو سالب).
الارتباط (Correlation)
مقياس معياري للتباين المشترك تتراوح قيمه بين -1 و +1، ويعبر عن قوة واتجاه العلاقة.
أنواع الارتباط
ارتباط موجب: زيادة متغير تؤدي إلى زيادة الآخر
ارتباط سالب: زيادة متغير تؤدي إلى نقصان الآخر
عدم وجود ارتباط: لا توجد علاقة واضحة بين المتغيرين
5. النمذجة التنبؤية والتعلم الآلي
Predictive Modeling and Machine Learning
التعلم الخاضع للإشراف (Supervised Learning)
نماذج تتعلم من بيانات تحتوي على متغير مستهدف معروف.
الانحدار (Regression)
يُستخدم للتنبؤ بقيم عددية مثل الأسعار أو الدرجات.
الانحدار الخطي (Linear Regression)
نموذج يبحث عن أفضل خط يصف العلاقة بين المتغيرات.
التصنيف (Classification)
يُستخدم للتنبؤ بفئات أو تسميات.
خوارزمية K-Nearest Neighbors (KNN)
خوارزمية تعتمد على أقرب الجيران لتصنيف أو تقدير القيم.
تقييم النموذج (Model Evaluation)
يشمل عدة مقاييس مثل:
مصفوفة الارتباك (Confusion Matrix): TP، TN، FP، FN
الدقة (Accuracy): نسبة التوقعات الصحيحة
متوسط مربع الخطأ (Mean Squared Error - MSE): مقياس شائع في الانحدار
6. الأدوات والعمليات البرمجية
Tools and Programming Operations
مكتبة Pandas
مكتبة تحليل بيانات في بايثون توفر هياكل مثل:
Series: بنية أحادية البعد
DataFrame: بنية ثنائية الأبعاد تشبه الجداول
عمليات البيانات (Data Operations)
الاختيار (Selection): تصفية الصفوف بناءً على شرط
الإسقاط (Projection): اختيار أعمدة محددة
التجميع (Aggregation): تلخيص البيانات في قيمة واحدة
التقسيم والتجميع (Grouping and Aggregation): تقسيم البيانات إلى مجموعات ثم إجراء الحسابات
بيئات التطوير (Environments)
Jupyter Notebook: بيئة تفاعلية لتحليل البيانات
Google Colab: بيئة سحابية مجانية تدعم بايثون وتحليل البيانات
❤4
💢تسجيلات المحاضرات 💢
🔻هذا اللي ارسلتهم د.منى
بقيه المحاضرات بحال توفرهم بنرسلهم
ومأجووورين اللي سجلوا.
❤3
🔰اللجنة العلمية DS مستوى اول 🔰
⭕️هاام للفائده⭕️ السلام عليكم من اجل ان تعم الفائده لزملائنا في السنوات القادمة ؛ اكتبوا ما تتذكروا من الاسئله لمادة اللغه الانجليزية عبر بوت الاستفسارات @SanaaUN_DS_inquiriesbot
💢ملاحظه💢
🔻أول إختبار نهائي ل د.منى وثاني اختبار للماده بشكل عام
فجميل يكون كل واحد فينا مبادر من عنده نفيد غيرنا نفس ما نستفيد من نماذج سنوات سابقه.
🔻فلا تنسوا، نحاول نحفظ اكبر قدر من الأسئلة
ونرسلها بعد الاختبار للبوت مباشرة لاجل ما ننسى مأجورين.🫡
@SanaaUN_DS_inquiriesbot
🔥1🫡1
أنفِق من الصبرِ الجَميلِ فَإنَّهُ
لم يخشَ فَقرًا مُنفِقٌ مِن صَبرِهِ✌️
لم يخشَ فَقرًا مُنفِقٌ مِن صَبرِهِ✌️
❤4
💢الإختبار القادم💢
💻 أالثقافة الوطنية
📆 الثلاثاء 17فبراير 2026
🕒 الفترة الثالثة(12:00_1:30)
📘 المقررات المطلوبه:
الملزمة كاملة👇👇
https://news.1rj.ru/str/DS_SANAAUNIVERSITY/267/2174
💻 أالثقافة الوطنية
📆 الثلاثاء 17فبراير 2026
🕒 الفترة الثالثة(12:00_1:30)
📘 المقررات المطلوبه:
الملزمة كاملة👇👇
https://news.1rj.ru/str/DS_SANAAUNIVERSITY/267/2174
🔥1
🔰اللجنة العلمية DS مستوى اول 🔰 pinned «💢الإختبار القادم💢 💻 أالثقافة الوطنية 📆 الثلاثاء 17فبراير 2026 🕒 الفترة الثالثة(12:00_1:30) 📘 المقررات المطلوبه: الملزمة كاملة👇👇 https://news.1rj.ru/str/DS_SANAAUNIVERSITY/267/2174»
⭕️بالنسبة للتواريخ المقررة بالاختبار⭕️
تواريخ الفصل الرابع كامل
🔻ملاحظه مهمه:
كل المقرر داخل في الامتحان،
باستثناء الإرث المادي والمعنوي، العماير الزوامل ..الخ
بمعنى (من صفحه 91 الى 99)
🔻الامتحان سهل جدا، لا تقلقوا، والله يوفقكم جميعا.🌷
_منقول من د.خالد الشامي
❤5
🔰اللجنة العلمية DS مستوى اول 🔰 pinned «⭕️بالنسبة للتواريخ المقررة بالاختبار⭕️ تواريخ الفصل الرابع كامل 🔻ملاحظه مهمه: كل المقرر داخل في الامتحان، باستثناء الإرث المادي والمعنوي، العماير الزوامل ..الخ بمعنى (من صفحه 91 الى 99) 🔻الامتحان سهل جدا، لا تقلقوا، والله يوفقكم جميعا.🌷 _منقول من د.خالد…»
بسم الله الرحمن الرحيم
﴿الَّذِينَ إِذَا أَصَابَتْهُم مُّصِيبَةٌ قَالُوا إِنَّا لِلَّهِ وَإِنَّا إِلَيْهِ رَاجِعُونَ أُولَٰئِكَ عَلَيْهِمْ صَلَوَاتٌ مِّن رَّبِّهِمْ وَرَحْمَةٌ﴾
صدق الله العظيم
ببالغ الحزن وعظيم الأسى، تتقدّم دفعة علم البيانات – الدفـعـ(2)ــة بخالص التعازي وعظيم المواساة إلى فخامة الرئيس مهدي حيدر المشاط، رئيس المجلس السياسي الأعلى، وإلى والده محمد المشاط، وكافة أفراد الأسرة الكريمة، في وفاة والدة فخامة الرئيس ، سائلين الله العلي القدير أن يتغمد الفقيدة بواسع رحمته، وأن يسكنها فسيح جناته، وأن يلهمكم جميعاً الصبر والسلوان.
وإن هذا المصاب الأليم ليذكّرنا بحقيقة الفقد التي لا يسلم منها أحد، غير أن عزاء المؤمن في الرضا بقضاء الله وقدره، والثقة برحمته الواسعة، وأن ما عند الله خيرٌ وأبقى.
نسأل الله أن يجعل ما أصابكم رفعةً في الدرجات، وأن يجزي الفقيدة خير الجزاء على ما قدمت في حياتها من خير، وأن يربط على قلوب أهلها ومحبيها، وأن يبدل حزنكم صبراً وسكينة.
إنا لله وإنا إليه راجعون.
﴿الَّذِينَ إِذَا أَصَابَتْهُم مُّصِيبَةٌ قَالُوا إِنَّا لِلَّهِ وَإِنَّا إِلَيْهِ رَاجِعُونَ أُولَٰئِكَ عَلَيْهِمْ صَلَوَاتٌ مِّن رَّبِّهِمْ وَرَحْمَةٌ﴾
صدق الله العظيم
ببالغ الحزن وعظيم الأسى، تتقدّم دفعة علم البيانات – الدفـعـ(2)ــة بخالص التعازي وعظيم المواساة إلى فخامة الرئيس مهدي حيدر المشاط، رئيس المجلس السياسي الأعلى، وإلى والده محمد المشاط، وكافة أفراد الأسرة الكريمة، في وفاة والدة فخامة الرئيس ، سائلين الله العلي القدير أن يتغمد الفقيدة بواسع رحمته، وأن يسكنها فسيح جناته، وأن يلهمكم جميعاً الصبر والسلوان.
وإن هذا المصاب الأليم ليذكّرنا بحقيقة الفقد التي لا يسلم منها أحد، غير أن عزاء المؤمن في الرضا بقضاء الله وقدره، والثقة برحمته الواسعة، وأن ما عند الله خيرٌ وأبقى.
نسأل الله أن يجعل ما أصابكم رفعةً في الدرجات، وأن يجزي الفقيدة خير الجزاء على ما قدمت في حياتها من خير، وأن يربط على قلوب أهلها ومحبيها، وأن يبدل حزنكم صبراً وسكينة.
إنا لله وإنا إليه راجعون.
❤5👏1🫡1
DS.pdf
318.3 KB
🚨هااااااااااااااااااااااااااام🚨
🔻توزيع الاختبارات للطلاب المختبرين يوم الثلاثاء.
🔻على الجميع الالتزام بمقاعدهم واماكنهم المحددة ووقتهم المحدد.
#ملتقى_الطالب_الجامعي_كلية_الحاسوب.
#نحن_في_خدمتكم🌹
🔻توزيع الاختبارات للطلاب المختبرين يوم الثلاثاء.
🔻على الجميع الالتزام بمقاعدهم واماكنهم المحددة ووقتهم المحدد.
🔻ركزوا البعض بمعمل كليه التجاره والبعض بمعامل الحاسوب
#ملتقى_الطالب_الجامعي_كلية_الحاسوب.
#نحن_في_خدمتكم🌹
❤2