This project analyzes the Grocery Dataset (GRC) using R programming.
The main tasks completed in the project are:
Data Preprocessing:
Checked and removed missing values, duplicates, and outliers.
Cleaned and validated dataset columns.
Data Visualization:
Compared Cash vs Credit totals (Pie Chart).
Visualized Total Spending vs Age (Scatter Plot).
Displayed Total Spending by City arranged in descending order (Bar Chart).
Distribution of Total Spending (Boxplot/Histogram).
Combined all plots into a Dashboard.
Clustering (K-Means Algorithm):
Grouped customers based on Age and Total Spending.
User inputs number of clusters (between 2 and 4).
Generated a table with Customer Name, Age, Total Spending, Cluster Number.
Saved results to a new Excel file.
Association Rules (Apriori Algorithm):
Transformed items into transactions.
Allowed user input for Minimum Support & Confidence.
Generated frequent itemsets and rules for Market Basket Analysis.
Interactive Shiny App:
User-friendly interface to upload dataset.
Run K-Means Clustering and visualize results.
Run Apriori Algorithm and display generated rules.
Interactive City Analysis for payment types using bar charts.
This project demonstrates skills in R programming, Data Science, Data Cleaning, Visualization (ggplot2), Clustering, Market Basket Analysis, and Shiny App development.
تحليل بيانات البقالة (GRC) ولوحة تحكم تفاعلية باستخدام R
المشروع يقوم بتحليل بيانات البقالة باستخدام لغة R، ويتضمن:
معالجة البيانات (Data Cleaning):
التحقق من القيم المفقودة وحذف التكرارات والقيم المتطرفة.
تنظيف أعمدة البيانات وتجهيزها للتحليل.
تصوير البيانات (Visualization):
مقارنة إجمالي الدفع نقدًا وبالبطاقة (مخطط دائري).
عرض العلاقة بين العمر وإجمالي الإنفاق (Scatter Plot).
ترتيب المدن حسب إجمالي الإنفاق (مخطط أعمدة).
توزيع إجمالي الإنفاق (Boxplot/Histogram).
تجميع الرسوم البيانية داخل Dashboard.
التجميع (K-Means Clustering):
تجميع العملاء حسب العمر و إجمالي الإنفاق.
إدخال عدد المجموعات (من 2 إلى 4) من المستخدم.
إنشاء جدول يوضح: اسم العميل، العمر، إجمالي الإنفاق، ورقم المجموعة (Cluster).
حفظ النتائج في ملف Excel جديد.
قواعد الترابط (Apriori Algorithm):
تحويل البيانات إلى معاملات (Transactions).
إدخال Minimum Support و Confidence من المستخدم.
استخراج قواعد التسوق (Market Basket Rules).
تطبيق تفاعلي (Shiny App):
واجهة لرفع البيانات (CSV).
تشغيل K-Means وعرض نتائجه.
تشغيل Apriori وعرض القواعد الناتجة.
تحليل المدن (City Analysis) مع رسوم بيانية تفاعلية.