دوره تحلیل داده 1 در Data Science
آمار توصیفی در دیتاساینس بر اساس پایتون و R
یک تحلیل آماری باید توسط یک محقق آمار اجرا شود. هر فرد در فرآیند انجام پژوهشهایی مثل پایان نامه یا تحقیقهای علمی با داده هایی سروکار دارد که برای نتیجه گیری و استفاده از آنها در پژوهش خود نیاز به تحلیل آنها دارد. نرم افزار SPSS که مخفف عبارت Statistical Package for the Social Sciences می باشد، یک نرم افزار جامع و کاربردی برای انجام تحلیلهای آماری و داده کاوی است که در رشته های مختلف به خصوص علوم اجتماعی و رفتاری مورد استفاده گسترده قرار میگیرد.
تحلیل داده 1 در Data Science
- (28 ساعت)
- پیش نیاز:
ویدئو معرفی این دوره
معرفی این دوره
علم داده یک میان رشته است که از آمار، محاسبات علمی، روش های علمی، فرآیندها، الگوریتم ها و سیستم ها برای استخراج یا برونیابی دانش و بینش از دادههای ساختاریافته و بدون ساختار استفاده میکند.
علم داده همچنین دانش را از حوزه های مختلف کاربردی (به عنوان مثال، علوم اعصاب، فناوری اطلاعات و پزشکی) یکپارچه می کند. علم داده چند وجهی است و می توان آن را به عنوان یک علم، یک الگوی تحقیق، یک روش تحقیق، یک رشته، یک گردش کار و یک شغل توصیف کرد.
پروفسور استنفورد دیوید دونوو می نویسد که علم داده با اندازه مجموعه داده ها یا استفاده از محاسبات از آمار متمایز نمی شود و بسیاری از برنامه های فارغ التحصیلی این رشته (واحد های دانشگاهی) به طور گمراه کننده ای آموزش تجزیه و تحلیل و آمار خود را به عنوان ماهیت یک برنامه علم داده تبلیغ می کنند. او علم داده را به عنوان یک حوزه کاربردی که از آمار سنتی رشد می کند، توصیف می کند.
در بیانی ساده تر می توانیم بگوییم علم داده در واقع همان آمار است که با علوم کامپیوتر ترکیب شده است و ساختار جدید و موثرتری پیدا کرده است.
در گام اول دانشجو با اصول اولیه نظریات آمار و احتمالات و جبر خطی آشنا می شود، مباحث آمار توصیفی از جمله مود، میانه و میانگین، کشیدگی و چولگی، انحراف معیار و واریانس، نظریه حد مرکزی انواع آزمون های همبستگی از جمله پیرسون، اسپیرمن و کندال از سرفصل های این دوره می باشد.
لازم به ذکر است که در این گام دانشجو همزمان با جنبه های تئوری این بخش آشنا و بلافاصله تئوری های آموخته شده درنرم افزارهای پایتون و R اجرا می شود.
سرفصل های این دوره
- مفاهیم اولیه در آمار
- آمار توصیفی (بخش اول)
- اشنایی با انواع متغیر در علم آمار
- شاخص های مرکزی
- مد (mode) و توزیع یکنواخت
- توزیع تصادفی یکنواخت در پایتون
- ترسیم توزیع تصادفی در پایتون
- میانه (median)
- استفاده از پایتون برای تشخیص میانه
- میانگین و محاسبه میانگین توسط لایبرری numpy در پایتون
- آشنایی با نمودار های آماری
- ترسیم نمودار های آماری در پایتون و SPSS
- توزیع نرمال
- ترسیم توزیع نرمال توسط لایبرری matplot در پایتون
- چولگی (skewness)
- محاسبه چولگی توسط پایتون، R و SPSS
- نمودار جعبه ای (boxplot)
- رسم باکس پلات توسط پایتون، R و SPSS
- شاخص های پراکندگی
- دامنه تغییرات
- انحراف چارکی
- محاسبه کوانتایل دیوی ایشن (انحراف چارکی) در پایتون، R و SPSS
- انحراف متوسط (انحراف از میانگین) (mean deviation)
- محاسبه انحراف متوسط توسط پایتون
- واریانس
- قضیه حد مرکزی
- انحراف استاندارد
- ضریب تغییرات
- کشیدگی (kurtosis)
- تاثیر اعمال ریاضی بر شاخصهای آماری (مرکزی / پراکندگی)
- نمرات استاندارد
- رتبه درصدی
- نمراه استاندارد Z
- نمره استاندارد T
- همبستگی
- Scatter plots (نمودار پراکنش)
- ترسیم نمودار پراکنش در پایتون، R و SPSS
- ضریبب همبستگی پیرسون
- انواع ضرایب همبستگی
- ضریب همبستگی اسپیرمن
- پروژه 1 انجام همبستگی توسط داده های واقعی در پایتون، R و SPSS
- آزمون فرض
- انواع خطای آماری
- انجام آزمون های هبستگی در SPSS
- اندازه اثر در همبستگی
- همبستی پیرسون در پایتون، R و SPSS
مخاطبین این دوره
- مدیران کسب و کار
- دانشجویان کلیه مقاطع تحصیلی
- پزشکی و داروسازی
- آمار زیستی
- حسابداری
- و….
آنچه در این دوره خواهید آموخت
- به طور قابل توجهی کسب دانش نظری و عملی مربوط به حوزه آمار در تحقیقات آموزشی را تسهیل میکند.
- هدف دوره تحلیل آماری با زبانهای برنامهنویسی R، پایتون و نرم افزار IBM SPSS این است که بتواند پژوهشگرانی تربیت کند تا بتوانند به رفع مشکلات موجود در کشور کمک کنند.
درخواست مشاوره رایگان یا رزرو دوره
"*" indicates required fields