علم داده کاربردی
پیشرفت تکنولوژی سبب شده است تا علم داده و هوش مصنوعی، به منظور استخراج، ذخیره سازی، تحلیل و بررسی استراتژی های داده محور به عنوان یک بخش اصلی و مهم در صنعت و تجارت، استفاده شود. به همین سبب بسیاری از صنایع و سازمان ها تمام توان و تجربه خود را جهت ایجاد چارچوب و به وجود آوردن راه حل های مناسب در این زمینه به کار گرفته اند. با استفاده از علم داده، می توان ایده های جدید خلق کرد و با مدیریت جامع در راستای ذخیره سازی و تحلیل انواع اطلاعات، تغییر و تحول اساسی در زمینه صنعت و تجارت به وجود آورد.
در این دوره آموزشی تلاش می شود در زمان کوتاهی محتوای قابل توجهی در حوزه علم داده و هوش مصنوعی به صورت تئوری و عملی آموزش داده شود. این دوره در راستای توانمندسازی نیروهای مشتاق علم داده و هوش مصنوعی برگزار می شود. انجام پروژههای عملی به شرکتکنندگان کمک میکند تا مفاهیم آموخته شده را در محیطهای واقعی پیادهسازی کنند و تجربه عملی کسب کنند. دوره حاضر با ترکیب بخشهای نظری و عملی، افراد را به یادگیری عمیقتر و درک بهتر از مفاهیم این حوزه تشویق میکند.
سر فصل ها:
-
1 معرفی علم داده و ابزارهای آن
- 1-1- تعریف علم داده
- 2-1- نقشها و مسئولیتهای یک دانشمند داده
- 3-1- مرور کلی فرآیند علم داده
- 4-1- معرفی ابزارهای مهم: پایتون، Jupyter Notebook و کتابخانه های NumPy، pandas، و matplotlib
-
2 مبانی برنامهنویسی با پایتون
- 1-2- نصب و راهاندازی محیط برنامهنویسی
- 2-2- مبانی زبان برنامهنویسی پایتون
- 3-2- انواع دادهها و متغیرها
- 4-2- عملیات ریاضی و منطقی
- 5-2- حلقهها و شروط
- 6-2- توابع و ماژولها
-
3 مدیریت و تحلیل داده با pandas
- 1-3- معرفی pandas و ساختار dataframe
- 2-3- وارد کردن داده ها از فایل های csv و Excel
- 3-3- پاکسازی و آمادهسازی دادهها
- 4-3- عملیات پایهای روی دادهها
-
4 تحلیل دادههای اکتشافی
- 1-4- توصیف آماری دادهها
- 2-4- توزیع ها و شاخص های آماری
- 3-4- بصریسازی دادهها با matplotlib و seaborn
- 4-4- تحلیل همبستگی و کشف الگوها
-
5 معرفی یادگیری ماشین
- 1-5- مفاهیم پایهای یادگیری ماشین
- 2-5- انواع الگوریتمهای یادگیری ماشین (نظارتشده و نظارتنشده)
- 3-5- مراحل اصلی یک پروژه یادگیری ماشین
-
6 یشپردازش دادهها برای یادگیری ماشین
- 1-6- تقسیمبندی دادهها به مجموعههای آموزشی و تست
- 2-6- مقیاسبندی و نرمالسازی دادهها
- 3-6- مدیریت دادههای گمشده
- 4-6- ویژگیسازی و انتخاب ویژگیها
-
7 الگوریتمهای یادگیری ماشین نظارتشده
- 1-7- رگرسیون خطی
- 2-7- رگرسیون لجستیک
- 3-7- درخت تصمیمگیری
- 4-7- ارزیابی مدلها: دقت، فراخوانی، F1-score، و ماتریس اغتشاش
-
8 الگوریتمهای یادگیری ماشین نظارتنشده
- 1-8- خوشهبندی K-Means
- 2-8- کاهش ابعاد با PCA
- 3-8- کاربردها و ارزیابی مدلهای نظارتنشده
-
9 پروژه عملی: پیشبینی
- 1-9- تعریف مسئله
- 2-9- جمعآوری و آمادهسازی دادهها
- 3-9- انتخاب و پیادهسازی مدل مناسب
- 4-9- ارزیابی و بهینهسازی مدل
- 5-9- ارائه نتایج و تجسم دادهها
-
10 پروژه عملی: تحلیل اکتشافی و خوشهبندی
- 1-10- تعریف مسئله
- 2-10- جمعآوری و آمادهسازی دادهها
- 3-10- انتخاب و پیادهسازی الگوریتم خوشهبندی
- 4-10- تحلیل نتایج و بصریسازی خوشهها
- 5-10- ارائه نتایج و جمعبندی
-
11 جمعبندی و مرور نهایی
- 1-11- مرور مفاهیم کلیدی دوره
- 2-11- بررسی سوالات و رفع اشکالات
- 3-11- راهنمایی برای منابع بیشتر و قدمهای بعدی در علم داده
- 4-11- انجام یک پروژه کوچک تیمی به عنوان تمرین نهایی
-
مهارتها
1. اینترنت اشیاء (Internet of Things)
2. رایانش ابری (Cloud Computing)
3. رایانش مهی (Fog Computing)
4. پردازش تصویر
5. یادگیری ماشین