پایان نامه: یک روش هوشمند هدایت تحصیلی دانش¬آموزان با استفاده از داده¬کاوی
عنوان: پایان نامه کارشناسی ارشد
یک روش هوشمند هدایت تحصیلی دانش آموزان با استفاده از دادهکاوی
چکيده
اجرای طرح هدایت تحصیلی بر اساس استعداد و عملکرد تحصیلی دانشآموزان ، نقطه آغازی است برای کمک به کسب شغل آنان در آینده که تنها نباید بر دوش آموزش و پرورش باشد و نیازمند آموزش خانوادهها و همافزایی جامعه دارد.در پایان نامه حاضر به بررسی و هدایت تحصیلی دانش آموزان و ارائه یک روش هوشمند پرداخته شده است. برای این امر ابتدا تحلیل دادها با روش های مرسوم بررسی شده و درنهایت ارائه یک روش عصبی – ژنتیک برای بهبود نتایج ارائه داده شده است. به این منظور به روش های رگرسیون خطی به تحلیل داده ها پرداخته و سپس یک شبکه عصبی آموزش داده شده و در نهایت به ارائه یک روش هوشمند عصبی-ژنتیک به بهبود نتایج پرداخته شده است. برای این منظور از پرونده هدایت تحصیلی ۳۵۰ دانش آموز و داده های آموزشی موجود استفاده شده و یک روش جامع ارائه داده شده و مدلی طراحی شده است که رشتهای را با بيشترين شانس موفقيت در آينده به دانش آموزان جديد پيشنهاد می دهد. نتایج کلی تحقیق نشان داد که مدلهاي خطي MLR و MQR مقدار خطاي RSE بالا و قابل بحث نمي باشد و مقدار RSE در مدل MLR برابر ۴۴% و در مدل MQR برابر ۳۵% به دست آمده است. ساير مقادير خطاي محاسبه شده يعني MPE و MSE در محدوده زیادی می باشند و مقدار خطا RSE در مدل شبکه عصبی برابر ۱۴% و در مدل عصبی ژنتیک برابر ۹% به دست آمده است همانطور که مشاهده شد مدل ارائه شده عصبی ژنتیک دارای کمترین خطا است. نتایج کلی تحقیق نشان داد که یک شبکه عصبی بهینه شده میتواند نتایج و تخمین خوبی برای هدایت تحصیلی دانش آموزان رقم بزند که مدیران بتوانند به آن اتکا کنند.
واژههاي کليدي: دادهکاوی، هدایت تحصیلی، شبکه عصبی، انتخاب رشته.
فهرست مطالب
عنوان صفحه
۱-۶ -محدودیتهای پیش روی هدایت تحصیلی دانش آموزان. ۷
۱-۷ -کاربردهای شیوه داده کاوی تحصیلی.. ۷
۲ -فصل دوم: ادبیات و پیشینه تحقیق ۱۰
۲-۲ -عوامل مؤثر در انتخاب رشته. ۱۱
۲-۱ -ساختار الگوريتمهاي ژنتيك ۲۱
۲-۱-۲ -روند كلي الگوريتمهاي ژنتيك… ۲۴
۲-۳ -ساختار شبکههای عصبی مصنوعی.. ۲۸
۲-۳-۲ -مزایای شبکههای عصبی.. ۳۰
۲-۴ -يادگيری ماشين و طبقه بندي.. ۳۱
۲-۴-۲ -روشهاي ساختاري يا نحوي.. ۳۲
۲-۴-۴-۱ -روش k-نزدیکترین همسايه. ۳۴
۳-۵ -مدل سازی با رگرسيون خطي- چندگانه ( MLR) 43
۳-۶ -مدل سازی با رگرسیون درجه دوم چندگانه (MQR) 44
۳-۶-۱ -محاسبات خطا برای مدل MLR و MQR.. 44
۳-۶-۲ -مدلسازي شبكه عصبي (SVM) 45
۳-۶-۳ -طراحي و بهینه سازی شبكه عصبي.. ۴۵
۴-۲ -داده های موجود در مدارس ۵۲
۴-۴-۱ -مدلسازی با روش رگرسيون خطی چندگانه (MLR). 57
۴-۴-۲ -تست مدل با گروه ارزیابی.. ۶۱
۴-۴-۳ -تست مدل بامجموعه شبیه سازی.. ۶۲
۴-۴-۴ -مدلسازی با روش رگرسيون درجه دوم چندگانه (MQR). 62
۴-۴-۵ -محاسبات خطا برای مدل MQR.. 64
۴-۴-۶ -تست مدل با مجموعه ارزیابی.. ۶۴
۴-۴-۷ -تست مدل MQR با مجموعه شبیه سازی.. ۶۵
۴-۴-۸ -طراحي و بهينه سازي شبكه عصبي مصنوعي.. ۶۶
۴-۴-۹ -وروديها و خروجيهاي شبكه عصبي بردار پشتیبان. ۶۶
۴-۴-۱۰ -بهینه سازی شبکه عصبی مصنوعی.. ۶۷
۴-۵ -ارزيابي نهايي مدلهاي طراحي شده و مقايسه مدلها با هم. ۷۴
۵ -فصل پنجم : نتیجه گیری و پیشنهادات.. ۷۶
فهرست اشکال
شکل ۲‑۳ مراحل اصلی يک الگوريتم تکاملی ( ۲۰۱۳ ،Rakesh Kumar Soni) 20
شکل (۳‑۲) يك كروموزوم قبل و بعد از اعمال عملگر جهش… ۲۴
شکل (۳‑۳) نمودار گردشي الگوريتمهاي ژنتيك… ۲۵
شکل (۳‑۳) : يك الگوريتم ژنتيك استاندارد. Error! Bookmark not defined.
شکل ۲‑۴شبکه عصبي چند لايه مصنوعي ( ۱۳۹۴ ، بهادر . حمید، علیایی . صغری، باقری . افسانه) ۲۸
شکل ۲‑۵ساختار شبکه عصبی ( ۱۳۹۱ ، مقصودي بهروز, سليماني صادق, اميري علي, افشارچي محسن) ۲۹
شکل ۲‑۶ الگوريتم نزدیکترین همسايه (۱۳۹۰ ،طاهري . فائزه، رحیماف . حامد، فرهادي . محسن). ۳۵
شکل ۳‑۱: لایههای شبکه عصبی ایجاد شده ۴۵
شکل ۴‑۱فرم مشاوره ای شماره پنج.. ۵۲
شکل ۴‑۲فرم مشاوره ای شماره شش… ۵۴
شکل ۴‑۳: همبستگی نتایج بدست آمده از مدل خطی با مجموعه ارزیابی.. ۶۱
شکل ۴‑۴: همبستگی نتایج بدست آمده از مدل خطی با مجموعه شبیه سازی.. ۶۲
شکل ۴‑۵: همبستگی نتایج بدست آمده از مدل خطی با مجموعه ارزیابی.. ۶۵
شکل ۴‑۶: همبستگی نتایج بدست آمده از مدل خطی با مجموعه شبیه سازی.. ۶۶
شکل ۴‑۷: همبستگی نتایج بدست آمده از مدل خطی با مجموعه شبیه سازی.. ۶۷
شکل ۴‑۸: تغییرات R نسبت به تغییرات Rate Learning. 68
شکل ۴‑۹: تغییرات RMSE نسبت به تغییرات Rate Learning. 68
شکل ۴‑۱۰: تغییرات R نسبت به تغییرات Momentum.. 69
شکل ۴‑۱۱: تغییرات RMSE نسبت به تغییرات Momentum.. 69
شکل ۴‑۱۲: تغییرات R نسبت به تغییرات N تعداد نورونهای لايه هاي مخفي.. ۷۰
شکل ۴‑۱۳: تغییرات RMSE نسبت به تغییرات N تعداد نورونهای لايه هاي مخفي.. ۷۰
شکل ۴‑۱۴: تغییرات R نسبت به تغییرات تعداد تکرار Iteration. 71
شکل ۴‑۱۵: تغییرات RMSE نسبت به تغییرات تعداد تکرار Iteration. 71
شکل ۴‑۱۶ مقادیر بهینه ژنتیک… ۷۲
فهرست جداول
جدول ۴۱-: مقادير ضرایب معادله در شبیه سازی MLR. 58
جدول ۴‑۲-: پارامتر های اصلی حل.. ۵۹
جدول ۴‑۳- آناليز رگرسيوني مجدد با سطح اطمينان ۹۵% پس از حذف ضرایب فاقد معني دار ۶۰
جدول ۴‑۴- خطاهاي نسبي در مدل MLR و ضریب همبستگی مدل. ۶۱
جدول ۴‑۵- خطاهاي نسبي در مدل MLR و ضریب همبستگی مدل. ۶۱
جدول ۴‑۶- خطاهاي نسبي بين پاسخهاي واقعي (مجموعه شبیه سازی) و پاسخهاي مدل MLR. 62
جدول ۴‑۷- مقادير معادله در شبیه سازی MQR. 63
جدول ۴‑۸- آناليز رگرسيوني مجدد با سطح اطمينان ۹۵% پس از حذف ضرائب عدم معني دار ۶۳
جدول ۴‑۹- خطاهاي نسبي در مدل MQR و ضریب همبستگی مدل. ۶۴
جدول ۴‑۱۰- خطاهاي نسبي بين پاسخهاي واقعي (ست ارزیابی) و پاسخهاي مدل MQR. 64
جدول ۴‑۱۱- خطاهاي نسبي و ضریب همبستگی در مدل MQR برای مجموعه شبیه سازی.. ۶۵
جدول ۴‑۱۲- مقادير بهينه پارامترهای شبکه عصبی مصنوعی طراحی شده برای مدلسازی.. ۷۱
جدول ۴‑۱۳- مقادیر استفاده شده در الگوریتم ژنتیک… ۷۳
جدول ۴‑۱۴- خطاهاي نسبي بهینه سازی الگوریتم ژنتیک در مجموعه شبیه سازی.. ۷۳
جدول ۴‑۱۵- خطاهاي نسبي و ضریب همبستگی برای دو مجموعه آموزشی و ارزیابی در شبکه عصبی.. ۷۳
جدول ۴‑۱۶- خطاهاي نسبي و ضریب همبستگی در مدل SVM… 74
جدول ۴‑۱۷- خطاهاي نسبي و ضرايب همبستگي در دادههاي شبیه سازی.. ۷۵