پایان نامه:مدلسازی روابط کمی ساختار– فعالیت تخریب فتوکاتالیزی

فایل زیر شامل

۱- عدد فایل ورد(قابل ویراش و کپی) پایان نامه ارشد به همراه فایل پی دی اف به تعداد ۱۱۴ صفحه است.

(نوشته دارای نظم نگارشی و  فرمتبندی کامل همچنین رفرنس نویس کامل است )

 

مدلسازی روابط کمی ساختار– فعالیت تخریب فتوکاتالیزی

فهرست مطالب

عنوان                                                                                                                                                   صفحه

(۱-۱)…………………………………………………………………………………………………………….. مقدمه.. ۲

(١-٢) ارتباط کمی ساختار- فعالیت QSAR.. 7

(١-٢-١)  QSAR چیست؟.. ۷

(١-٢-١-١) محاسبه و انتخاب  توصیف‌کننده‌ها.. ۹

(١-٢-١-٢) مدل‌سازی و انتخاب بهترین مدل.. ۱۱

(۱-۲-۱-۳) ارزیابی اعتبار مدل‌های انتخاب شده.. ۱۲

(١-٢-٢) بررسي ها براي انتخاب روش.. ۱۴

(١-٢-٢-١) رگرسيون خطي ساده.. ۱۴

(١-٢-٢-٢) رگرسيون خطي چندگانه.. ۱۵

(١-٢-٢-٣) رگرسيون خطی چندگانه مرحله اي.. ۱۵

(١-٣) شبکه عصبی مصنوعی.. ۱۸

(١-٣-١) تاریخچه شبکه‌های عصبی مصنوعی.. ۲۰

(۱-۳-۲) توپولوژی شبکه عصبی مصنوعی.. ۲۳

(۱-۳-۳) مزایای شبکه‌های عصبی مصنوعی ۲۵

(۱-۳-۴) آموزش شبکه عصبی مصنوعی.. ۲۶

(۱-۳-۵) انواع شبکه عصبی مصنوعی.. ۲۷

(۱-۳-۵-۱) شبکه هاپفیلد…………………………………………………………………………………………………………………………………….۲۷           

(۱-۳-۵-۲) شبکه پرسپترون چند لایه.. ۲۸

(۱-۳-۵-۳) شبکه کوهونن.. ۲۹

(۱-۳-۶)مدل رياضي شبکه عصبي.. ۲۹

(١-٣-٧) مقايسه  مدلسازي كلاسيك در مقايسه  با مدلسازي شبكه عصبي.. ۳۲

(۱-۳-۸) انتخاب وزن NN و يادگيري :.. ۳۴

(۱-۳-۹) انتخاب نرم افزار مناسب.. ۳۵

(۱-۴) پيشينه تحقيق.. ۳۶

(١-٥) اهداف تحقیق.. ۴۰

(٢-١) مراحل كار پژوهشي.. ۴۲

(٢-٢) توضيح مراحل روش كار.. ۴۳

(٢-٢-١) انتخاب مولكولهاي آلي از  منبع.. ۴۳

(٢-٢-٢) بدست آوردن پارامتر های غلظت، زمان و میزان تخریب فتوکاتالیزی برای هر مولکول.. ۴۳

(٢-٢-٣) ترسيم  اشكال مولكولها :.. ۴۳

(٢-٢-٣-١) بسته نرم افزاری Hyper Chem.. 44

(٢-٢-٤) بهينه سازي مولكولي.. ۴۴

(٢-٢-٥) محاسبه  توصيف گرها.. ۴۵

(٢-٢-٦) كاهش تعداد توصيف گرها.. ۴۷

(٢-٢-٧) ایجاد ماتریس داده ها.. ۵۱

(٢-٢-٨) مدلسازي.. ۵۲

(٢-٢-٨-١) انجام  رگرسيون خطي – چندگانه  و ايجاد مدل MLR.. 52

(٢-٢-٨-۲) مدلسازي شبكه عصبي پرسپترون چند لايه (MLP-NN).. 56

(٣-١) نتایج.. ۶۱

(٣-١-١) مدلسازی با روش رگرسيون خطی چندگانه (MLR) 61

(٣-١-٢) مدلسازی با روش رگرسيون درجه دوم چندگانه (MQR) 67

(٣-١-۲-۱) ايجاد مدل MQR و نتايج حاصل از آن.. ۶۸

(٣-١-٢-١) محاسبات خطا برای مدل MQR.. 71

(٣-١-٢-۲) ارزيابي وتست مدل رياضي بدست آمده با استفاده از گروه ارزیابی و شبیه سازی.. ۷۲

(٣-١-٣)  طراحي و بهينه سازي شبكه عصبي مصنوعي.. ۷۳

(٣-١-٣-۱) وروديها و خروجيهاي شبكه عصبي پرسپترون چندلايه.. ۷۴

(٣-١-٣-۲) بهینه سازی شبکه.. ۷۵

(۳-۱-۳-۳) ساختار کلي شبکه های عصبی طراحي شده.. ۸۱

(۳-۱-۳-۴) بررسي مقادير خطا روي پاسخ هاي حاصل از داده هاي آموزشي شبكه   ۸۳

(٣-١-۴) ارزيابي نهايي مدلهاي طراحي شده و مقايسه مدلها با هم.. ۸۴

(٣-١-۴-۱) مطالعه اعتبار مدلهاي طراحي شده براي پيشگويی میزان تخریب فتو کاتالیزی رنگهای آلی.. ۸۴

(۳-٢) نتیجه گیری:.. ۸۶

پیشنهادها.. ۸۷

پیوست ها.. ۸۸

فهرست منابع فارسی و غیر فارسی.. ۹۷

 

 

فهرست جداول

عنوان                                                                                                                                                   صفحه

جدول (۲-۱) اسامی توصیف گر های محاسبه شده توسط نرم افزار ………………………………………….Dragon47

جدول (۳-۱) مقادير عرض از مبدا (Constant)، ضرائب متغيرهاي مستقل (X1 و….)، ضريب همبستگي(R) و P-Value براي معادله رگرسيوني  در مدلسازي MLR     ………………………………………………………۶۲

جدول (۳-۲) آناليز رگرسيوني مجدد با سطح اطمينان ۹۵% پس از حذف ضرائب عدم معني دار. ۶۴

جدول (۳-۳) خطاهاي نسبي بين پاسخهاي واقعي برای ست آموزشی و پاسخهاي مدل   ……………………….MLR65

 جدول (۳-۴) خطاهاي نسبي بين پاسخهاي واقعي (ست ارزیابی) و پاسخهاي مدل …………………………….MLR 65

جدول (۳-۵) خطاهاي نسبي بين پاسخهاي واقعي (ست شبیه سازی) و پاسخهاي مدل MLR. 66

 جدول (۳-۶) مقادير عرض از مبدا (Constant)، ضرائب متغيرهاي مستقل (x1 و….)، ضريب همبستگي(R) و P-Value براي معادله رگرسيوني در مدلسازي MQR…………………………………………………………………………….69

جدول(۳-۷) آناليز رگرسيوني مجدد با سطح اطمينان ۹۵% پس از حذف ضرائب عدم معني دار. ۷۰

جدول (۳-۸) آناليز رگرسيوني مجدد با سطح اطمينان ۹۵% پس از حذف ضرائب عدم معني دار. ۷۱

جدول (۳-۹) خطاهاي نسبي بين پاسخهاي واقعي ست آموزشی و پاسخهاي مدل MQR  ۷۱

 جدول (۳-۱۰) خطاهاي نسبي بين پاسخهاي واقعي (ست ارزیابی) و پاسخهاي مدل MQR . 72

جدول (۳-۱۱) خطاهاي نسبي بين پاسخهاي واقعي (ست شبیه سازی) و پاسخهاي مدل MQR ………………………72

جدول (۳-۱۲) مقادير فاكتورهاي مورد نظر براي بهينه كردن پاسخهاي خطا و ضريب همبستگی………………………۸۱

جدول(۳-۱۳) خطاهاي نسبي بين پاسخهاي واقعي و پاسخهاي مدل …………………………………….MLP-NN83

جدول(۳-۱۴) خطاهاي نسبي و ضرايب همبستگي بين پاسخهاي واقعي و پاسخهاي مدلهاي طراحي شده توسط داده هاي تست………………………………………………………………………………………………………….۸۴

جدول(۳-۱۵) خطاهاي نسبي و ضرايب همبستگي بين پاسخهاي واقعي و پاسخهاي مدلهاي طراحي شده توسط داده­هاي شبیه­سازی…………………………………………………………………………………………………….۸۵

جدول (الف-۱)اسامی مولکولهای مورد استفاده در مدلسازی………………………………………………………..۹۰

جدول الف-۲٫ اسامی توصیف­­گرهای باقی­مانده بعد از حذف تعدادی از آنها توسط mfile  نوشته شده در نرم­افزار…………۹۲

 

 

 

 

فهرست نمودارها

عنوان                                                                                                                                                   صفحه

نمودار۳-۱- همبستگی نتایج بدست آمده از مدل خطی MLR با دسته ارزیابی    ۶۶

نمودار۳-۲- همبستگی نتایج بدست آمده از مدل خطی MLR با دسته شبیه سازی  ………………………………… ۶۷

نمودار۳-۳ – همبستگی نتایج بدست آمده از مدل خطی MQR با دسته ارزیابی  ۷۲

نمودار۳-۴- همبستگی نتایج بدست آمده از مدل خطی MQR با دسته شبیه سازی. ۷۳

نمودار۳-۵- تغییرات  R نسبت به تغییرات Learning Rate ……………………………………………………….76

نمودار۳-۶- تغییرات RMSE نسبت به تغییرات Rate  Learning  . ۷۶

نمودار۳-۷- تغییرات  R نسبت به تغییرات Momentum    ………………………………………………………………………۷۷

نمودار۳-۸- تغییرات  RMSE نسبت به تغییرات Momentum………………………………………………………78

نمودار۳-۹- تغییرات  R نسبت به تغییرات  N لايه هاي مخفي……………………………………………………..۷۹

نمودار۳-۱۰- تغییرات  RMSE نسبت به تغییرات  N لايه هاي مخفي.. ۷۹

نمودار۳-۱۱- تغییرات  R نسبت به تغییرات تكراپذيري …………………………………………………. Iteration80

نمودار۳-۱۲- تغییرات  RMSE نسبت به تغییرات تكراپذيري  …………………………………………….Iteration81

نمودار ۳-۱۳-  همبستگي بين داده ها ي آزمايشي و داده هاي مدل ………………………………………….ANN85

 

فهرست شکلها

عنوان                                                                                                                                                   صفحه

شکل ١-١ارتباط کمومتریکس با دیگر شاخه های.. ۵

شکل ١-٢ تقسیم بندی روش های مختلف کمومتری.. ۶

شکل١-٣.ساختمان نورون.. ۱۹

شکل ١-٤.توپولوژی شبکه عصبی.. ۲۴

شکل ١-٥.پرسپترون چند لايه ای.. ۲۹

شکل ١-٦.مدل رياضي نورون.. ۳۰

شکل ١-٧. نمونه هاي رايج از تابع هاي فعال.. ۳۱

شکل١-٨. شبکه عصبي دو لايه.. ۳۲

شکل ۲-۱٫لایه های شبکه عصبی ایجاد شده ……………………………………………………………………….۵۷

شکل ۳-۱٫ ساختار شبکه عصبی بهینه شده در مدلسازی میزان تخریب فتوکاتالیزی رنگهای آلی ………………………….۸۳

 

 

فصل اول

کلیات و بررسی منابع

 

  • مقدمه

QSAR[1] یکی از مهمترین مدل­های حوزه کمومتریکس است که اطلاعات بسیار ارزشمندی ارائه می­نماید. مدل­های QSAR معادلات ریاضی هستند که ساختار ترکیب را به محدوده وسیعی از خواص بیولوژیکی، شیمیائی و فیزیکی ربط می­دهند]١ [. در مطالعه حاضر، هدف اصلی کاربرد QSAR در رنگهای آلی، بدست آوردن مدل­های آماری قابل اعتماد برای پیشگوئی میزان تخریب فتوکاتالیزی آنها می­باشد. بدین منظور روش­های مختلف کمومتریکس نظیر شبکه عصبی مصنوعی (ANN) و رگرسیون خطی چندگانه (MLR) برای ساخت مدل­های  QSAR برای پیشگوئی تخریب فتوکاتالیزی برخی رنگهای آلی مورد ارزیابی قرار می­گیرد.

در سالهاي اخير براي كاهش  زمان  صرف شده  در آزمايشگاههاي شيمي  وپايين آوردن خطاهاي آزمايشگاهي  كه ناشي از خطاهاي  انساني و خطاهاي دستگاهي  مي­باشند، روش هاي تئوري گسترش يافته­اند، از روش هاي مهم مورد استفاده روش كمومتريكس[۲] مي­باشد، در واقع كمومتريكس يعني، استفاده از روش هاي تئوري رياضي و آمار در علوم مربوط به شيمي مي­باشد.

کمومتریکس یک شاخه علمی مهمی می­باشد که دارای کاربرد فراوانی در بیشتر زمینه های علوم  می­باشد. این شاخه علمی دارای گرایش­های مختلفی مانند بهینه­سازی، انتخاب و طراحی آزمایش، کالیبراسیون چند متغیره، ارتباط کمی ساختار – فعالیت و روش­های تشخیص الگو و طبقه­بندی

می­باشد. با توجه به گسترش مسائل زیستی و اهمیت و تاثیر آن­ها بر زندگی، امروزه کمومتری به عنوان علمی بسیار مهم و رو به گسترش و پیشرفت است. زمینه های مختلف شیمی از قبیل شیمی نظری، بیو­­شیمی، اکثر زمینه­های طیف­ سنجی و کروماتوگرافی می توانند از کمومتریکس استفاده نمایند. به طور کلی کمومتریکس بر روی زمینه خاصی تمرکز ندارد، بلکه ایده های کمومتریکس به طور مجزا در شاخه­های مختلف علمی و کاربرد پراکنده است[١].

از ابتدای دهه هشتاد میلادی، با پیشرفت علوم مختلف همچون علوم کامپیوتر و شیمی حجم بسیار زیادی از اطلاعات در مدت زمان نسبتا” کوتاه قابل حصول بوده است. به منظور بدست آوردن بهترین نتایج از داده­ها و همچنین استخراج اطلاعات مفید آزمایش­ها به یک سری از روش­های خاص نیاز می­باشد. همین نیاز موجب توسعه علم کمومتریکس شد که شامل هیبریدی از ریاضی، روش­های آماری و علوم کامپیوتری می­باشد. گروه­های متفاوتی با اهداف متفاوت علاقه­مند به استفاده از روش­های کمومتریکس هستند. بنابراین یک تعریف جهان شمول در مورد کمومتریکس وجود ندارد و هر گروه با توجه به زمینه کاری خود تعریف خاص از کمو متریکس ارائه می­دهد. با این وجود برخی تعاریف ارائه شده مناسب تر می­باشد مانند تعریف انجمن بین المللی کمومتریکس:

کمومتریکس علمی است که به بررسی اندازه­گیری­های انجام شده در یک سیستم شیمیایی و ارتباط آن با حالت سیستم مورد بررسی می­پردازد که در آن روش­های آماری، ریاضیات و کامپیوتر استفاده می­شود. علاوه بر این تعریف، افراد معتبر در این رشته مانند موسارت[۳] یا ولد[۴] نیز تعاریفی ارائه داده­اند.

موسارت تعریف زیر را در مورد کمومتریکس ارائه نموده است:

کمومتریکس روشی ریاضی، آماری و یا ترسیمی در محدوده علم شیمی می­باشد که هدف آن گسترش روش­هایی برای بدست آوردن حداکثر اطلاعات شیمیایی از سیستم مورد نظر می­باشد. کمومتریکس در زمینه­های مختلف و گستره­هایی همچون آنالیز داده­ها، کالیبراسیون، کنترل کیفیت، طراحی آزمایش و بررسی­های ساختار- فعالیت ترکیبات مختلف شیمیایی کاربرد فراوان دارد.

قابلیت­های متفاوت کمومتریکس موجب شده است که گروه­های مختلف انتظارات متفاوتی از این علم داشته باشند. بررسی تحقیقات انجام شده توسط گروه­های پژوهشی مختلف نشان می­دهد که رشته­هایی شامل گستره­ای از شیمی آلی، شیمی فیزیک، شیمی تجزیه و برخی رشته­های مهندسی شیمی نیز به استفاده از کمومتریکس علاقه نشان می­دهند.

امروزه حجم عظیم داده­های تولید شده به وسیله دستگاه­های پیشرفته موجب علاقه شیمیدان­های تجزیه به کمومتریکس شده است، این علاقه موجب توسعه روش­های موثری از این علم شده است. کمومتریکس از علم شیمی سرچشمه گرفته است و دارای کاربردهای فراوانی در رشته­هایی نظیر بیولوژی، علوم جنایی، شیمی غذایی ، شیمی خاک، کنترل محیط زیست و غیره می­باشد.

ارتباط بین کمومتریکس و شاخه­های مختلف علوم در شکل ۱-۱ نشان داده شده است.

این شکل نشان می­دهد که شیمی و کمومتریکس به یکدیگر مرتبط هستند، زیرا این دو علم موجب گسترش مرز­های یکدیگر می­شوند، به این صورت که اغلب روش­های کمومتریکس توسط گروه­های تحقیقاتی شیمی تجزیه توسعه داده شده­اند.

باید به این نکته توجه داشت که برای توسعه عمیق کمومتریکس آشنایی به علوم کامپیوتری و  برنامه­نویسی ضروری می­باشد. این نمودار نشان می­دهد که این علم نه تنها موجب توسعه روش­های تجزیه­ای شده است بلکه در روش­هایی که به نوعی وابسته به شیمی تجزیه هستند نیز تحولی شگرف ایجاد نموده است.

کاربردهای صنعتی، زیستی– محیطی و طراحی دارویی بخشی از این کاربرد­ها هستند. روش­های کمومتریکس را می­توان به دو گروه کلی تقسیم نمود. این تقسیم ­بندی در شکل ١-٢ نشان داده شده است.

 

شکل ١-٢. تقسیم­ بندی روش­های مختلف کمومتریکس

 

همانطور که در این شکل نشان داده شده است، یک سری از روش­ها مربوط به طریقه انجام آزمایش می­شوند. این روش­ها شامل نمونه­برداری و طراحی آزمایش هستند. در این روش ها سعی بر این است که آزمایش به چه صورت انجام پذیرد تا بیشترین داده­های مفید را تولید نماید. روش­های دیگر بعد از جمع­آوری داده­ها کاربرد دارند، در این روش­ها تلاش بر این است که حداکثر اطلاعات مفید از داده­ها استخراج گردد. این روش­ها شامل رابطه کمی ساختار- فعالیت، تشخیص الگو، مدل­سازی و تفکیک منحنی چند متغیره می­با شد[٢].

 

(١-٢) ارتباط کمی ساختار-  فعالیت QSAR

 

با استفاده از آنالیز QSAR امکان انتخاب ساختارهای مناسب از بین مجموعه ساختار­های گسترده وجود دارد. اساس روش QSAR ایجاد یک ارتباط کمی بین ویژگی­های مولکولی در یک سری نسبتا” گسترده از مولکول­ها می با­شد.

با استفاده از مدل توسعه­ داده شده، پیش­بینی فعالیت مولکول­های جدید امکان پذیر می­باشد. مطالعات QSAR دارای جنبه­های متفاوتی می­باشد که هر گروه پژوهشی بر روی یک جنبه از آن متمرکز شده است. بطور کلی چند زمینه مهم QSAR عبارت است از:

  • مطالعات کمی ساختار- فعالیت بر روی مولکولها
  • توسعه روش­های نوین انتخاب متغیر و مدل سازی در مطالعات کمومتریکس

 

٢١)  QSAR چیست؟

امروزه با وجود حجم فراوان اطلاعات و داده­ها به روش­هایی مناسب برای پردازش و استخراج اطلاعات نیاز می­با­شد. پیش­بینی و مدل­سازی که بنام ارتباط کمی ساختار- فعالیت شناخته می­شوند، یکی از این روش­ها است. اساس این روش بر پایه آمار می­باشد و به توسعه ارتباط بین خاصیت مشاهده شده و ویژگی ساختار مولکول مربوط می شود. یکی از مهم‌ترین کاربردهای کمومتریکس ارتباط کمی ساختار- فعالیت QSAR می‌باشد، که به نحوه ارتباط بین فعالیت بیولوژیکی و ساختار شیمیایی ترکیبات می‌پردازد. هدف از QSAR، ایجاد رابطه­ای منطقی بین کمیت‌ها و یا خواص ترکیبات (فعالیت) و ساختار شیمیایی آنها می‌باشد و این قانون برای مولکول‌های جدید مورد استفاده قرار می‌گیرد. QSAR برای اولین بار در قرن نوزدهم مورد استفاده قرار گرفت.

این روش برای نخستین بار توسط هانش[۵] و همکارانش بررسی شد. سپس کروس[۶] در مورد سمیت الکل ها و ارتباط آن­ها با خاصیت چربی­دوستی مطالعاتی انجام داد.

هانش همچنین مطالعاتی در مورد ثابت­های اسید­های آروماتیک آلی و ارتباط آنها به استخلاف­های اورتو و پارا انجام داد که می­توان آن را به عنوان اولین مطالعه کمی ساختار- فعالیت در نظر گرفت. به طور کلی می­توان مطالعاتQSAR  را به دو مجموعه کلی پیش­بینی­کننده[۷] و توصیف­کننده[۸] تقسیم نمود. جنبه پیش­بینی­کننده مطالعه، شامل ایجاد یک ارتباط ریاضی بین فعالیت بیولوژیکی و ساختار مولکول می­باشد. هدف از مطالعه پیش­بینی­کننده، سنتز مولکول­هایی با خواص بیولوژیکی مناسب و بهتر نسبت به مولکول­های اولیه مورد بررسی می­باشد.

هدف از انجام مطالعات توصیف­کننده بررسی نحوه عمل و تاثیر­گذاری بیولوژیکی مولکول­های مورد مطالعه می­باشد. برای مثال بررسی نحوه تاثیر­گذاری پارامتر­های مختلف در مکانیسم عمل یک دارو بر روی یک سایت پروتئین یکی از انواع مطالعات توصیف­کننده می­باشد[٣].

مطالعات QSAR و  QSPR به سه قسمت عمده تقسیم می‌شوند:

۱ ـ محاسبه و انتخاب توصیف‌کننده‌ها

۲ ـ مدل‌سازی و انتخاب بهترین مدل

۳ ـ ارزیابی اعتبار مدل‌های انتخاب شده

همان‌طور که می‌دانیم اساس QSAR مطالعه کمی بین ساختار و فعالیت است. برای رسیدن به این

مهم باید فعالیت بیولوژیکی یا سایر کمیت‌هایی که بیانگر خاصیت ویژه‌ای از آن ترکیبات می‌باشند، در شرایط آزمایشگاهی یکسان تعیین شده باشند، تا بتوان آنها را از لحاظ کمی بررسی کرد. مجموعه ترکیبات مورد مطالعه باید تا حدودی تشابهات ساختاری داشته باشند تا تعداد توصیف‌کننده‌های مورد نیاز برای ایجاد یک مدل مناسب، کم شود.

(١-٢-١-١) محاسبه و انتخاب  توصیف‌کننده‌ها

(١-٢-١-١-١) توصیف‌کننده‌های مولکولی:

توصیف‌کننده‌های مولکولی نتیجه نهایی یک استدلال و روش ریاضی است که اطلاعات شیمیایی را به رمز تبدیل می‌کند و آنها را به صورت یک نماد نشان می‌دهد که ارائه دهنده یک مولکول به صورت یک عدد مفید می‌باشد.

بکارگیری و تحلیل اطلاعات ساختار شیمیایی استفاده از توصیف‌کننده‌های مولکولی را ممکن ساخته است. توصیف‌کننده‌ها مقادیر عددی هستند که بیانگر ویژگی‌های مولکول می‌باشند. هر یک از این توصیف کننده‌ها اطلاعات خاصی از مولکول را در اختیار می‌گذارد. برای مثال ممکن است توصیف‌کننده‌ها، ویژگی‌های فیزیکی و شیمیایی یک مولکول باشند و یا آنها ممکن است مقادیر ناشی از بکارگیری روش‌های الگوریتمی برای ساختارهای مولکولی باشند.

توصیف‌کننده‌های مولکولی مختلفی برای اهداف گوناگون به کار برده شده‌اند. اختلاف این توصیف‌کننده‌ها در پیچیدگی اطلاعات رمزگذاری شده و زمان مورد نیاز برای محاسبه می‌باشد. بطورکلی، افزایش محاسبات مورد نیاز در هر مرحله به واسطه اختلافاتی هست که ناشی می‌شود. برای مثال وزن مولکولی ویژگی‌های مولکولی زیادی را نشان نمی‌دهد ولی محاسبه آن خیلی سریع می‌باشد. در مقایسه توصیف‌کننده‌هایی که بر اساس مکانیک کوانتومی بدست می‌آیند، خصوصیات دقیق زیادی ارائه می‌دهند، ولی زمان زیادی برای محاسبه مصرف می‌کنند.

(١-٢-١-١-١-١) توصیف‌کننده‌های توپولوژی

این توصیف‌کننده‌ها از روی گراف‌های مولکولی بدست می‌آیند. این توصیف‌کننده‌ها جزء ساده­ترین نوع توصیف‌کننده‌ها می‌باشند و به ساختار فضایی مولکول ارتباطی نداشته و تنها به نوع اتم، نوع پیوندها و نحوه ارتباط اتم‌ها به یکدیگر وابسته است. این پارامترها را می‌توان بدون بهینه کردن ساختار مولکول محاسبه کرد. از قبیل : تعداد اتم‌ها، شاخص‌های ارتباطی مولکولی و وزن مولکولی.

 

(١-٢-١-١-١-٢) توصیف‌کننده‌های هندسی

این توصیف‌کننده‌ها با ساختار سه­بعدی مولکول‌ها در ارتباط می‌باشند. برای محاسبه این توصیف‌کننده‌ها ابتدا می‌بایست ساختار فضایی مولکول‌ها بهینه شود. ازقبیل:

حجم مولکولی، مساحت سطح و مساحت سطح در دسترس حلال.

 

(١-٢-١-١-١-٣) توصیف‌کننده‌های شیمی کوانتومی

این توصیف‌کننده‌ها با استفاده از بهینه‌سازی نیمه تجربی ساختار مولکول‌ها در نرم‌افزارهای موپک[۹] و هایپرکم[۱۰] بدست می‌آیند.

از قبیل:

انرژی بالاترین تراز اشغال شده، انرژی پایین ترین تراز اشغال نشده، بار و الکترونگاتیویته اتم‌‌ها‌.

(١-٢-١-١-١-٤) توصیف‌کننده‌های فیزیک ‌وشیمیایی

این توصیف‌کننده‌ها بیانگر بعضی از خواص فیزیک ‌و شیمیایی مولکول‌ها می‌باشند که به ساختار مولکول وابستگی شدیدی نشان می‌دهند. از قبیل:

ضریب تقسیم آب- اکتانول، ویسکوزیته، میزان حلالیت ترکیبات در آب، شکست مولکولی، نقطه ذوب و نقطه جوش.

(١-٢-١-١-١-٥)توصیف‌کننده‌های ارتباطی مولکولی

شاخص‌های ارتباطی مولکولی، برخی اطلاعات را در موارد زیر فراهم می‌کند:

  • اندازه و ساختار مولکول
  • مرتبه شاخه‌دار شدن
  • نحوه ارتباط اتم‌ها در مولکول

 

(١-٢-١-٢) مدل‌سازی و انتخاب بهترین مدل

تا این مرحله انتخاب توصیف‌کننده‌ها براساس احتمالات و تشخیص نظری استوار است. بنابراین احتمال اینکه برخی از توصیف‌کننده‌ها برای مدل‌سازی مناسب نباشند وجود دارد و باید آنها را حذف کرد. توصیف‌کننده‌هایی که حذف می‌شوند معمولاً یک یا چند ویژگی زیر را دارند:

  • توصیف‌کننده‌هایی که کمتر از ١٠% مقادیر غیر صفر دارند یا دارای بیش از ٩٠% مقادیر یکسان باشند.
  • توصیف‌کننده‌هایی که با توصیف‌کننده‌های دیگر همبستگی بالایی دارند (٩/٠<r ).
  • توصیف‌کننده‌هایی که با متغیر وابسته، همبستگی کمی دارند و محاسبه آنها مشکل است.

با توجه به موارد فوق، تعدادی از توصیف‌کننده‌ها حذف می‌شوند و از پیچیدگی محاسبات جلوگیری می‌شود. در این مرحله می‌توان با استفاده از روش‌های آماری مختلف به جستجوی مدل پرداخت. مدل، در واقع یک رابطه ریاضی است که بیان کننده ارتباط بین متغیر وابسته (فعالیت) و متغیرهای مستقل (ویژگی‌های مولکول یا توصیف‌کننده‌ها) می‌باشد.

به کمک مدل می‌توان با داشتن مقادیر متغیرهای مستقل، متغیر وابسته را ارزیابی کرد. در این جا چون متغیر وابسته با چندین متغیر مستقل تشکیل مدل می‌دهد، از رگرسیون خطی چند گانه (MLR) استفاده می­شود. آناليز رگرسيون خطي يا غيرخطي چندگانه بعنوان يك ابزار آماري جهت استخراج مدل‌هاي كمي، بررسي ميزان اهميت مدل‌هاي مذكور و اهمیت هر متغير مستقل در معادله رگرسيون به كار مي‌رود[٤].

(۱-۲-۱-۳) ارزیابی اعتبار مدل‌های انتخاب شده

برای اطمینان از اینکه مدل بدست آمده، مدلی مناسب می­باشد باید یک سری از پارامترها در نظر گرفته شود. به طور کلی می‌توان گفت مدلی مناسب‌تر است که دارای ویژگی های زیر باشد:

  • تعداد متغیرهای مستقل آن از سایر مدل‌های دیگر کمتر باشد.
  • محاسبه متغیرهای مستقل آن ساده تر از سایر مدل‌ها باشد.
  • ضریب همبستگی بین توصیف‌کننده هایی که در مدل شرکت دارد کم باشد.
  • خطای استاندارد آن کم باشد.
  • آماره F بزرگ بوده و ضریب همبستگی آن به یک نزدیک باشد.
  • قدرت پیش بینی بالایی داشته باشد.

 

ارزش   [۱۱]F: از روي اين مقدار ميتوان بررسي كرد كه از بين چند مدل رگرسيون (به عنوان مثال مدل خطي، لگاريتمي، چند جمله اي، تواني، لگاريتم تواني و يا ميانگين متحرك) امتحان شده، كدام مدل از نظر آماري بهتر بر اطلاعات تجربي مطابقت پيدا كرده است. به عنوان يك اصل كلي، مدلهايي با  F-Valueبالاتر انطباق بهتري دارند.

نتايج  مطالعات QSAR علاوه بر شفاف­سازي نحوه ارتباط بين خواص ملكول‌ها و ويژگي‌هاي ساختماني آنها به پژوهشگران در پيش­‌بيني رفتار ملكول‌هاي جديد براساس رفتار ملكول‌هاي مشابه كمك مي‌كند. به مجموعه ابزارها و روش­هايي كه به اين منظور مورد استفاده قرار مي‌گيرند، روش‌هاي پارامتري گويند.

در روش‌هاي پارامتري سعي مي‌شود، بين يك مجموعه توصيف­كننده‌هاي ملكولي با فعاليت يا خاصيت مورد نظر ارتباط منطقي برقرار نمايند. توصيف‌كننده‌هاي ملكولي كه به اين منظور استفاده مي‌شوند، مقادير عددي مي‌باشند كه جنبه‌هاي مختلف ساختاري ملكول را به طور كمي نشان مي‌دهند. وقتی خصوصیات ساختاری گونه‌ها و فعالیت آنها توسط اعداد و ارقام بیان می‌شود می‌توان رابطه ریاضی یا کمی بین ساختار و فعالیت گونه ایجاد کرد. این رابطه می‌تواند برای پیش بینی پاسخ بیولوژیکی یا شیمیایی دیگر ساختارها مورد استفاده قرار گیرد[٤].

برخی از روش‌های پارامتری کمومتری به اختصار به شرح زیر است:

  • کالیبراسیون یک متغیره
  • کالیبراسیون چند متغیره

[۱] Quantitative structure activity realationshin

[۲] Chemometrics

[۳] Massart

[۴] Vold

[۵] Hansch

[۶] Cros

[۷] Predictive

[۸] Descriptor

[۹] MOPAC

[۱۰] HyperChem

[۱۱] F-value

۵۵۰۰۰ تومان – خرید
درباره این محصول نظر دهید !