پایان نامه مدلسازی QSAR سمیت مایعات یونی |
دانشگاه مازندران
دانشکده شیمی
پایان نامه دوره کارشناسی ارشد در رشته شیمی گرایش تجزیه
عنوان:
مدلسازی QSAR سمیت مایعات یونی
چکیده
سمیت سلولی سری متنوعی از 227 مایع یونی (بدست آمده از پایگاه دادهی تاثیرات زیستی مایعات یونی UFT/Merck) حاوی 94 کاتیون ایمیدازولیوم، 53 پیریدینیوم، 23 پیرولیدینیوم، 22 آمونیوم، 15 پپریدینیوم، 10 مورفولینیوم، 5 فسفونیوم و 5 کویینولینیوم در ترکیب با 25 نوع آنیون متفاوت، با استفاده از پارامترهای ساختاری آنها و با بهرهگیری از رویکرد QSAR تخمین زده شد. مدلهای خطی و غیر خطی جهت پیشبینی سمیت مایعات یونی با استفاده از روشهای رگرسیون خطی چندگانه (MLR)، شبکهی عصبی پرسپترون چند لایه (MLP NN) و الگوریتم ژنتیک ساخته شدند. کیفیت و اعتبار مدلهای پیشنهادی نیز با استفاده از روشهای ارزیابی داخلی و خارجی مورد بررسی قرار گرفت. همچنین، قلمرو کاربرد مدل نیز برای مدل ارائه شده محاسبه گردید. نتایج حاصل نشان دادند که نیمهی کاتیونی مایعات یونی بیشترین سهم را در بروز فعالیت سمی این ترکیبات بر عهده داشته و نیمهی آنیونی دارای سهم کمتری میباشد. اطلاعات ساختاری ارائه شده در این کار میتواند جهت طراحی منطقی مایعات یونی ایمنتر مورد استفاده قرار گیرد.
واژههای کلیدی
مایعات یونی، شبکهی عصبی پرسپترون چندلایه، الگوریتم ژنتیک
فهرست مطالب
عنوان صفحه
1-4) نگاهی گذرا برمایعات یونی 5
2-1) جمعآوری سری دادهها………………………………………………………………………………………………………………..10
2-1-1) روشهای تقسیم بندی سری دادهها……………………………………………………………………………………………….10
2-1-1-1) تحلیل خوشهای (CA)……………………………………………………………………………………………………….11
2-1-1-2) انواع خوشهبندی……………………………………………………………………………………………… …………….12
2-1-1-3) اندازهگیری فاصله ……………………………………………………………………………………………………………13
2-1-1-4) دستهبندی تفکیکی……………………………………………………………………………………………………………14
2-1-1-4-1) دسته بندی مبهم C- میانگین………………………………………………………………………………………….14
2-1-1-4-2) الگوریتم دستهبندی QT………………………………………………………………………………………………15
2-1-1-4-3) خوشه بندی K- میانگین………………………………………………………………………………………………15
2-2) بهینهسازی ساختارهای مولکولی…………………………………………………………………………………………………………………………….17
2-3) محاسبه توصیفکنندههای مولکولی 17
2-3-1) توصیفکنندههای ساختاری………………………………………………………………………………………………………………………..19
2-3-2) توصیف کنندههای توپولوژیکی……………………………………………………………………………………………………………………19
2-3-2-1) توصیفکنندههای جزء……………………………………………………………………………………………………………………..19
2-3-2-2) اندیسهای توپولوژی 19
2-3-2-3) توصیفکنندههای زیرساختاری 20
2-3-2-4) توصیفکنندههای محیطی………………………………………………………………………………………………………………….20
2-3-3) توصیفکنندههای هندسی.. 20
2-3-4) توصیفکنندههای الکترونی.. 21
2-3-5) توصیفکنندههای فیزیکو شیمیایی………………………………………………………………………………………………………………..21
2-3-6) توصیفکنندههای توسعه یافته………………………………………………………………………………………………………………………21
2-3-7) توصیفکنندههای LFER……………………………………………………………………………………………………………………………22
2-4) تجزیه و تحلیل آماری توصیفکنندهها و انتخاب مؤثرترین آنها…………………………………………………………………………………..22
2-4-1) الگوریتم ژنتیک (GA)……………………………………………………………………………………………………………………………….23
2-4-1-1) اصول الگوریتمهای ژنتیکی…………………………………………………………………………………………………24 2-4-1-2) روشهای انتخاب…………………………………………………………………………………………………………………….25
2-5-1) رگرسیون خطی چندگانه…………………………………………………………………………………………………………..26
2-5-2) شبکههای عصبی پرسپترون چندلایه(MLP)…………………………………………………………………………………….27
2-5-2-1) تک نرون و ساختار (MLP)………………………………………………………………………………………………..28
2-5-2-2) پرسپترون چند لایه……………………………………………………………………………………………………………30
2-5-2-3) آموزش شبکههای عصبی MLP……………………………………………………………………………………………30
2-6) انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب شده 33
2-6-1) قلمرو کاربرد مدل………………………………………………………………………………………………………………….37
2-7) نرم افزارهای مورد استفاده………………………………………………………………………………………………………………………………………………………………38
2-7-1) بسته نرم افزاری Hyperchem………………………………………………………………………………………………………………………38
2-7-2) بسته نرم افزاری MOPAC…………………………………………………………………………………………………………………………..38
2-7-3) بسته نرم افزاریSTATISTICA 39
2-7-5) نرم افزار CODESSA………………………………………………………………………………………………………………………………..39
فصل سوم: مدلسازی QSAR سمیت مایعات یونی.. 41
3-1-1) سری دادهها………………………………………………………………………………………………………………………………………………43
3-1-2) محاسبه و پیشپردازش توصیفکنندهها…………………………………………………………………………………………………………53
3-1-3) انتخاب اعضای سریهای آموزشی و ارزیابی به روش خوشهبندی k-میانگین……………………………………………………….54
3-1-4) انتخاب بهترین توصیف کننده و مدلسازی خطی…………………………………………………………………………………………….55
3-1-5) مدلسازی غیر خطی با شبکهی عصبی مصنوعی پرسپترون چند لایه. 56
3-2-1) تفسیر توصیفکنندهها………………………………………………………………………………………………………………………………..75
3-2-2) بررسی نتایج……………………………………………………………………………………………………………………………………………..61
3-2-3) ارزیابی نتایج مدل………………………………………………………………………………………………………………………………………63
فصل چهارم: پیشبینی دمای ذوب مایعات یونی و نمکهای مربوطه با بهرهگیری از رویکرد QSPR.. 67
4-1-1) سری دادهها………………………………………………………………………………………………………………………………………………70
4-1-2) محاسبه و پیشپردازش توصیفکنندهها…………………………………………………………………………………………………………72
4-1-3) تقسیمبندی سری دادهها توسط روش تحلیل خوشهای……………………………………………………………………………………….73
4-1-4) انتخاب متغیر و مدلسازی خطی……………………………………………………………………………………………………………………74
4-1-5) مدلسازی به روش شبکهی عصبی پرسپترون چند لایه (MLP) 77
4-2-1) تفسیر توصیفکنندهها………………………………………………………………………………………………………………………………..79
4-2-2) ارزیابی نتایج مدلها…………………………………………………………………………………………………………………………………..81
4-3) جمعبندی نهایی…………………………………………………………………………………………………………………………………………………82
فهرست شکلها
عنوان صفحه
شکل 2-1: طرحی ساده از خوشه بندی سلسلهای…………………………………………………………………………………………………………….. 13
شکل 2-2: شمایی کلی از الگوریتم ژنتیک……………………………………………………………………………………………………………………. 25
شکل 2-3: شمایی کلی از یک نرون……………………………………………………………………………………………………………………………… 29
شکل 2-4: ساختار کلی پرسپترون تک لایه…………………………………………………………………………………………………………………….. 29
شکل 2-5: ساختار شبکه پیشرو دولایه با توابع سیگموید در لایه پنهان و لایه خروجی………………………………………………………….. 30
شکل 2-6: کمینه کلی و کمینه محلی……………………………………………………………………………………………………………………………. 31
شکل 2-7: ساختار کلی آموزش با ناظر…………………………………………………………………………………………………………………………. 32
شکل 3-1: شمایی از شبکهی بهینه شدهی پرسپترون………………………………………………………………………………………………………….. 57
شکل 3-2: نمودار مقادیر تجربی سمیت در برابر مقادیر محاسبه شده با مدل پرسپترون چند لایه……………………………………………….. 62
شکل 3-3: نتایج تحلیل حساسیت………………………………………………………………………………………………………………………………….. 63
شکل 3-4: قلمرو کاربرد مدل ارائه شده به صورت نمودار ویلیامز……………………………………………………………………………………… 64
شکل 1-4: نمودار حاصل از آنالیز خوشهای……………………………………………………………………………………………………………………. 76
شکل 4-2: نمودار تغییر ضریب همبستگی و لگاریتم خطای استاندارد مدل در برابر تعداد توصیفکنندهها…………………………………. 75
شکل 4-3: شبکهی عصبی پرسپترون طراحی شده جهت پیشبینی دمای ذوب مایعات یونی…………………………………………………….. 78
شکل 4-4: نمودار حاصل از تحلیل حساسیت…………………………………………………………………………………………………………………… 79
شکل 4-5: قلمرو کاربرد مدل……………………………………………………………………………………………………………………………………….. 81
فهرست جدولها
عنوان صفحه
جدول 3-1: سری دادههای سمیت تجربی و پیش بینی شده به صورت (log EC50)……………………………………………………………… 44
جدول 3-2: ماتریس ضرایب همبستگی بین توصیفکنندههای انتخاب شده………………………………………………………………………….. 55
جدول 3-3: آنیونهای متنوع به کار رفته در ساختار مایعات یونی موجود در سری داده………………………………………………………….. 60
جدول 3-4: پایههای کاتیونی به کار رفته در سری داده……………………………………………………………………………………………………… 61
جدول 3-5: نتایج حاصل از مدلهای خطی و غیر خطی…………………………………………………………………………………………………….. 62
جدول 4-1: مقادیر پیشبینی شده و تجربی دمای ذوب مایعات یونی……………………………………………………………………………………. 70
جدول 4-2: ماتریس ضرایب همبستگی بین توصیفکنندههای انتخاب شده………………………………………………………………………….. 76
جدول 4-3: ضرایب و آمارههای مدل MLR………………………………………………………………………………………………………………… 77
جدول 4-4: نتایج حاصل از مدلهای خطی و غیرخطی……………………………………………………………………………………………………… 78
برای دانلود متن کامل پایان نامه اینجا کلیک کنید.
فرم در حال بارگذاری ...
[چهارشنبه 1399-01-13] [ 12:49:00 ق.ظ ]
|