شکل(۱- ۲۰): ساختار یک MLP سه لایه
۱-۸-۶- ترتیب ارائه داده ها به شبکه
ارائه داده های آموزش به شبکه به روش های مختلفی انجام می­گیرد:
۱- داده ها به ترتیب به شبکه وارد می­شوند.
۲- داده ها به صورت تصادفی به شبکه ارائه می­شوند.
۳- یک داده مکرراً به شبکه ارائه می­گردد تا هنگامی که معیار خطا به یک مقدار قابل قبول برسد، سپس داده بعدی وارد شبکه می­ شود.
از بین روش های ذکر شده، ارائه تصادفی داده ها به شبکه، بهترین نرخ همگرایی و کاهش خطا را در حین آموزش داراست. همچنین اصلاح وزنها می ­تواند بعد از ارائه کل داده های آموزش، یا بعد از ارائه هر داده و یا بعد از ارائه تعداد مشخصی داده به شبکه صورت گیرد.
۱-۸-۷- تابع انتقال
تابعی که ورودیهای یک نرون را تبدیل می­ کند، مستقیماً فرایند یادگیری را تحت تأثیر قرار می­دهد. برای انتقال ورودیهای یک نرون از هر تابعی می­توان استفاده کرد، اما معمولاً توابع خطی، سیگموئید و تانژانت هایپربولیک به کار می­رود.
مقاله - پروژه
ساده ترین تابع، تابع خطی است که ورودیهای یک نرون را بدون تغییر به لایه بعدی یا به محیط انتقال می­دهد، در نتیجه دامنه آن ∞- تا ∞+ می­باشد. تابع خطی می ­تواند در لایه ورودی و یا لایه خروجی به کار رود، اما استفاده از آن در لایه مخفی فرایند یادگیری را مختل می­ کند.
اغلب برای شبکه های چند لایه ای از تابع انتقال سیگموئید استفاده می­ شود. تابع سیگموئید خروجی های بین (۱و۰) تولید می­ کند که درآن ورودیهای نرون از ∞- به سوی ∞+ می­رود.
(۱-۴۹)
همچنین در بعضی موارد ممکن است از تابع انتقال تانژانت هایپربولیک استفاده شود.
(۱-۵۰)

شکل(۱- ۲۱): تابع انتقال سیگموئید
شکل(۱- ۲۲): تابع انتقال تانژانت هایپربولیک
این دو نوع تابع معرفی شده پر استفاده ترین توابع در شبکه های عصبی هستند. اما توابع انتقال مختلف دیگر می­توانند خلق شوند و اگر لازم باشد با الگوریتم پس انتشار مورد استفاده قرار گیرند.
۱-۸-۸- پایان آموزش
مسأله دیگری که در الگوریتم یادگیری مطرح است این است که چه هنگام باید آموزش خاتمه یابد. برای این کار یکی از سه روش زیر می ­تواند استفاده شود:
۱- یک مقدار ثابت برای تعداد دورهای (Epoch) ارائه کل داده ها به شبکه در نظر گرفته شود. اگر در انتهای آموزش نتایج رضایت بخش نبود، مراحل دوباره تکرار شود.
۲- در حین آموزش بعد از هر n دور ارائه داده ها به شبکه، آموزش موقتاً متوقف شده و عملکرد شبکه سنجیده شود. سنجش عملکرد شبکه می ­تواند در برابر سری داده های آموزش یا سری داده های Cross Validation صورت گیرد.
۳- دو روش بالا برای معیار خاتمه آموزش می­توانند ترکیب شوند.
عموماً عملکرد یک شبکه عصبی در برابر یک سری داده Cross Validation امتحان می­ شود تا نتایج آینده شبکه مورد قضاوت قرار گیرد و همچنین از آموزش بیش از حد شبکه جلوگیری شود.
۱-۸-۹- تعداد نرون در لایه ها
تعداد نرون در لایه ورودی به تعداد پارامترهای مستقل مؤثر بر پدیده مورد بررسی می­باشد. همچنین تعداد نرون در لایه خروجی برابر با تعداد متغیرهایی است که باید پیش بینی شوند. تعداد نرون در لایه مخفی متغیری است که باید تعیین شود. معمولاً مقدار این متغیر بر پایه سعی و خطا با توجه به نتایج شبکه تعیین می­ شود، اما روش های تئوری متعددی نیز برای تعیین این متغیر وجود دارد­[۲۵]. همچنین می­توان از روش های بهینه سازی مانند الگوریتم ژنتیک برای یافتن مقدار بهینه تعداد نرونها در لایه مخفی استفاده کرد.
۱-۸-۱۰- معیار‌های نیکویی برازش
معمولاً از معیار‌های آماری مختلفی برای سنجش عملکرد شبکه عصبی استفاده می‌شود که مهم‌ترین آن‌ها عبارتند از:
تحلیل رگرسیون
با بهره گرفتن از برازش می‌توان نتایج پیش‌بینی شده‌ی شبکه را در برابر خروجی مطلوب در نموداری که به‌عنوان نمودار تحلیل رگرسیون است (متغییر مستقل  در مقابل متغییر وابسته  رسم می‌شود) رسم کرد. مطابق رابطه‌ی (۱-۵۳)، دو معیار a وb، را محاسبه کرد که هر چه مقدار b نزدیک به ۱ و هر چه مقدار a نزدیک به صفر باشد، بیان‌کننده‌ی مناسب بودن عملکرد به‌کار رفته است.

(۱-۵۳)
ضریب همبستگی[۴۷]
ضریب همبستگی، بیان‌کننده‌ی میزان همبستگی بین نتایج پیش‌بینی شده‌ی شبکه و داده‌های واقعی می‌باشد و به‌عبارتی از تقسیم کوواریانس متغیر‌های مستقل و وابسته، بر انحراف معیار آن‌ها به‌دست می‌آید. مطابق رابطه‌ی (۱-۵۴)، می‌توان ضریب همبستگی را محاسبه کرد. بدیهی است که هر چه مقدار این ضریب به عدد ۱ نزدیکتر باشد، نشان‌دهنده‌ی نزدیکی بیشتر مقادیر پیش‌بینی شده با مقادیر واقعی است.

(۱-۵۴)
که در آن:
: مقادیر مشاهده شده (واقعی).
: میانگین مقادیر مشاهده شده (واقعی).
: مقادیر تخمینی (خروجی شبکه).
: میانگین مقادیر تخمینی (خروجی شبکه)، می‌باشد.
مجذور میانگین مربعات خطا[۴۸]
یک شاخص مناسب‌تر که می‌توان از آن در برآورد میزان دقت شبکه استفاده کرد، مجذور میانگین مربعات خطا می‌باشد. این معیار، دقت مدل را بر اساس تفاضل بین مقادیر واقعی و مقادیر پیش‌بینی شده، ارزیابی می‌کند و طبیعتاً هرچه به صفر نزدیک‌تر باشد، نمایانگر اختلاف کمتری بین آن‌ها خواهد بود. مجذور میانگین مربعات خطا با رابطه‌ی (۱-۵۵) تعریف می‌شود.

(۱-۵۵)
که در آن، n تعداد داده‌ها وسایر پارامتر‌ها مانند رابطه‌ی (۱-۵۴) می‌باشند.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...