پژوهش های انجام شده در رابطه با مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک ... |
در این روش یک مدل احتمالی مشخص برای دادهها در نظر گرفته شده و سپس پارامترها برآورد میشوند. در این گروه از الگوریتمها یک مدل چگالی آمیخته مطرح می شود و فرض می شود که دادهها از مخلوط شدن تعدادی منبع داده به وجود آمدهاند. هر یک از این منابع یک خوشه بالقوه در نظر گرفته می شود.
۳- خوشهبندی مبتنی بر بخشبندی[۹۸]
نام دیگر این روش خوشهبندی بر مبنای تابع هدف است که در آن اساس کار فرمولبندی تابع هدف میباشد. تابع هدف حاصل باید طبیعت مسئله را به خوبی نشان دهد تا بتوان از طریق کمینهسازی آن، ساختار معنیداری (خوشهها) را در دادههای مفروض آشکار ساخت. معروفترین و سادهترین الگوریتم خوشهبندی مبتنی بر بخشبندی، الگوریتم K-means است. این الگوریتم به خاطر سادگی اجرا، سادگی برنامه و کارایی آن استفاده فراوانی دارد [۱]. عملکرد کلی این روش به این صورت است که هدف ایجاد K خوشه است، بدین ترتیب که عناصر درون هر خوشه نسبت به میانگین رکوردهای آن خوشه که مرکز نامیده می شود بیشترین شباهت و با مراکز دیگر خوشهها بیشترین عدم شباهت را داشته باشند.
۲-۸-۵-۵-۲- معیارهای ارزیابی در خوشهبندی
تکنیکهای خوشهبندی برای تخصیص هر داده به خوشه مربوطه بر اساس یکی از معیارهای شباهت[۹۹] و یا عدم شباهت[۱۰۰] (یا فاصله) عمل می کنند. داده، در صورتی که بیشترین شباهت را با دادههای یک خوشه و یا بیشترین فاصله را با خوشههای دیگر داشته باشد، به خوشه منتسب می شود.
زمانی که مشاهدات به گونهای خوشهبندی شوند که هر خوشه در حداکثر تراکم باشد و حداکثر فاصله را با دیگر خوشهها داشته باشند، خوشه بندی خوبی انجامگرفته است [۱۱].
معیار شباهت، معیاری عددی است که میزان شباهت دو شیء داده را نسبت به یکدیگر نشان میدهد. هر چقدر دو شیء به یکدیگر شبیهتر باشند این معیار مقدار بالاتری دارد و معمولاً مقداری بین ۰ و ۱ دارد. معیارهای ارزیابی شباهت در جدول ۲-۶ نشان داده شده است.
n: تعداد ابعاد (ویژگیهای) ورودی، p و q: اشیاء داده ورودی، pk و qk: kامین ویژگی یا شیء داده ورودی میباشند.
جدول ۲-۶ معیارهای محاسبه شباهت در خوشهبندی
نام معیار | فرمول محاسبه |
کسین[۱۰۱] | d1 و d2 دو بردار متن میباشند |
جاکارد[۱۰۲] |
معیار فاصله نیز مقداری عددی است که میزان تفاوت دو شیء داده را نشان میدهد. هر چقدر دو شیء داده به یکدیگر شبیهتر باشند این معیار مقدار پایینتری خواهد داشت. معیارهای ارزیابی فاصله در جدول ۲-۷ ارائه شده است.
جدول ۲-۷ معیارهای محاسبه فاصله در خوشهبندی
نام معیار | فرمول محاسبه |
فاصله اقلیدسی | |
مینکوسکی | |
سیتی بلاک[۱۰۳] یا مانهاتان | if r=1 |
ماهالانوبیس[۱۰۴] |
فرم در حال بارگذاری ...
[یکشنبه 1400-08-16] [ 03:34:00 ق.ظ ]
|