در این روش یک مدل احتمالی مشخص برای داده‌ها در نظر گرفته شده و سپس پارامترها برآورد می­شوند. در این گروه از الگوریتم­ها یک مدل چگالی آمیخته مطرح می­ شود و فرض می­ شود که داده‌ها از مخلوط شدن تعدادی منبع داده به وجود آمده­اند. هر یک از این منابع یک خوشه بالقوه در نظر گرفته می­ شود.
پایان نامه - مقاله - پروژه
۳- خوشه‌بندی مبتنی بر بخش‌بندی[۹۸]
نام دیگر این روش خوشه‌بندی بر مبنای تابع هدف است که در آن اساس کار فرمول­بندی تابع هدف می­باشد. تابع هدف حاصل باید طبیعت مسئله را به خوبی نشان دهد تا بتوان از طریق کمینه­سازی آن، ساختار معنی­داری (خوشه‌ها) را در داده‌های مفروض آشکار ساخت. معروف­ترین و ساده­ترین الگوریتم خوشه‌بندی مبتنی بر بخش‌بندی، الگوریتم K-means است. این الگوریتم به خاطر سادگی اجرا، سادگی برنامه و کارایی آن استفاده فراوانی دارد [۱]. عملکرد کلی این روش به این صورت است که هدف ایجاد K خوشه است، بدین ترتیب که عناصر درون هر خوشه نسبت به میانگین رکوردهای آن خوشه که مرکز نامیده می­ شود بیشترین شباهت و با مراکز دیگر خوشه‌ها بیشترین عدم شباهت را داشته باشند.
۲-۸-۵-۵-۲- معیارهای ارزیابی در خوشه‌بندی
تکنیک­های خوشه‌بندی برای تخصیص هر داده به خوشه مربوطه بر اساس یکی از معیارهای شباهت[۹۹] و یا عدم شباهت[۱۰۰] (یا فاصله) عمل می­ کنند. داده، در صورتی که بیشترین شباهت را با داده‌های یک خوشه و یا بیشترین فاصله را با خوشه­های دیگر داشته باشد، به خوشه منتسب می­ شود.
زمانی که مشاهدات به گونه‌ای خوشه‌بندی شوند که هر خوشه در حداکثر تراکم باشد و حداکثر فاصله را با دیگر خوشه‌ها داشته باشند، خوشه بندی خوبی انجام‌گرفته است [۱۱].
معیار شباهت، معیاری عددی است که میزان شباهت دو شیء داده را نسبت به یکدیگر نشان می‌دهد. هر چقدر دو شیء به یکدیگر شبیه­تر باشند این معیار مقدار بالاتری دارد و معمولاً مقداری بین ۰ و ۱ دارد. معیارهای ارزیابی شباهت در جدول ۲-۶ نشان داده شده است.
n: تعداد ابعاد (ویژگی‌های) ورودی، p و q: اشیاء داده ورودی، pk و qk: kامین ویژگی یا شیء داده ورودی می­باشند.
جدول ۲-۶ معیارهای محاسبه شباهت در خوشه‌بندی

 

نام معیار فرمول محاسبه
کسین[۱۰۱] d1 و d2 دو بردار متن می­باشند
جاکارد[۱۰۲]  

معیار فاصله نیز مقداری عددی است که میزان تفاوت دو شیء داده را نشان می‌دهد. هر چقدر دو شیء داده به یکدیگر شبیه­تر باشند این معیار مقدار پایین­تری خواهد داشت. معیارهای ارزیابی فاصله در جدول ۲-۷ ارائه شده است.
جدول ۲-۷ معیارهای محاسبه فاصله در خوشه‌بندی

 

نام معیار فرمول محاسبه
فاصله اقلیدسی  
مینکوسکی  
سیتی بلاک[۱۰۳] یا مانهاتان if r=1
ماهالانوبیس[۱۰۴]  
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...