Clustering with Intelligent Linexk-Means

Document Type: research paper

Authors

1 Department of Statistics, Science and Research Branch, Islamic Azad University, Tehran, Iran

2 Department of Statistics, Faculty of Mathematics & Computer Science, Amirkabir University of Technology (Tehran Polytechnic), Tehran, Iran.

Abstract

The intelligent LINEX k-means clustering is a generalization of the k-means clustering so that the number of clusters and their related centroid can be determined while the LINEX loss function is considered as the dissimilarity measure. Therefore, the selection of the centers in each cluster is not randomly. Choosing the LINEX dissimilarity measure helps the researcher to overestimate or underestimate the centers which helps to assign some entities into a special cluster. We check the performance of the algorithm on some real and artificial datasets and evaluate the results according to some internal and external indexes.

Keywords


Article Title [Persian]

خوشه‌بندی با الگوریتم k- میانگین لاینکس هوشمند

Authors [Persian]

  • نرگس احمدزاده‌گلی 1
  • محمدحسن بهزادی 1
  • عادل محمدپور 2
1 گروه آمار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران
2 گروه آمار، دانشکده ریاضی و علوم کامپیوتر، دانشگاه صنعتی امیرکبیر، تهران، ایران
Abstract [Persian]

خوشه‌بندی k- میانگین لاینکس هوشمند یک تعمیم از خوشه‌بندی k- میانگین است که در آن تعداد خوشه‌‌ها و مراکز مربوطه را می‌توان مشخص کرد در حالی که تابع زیان لاینکس به‌عنوان معیار عدم‌تشابه در نظر گرفته می‌شود. بنابراین انتخاب مراکز در هر خوشه تصادفی نیست. انتخاب معیار عدم‌تشابه لاینکس به پژوهش‌گر کمک می‌کند تا مراکز را در صورت نیاز بیش برآورد یا کم برآورد نماید که سبب می‌شود برخی مشاهدات به خوشه‌ای خاص هدایت شوند. در این پژوهش، کارکرد الگوریتم یاد شده بر برخی پایگاه داده‌های واقعی و شبیه‌سازی‌ شده بررسی می‌شود و نتایج با توجه به برخی معیارهای درونی و بیرونی ارزیابی می‌شود.

Keywords [Persian]

  • معیار عدم تشابه
  • k-میانگین هوشمند
  • خوشه‌بندی
  • تابع زیان لاینکس