A new approach based on data envelopment analysis with double frontiers for ranking the discovered rules from data mining

Document Type: research paper

Author

Department of Applied Mathematics, Parsabad Moghan Branch, Islamic Azad University, Parsabad Moghan, Iran.

Abstract

Data envelopment analysis (DEA) is a relatively new data oriented approach to evaluate performance of a set of peer entities called decision-making units (DMUs) that convert multiple inputs into multiple outputs. Within a relative limited period, DEA has been converted into a strong quantitative and analytical tool to measure and evaluate performance. In an article written by Toloo et al. (2009), they proposed a new DEA model to find the most efficient association rule in data mining. Considering several criteria, they created an algorithm for ranking association rules using this model. In the present article, we show that their model only selects an optimistic efficient association rule randomly and it is completely dependent on solution or software, which is used for solving problems. In addition, it shows that their proposed algorithm can only rank optimistic efficient rules randomly and it is not able to rank optimistic non-efficient DMUs. We mention other disadvantages and propose a new approach “DEA with double frontiers” to create a complete ranking of association rules. A numerical example will explain some contents of the paper.

Keywords


Article Title [Persian]

یک رویکرد جدید مبتنی بر تحلیل پوششی داده‌ها با مرز دوگانه برای رتبه‌بندی قواعد کشف شده از داده‌کاوی

Author [Persian]

  • حسین عزیزی
استادیار، گروه ریاضی، واحد پارس‌آباد مغان، دانشگاه آزاد اسلامی، پارس‌آباد مغان، ایران.
Abstract [Persian]

تحلیل پوششی داده‌ها (DEA) یک رویکرد نسبتاً جدید با ماهیت داده‌ای برای ارزیابی عملکرد مجموعه‌ای از موجودیت‌های همتا به نام واحدهای تصمیم‌گیری (DMUها) است که چندین ورودی را به چندین خروجی تبدیل می‌کنند. DEA در دوره‌ی زمانی نسبتاً محدودی تبدیل به ابزار کمّی و تحلیلی قدرتمندی برای اندازه‌گیری و ارزیابی عملکرد شده است. در مقاله‌ای به قلم طلوع و همکاران [5]، آنها یک مدل DEAی جدید برای پیدا کردن کارآترین قاعده‌ی ارتباطی در داده‌کاوی پیشنهاد کردند. آنگاه، با استفاده از این مدل، آلگوریتمی برای رتبه‌بندی قواعد ارتباطی با در نظر گرفتن معیارهای متعدد ایجاد کردند. در این مقاله، ما نشان می‌دهیم که مدل آنها تنها یک قاعده‌ی ارتباطی کارآی خوشبینانه را به طور شانسی انتخاب می‌کند و کاملاً وابسته به روش حل یا برنامه‌ی نرم‌افزاری است که برای حل مسئله استفاده می‌شود. به علاوه، نشان داده می‌شود که آلگوریتم پیشنهادی آنها تنها می‌تواند قواعد کارآی خوشبینانه را به طور تصادفی رتبه‌بندی کند، و قادر به رتبه‌بندی DMUهای غیرکارآی خوشبینانه نیست. همچنین، به معایب دیگری در این مقاله، اشاره می‌کنیم و رویکرد جدید «DEA با مرز دوگانه» را برای ایجاد یک رتبه‌بندی کامل قواعد ارتباطی پیشنهاد می‌کنیم. یک مثال عددی برخی از محتویات مقاله را توضیح خواهد داد.

Keywords [Persian]

  • تحلیل پوششی داده‌ها
  • داده‌کاوی
  • کارآیی‌های خوشبینانه و بدبینانه
  • عملکرد کلی