Regelextraktionssystem familj

Regelextraktionssystemet (RULES) familjen är en familj av induktiv inlärning som inkluderar flera täckande algoritmer. Denna familj används för att bygga en prediktiv modell baserad på givna observationer. Det fungerar baserat på konceptet separat-och-erövra för att direkt inducera regler från en given träningsuppsättning och bygga dess kunskapsförråd.

Algoritmer under RULES-familjen är vanligtvis tillgängliga i datautvinningsverktyg, såsom KEEL och WEKA , kända för kunskapsutvinning och beslutsfattande.

Översikt

REGLER-familjens algoritmer används huvudsakligen i datautvinning för att skapa en modell som förutsäger åtgärderna för en given ingångsfunktion. Det går under paraplyet induktiv inlärning, som är ett tillvägagångssätt för maskininlärning. I denna typ av lärande förses agenten vanligtvis med tidigare information för att få beskrivande kunskap baserat på givna historiska data. Det är alltså ett övervakat lärandeparadigm som fungerar som ett dataanalysverktyg, som använder kunskapen som erhållits genom träning för att nå en allmän slutsats och identifiera nya objekt med den producerade klassificeraren.

Induktivt lärande hade delats upp i två typer: beslutsträd (DT) och täckande algoritmer (CA). DTs upptäcker regler med hjälp av beslutsträd baserat på konceptet dela-och-härska, medan CA direkt inducerar regler från träningsuppsättningen baserat på konceptet separat och erövra. Även om DT-algoritmer var välkända under de senaste decennierna, började CA locka uppmärksamheten på grund av dess direkta regelinduktionsegenskap, vilket betonades av Kurgan et al. [1]. Under denna typ av induktivt lärande har flera familjer utvecklats och förbättrats. REGEL-familjen [2], känd som regelextraktionssystem, är en familj av täckande algoritmer som separerar varje instans eller exempel när de inducerar de bästa reglerna. I denna familj lagras de resulterande reglerna i strukturen "OM villkor DÅ slutsats". Den har sin egen induktionsprocedur som används för att inducera de bästa reglerna och bygga upp kunskapsförrådet.

Induktionsprocedur

För att inducera de bästa reglerna baserat på en given observation, börjar RULES-familjen med att välja (separera) ett fröexempel för att bygga en regel, villkor för villkor. Den regel som täcker de mest positiva exemplen och de minst negativa exemplen väljs som den bästa regeln för det aktuella fröexemplet. Det tillåter den bästa regeln att täcka några negativa exempel för att hantera den ökade flexibiliteten och minska överanpassningsproblemet och bullriga data i regelinduktionen. När täckningsprestandan når en specificerad tröskel markerar den exemplen som matchar de inducerade reglerna utan radering. Detta förhindrar upprepning av att upptäcka samma regel samt bevarar täckningsprecisionen och allmänheten hos nya regler. Därefter upprepas algoritmen för att välja (erövra) ett annat fröexempel tills alla exempel är täckta. Därför kan endast en regel genereras vid varje steg.

Algoritmer

Flera versioner och algoritmer har föreslagits i RULES-familjen och kan sammanfattas enligt följande:

RULES-1 [3] är den första versionen i RULES-familjen och föreslogs av prof. Pham och prof. Aksoy 1995.
RULES-2 [4] är en uppgraderad version av RULES-1, där varje exempel studeras separat.
RULES-3 [5] är en annan version som innehöll alla egenskaper för RULES-2 såväl som andra ytterligare funktioner för att generera mer allmänna regler.
RULES-3Plus [6] är en utökad version av RULES-3 med ytterligare två funktioner.
RULES-4 [7] är den första inkrementella versionen i RULES-familjen.
RULES-5 [8] är den första RULES-versionen som hanterar kontinuerliga attribut utan diskretisering. Den utökades också för att producera RULES-5+[9], som förbättrar prestandan med hjälp av ett nytt regelutrymmesrepresentationssystem.
RULES-6 [10] är en skalbar version av RULES-familjen utvecklad som en förlängning av RULES-3 plus.
RULES-F [11] är en förlängning av RULES-5 som hanterar inte bara kontinuerliga attribut utan även kontinuerliga klasser. Ett nytt regelutrymmesrepresentationssystem integrerades också för att producera en utökad version kallad RULES-F+ [9].
RULES-SRI [12] är en annan skalbar RULES-algoritm, utvecklad för att förbättra RULES-6-skalbarheten.
Rule Extractor-1 (REX-1) [13] är en förbättring av RULES-3, RULES-3 Plus och RULES-4 för att förkorta processtiden och producera enklare modeller med färre regler.
RULES-IS [14] en inkrementell algoritm inspirerad av immunsystemet.
RULES-3EXT [15] är en förlängning av RULES-3 med ytterligare funktioner.
RULES-7 [16] är en förlängning av RULES-6, där den tillämpar specialisering över ett frö i taget.
REGLER-8 [17] är en förbättrad version som hanterar kontinuerliga attribut online.
RULES-TL [18] är en annan skalbar algoritm som föreslogs för att förbättra prestandan och hastigheten samtidigt som den introducerar mer intelligenta aspekter.
RULES-IT [19] är en inkrementell version som är byggd baserad på RULES-TL för att stegvis hantera stora och ofullständiga problem.

Ansökningar

Täckande algoritmer, i allmänhet, kan tillämpas på alla applikationsfält för maskininlärning, så länge det stöder dess datatyp. Witten, Frank och Hall [20] identifierade sex huvudsakliga applikationer som aktivt används som ML-applikationer, inklusive försäljning och marknadsföring, bedömningsbeslut, bildscreening, belastningsprognoser, diagnostik och webbmining.

RULES-algoritmer, i synnerhet, användes i olika tillverknings- och ingenjörstillämpningar [21]. RULES-3 EXT tillämpades också över signaturverifiering och algoritmens prestanda verifierades av Aksoy och Mathkour [22]. Nyligen har Salem och Schmickl [23] studerat effektiviteten av RULEs-4 i predating agents densitet.

Se även

[1] LA Kurgan, KJ Cios och S. Dick, "Mycket skalbar och robust regellärare: prestationsutvärdering och jämförelse," IEEE SYSTEMS, MAN, AND CYBERNETICS—DEL B: CYBERNETICS, vol. 36, s. 32–53, 2006.

[2] MS Aksoy, "A review of rule family of algorithms," Mathematical and Computational Applications, vol. 13, s. 51–60, 2008.

[3] DT Pham och MS Aksoy, "REGLER: Ett enkelt regelextraktionssystem," Expert Systems with Applications, vol. 8, s. 59–65, 1995.

[4] DT Pham och MS Aksoy, "En algoritm för automatisk regelinduktion," Artificial Intelligence in Engineering, vol. 8, s. 277–282, 1993.

[5] DT Pham och MS Aksoy, "En ny algoritm för induktiv inlärning," Journal of Systems Engenering, vol. 5, s. 115–122, 1995.

[6] DT Pham och SS Dimov, "The RULES-3 Plus inductive learning algorithm," i In Proceedings of the Third World Congress on Expert Systems, Seoul, Korea, 1996, s. 917–924.

[7] DT Pham och SS Dimov, "An algorithm for incremental inductive learning," Journal of Engineering Manufacture, vol. 211, s. 239–249, 1997.

[8] D. Pham, S. Bigot och S. Dimov, "REGLER-5: en regelinduktionsalgoritm för klassificeringsproblem som involverar kontinuerliga attribut," i Institution of Mechanical Engineers, 2003, s. 1273–1286.

[9] S. Bigot, "A new rule space representation scheme for rule induction in classification and control applications," Proceedings of the Institution of Mechanical Engineers, Del I: Journal of Systems and Control Engineering, 2011.

[10] DT Pham och AA Afify, "RULES-6: A Simple Rule Induction Algorithm for Supporting Decision Making," i 31st Annual Conference of IEEE Industrial Electronics Society (IECON '05), 2005, s. 2184–2189.

[11] DT Pham, S. Bigot och SS Dimov, "RULES-F: A fuzzy inductive learning algorithm," Proceedings of the Institution of Mechanical Engineers, Del C: Journal of Mechanical Engineering Science, vol. 220, s. 1433–1447, 2006.

[12] AA Afify och DT Pham, "SRI: A Scalable Rule Induction Algorithm," Proceedings of the Institution of Mechanical Engineers, Del C: Journal of Mechanical Engineering Science, vol. 220, s. 537–552, 2006.

[13] Ö. Akgöbek, YS Aydin, E. Öztemel och MS Aksoy, "En ny algoritm för automatisk kunskapsinhämtning vid induktivt lärande," Knowledge-Based Systems, vol. 19, s. 388–395, 2006.

[14] DT Pham och AJ Soroka, "En immunnätverksinspirerad regelgenereringsalgoritm (RULES-IS)," i Third Virtual International Conference on Innovative Production Machines and Systems, WhittlesDunbeath, 2007.

[15] HI Mathkour, "RULES3-EXT Improvement on RULES-3 Induction Algorithm," Mathematical and Computational Applications, Vol. 15, nr 3, sid., 2010, vol. 15, s. 318–324, 2010.

[16] K. Shehzad, "EDISC: En klassanpassad diskretiseringsteknik för regelbaserad klassificering," IEEE Transactions on Knowledge and Data Engineering, vol. 24, s. 1435–1447, 2012.

[17] D. Pham, "En ny regelinduktionsalgoritm med förbättrad hantering av kontinuerliga värderade attribut," Doctor of Philosophy, School of Engineering, Cardiff University, Cardiff, 2012.

[18] H. ElGibreen och MS Aksoy, "RULES – TL: A simple and Improved RULES Algorithm for Incomplete and Large Data," Journal of Theoretical and Applied Information Technology, vol. 47, s. 28–40, 2013.

[19] H. Elgibreen och M. Aksoy, "RULES-IT: incremental transfer learning with RULES family," Frontiers of Computer Science, vol. 8, s. 537–562, 2014.

[20] IH Witten, E. Frank och MA Hall, Data Mining Practical Machine Learning Tools and Techniques, tredje upplagan: Morgan Kaufmann, 2011.

[21] D. Pham och A. Afify, "Machine-learning techniques and their applications in manufacturing," Proceedings of the Institution of Mechanical Engineers Part B Journal of Engineering Manufacture, vol. 219, s. 395–412, 2005.

[22] MS Aksoy och H. Mathkour, "Signaturverifiering med regler 3-ext induktivt inlärningssystem," International Journal of the Physical Sciences, vol. 6, s. 4428–4434, 2011.

[23] Z. Salem och T. Schmickl, "Effektiviteten hos RULES-4 klassificeringsinlärningsalgoritmen för att förutsäga tätheten av agenter," Cogent Engineering, vol. 1, sid. 986262, 2014.