Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Hybridmodeller för prediktiv modellering skapade med genetisk programmering.
University of Borås, School of Business and IT.
University of Borås, School of Business and IT.
2013 (Swedish)Independent thesis Basic level (degree of Bachelor)Student thesisAlternative title
Hybrid models for predictive modeling created with genetic programming. (English)
Abstract [sv]

Det finns idag ett stort behov av att kunna klassificera stora mängder data på ett effektivt sätt. Prediktiv modellering är ett område inom data mining där prediktioner kan utföras baserat på tidigare erfarenheter. Dessa prediktioner presenteras sedan i en modell. Avvägningen mellan tolkningsbarhet och träffsäkerhet är ett begrepp som beskriver hur träffsäkra modeller ofta är ogenomskinliga, medan genomskinliga modeller ofta har lägre träffsäkerhet. Detta är ett problem eftersom det finns ett behov av modeller som är både träffsäkra och tolkningsbara. I denna studie visas hur man kan gå till väga för att skapa en modell som har en träffsäkerhet i klass med en ogenomskinlig modell, men samtidigt har en högre tolkningsbarhet. Två algoritmer presenteras för att ta fram en hybridmodell som bygger på beslutsträd där en implementering av Random Forest hanteras som alternativa lövnoder. Kontrollerade experiment och statistiska tester genomfördes för att mäta hybridmodellens träffsäkerhet mot träffsäkerheten hos J48 och Random Forest. Träffsäkerheten mättes även mot beslutsträd som genererats av den genetiska programmeringen som finns implementerad i ramverket G-REX. Resultatet visar att hybridmodellen kan uppnå en träffsäkerhet som är jämförbar med Random Forest men samtidigt hanterar de vanliga prediktionslöven i genomsnitt 39,21% av instanserna. Alltså är den hybridmodell som presenteras i studien mer tolkningsbar än Random Forest utan att ha någon signifikant skillnad i träffsäkerhet.

Place, publisher, year, edition, pages
University of Borås/School of Business and IT , 2013.
Series
Kandidatuppsats ; 2013KSAI02
Keywords [en]
Data Mining, Genetisk programmering, Random Forest
Keywords [sv]
Maskininlärning, Hybriddatamodeller, Beslutsträd, Träffsäkerhet VS. Tolkningsbarhet
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:hb:diva-17316Local ID: 2320/12663OAI: oai:DiVA.org:hb-17316DiVA, id: diva2:1309224
Note
Program: SystemarkitekturutbildningenAvailable from: 2019-04-30 Created: 2019-04-30

Open Access in DiVA

fulltext(976 kB)15 downloads
File information
File name FULLTEXT01.pdfFile size 976 kBChecksum SHA-512
ee8fbc8edafda38e184ab70ef210c2a7376b19460b8d694b465881d3b42886a63f2af20b632316e06c3839b7780a35570e575d9bc393054fe54078e0c10d42c1
Type fulltextMimetype application/pdf

By organisation
School of Business and IT
Engineering and Technology

Search outside of DiVA

GoogleGoogle Scholar
Total: 15 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 8 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf