Data mining och big data

Data mining och big data

Vad är datamining algoritmer?

En algoritm är ett antal regler eller processer som följs för att lösa ett problem. Algoritmer använd i högre grad för att producera nyheter och produkter. Det finns olika typer av datamining algoritmer.

kNN
Klassificerings algoritm

AdaBoost
Inlärningsalgoritm som tar flera inlärningsalgoritmer (t.ex. beslutsmodeller) och kombinerar dem.

Verktyg:
scikit-learn
ICSIBoost
gbm: Generalized Boosted Regression Models

PSO
Partikel svärm optimering (PSO, eng= Particle swarm optimization) är en artificiell intelligens (AI) teknik som först publicerades 1995 som en modell för socialt beteende. Tekniken bygger på  fågel hur fåglar flockas och ha.r används inom bla SEO.

EM
Statistisk algoritm som ser på fördelningskurva.
Cluster algoritm

Apriori
Exempel på verktyg är Artool, Weka, och orange.

C4.5
C4.5 konstruerar en klassificerare i form av ett beslutsträd. För att göra detta, är C4.5 ges en uppsättning data som representerar saker som redan är klassificerade.
Exempel på verktyg: OpenTox. Orange, ett open-source datavisualisering och analysverktyg för data mining.

Support vector machines
Support vektor maskin (SVM) lär en hyper att klassificera data till 2 klasser. Vid en hög nivå, SVM utför en liknande uppgift som C4.5 utom SVM inte använder beslutsträd.

k-means
Det är en populär klusteranalys teknik för att utforska en datamängd.

 • Apache Mahout
 • Julia
 • R
 • SciPy
 • Weka
 • MATLAB
 • SAS

Naive Bayes
CARTWP Business Intelligence

Webbaserade datamining algoritmer

 • PageRank: Grundalgoritmen i Googles sökningar. Har inte uppdaterats på några år.
 • MozRank: Används av Moz.com för att klassificera sajter
 • TrustFlow: Används av Majestic.com för att klassificera kvaliteten på länkar
 • CitationFlow: Används av Majestic.com för att klassificera kvantitet på länkar
 • Seo-visibility: Används av Searchmetric för att visa synligheten man har på alla sökord. Den visar inte lika stor datamängd som Google Webmaster Tool

Källa:
http://rayli.net/blog/data/top-10-data-mining-algorithms-in-plain-english

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *