types machine learning
Denne vejledning forklarer typer maskinindlæring, dvs. overvåget, ikke-overvåget, forstærkning og semi-overvåget læring med enkle eksempler. Du vil også lære forskelle mellem overvåget vs ikke-overvåget læring:
I Forrige vejledning , vi har lært om maskinlæring, dens arbejde og applikationer. Vi har også set en sammenligning af maskinlæring mod kunstig intelligens.
Machine Learning er et videnskabsfelt, der beskæftiger sig med computerprogrammer, der lærer gennem erfaring og forudsiger output.
Hovedtræk ved ML er at lære af erfaring. Læringen sker, når systemet fodret med træningsinputdata foretager ændringer i dets parametre og justerer sig til at give det ønskede output. Outputtet er den målværdi, der er defineret i træningsdataene.
=> Læs gennem den komplette maskinlæringstræningsserie
Hvad du lærer:
- Typer af maskinindlæring
- Virkelig eksempel på overvåget og ikke-overvåget læring
- Forskellen mellem overvåget og ikke-overvåget læring
- Semi-overvåget læring
- Konklusion
Typer af maskinindlæring
Machine Learning-programmer er klassificeret i 3 typer som vist nedenfor.
- Overvåget
- Uden opsyn
- Forstærkningslæring
Lad os forstå hver af disse i detaljer !!
# 1) Overvåget læring
Overvåget læring sker i nærværelse af en vejleder ligesom læring udført af et lille barn ved hjælp af sin lærer. Da et barn er uddannet til at genkende frugt, farver, tal under opsyn af en lærer, er denne metode overvåget læring.
I denne metode kontrolleres hvert trin i barnet af læreren, og barnet lærer af det output, det skal producere.
Hvordan overvåget læring fungerer?
I den overvågede ML-algoritme er output allerede kendt. Der er en kortlægning af input med output. Derfor, for at oprette en model, fodres maskinen med masser af træningsinputdata (med input og tilsvarende output kendt).
Træningsdataene hjælper med at opnå et nøjagtighedsniveau for den oprettede datamodel. Den indbyggede model er nu klar til at blive fodret med nye inputdata og forudsige resultaterne.
Hvad er et mærket datasæt?
Datasættet med output kendt for et givet input kaldes et mærket datasæt. For eksempel, et billede af frugt sammen med frugtnavnet er kendt. Så når der vises et nyt billede af frugt, sammenlignes det med træningssættet for at forudsige svaret.
Overvåget læring er en hurtig læringsmekanisme med høj nøjagtighed. De overvågede indlæringsproblemer inkluderer regression og klassificeringsproblemer.
Nogle af de overvågede læringsalgoritmer er:
- Beslutningstræer,
- K-nærmeste nabo,
- Lineær regression,
- Support Vector Machine og
- Neurale netværk.
Eksempel på overvåget læring
- I det første trin tilføres et træningsdatasæt til maskinindlæringsalgoritmen.
- Med træningsdatasættet justerer maskinen sig selv ved at foretage ændringer i parametrene for at opbygge en logisk model.
hvordan man åbner en torrent-fil
- Den indbyggede model bruges derefter til et nyt sæt data til at forudsige resultatet.
Typer af overvågede læringsalgoritmer
- Klassifikation: I disse typer problemer forudsiger vi svaret som specifikke klasser, såsom “ja” eller “nej”. Når kun 2 klasser er til stede, kaldes det en binær klassifikation. For mere end 2 klasseværdier kaldes det en Multi-class Classification. De forudsagte responsværdier er diskrete værdier. For eksempel, Er det billedet af solen eller månen? Klassificeringsalgoritmen adskiller dataene i klasser.
- Regression: Regressionsproblemer forudsiger responset som kontinuerlige værdier såsom at forudsige en værdi, der spænder fra - uendelig til uendelig. Det kan tage mange værdier. For eksempel, den lineære regressionsalgoritme, der anvendes, forudsiger husets omkostninger baseret på mange parametre som placering, nærliggende lufthavn, husets størrelse osv.
# 2) Uovervåget læring
Uovervåget læring sker uden hjælp fra en vejleder, ligesom en fisk lærer at svømme af sig selv. Det er en uafhængig læringsproces.
I denne model er målværdierne ukendte / umærket, da der ikke er nogen output, der er kortlagt med input. Systemet skal lære af sig selv fra datainput til det og opdage de skjulte mønstre.
Hvad er umærket datasæt?
Et datasæt med ukendte outputværdier for alle inputværdier kaldes et umærket datasæt.
Hvordan fungerer ikke-overvåget læring?
Da der ikke er nogen kendte outputværdier, der kan bruges til at opbygge en logisk model mellem input og output, bruges nogle teknikker til at udvinde dataregler, mønstre og datagrupper med lignende typer. Disse grupper hjælper slutbrugerne med at forstå dataene bedre og finde en meningsfuld output.
De fødte input er ikke i form af en ordentlig struktur ligesom træningsdata er (i overvåget læring). Det kan indeholde outliers, støjende data osv. Disse indgange tilføres sammen til systemet. Under træning af modellen er inputene organiseret til at danne klynger.
De ikke-overvågede læringsalgoritmer inkluderer Clustering og Association Algorithms såsom:
- Apriori,
- K-betyder klyngedannelse og andre algoritmer for minedrift for minedrift.
Når nye data tilføres modellen, forudsiger den resultatet som en klassemærkning, som input tilhører. Hvis klassemærket ikke er til stede, genereres en ny klasse.
Mens man gennemgår processen med at opdage mønstre i dataene, tilpasser modellen sine parametre i sig selv, derfor kaldes det også selvorganiserende. Klyngerne dannes ved at finde ud af lighederne mellem input.
For eksempel, mens der købes produkter online, hvis der lægges smør i vognen, foreslår det at købe brød, ost osv. Den ikke-overvågede model ser på datapunkterne og forudsiger de andre attributter, der er knyttet til produktet.
Eksempel på tilsyn uden opsyn
Typer af ikke-overvågede algoritmer
- Clustering Algorithm : Metoderne til at finde ligheder mellem dataelementer som samme form, størrelse, farve, pris osv. Og gruppere dem til at danne en klynge er klyngeanalyse.
- Outlier afsløring : I denne metode er datasættet søgningen efter enhver form for ulighed og afvigelser i dataene. For eksempel, en transaktion med høj værdi på kreditkort opdages af systemet til afsløring af svig.
- Association Rule Mining : I denne type minedrift finder den ud af de hyppigst forekommende varesæt eller associering mellem elementer. Foreninger såsom 'produkter, der ofte købes sammen' osv.
- Autokodere: Indgangen komprimeres til en kodet form og genskabes for at fjerne støjende data. Denne teknik bruges til at forbedre billed- og videokvaliteten.
# 3) Forstærkningslæring
I denne type læring lærer algoritmen ved hjælp af feedbackmekanisme og tidligere erfaringer. Det er altid ønsket, at hvert trin i algoritmen tages for at nå et mål.
Så når det næste trin skal tages, modtager det feedback fra det forrige trin sammen med læringen fra oplevelsen til at forudsige, hvad der kunne være det næstbedste trin. Denne proces kaldes også en prøve- og fejlproces for at nå målet.
Forstærkningslæring er en langsigtet iterativ proces. Jo mere antallet af tilbagemeldinger, jo mere præcist bliver systemet. Grundlæggende forstærkningslæring kaldes også Markov Decision Process.
Eksempel på forstærkningslæring
Eksempel på forstærkningslæring er videospil, hvor spillerne gennemfører bestemte niveauer i et spil og optjener belønningspoint. Spillet giver feedback til spilleren gennem bonusbevægelser for at forbedre hans / hendes præstationer.
Forstærkningslæring bruges til træning af robotter, selvdrevne biler, automatisk styring af lager osv.
Nogle populære algoritmer til forstærkningslæring inkluderer:
- Q-læring,
- Dybe kontroversielle netværk
- Temporal forskel
Figuren nedenfor beskriver feedbackmekanismen for forstærkningslæring.
- Inputet observeres af den agent, der er AI-elementet.
- Denne AI-agent handler på miljøet i henhold til den trufne beslutning.
- Miljøets svar sendes til AI i form af en belønning tilbage som feedback.
- Tilstand og handling udført på miljøet gemmes også.
(billede kilde )
Virkelig eksempel på overvåget og ikke-overvåget læring
Til overvåget læring:
# 1) Lad os tage et eksempel på en kurv med grøntsager med løg, gulerod, radise, tomat osv., Og vi kan arrangere dem i form af grupper.
#to) Vi opretter en træningsdatatabel for at forstå Supervised Learning.
Træningsdatatabellen karakteriserer grøntsagerne baseret på:
- Form
- Farve
- Størrelse
Form | Farve | Størrelse | Grøntsag |
---|---|---|---|
Det er mere nøjagtigt end uovervåget læring, da inputdata og tilsvarende output er velkendte, og maskinen behøver kun at give forudsigelser. | Det har mindre nøjagtighed, da inputdataene ikke er mærket. Således skal maskinen først forstå og mærke dataene og derefter give forudsigelser. | ||
Rund | Brun | Stor | Løg |
Rund | Net | Medium | Tomat |
Cylindrisk | hvid | Stor | Radise |
Cylindrisk | Net | Medium | Gulerod |
Når denne træningsdatatabel tilføres maskinen, bygger den en logisk model ved hjælp af formen, farven, størrelsen på grøntsagen osv. For at forudsige resultatet (grøntsagen).
Da en ny input tilføres denne model, analyserer algoritmen parametrene og sender navnet på frugten.
Til ikke-overvåget læring:
I ikke-overvåget læring opretter det grupper eller klynger baseret på attributter. I ovenstående eksempeldatasæt er parameteren for grøntsager:
# 1) Form
Grøntsagerne er grupperet efter form.
- Rund: Løg og tomat.
- Cylindrisk: Radise og gulerod.
Tag en anden parameter, f.eks. Størrelse.
# 2) Størrelse
Grøntsagerne er grupperet efter størrelse og form:
- Medium størrelse og rund form: Tomat
- Stor størrelse og rund form: Løg
I ikke-overvåget læring har vi ikke noget træningsdatasæt og resultatvariabel, mens vi er i overvåget læring, træningsdataene er kendte og bruges til at træne algoritmen.
Forskellen mellem overvåget og ikke-overvåget læring
Overvåget | Uden opsyn |
---|---|
I overvågede læringsalgoritmer er output for det givne input kendt. | I ikke-overvågede læringsalgoritmer er output for det givne input ukendt. |
Algoritmerne lærer af mærket datasæt. Disse data hjælper med at evaluere nøjagtigheden af træningsdata. | Algoritmen er forsynet med umærket data, hvor den forsøger at finde mønstre og tilknytninger mellem dataelementerne. |
Det er en forudsigelig modelleringsteknik, der forudsiger de fremtidige resultater nøjagtigt. | Det er en beskrivende modelleringsteknik, der forklarer det virkelige forhold mellem elementerne og historien om elementerne. |
Det inkluderer klassificerings- og regressionsalgoritmer. | Det inkluderer grupperings- og tilknytningsregler, læringsalgoritmer. |
Nogle algoritmer for overvåget læring er Lineær regression, Naïve Bayes og Neurale netværk. | Nogle algoritmer til ikke-overvåget læring er k- betyder klyngedannelse, Apriori osv. |
Denne type læring er relativt kompleks, da den kræver mærkede data. | Det er mindre komplekst, da der ikke er behov for at forstå og mærke data. |
Det er en online proces med dataanalyse og kræver ikke menneskelig interaktion. | Dette er en realtidsanalyse af data. |
Semi-overvåget læring
Den semi-overvågede læringsmetode tager både mærket og umærket træningsdataindgang. Denne type læring er nyttig, når det er vanskeligt at udtrække nyttige funktioner fra umærket data (overvåget tilgang), og dataeksperter har svært ved at mærke inputdataene (ikke-overvåget tilgang).
Kun en lille mængde mærkede data i disse algoritmer kan føre til nøjagtigheden af modellen.
Eksempler af semi-overvåget læring inkluderer CT-scanninger og MR'er, hvor en medicinsk ekspert kan mærke et par punkter i scanningerne for enhver sygdom, mens det er svært at mærke alle scanningerne.
Konklusion
Maskinindlæringsopgaverne klassificeres bredt i overvågede, ikke-overvågede, semi-overvågede og forstærkende læringsopgaver.
Overvåget læring er læring ved hjælp af mærkede data. ML-algoritmerne tilføres et træningsdatasæt, hvor output for alle inputdata er kendt for at forudsige fremtidige resultater.
Denne model er meget nøjagtig og hurtig, men det kræver høj ekspertise og tid til at opbygge. Disse modeller kræver også genopbygning, hvis dataene ændres. ML-opgaver som regression og klassificering udføres under et overvåget læringsmiljø.
Uovervåget læring finder sted uden hjælp fra en vejleder. Indgangsdataene, der tilføres ML-algoritmerne, er umærket, dvs. for hver indgang kendes ingen output. Algoritmen finder i sig selv ud af tendenser og mønster i inputdataene og skaber en sammenhæng mellem inputets forskellige attributter.
Denne type læring er nyttig til at finde mønstre i data, skabe klynger af data og realtidsanalyse. Opgaver såsom klyngedannelse, KNN-algoritmer osv. Kommer under tilsyn uden opsyn.
Semi-overvågede læringsopgaver fordelen ved både overvågede og ikke-overvågede algoritmer ved at forudsige resultaterne ved hjælp af både mærkede og umærkede data. Forstærkningslæring er en type feedbackmekanisme, hvor maskinen lærer af konstant feedback fra miljøet for at nå sit mål.
I denne type læring udfører AI-agenter nogle handlinger på dataene, og miljøet giver en belønning. Forstærkningsindlæring bruges af multiplayer-spil til børn, selvkørende biler osv.
Hold øje med vores kommende vejledning for at vide mere om maskinindlæring og kunstigt neuralt netværk!
=> Besøg her for den eksklusive maskinlæringsserie
Anbefalet læsning
- Data Mining Vs Machine Learning Vs Artificial Intelligence Vs Deep Learning
- 11 mest populære maskinlæringssoftwareværktøjer i 2021
- Machine Learning Tutorial: Introduktion til ML og dens applikationer
- Python-datatyper
- C ++ datatyper
- Typer af risici i softwareprojekter
- Typer af migreringstest: Med testscenarier for hver type
- 15 bedste læringsstyringssystemer (årets LMS 2021)