Tema: Hvad er AI?

Hvad er AI: Maskinlæring

2024/08/13 at 12:24 pm Mark Sinclair Fleeton2024/08/13

Læsetid 22 minutter

Array

Dette er anden del af serien “Hvad er AI?”. Formålet med serien er, at komme med en uddybning af nogle af de centrale begreber indenfor kunstig intelligens og den er altså ikke tænkt til dig, der allerede ved alt om AI. Du kan læse første del her.

Har du nogensinde undret dig over, hvordan din telefon kan genkende dit ansigt, eller hvordan Netflix altid synes at vide, hvilke film du vil kunne lide? Disse imponerende funktioner er mulige takket være en teknologi kaldet machine learning eller på dansk maskinlæring. Selvom maskinlæring lyder som noget fra en science fiction-film, er det faktisk en af de mest anvendte teknologier i vores moderne verden.

Maskinlæring er en af de mest revolutionerende teknologier i det 21. århundrede, og den spiller en central rolle i alt fra anbefalingssystemer på streamingtjenester til avancerede medicinske diagnoser. Men hvordan fungerer maskinlæring egentlig? I denne artikel vil vi dykke ned i de grundlæggende principper bag maskinlæring, forklare de forskellige typer af metoder, og belyse de udfordringer og begrænsninger, der følger med, når maskiner lærer fra data.

Hvad er maskinlæring?

Maskinlæring er en gren af kunstig intelligens (AI), hvor computere lærer fra data for at forbedre deres præstationer i specifikke opgaver. I stedet for at blive manuelt programmeret til at udføre en opgave, lærer en maskine selv, hvordan den bedst udfører den, ved at analysere store mængder data. Maskinlæring stammer fra statistiske metoder og har udviklet sig til at omfatte mere avancerede teknikker, der gør det muligt for computere at lære og træffe beslutninger uden menneskelig indgriben. Eksempler på maskinlæring kan ses overalt i vores hverdag, fra de spamfiltre, der beskytter din indbakke, til de anbefalinger, du modtager på sociale medier.

De grundlæggende principper i maskinlæring

Maskinlæring bygger på en række grundlæggende principper, der gør det muligt for en computer at lære af data.

Data som Grundlaget: Data er brændstoffet, der driver maskinlæring. Ved at fodre en maskine med store mængder data, kan den lære at genkende mønstre og træffe beslutninger baseret på disse mønstre. Jo mere data, maskinen har adgang til, desto bedre kan den lære.

Algoritmer og Modeller: En algoritme er et sæt af regler, der bruges til at behandle data og træne en model. En model er det resultat, der opnås efter træningen. Denne model kan derefter bruges til at forudsige eller klassificere nye data.

Måder systemer lærer på

Selve måden modellerne lærer på inddeles overordnet i tre kategorier: Supervised learning, unsupervised learning og reinforcement learning. Det har i høj grad noget at gøre med, hvor meget af læringen, du overlader til systemet selv.

Supervised learning (Overvåget læring)

Supervised learning betyder at maskinen trænes med mærkede data, hvor den korrekte svar allerede er kendt. For eksempel kan en model trænes til at genkende billeder af katte ved at vise den tusindvis af billeder, der allerede er mærket som “kat”.

Forestil dig, at du skal lære en ven at skelne mellem forskellige typer frugt – f.eks. æbler og appelsiner. For at hjælpe din ven giver du ham en masse billeder af både æbler og appelsiner, og ved hvert billede fortæller du, om det er et æble eller en appelsin. Din ven begynder at lære, hvilke træk adskiller æbler fra appelsiner, som farve, form og størrelse. Efter at have set mange billeder, kan din ven selv begynde at genkende æbler og appelsiner uden din hjælp.

Dette er grundidéen bag supervised learning: En maskine trænes med data, hvor den korrekte svar allerede er kendt (ligesom at du fortæller, om det er et æble eller en appelsin). Maskinen bruger disse “mærkede” data til at lære, hvordan den kan klassificere nye, ukendte data. Supervised learning bruges ofte til opgaver som billedgenkendelse (f.eks. at genkende ansigter), spamfiltre i e-mails, og forudsigelser (f.eks. at forudsige boligpriser baseret på tidligere data).

Unsupervised learning (Ikke-overvåget læring)

Her arbejder maskinen med data, der ikke er mærket, og forsøger selv at finde mønstre. For eksempel kan maskinen gruppere kunder i forskellige segmenter baseret på deres købsadfærd uden at vide på forhånd, hvad segmenterne er.

Lad os sige, at du ikke fortæller din ven, hvad de forskellige frugter hedder, men blot viser ham en masse billeder af forskellige frugter uden at mærke dem som æbler eller appelsiner. I stedet for at lære, hvad hver frugt er, vil din ven begynde at bemærke, at nogle frugter ligner hinanden mere end andre – f.eks. at runde, orange frugter hører sammen, og at runde, røde frugter hører til en anden gruppe. Din ven opdeler altså frugterne i grupper baseret på ligheder, selvom han ikke ved, hvad de forskellige frugter hedder.

Dette er, hvad der sker i unsupervised learning. Maskinen får en masse data, men der er ingen “korrekte” svar til at lære den fra. I stedet forsøger maskinen at finde mønstre og relationer i dataene selv. Unsupervised learning bruges ofte til opgaver som klyngedannelse (f.eks. segmentering af kunder baseret på deres købsadfærd) eller datareduktion (f.eks. at finde de vigtigste træk i store datasæt).

Reinforcement learning (Forstærkningslæring)

I denne type læring lærer maskinen gennem belønninger og straffe. Den foretager handlinger i et miljø og får feedback, som den bruger til at forbedre sin fremtidige præstation. Dette bruges ofte i spiludvikling og robotteknologi.

Forestil dig, at du træner en hund til at udføre tricks. I stedet for at forklare hunden, hvad den skal gøre, belønner du den, når den gør noget rigtigt, og ignorerer eller korrigerer den, når den gør noget forkert. Efterhånden vil hunden lære, at hvis den følger dine kommandoer korrekt, får den en godbid. Det er en proces baseret på trial-and-error, hvor hunden lærer at maksimere sin belønning ved at udføre de rigtige handlinger.

Dette er princippet bag reinforcement learning. Maskinen (eller agenten) lærer gennem erfaring ved at interagere med et miljø. Den foretager handlinger og får feedback i form af belønninger eller straffe. Over tid lærer maskinen at vælge de handlinger, der giver den mest positive feedback. Reinforcement learning bruges ofte i spiludvikling (f.eks. at træne AI til at spille skak eller videospil), robotteknologi (f.eks. at lære en robot at gå), og selvkørende biler, der skal navigere sikkert i trafikken.

Forskellige anvendelser

De forskellige typer at lære på har hver deres styrker og bruges i forskellige sammenhænge. Supervised learning er særlig stærk til at producere forudsigelser og klassifikationer. Hvis du ønsker at forudsige en bestemt værdi (f.eks. boligpriser) eller klassificere data i kategorier (f.eks. e-mails som spam eller ikke-spam), er supervised learning det bedste valg. På samme måde er supervised learning en funktion indenfor medicinsk diagnosticering. Hvis du for eksempel har et datasæt med patientdata, hvor det er kendt, om de har en bestemt sygdom eller ej, kan du bruge supervised learning til at træne en model, der kan hjælpe med at diagnosticere nye patienter.

Hvis dine data ikke har etiketter, men du stadig vil opdage strukturer eller mønstre, er unsupervised learning en god løsning. For eksempel, hvis du har kundedata uden prædefinerede kategorier, kan du bruge unsupervised learning til at gruppere kunder med lignende adfærd. Unsupervised learning bruges til at finde skjulte mønstre eller relationer i data, som du måske ikke kender på forhånd. Hvis du har et stort datasæt med mange variabler, og du ønsker at reducere dets kompleksitet ved at finde de vigtigste faktorer, kan unsupervised learning hjælpe med dette.

Reinforcement learning er velegnet, når du har en situation, hvor en agent (f.eks. en robot eller et program) skal lære at opnå et mål ved at interagere med et miljø, hvor handlinger fører til belønninger eller straffe. Det bruges ofte i situationer, hvor beslutninger skal træffes sekventielt, og hvor tidligere beslutninger kan påvirke fremtidige resultater. Hvis du udvikler AI til at spille et spil (f.eks. skak eller videospil) eller styre en robot (f.eks. lære en robot at gå), er reinforcement learning den bedste metode, da agenten lærer gennem trial-and-error.

I mange komplekse systemer kan flere maskinlæringsmetoder kombineres for at opnå bedre resultater. Først kan unsupervised learning bruges til at opdage grupper eller mønstre i data, og derefter kan supervised learning bruges til at finjustere modellen til præcise forudsigelser eller klassifikationer. Reinforcement learning kan bruges i kombination med supervised learning, især når man ønsker at lære en agent at foretage beslutninger, men også har brug for præcise etiketter til at guide træningen.

At vælge den rette maskinlæringsmetode afhænger af din specifikke opgave, dataenes karakter, og de resultater, du ønsker at opnå. Ved at forstå, hvornår og hvordan man bruger hver metode, kan du udnytte maskinlæringens fulde potentiale til at løse komplekse problemer.

Hvordan trænes en Maskinlæringsmodel?

Med den viden om maskinlæring i baghovedet, kan vi tage fat på den praktiske del af maskinlæringen – træningsdelen. For hvordan træner man så sin AI-model?

Processen med at træne en maskinlæringsmodel involverer flere trin:

Processen begynder med træning af modellen. Dette trin involverer at fodre maskinlæringsalgoritmen med et stort datasæt, som vi kalder træningsdata. Disse data er allerede kendt og mærket, hvilket betyder, at vi kender de korrekte svar eller kategorier for hvert datapunkt. For eksempel, hvis du træner en model til at genkende katte og hunde i billeder, vil træningsdataene bestå af mange billeder, der hver især er mærket som enten en “kat” eller en “hund”.

Modellen begynder at lære ved at analysere disse data og forsøger at identificere mønstre eller karakteristika, der adskiller katte fra hunde. Dette kunne være farven på pelsen, formen på ørene, eller noget mere komplekst som forholdet mellem forskellige pixels i billedet. I starten er modellens forudsigelser ikke særlig præcise, men gennem mange iterationer – hvor den sammenligner sine forudsigelser med de korrekte etiketter og justerer sine indre parametre – bliver den gradvist bedre til at genkende de forskellige dyr.

Når modellen har gennemgået en vis træningsperiode, er det vigtigt at teste dens ydeevne på et sæt data, som den ikke tidligere har set. Dette er kendt som validering. Valideringsdatasættet minder om træningsdataene, men det bruges udelukkende til at evaluere modellens præcision og generaliseringsevne. Ideen her er at sikre, at modellen ikke blot har lært at huske træningsdataene, men at den også kan anvende det, den har lært, på nye, ukendte data.

I valideringsfasen kan vi få en idé om, hvor godt modellen vil klare sig i den virkelige verden, når den skal arbejde med data, der ikke nødvendigvis følger samme mønstre som træningsdataene. Hvis modellen klarer sig godt på valideringsdataene, er det et godt tegn på, at den har lært at generalisere de rigtige mønstre fra træningsdataene.

En af de største udfordringer i maskinlæring er at finde den rette balance mellem overfitting og underfitting. Overfitting sker, når modellen bliver for specifik og nærmest lærer træningsdataene udenad, inklusive støj og irrelevante detaljer. Dette betyder, at den kan præstere fremragende på træningsdataene, men vil sandsynligvis fejle, når den bliver præsenteret for nye data, fordi den ikke har lært de generelle mønstre.

På den anden side har vi underfitting, som opstår, når modellen er for simpel og ikke fanger de relevante mønstre i dataene. Dette kan ske, hvis modellen ikke har tilstrækkelig kapacitet til at lære fra dataene, eller hvis algoritmen ikke er kompleks nok. Underfitting resulterer i en model, der ikke præsterer godt, hverken på træningsdataene eller nye data.

For at undgå disse problemer er det vigtigt at justere modellens kompleksitet og træningsproces, så den hverken overtræner eller undertræner. Dette kan involvere at finjustere forskellige parametre i modellen, ændre størrelsen på træningsdatasættet, eller vælge en mere passende algoritme.

Efter trænings- og valideringsfaserne kan der være behov for yderligere optimering for at forbedre modellens præstation. Optimering handler om at justere modellens parametre – ofte kaldet hyperparametre – for at finde den kombination, der giver den bedste præcision. Dette kan omfatte justering af læringshastigheden, som styrer, hvor hurtigt eller langsomt modellen lærer fra dataene, eller at vælge den rigtige modelarkitektur, som passer bedst til den specifikke opgave.

I mange tilfælde vil udvikleren gentagne gange justere og teste modellen, indtil den ønskede ydeevne er opnået. Dette er en iterativ proces, hvor hver runde af justeringer bringer modellen tættere på dens optimale præstation. Når modellen er optimeret, og ydeevnen er tilfredsstillende, er den klar til at blive brugt i praksis.

Selvfølgelig! Lad os udfolde afsnittet om eksempler på maskinlæringsalgoritmer for at give en mere dybdegående forståelse.

Eksempler på maskinlæringsalgoritmer

Maskinlæring er et rigt felt med mange forskellige algoritmer, hver designet til at tackle bestemte typer problemer. Her vil vi gennemgå nogle af de mest kendte og anvendte maskinlæringsalgoritmer, og forklare, hvordan de fungerer, og hvornår de typisk bruges.

Linear Regression (Lineær Regression) er en af de mest grundlæggende og letforståelige maskinlæringsalgoritmer, som primært bruges til at forudsige kontinuerlige værdier. Forestil dig, at du har en række data om kvadratmeterpriser på boliger i en by, og du vil kunne forudsige prisen på en ny bolig baseret på dens størrelse. Lineær regression forsøger at finde en lige linje, der bedst passer til alle de datapunkter, du har. Denne linje kaldes en regressionslinje.

Modellen lærer, hvordan kvadratmeterprisen ændrer sig i forhold til boligstørrelsen ved at minimere afstanden mellem de faktiske data og linjen. Resultatet er en simpel model, hvor du kan indtaste en boligs størrelse og få en forudsigelse af dens pris. Lineær regression er dog begrænset til forhold, hvor der er en lineær sammenhæng mellem variablerne, og den kan derfor være mindre effektiv, når forholdene er mere komplekse.

Decision Trees (Beslutningstræer) er en kraftfuld og visuel algoritme, der bruges til både klassifikation og regression. Forestil dig et træ, hvor hver forgrening repræsenterer en beslutning baseret på en bestemt egenskab ved dataene, og hvert blad (enden af en gren) repræsenterer en forudsigelse eller beslutning.

Lad os sige, at du vil klassificere, om en person kan lide at se en bestemt type film baseret på deres alder, køn, og om de har set lignende film før. Beslutningstræet vil begynde med en beslutning om, hvilken af disse egenskaber der er mest informativ. For eksempel kan træet først spørge: “Er personen under 30 år?”. Afhængigt af svaret vil træet forgrene sig og stille et nyt spørgsmål, som f.eks.: “Er det en actionfilm?”. Til sidst når vi frem til et blad, der giver en forudsigelse, f.eks. “Ja, personen vil sandsynligvis kunne lide filmen” eller “Nej, personen vil sandsynligvis ikke kunne lide filmen”.

Beslutningstræer er lette at forstå og forklare, hvilket gør dem populære, især når det er vigtigt at kunne forklare, hvordan modellen træffer sine beslutninger. De kan dog blive komplekse og overfitting, især hvis træet bliver for dybt med mange beslutningslag.

Neurale netværk er inspireret af den menneskelige hjerne og består af lag af sammenkoblede “neuroner”. Hvert neuron modtager input, udfører en simpel beregning og sender output videre til næste lag. Et neuralt netværk kan have mange lag, og når det har mange, kalder vi det et dybt neuralt netværk, som bruges i dyb læring.

Forestil dig et neuralt netværk, der er trænet til at genkende håndskrevne cifre. Når et billede af et håndskrevet tal (som f.eks. “5”) fodres ind i netværket, behandles det gennem flere lag af neuroner. Hvert lag forsøger at lære forskellige mønstre i billedet, såsom kurver, kanter og tekstur. Til sidst kombinerer det sidste lag disse mønstre for at bestemme, hvilket tal billedet forestiller.

Neurale netværk er yderst kraftfulde og kan lære meget komplekse mønstre, hvilket gør dem velegnede til opgaver som billedgenkendelse, talegenkendelse og naturlig sprogbehandling. De kræver dog meget data og beregningskraft, og de kan være svære at fortolke, hvilket betyder, at det kan være udfordrende at forstå præcis, hvordan netværket kom frem til en bestemt beslutning.

K-means clustering er en algoritme, der bruges til unsupervised learning, hvor målet er at gruppere data i k forskellige klynger baseret på deres ligheder. Forestil dig, at du har data om en gruppe kunders købsadfærd, men du har ingen idé om, hvilke typer kunder du har. K-means clustering hjælper med at opdage disse grupper ved at placere hvert datapunkt i en af k klynger, hvor k er et tal, du selv vælger.

Processen begynder med at tilfældigt vælge k “centroider”, som er midtpunkter for hver klynge. Derefter tildeles hver kunde til den nærmeste centroid baseret på deres adfærdsmønstre. Efter hver tildeling justeres centroidernes positioner for at bedre repræsentere deres klynge. Denne proces gentages, indtil klyngerne stabiliserer sig, og hver kunde er tildelt en klynge, der bedst beskriver deres adfærd.

K-means clustering er særligt nyttigt i markedsføring, hvor det kan bruges til at segmentere kunder i forskellige grupper, så virksomheder kan målrette deres produkter og kampagner mere præcist. Det er dog vigtigt at bemærke, at antallet af klynger (k) skal vælges omhyggeligt, da det kan påvirke kvaliteten af klyngerne.

Begrænsninger ved maskinlæring

Maskinlæring er stærkt afhængig af datakvalitet. Hvis dataene på en eller anden måde er uklare (støj i data), ufuldstændige eller biased, vil modellerne træffe upålidelige beslutninger. Støj i data kan forvirre modellen, manglende data kan føre til skævheder, og bias kan skabe uretfærdige resultater, især i sensitive anvendelser som ansigtsgenkendelse eller rekruttering. At sikre rene, repræsentative data er afgørende, men ofte tidskrævende og ressourcekrævende.

Bias kan overføres fra data til model, hvilket kan føre til diskriminerende resultater. For eksempel kan en jobansøgningsmodel, trænet på biased data, favorisere visse demografiske grupper. For at undgå bias kræver det omhyggelig dataforberedelse og test for retfærdighed, hvilket er en udfordring, da bias ikke altid er synligt eller let at rette.

Avancerede maskinlæringsmodeller, især dybe neurale netværk, kræver betydelig beregningskraft. Træning af disse modeller kan være meget tids- og energikrævende, hvilket kan gøre det dyrt og udfordrende for mindre organisationer at anvende dem. Specialiseret hardware som GPUs eller TPUs er ofte nødvendig, men de er kostbare og kan også have en stor miljøpåvirkning.

Komplekse modeller, som dybe neurale netværk, er ofte “sort bokse”, hvilket gør det svært at forstå, hvordan de træffer deres beslutninger. Dette kan være problematisk i anvendelser, hvor gennemsigtighed er kritisk, som i sundhedsvæsenet eller finanssektoren. Manglen på forklarbarhed kan påvirke tilliden til modellen og begrænse dens anvendelse i praksis. Forskning i forklarbar AI (XAI) forsøger at adressere denne udfordring, men det er stadig en væsentlig barriere.