好色先生TV

Tekniska ?mnen

Vad ?r maskininl?rning?

Illustration av IT-objekt med fokus p? ett fr?getecken

?versikt

Maskininl?rning ?r en delm?ngd av artificiell intelligens som fokuserar p? att bygga system som kan l?ra sig av historiska data, identifiera m?nster och fatta logiska beslut med liten eller ingen m?nsklig inblandning. Det ?r en dataanalysmetod som automatiserar skapandet av analytiska modeller genom att anv?nda data som omfattar olika former av digital information, t.ex. siffror, ord, klick och bilder.

Program f?r maskininl?rning l?r sig av indata och f?rb?ttrar kontinuerligt noggrannheten i utdata med hj?lp av automatiserade optimeringsmetoder. Kvaliteten p? en maskininl?rningsmodell ?r beroende av tv? viktiga aspekter:

  1. Kvaliteten p? indata. En vanlig fras n?r det g?ller att utveckla maskininl?rningsalgoritmer ?r "skr?p in, skr?p ut". Uttrycket betyder att om du l?gger in data av l?g kvalitet eller r?rig data kommer resultatet av din modell att vara till stor del felaktigt.
  2. Sj?lva modellvalet. Inom maskininl?rning finns det en uppsj? av algoritmer som en datavetare kan v?lja, alla med sina egna specifika anv?ndningsomr?den. Det ?r viktigt att v?lja r?tt algoritm f?r varje anv?ndningsfall. Neurala n?tverk ?r en algoritmtyp med betydande hype kring sig p? grund av den h?ga noggrannhet och m?ngsidighet som den kan leverera. F?r sm? datam?ngder ?r det dock ofta b?ttre att v?lja en enklare modell.

Ju b?ttre maskininl?rningsmodellen ?r, desto mer exakt kan den hitta funktioner och m?nster i data. Det inneb?r i sin tur att dess beslut och f?ruts?gelser blir mer exakta.

好色先生TV ArcSight Intelligence f?r CrowdStrike

O?vertr?ffat skydd som kombinerar maskininl?rning och endpoint-s?kerhet tillsammans med hotjakt i v?rldsklass som en tj?nst.

Maskininl?rning

Varf?r ?r maskininl?rning viktigt?

Varf?r anv?nda maskininl?rning? Maskininl?rning blir allt viktigare p? grund av de alltmer enorma volymerna och variationen av data, tillg?ngen till och ?verkomligheten f?r ber?kningskraft och tillg?ngen till h?ghastighetsinternet. Dessa digitala transformationsfaktorer g?r det m?jligt att snabbt och automatiskt utveckla modeller som snabbt och korrekt kan analysera utomordentligt stora och komplexa datam?ngder.

Det finns en m?ngd olika anv?ndningsomr?den d?r maskininl?rning kan anv?ndas f?r att s?nka kostnaderna, minska riskerna och f?rb?ttra den allm?nna livskvaliteten, t.ex. f?r att rekommendera produkter/tj?nster, uppt?cka cybers?kerhets?vertr?delser och m?jligg?ra sj?lvk?rande bilar. Med st?rre tillg?ng till data och ber?kningskraft blir maskininl?rning allt vanligare varje dag och kommer snart att integreras i m?nga aspekter av m?nniskors liv.


Hur fungerar maskininl?rning?

Det finns fyra viktiga steg som du f?ljer n?r du skapar en maskininl?rningsmodell.

  1. V?lj och f?rbered en tr?ningsdataupps?ttning

    Tr?ningsdata ?r information som ?r representativ f?r de data som maskininl?rningsprogrammet kommer att ta in f?r att st?lla in modellparametrar. Tr?ningsdata ?r ibland m?rkta, vilket inneb?r att de har m?rkts f?r att ringa ut klassificeringar eller f?rv?ntade v?rden som maskininl?rningsl?get kr?vs f?r att f?ruts?ga. Andra tr?ningsdata kan vara om?rkta s? att modellen m?ste extrahera funktioner och tilldela kluster autonomt.

    F?r m?rkning b?r data delas in i en tr?ningsdel och en testdel. Den f?rstn?mnda anv?nds f?r att tr?na modellen och den sistn?mnda f?r att utv?rdera modellens effektivitet och hitta s?tt att f?rb?ttra den.

  2. V?lj en algoritm som ska till?mpas p? tr?ningsdataupps?ttningen

    Vilken typ av maskininl?rningsalgoritm du v?ljer beror i f?rsta hand p? n?gra olika aspekter:

    • Om anv?ndningsfallet ?r prediktion av ett v?rde eller klassificering som anv?nder m?rkta tr?ningsdata eller om anv?ndningsfallet ?r klustring eller dimensionsreduktion som anv?nder om?rkta tr?ningsdata
    • Hur mycket data som finns i tr?ningsupps?ttningen
    • Vilken typ av problem som modellen f?rs?ker l?sa

    F?r prediktions- eller klassificeringsfall anv?nder du vanligtvis regressionsalgoritmer som vanlig minsta kvadratregression eller logistisk regression. Med om?rkta data ?r det troligt att du f?rlitar dig p? klusteralgoritmer som k-means eller n?rmaste granne. Vissa algoritmer, t.ex. neurala n?tverk, kan konfigureras f?r att fungera med b?de klustring och prediktion.

  3. Tr?na algoritmen att bygga modellen

    Tr?ning av algoritmen ?r en process d?r modellvariabler och parametrar justeras f?r att mer exakt kunna f?ruts?ga l?mpliga resultat. Tr?ning av maskininl?rningsalgoritmen ?r vanligtvis iterativ och anv?nder en m?ngd olika optimeringsmetoder beroende p? den valda modellen. Dessa optimeringsmetoder kr?ver inte m?nsklig inblandning, vilket ?r en del av kraften i maskininl?rning. Maskinen l?r sig fr?n de data du ger den med liten eller ingen specifik riktning fr?n anv?ndaren.

  4. Anv?nda och f?rb?ttra modellen

    Det sista steget ?r att mata in nya data i modellen f?r att f?rb?ttra dess effektivitet och noggrannhet ?ver tiden. Var den nya informationen kommer ifr?n beror p? vilken typ av problem som ska l?sas. Till exempel kommer en maskininl?rningsmodell f?r sj?lvk?rande bilar att ta in verklig information om v?gf?rh?llanden, f?rem?l och trafiklagar.


Metoder f?r maskininl?rning

Vad ?r ?vervakad maskininl?rning?

?vervakade maskininl?rningsalgoritmer anv?nder m?rkta data som tr?ningsdata d?r l?mpliga utdata f?r indata ?r k?nda. Maskininl?rningsalgoritmen tar in en upps?ttning indata och motsvarande korrekta utdata. Algoritmen j?mf?r sina egna f?rutsp?dda utdata med de korrekta utdata f?r att ber?kna modellens noggrannhet och optimerar sedan modellparametrarna f?r att f?rb?ttra noggrannheten.

?vervakad maskininl?rning bygger p? m?nster f?r att f?ruts?ga v?rden p? om?rkta data. Det anv?nds oftast vid automatisering, f?r stora m?ngder dataposter eller i fall d?r det finns f?r m?nga datainmatningar f?r att m?nniskor ska kunna bearbeta dem effektivt. Algoritmen kan till exempel f?nga upp kreditkortstransaktioner som sannolikt ?r bedr?gliga eller identifiera den f?rs?kringskund som troligen kommer att g?ra en skadeanm?lan.

Vad ?r o?vervakad maskininl?rning?

Maskininl?rning utan supervisering till?mpas b?st p? data som inte har strukturerade eller objektiva svar. Det finns ingen f?rhandsbest?mning av r?tt resultat f?r en given indata. Ist?llet m?ste algoritmen f?rst? indata och fatta ett l?mpligt beslut. M?let ?r att unders?ka informationen och identifiera strukturen i den.

Maskininl?rning utan ?vervakning fungerar bra p? transaktionsinformation. Algoritmen kan till exempel identifiera kundsegment som har liknande attribut. Kunder inom dessa segment kan sedan n?s av liknande marknadsf?ringskampanjer. Popul?ra tekniker som anv?nds vid o?vervakad inl?rning ?r bland annat mappning av n?rmaste granne, sj?lvorganiserande kartor, singular value decomposition och k-means clustering. Algoritmerna anv?nds sedan f?r att segmentera ?mnen, identifiera avvikande v?rden och rekommendera artiklar.


Vad ?r skillnaden mellan ?vervakad och o?vervakad maskininl?rning?

Aspekt

?vervakad inl?rning

O?vervakad inl?rning

Process

Ing?ngs- och utg?ngsvariabler tillhandah?lls f?r att tr?na modellen.

Endast indata tillhandah?lls f?r att tr?na modellen. Inga utdata anv?nds.

Inmatade data

Anv?nder m?rkta data.

Anv?nder om?rkta data.

Algoritmer som st?ds

St?der regressionsalgoritmer, instansbaserade algoritmer, klassificeringsalgoritmer, neurala n?tverk och beslutstr?d.

St?der klustringsalgoritmer, associationsalgoritmer och neurala n?tverk.

Komplexitet

Enklare.

Mer komplex.

Subjektivitet

M?ls?ttning.

Subjektivt.

Antal klasser

Antalet klasser ?r k?nt.

Antal klasser ?r ok?nt.

Prim?r nackdel

Det ?r sv?rt att klassificera stora datam?ngder med hj?lp av ?vervakad inl?rning.

Att v?lja antal kluster kan vara subjektivt.

Prim?rt m?l

Tr?na modellen att f?ruts?ga utdata n?r den presenteras med nya indata.

Hitta anv?ndbara insikter och dolda m?nster.


Vad kan maskininl?rning g?ra: Maskininl?rning i den verkliga v?rlden

Funktionen f?r maskininl?rning har funnits i ?rtionden, men det ?r den senaste tidens f?rm?ga att till?mpa och automatiskt ber?kna komplexa matematiska ber?kningar som involverar stora datam?ngder som har gett den en o?vertr?ffad sofistikering. Anv?ndningsomr?det f?r maskininl?rning idag ?r stort och str?cker sig fr?n f?retags AIOps till detaljhandel online. N?gra exempel fr?n verkligheten p? maskininl?rningsfunktioner idag inkluderar f?ljande:

  • Cyber Security anv?nder beteendeanalys f?r att fastst?lla misst?nkta eller avvikande h?ndelser som kan tyda p? insiderhot, eller nolldagsattacker.
  • Projekt f?r sj?lvk?rande bilar, s?som (ett dotterbolag till Alphabet Inc.) och Teslas som ?r ett steg under faktiska sj?lvk?rande bilar.
  • Digitala assistenter som Siri, Alexa och Google Assistant som s?ker efter information p? webben med hj?lp av v?ra r?stkommandon.
  • Anv?ndaranpassade rekommendationer som drivs av maskininl?rningsalgoritmer p? webbplatser och i appar som Netflix, Amazon och YouTube.
  • L?sningar f?r bedr?geridetektering och cyberresiliens som sammanst?ller data fr?n flera system, uppt?cker kunder som uppvisar h?griskbeteende och identifierar m?nster av misst?nkt aktivitet. Dessa l?sningar kan anv?nda ?vervakad och o?vervakad maskininl?rning f?r att klassificera transaktioner f?r finansiella organisationer som bedr?gliga eller legitima. Det ?r d?rf?r en konsument kan f? sms fr?n sitt kreditkortsf?retag som verifierar om ett ovanligt k?p som gjorts med konsumentens finansiella uppgifter ?r legitimt. Maskininl?rning har blivit s? avancerad n?r det g?ller bedr?gerier att m?nga kreditkortsf?retag g?r reklam f?r att de inte har n?gra fel gentemot konsumenterna om bedr?gerier inte uppt?cks av finansorganisationens algoritmer.
  • Bildigenk?nning har utvecklats avsev?rt och kan nu anv?ndas f?r ansiktsigenk?nning, avl?sning av handskrift p? checkar, trafik?vervakning och f?r att r?kna antalet personer i ett rum.
  • Spamfilter som uppt?cker och blockerar o?nskad e-post fr?n inkorgen.
  • Elbolag som analyserar sensordata f?r att hitta s?tt att f?rb?ttra effektiviteten och s?nka kostnaderna.
  • B?rbara medicintekniska produkter som i realtid samlar in v?rdefull data f?r kontinuerlig bed?mning av patienters h?lsa.
  • Taxiappar utv?rderar trafikf?rh?llandena i realtid och rekommenderar den mest effektiva rutten.
  • Sentimentanalys fastst?ller tonen i en textrad. Bra till?mpningar av sentimentanalys ?r Twitter, kundrecensioner och enk?tsvar:
    • Twitter: Ett s?tt att utv?rdera varum?rken ?r att uppt?cka tonen i tweets som riktas mot en person eller ett f?retag. F?retag som Crimson Hexagon och Nuvi tillhandah?ller detta i realtid.
    • Kundrecensioner: Du kan k?nna av tonen i kundrecensioner f?r att utv?rdera hur ditt f?retag m?r. Detta ?r s?rskilt anv?ndbart om det inte finns n?got betygssystem i kombination med kundrecensioner i fritext.
    • Enk?tunders?kningar: Genom att anv?nda sentimentanalys p? enk?tsvar i fritext kan du f? en snabb utv?rdering av hur dina enk?tdeltagare k?nner. Qualtrics har implementerat detta i sina unders?kningar.
  • Marknadssegmenteringsanalys anv?nder o?vervakad maskininl?rning f?r att gruppera kunder enligt k?pvanor f?r att fastst?lla olika typer av kunder eller kundprofiler. Detta g?r att du b?ttre kan k?nna dina mest v?rdefulla eller underbetj?nade kunder.
  • Det ?r l?tt att trycka p? ctrl+F f?r att s?ka efter exakta ord och fraser i ett dokument, men om du inte vet exakt vilken formulering du letar efter kan det vara sv?rt att s?ka i dokument. Maskininl?rning kan anv?nda tekniker som fuzzy-metoder och ?mnesmodellering f?r att g?ra processen mycket enklare genom att l?ta dig s?ka i dokument utan att k?nna till den exakta formuleringen du letar efter.

Maskininl?rningens roll kommer bara att forts?tta v?xa

I takt med att datavolymerna v?xer, datorkraften ?kar, bandbredden p? Internet blir st?rre och datavetarna f?rb?ttrar sin expertis, kommer maskininl?rning bara att forts?tta att leda till ?kad och djupare effektivitet p? jobbet och i hemmet.

Med de st?ndigt ?kande cyberhoten som f?retag st?r inf?r idag kr?vs maskininl?rning f?r att s?kra v?rdefulla data och h?lla hackare borta fr?n interna n?tverk. V?r fr?msta UEBA SecOps-mjukvara, ArcSight Intelligence , anv?nder maskininl?rning f?r att uppt?cka avvikelser som kan tyda p? skadliga handlingar. Den har visat sig kunna uppt?cka insiderhot, nolldagsattacker och till och med aggressiva red team-attacker.

Hur kan vi hj?lpa till?

Fotnoter