Read the Official Description

Skills

Brug Python til at minde datasæt og forudsige mønstre.

Produktionsstandard

Byg statistiske modeller - regression og klassificering - der genererer brugbar information fra rå data.

Det store billede

Master det grundlæggende ved maskinindlæring og udnyt strømmen af ​​data til at forudsige, hvad der er næste.

Mød dit support team

Vores uddannelsesmæssige ekspertise er en fællesskabsindsats. Når du lærer hos GA, kan du altid stole på et internt team af eksperter til at give vejledning og support, når du har brug for det.

Instruktører

Lær industrielle rammer, værktøjer, ordforråd og bedste praksis fra en lærer, hvis daglige arbejde indebærer at bruge dem fagligt.

Undervisningsassistenter

At tage på nyt materiale er ikke altid let. Gennem kontortid og andre kanaler er vores TA'er her for at give dig svar, tips og meget mere.

Kursusproducenter

Vores alumni elsker deres kursusproducenter, som holdt dem motiverede i løbet af kurset. Du kan når som helst komme til din rådighed.

Se hvad du vil lære

Enhed 1: Forskningsdesign og sonderende dataanalyse

  • Hvad er datalogi
    • Beskriv kursusplan og etablere miljøet i klasseværelset
    • Svar på spørgsmålene: "Hvad er datalogi? Hvilke roller eksisterer i datalogi?"
    • Definer workflow, værktøjer og metoder, som datavidenskabsfolk bruger til at analysere data
  • Forskning Design og Pandas
  • Definer et problem og identificer relevante datasæt ved hjælp af datalogi-arbejdsgangen
  • Gennemgang af datalogisk arbejdsgang ved hjælp af et casestudie i Pandas bibliotek
  • Importer, format og ryd data ved hjælp af Pandas Bibliotek
  • Statistikker Grundlæggende I
  • Brug NumPy og Pandas biblioteker til at analysere datasæt ved hjælp af grundlæggende resumé statistik: middel, median, mode, max, min, kvartil, interkvartil, interval, varians, standardafvigelse og korrelation
  • Opret data visualisering - scatter plots, scatter matrix, linjediagram, box blots og histogrammer - at skelne egenskaber og tendenser i et datasæt
  • Identificer en normal fordeling inden for et datasæt ved hjælp af summarisk statistik og visualisering
  • Statistik Fundamental II
  • Forklar forskellen mellem årsagssammenhæng og korrelation
  • Test en hypotese inden for et eksempel case study
  • Valider dine resultater ved hjælp af statistisk analyse (p-værdier, konfidensintervaller)
  • Instruktørvalg
  • Fokus på et emne valgt af instruktøren / klassen for at give dybere indsigt i sonderende dataanalyse

Enhed 2: Fundamentals of Data Modeling

  • Introduktion til regression
    • Definer datamodellering og lineær regression
    • Differentier mellem kategoriske og kontinuerlige variabler
    • Opbyg en lineær regressionsmodel ved hjælp af et datasæt, der opfylder linearitetsforudsætningen ved hjælp af scikit-learn-biblioteket
  • Evaluering af Model Fit
  • Definer regularisering, bias og fejl metrics;
  • Vurdere modelpasning ved at bruge tabsfunktioner, herunder gennemsnitlig absolut fejl, gennemsnitlig kvadreret fejl, root mean squared fejl
  • Vælg regressionsmetoder baseret på pasform og kompleksitet
  • Introduktion til klassificering
  • Definer en klassifikationsmodel
  • Byg en K-Nærmeste naboer ved hjælp af biblioteket scikit-learn
  • Evaluere og tune model ved at bruge metrics som klassificering nøjagtighed / skade
  • Introduktion til logistisk regression
  • Byg en logistisk regression klassifikation model ved hjælp af scikit lære bibliotek
  • Beskriv sigmoidfunktionen, oddsene og oddsforholdene, og hvordan de vedrører logistisk regression
  • Evaluer en model ved hjælp af beregninger som klassifikationsnøjagtighed / fejl, forvirringsmatrix, ROC / AOC-kurver og tabsfunktioner
  • Kommuniker resultater fra logistisk regression
  • Forklare afvejningen mellem præcision og tilbagekaldelse af en model og formulere omkostningerne ved falske positive versus falske negativer.
  • Identificer komponenterne i en kortfattet, overbevisende rapport og hvordan de relaterer til specifikke målgrupper / interessenter
  • Beskriv forskellen mellem visualisering til præsentationer vs. sonderende data analyse
  • Fleksibel klassesession
  • Fokus på et emne valgt af instruktøren / klassen for at give dybere indsigt i datamodellering

Enhed 3: Datavidenskab i den virkelige verden

  • Beslutning Træer og Tilfældig Skov
    • Beskriv forskellen mellem klassificering og regressionstræer og hvordan man fortolker disse modeller
    • Forklar og kommunikerer afvigelserne mellem beslutningstræer og regressionsmodeller
    • Byg beslutning træer og tilfældige skove ved hjælp af scikit-lær biblioteket
  • Natural Language Processing
  • Demonstrere, hvordan man vælger naturligt sprogtekst ved hjælp af NLTK
  • Kategoriser og tag ustrukturerede tekstdata
  • Forklar, hvordan man opbygger en tekstklassificeringsmodel ved hjælp af NLTK
  • Dimensionalitetsreduktion
  • Forklar, hvordan du udfører en dimensionel reduktion ved hjælp af emnelameller
  • Demonstrere, hvordan man finjusterer data ved hjælp af latent dirichlet-tildeling (LDA)
  • Udtræk oplysninger fra et stikprøvedatasæt
  • Arbejder med Time Series Data
  • Forklar, hvorfor tidsseriedata er anderledes end andre data, og hvordan man redegør for det
  • Opret rullende midler og plot tidsseriedata ved hjælp af Pandas bibliotek
  • Udfør autokorrelation på tidsseriedata
  • Oprettelse af modeller med Time Series-data
  • Nedbryd tidsseriedata til trend og resterende komponenter
  • Valider og krydvalider data fra forskellige datasæt
  • Brug ARIMA-modellen til at prognose og registrere trends i tidsseriedata
  • Værdien af ​​databaser
  • Beskriv brugssagerne for forskellige typer databaser
  • Forklar forskelle mellem relationelle databaser og dokumentbaserede databaser
  • Skriv simple udvalgte forespørgsler for at trække data fra en database og bruge indenfor Pandas
  • Flyt videre med din datalogi karriere
  • Angiv fælles modeller, der anvendes inden for forskellige brancher
  • Identificer brugen tilfælde til fælles modeller
  • Diskuter næste trin og yderligere ressourcer til datalogi læring
  • Fleksibel klassesession
  • Fokus på et emne valgt af instruktør / klasse for at give dybere indsigt i datavidenskab i den virkelige verden
  • Afsluttende præsentationer
  • Tilstedeværende endelige præsentation til jævnaldrende, instruktør og gæstepanelister, der identificerer styrker og forbedringsområder

Finansieringsindstillinger

Har du brug for betalingshjælp? Vores finansieringsmuligheder giver dig mulighed for at fokusere på dine mål i stedet for de hindringer, der holder dig ude af at nå dem.

WeLend

Ansøg om et rentefrit lån på op til 18 måneder eller et fast gebyrlån på op til 48 måneder⁵ Skal være en borger i Hongkong eller permanent bosiddende.
Finansieringsmulighederne varierer i hvert marked og er kun tilgængelige for studerende, der er accepteret i vores programmer.
Kontakt en lokal admissionsofficer for mere info.

Program taught in:
Engelsk

See 12 more programs offered by General Assembly »

This course is Campus based
Start Date
Feb. 2019
Mar. 2019
Duration
10 uger
Deltid
Price
3,950 USD
Deadline
By locations
By date
Start Date
Jan. 2020
End Date
Application deadline
Start Date
Jan. 2020
End Date
Application deadline
Start Date
Jan. 2020
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Aug. 2019
End Date
Application deadline
Start Date
Aug. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Feb. 2019
End Date
Application deadline
Start Date
Mar. 2019
End Date
Application deadline
Start Date
Apr. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline
Start Date
Sep. 2019
End Date
Application deadline

Feb. 2019

Location
Application deadline
End Date

Mar. 2019

Location
Application deadline
End Date

Apr. 2019

Location
Application deadline
End Date

Aug. 2019

Location
Application deadline
End Date
Location
Application deadline
End Date

Sep. 2019

Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date

Jan. 2020

Location
Application deadline
End Date
Location
Application deadline
End Date
Location
Application deadline
End Date