Master i Big Data og Analytics

Generelt

Program beskrivelse

Master i Big Data og Analytics

Online Master i Big Data og Analytics

Master i Big Data og Analytics blev født som et resultat af foreningen mellem den omfattende erfaring inden for træning og forskning inden for teknologi, der kendetegner UPC, støttet af den anerkendelse og akkreditering, den har, både nationalt og internationalt; og erfaringen med onlineuddannelse med teknologisk og forretningsmæssig fokus af OBS .

Strukturen af Master i Big Data og Analytics giver studerende mulighed for at identificere, hvornår typen af Big Data-løsninger kan hjælpe organisationen og styre dens implementering inden for den.

I løbet af programmet ses tre store blokke:

  • Blok I. Management og opbevaring.
  • Blok II Processer og analyse.
  • Blok III Visualisering og forretning.

I løbet af studiet vil viden om teknologiske løsninger blive anvendt på en praktisk måde, da målet er at bringe den studerende tættere på den nuværende teknologi, der findes på markedet for at være i stand til at røre ved den og se dens anvendelighed.

karrieremuligheder

I OBS vi forpligtet til at træne som en motor for forandring, vækst og forbedring både personlig og professionel. Anvendelsen inden for det faglige felt af de udviklede kompetencer i hele programmet vil bidrage til vækst og forbedring af studerende såvel som deres virksomheder.

Virksomheders digitale transformation er en realitet, og dette indebærer ændringer i de forskellige funktionelle områder af dem. Det er af denne grund, at fagfolk skal være parat til at bruge de nye værktøjer, der leveres af det nye teknologiske miljø.

Professionelle udflugter er samlet i:

  • Ansvarlig for Big Data-projekter og avanceret forretningsanalyse.
  • Ekstern konsulent
  • Chef for infrastruktur Big Data Analytics i ikt-området.
  • Chief Data Officer
  • Dataanalytiker

målsætninger

Med et økosystem på 1.000 Big Data-løsninger, inden for et skiftende marked, der ikke holder op med at vokse år efter år, er det nødvendigt kontinuerligt at tilpasse og korrekt definere arkitekturernes baser, men altid under paraplyen for forretningsforventninger.

De store mængder data, variation og hastighed får ikke mere end at spilde ressourcer fra en organisation, der ikke er klar over, hvad den vil løse. Derfor er det at vide, hvorfor og hvad en organisation forventer (omkostningsreduktion eller indtægtsforøgelse), der markerer levedygtigheden af et Big Data-projekt.

Master i Big Data og Analytics tilbyder en dybest set praktisk og streng tilgang, der er orienteret til implementering af Big Data-teknologi med garantier for succes.

Generelt mål

Det overordnede mål for Master i Big Data og Analytics er at give den nødvendige viden til at styre et Big Data-projekt ud fra alle dets aspekter, ud fra hvordan man identificerer muligheden i en organisation til, hvad der leveres til forretningsområderne.

Master i Big Data og Analytics fokuserer på mere end en løsning. Målet er, at den ansvarlige professionelle kan identificere, om en organisation står overfor en Big Data-udfordring og have en defineret proces med de følgende trin: identificere den type løsninger, der skal implementeres; de professionelle profiler, du har brug for; Forbered en økonomisk levedygtighedsplan og have de grundlæggende elementer til at styre dens skalerbarhed.

Specifikke mål

Læreplanen for Master i Big Data og Analytics er designet til at nå følgende specifikke mål:

  • Forstå, hvordan man omdanner en traditionel organisation ved at anvende begrebet dataanalyse eller Big Data Analytics til en datadrevet organisation.
  • Kend markedets vigtigste teknologiske rammer og dens vigtigste applikationer: Hadoop, Spark, Neo4j.
  • Identificer, hvad der er de forskellige typer information, deres lagrings- og kvalitetsprocesser.
  • Forstå, hvordan man uddrager viden fra dataene for at generere forudsigelige modeller via forudsigelig statistik og maskinlæring.
  • Beher teknikkerne for datastyring: erhvervelse, opbevaring, proces, analyse, visualisering.
  • Oplev de nye visualiseringsteknikker i instrumentbrættet for at forbedre beslutningstagningen.

Curriculum

Blok I. Management og opbevaring

Big Data Leveling Course

Parallelt med modul 1 starter studerende Big Data og Analytics-programmet med dette nivelleringsforløb, der giver de tekniske videnbaser, der er nødvendige for at forfølge programmet og til at gennemføre Big Data-projekter. I dette kursus finder de studerende materielle ressourcer, der giver dem mulighed for at uddybe forskellige fag, der er nødvendige for opfølgningen af kurset, og vil realisere testtypetest, der vil tjene som en guide til evaluering af deres viden og den endelige evaluering af kurset.

Modul 1. Management af Big Data Analytics

I dette modul introducerer vi de grundlæggende koncepter i Big Data for at vide, hvordan man identificerer nøglerne til hvert projekt og skalerbarhed. At opdage, inden dataene varieres, variationen, volumetrin og hastigheden, vil hjælpe os med at identificere, hvilke faser der skal udføres, inden vi starter et Big Data-projekt, og vigtigst af alt, hvilket afkast forventer vi fra projektet? Hvilke forventninger har virksomheden?

mål:

  • Identificer, hvornår et projekt er Big Data.
  • Find ROI i et Big Data-projekt.
  • Forstå og anvende koncepterne Dark Data og Open Data.
  • Vejled organisationen til at være en Data Driven organisation og støtt projektet.
  • Kend dataens lovlighed.
  • Definer figuren af Data Science inden for en organisation.

Modul 2. Big Data Architecture

Big Data-løsningsøkosystemet vil være så stort som datatypologier og proceskapacitet, vi har brug for i projektet. De fleste af dem fokuserer på skalerbarhed, mangfoldighed og er primært baseret på Cloud-miljøer. Nogle virksomheder ønsker ikke at uploade deres mest kritiske data i skyen og foretrækker at have dem i hus, andre foretrækker 100% Cloud- eller hybridmiljøer.

I dette modul vil vi opdage PROs og NOC'erne for hver arkitektur, de største løsningsudbydere og hvordan vi kan opbygge de mest elastiske miljøer som muligt, altid på udkig efter den mest effektive arkitektur i løsninger og omkostninger.

mål:

  • Oplev typologierne på lokaler, hybrider og på skyarkitekturer.
  • Forstå rollen som Hadoop og HDFS som grundlæggende elementer i paralleliseringen af processer.
  • Ved hvad Spark er, og økosystemet Hive, Pig, Sqoop og Flume.
  • Identificer fordelene ved Kubernetes og Databricks.

Modul 3. ETL'er og ELT'er

Oplysningerne kan fås fra kilder uden for organisationen (sociale netværk, åbne data, blandt andre) og interne databaser (CRM'er, ERP'er, transaktionelle, blandt andre.). Alle disse data skal transformeres, inden de læses eller bagefter for senere at behandle dem gennem aggregeringsprocesser, der giver os mulighed for at få KPI'er.

På dette tidspunkt skal vi definere kvalitetsregler for at verificere, at dataene er korrekte og ikke besværliggør vores Data Lake.

I dette modul lærer vi at definere de baser, som alle dataindlæsningsprocesser skal have for at garantere integritet, sanitet, historisering og rekursion i belastninger.

mål:

  • Forstå forskellen mellem ETL'er og ELT'er.
  • Forstå fordelene ved ETL-processer.
  • Identificer KPI'er for MDM.
  • Integrer de forskellige systemer.
  • At kunne styre brugen af undtagelser.
  • Forstå forskellen mellem Data Lake og Data Warehouse.

Modul 4. Datasøer

Registrering af store mængder information kræver forskellige typer databaser ud over de relationelle med en mere traditionel tilgang; F.eks. Er video, ruter eller kritiske stier, dokumenter eller sociale netværk i stigende grad almindelige datakilder blandt de informationskilder, der interesserer en virksomhed.

Teknologimarkedet har tilpasset sig dem alle og skabt løsninger for at kunne gemme og udnytte dem optimalt. I dette modul opdager vi dens fordele og ulemper, vi udfører små praksis på hver af dem for at udforske dets potentiale.

mål:

  • Kend de relationelle databaser vs NOSQL.
  • Kend de kolumne databaser.
  • Kend grafdatabaserne. Neo4j.
  • Kend de dokumentariske databaser.
  • Oplev datakilder uden for organisationen for at berige vores Data Lake.
  • Forstå, hvilken rolle datastrømme spiller i realtids beslutningstagning.
Blok II Processer og analyse

Modul 5. Datamining

I dette modul lærer vi at udtrække oplysninger fra Data Lake-datasættet og frem for alt at gøre det fortolkeligt. I løbet af processen skal vi være klar over de forretningsmæssige mål, de værktøjer, der hjælper os med at rense dataene, bestemme, hvilke matematiske modeller der er bedre og kvalificere resultaterne.

mål:

  • Vælg det datasæt, der bedst kan løse forretningsspørgsmålet, fra de tilgængelige data.
  • Transformér inputdatasættet.
  • Vælg den mest passende data mining-teknik, for eksempel neurale netværk, beslutningstræer, klynger eller tilknytningsregler.
  • Forstå processen med videnekstraktion.
  • Fortolke og evaluere dataene.

Modul 6. Avanceret analyse: R og Python

Når vi har de korrekte data, vil det være på tide at udtrække viden, fortolke dem og tage viden til et nyt niveau. I dette modul etablerer vi en lille statistisk base til at arbejde med to af de vigtigste Advanced Analytics-værktøjer på markedet: R og Python. Med dem vil der blive udført små praksis for at finde ud af, hvornår de skal bruge hver af dem og udtrække det maksimale potentiale fra dataene.

mål:

  • Kend grundlaget for statistikker og beregningen af sandsynligheder.
  • Anvend multivariat dataanalyse.
  • Forstå og anvende tidsserier.
  • Forstå processen med statistisk kontrol af datakvalitet.
  • Beregn korrelationer og mønstre.
  • Kend til processen med at klynge dataene.

Modul 7. Maskinlæring

I de foregående moduler ser vi, hvordan man fortolker de eksisterende data, hvordan man udtrækker viden om alt, hvad der er sket med os. I dette modul vil vi henvende os til Machine Learning for at se, hvordan vi med god information kan henvende os til prediktorerne. Vi vil opdage de vigtigste teknikker og markedsværktøjer, hvilken type og mængde information er nødvendig, og vi vil udføre små praktiske moduler for at se deres anvendelighed.

mål:

  • Forstå forskellen mellem overvåget læring og uovervåget læring.
  • Kend til de forskellige klassificeringsteknikker, fra beslutningstræer til bayesiske teknikker.
  • Forstå begrebet maskinlæring.
  • Identificer den vigtigste open source og kommerciel software.
Blok III Visualisering og forretning

Modul 8. Datastyring.

Når vi har alle oplysningerne, skal vi definere reglerne for brug: hvem kan se dataene, definitionen af hver data, afstamning og give brugerne værktøjer til at fortolke dem.

Datastyring er hvor mange virksomheder mislykkes, der har to forskellige værdier for den samme KPI eller forudsigelse, forårsager mistillid mellem forskellige forretningsområder.

I dette modul lærer vi informationsstyringsteknikker til at opretholde integritet, sikkerhed og sporbarhed, for at sikre, at dataene hjælper med at tage sikre beslutninger uden at skabe mistillid.

mål:

  • Forstå, hvad der er tilgængelighed af data.
  • Administrer data som et aktiv.
  • Sørg for integritet.
  • Definer de vigtigste KPI'er og datasporbarhed.
  • Forstå begrebet sikkerhed.

Modul 9. Visualiseringsteknikker

I dette modul vil vi opdage, hvad der er de forskellige datavisualiseringsteknikker, og hvornår vi skal bruge hver af dem. De store datamængder har brug for nye grafiske repræsentationer for at fortolke dem: varmekort, klynger, dimensioner, kritiske stier, blandt andre.

Ud over grafikken er det vigtigt at knytte vurderingen til hver af dem og generere en fortolkning. Indikatorer kan forvirre og hindre beslutningstagning, orientere dem, sætte dem i sammenhæng og udsætte dem vil hjælpe til en bedre fortolkning:

mål:

  • Oplev de tilgængelige typer grafik.
  • Kend brugssagerne og deres vigtigste grafiske repræsentationer. Forstå processen, der er knyttet til overgangen til grafikken til forretningsfortællingen.
  • Ved, hvordan man forenkler og tilføjer data til adressedashboards.

Modul 10. Datavisualisering og selvbetjeningsværktøjer

Endelig, da økosystemet til visualiseringsværktøjer er komplekst, vil det være vigtigt at vælge det mest velegnede til hver type organisation. Vi må huske på, at vi i en organisation forsøger at forenkle teknologi, og vi skal finde en løsning for hele organisationen. Det er først da, vi let kan garantere sikkerheden, tilgængeligheden og tilgængeligheden af de samme KPI'er.

Selvbetjening er et vigtigt stykke i store organisationer med delegationer, filialer osv. Det giver dig mulighed for at decentralisere informationen og gøre hver node i organisationen autonom. I dette modul vil vi opdage de vigtigste værktøjer til datavisualisering og selvbetjening.

mål:

  • Identificer de vigtigste markedsværktøjer: Qlikview / sense, Tableau, PowerBI, Cognos.
  • Kend hver enkeltes styrker og svagheder.
  • Lav en case study med Qliksense og selvbetjeningsdata.
Afsluttende projekt

Under det endelige masterprojekt (PFM) arbejder den studerende hånd i hånd med en rigtig virksomhed i udviklingen af et projekt. Dette har mulighed for at gøre det for din egen virksomhed eller vælge mellem de muligheder, skolen foreslår.

De foreslåede projekter kan have to tilgange, Business og / eller Teknologisk, og inden for disse tilgange kan antage flere former, nogle eksempler er:

Fremgangsmåde 1. Forretning

  • Eksempel 1. Udvikling af forretningsplanen inklusive udstyr, infrastruktur og forretningsudleveringer i en teoretisk forretningssag med forskellige typer data.
  • Eksempel 2. Forretningsrådgivningsprojekt om en rigtig forretnings sag.

Fokus 2. Teknologisk

  • Eksempel 1. Udvikling af forretningsdashboards med et markedsværktøj med forskellige typer data og definition af indikatorer.
workshops

I Master i Big Data og Analytics har den studerende mulighed for at gennemføre 2 praktiske workshops. Disse workshops er:

Værksted 1. Neo4j

I denne workshop vil vi teknisk vide, hvordan Grafdatabaser fungerer. Hvordan man udnytter den magt, de kan bidrage til, når man søger efter de mest anvendte kritiske stier, hierarkiske gentagelser foran relationelle databaser.

Værksted 2. Watson

Løsningerne til opsætning af et kunstig intelligens / maskinlæringsmiljø kan gennemgå forskellige sammenkoblede Open Soucer-produkter, eller en løsning, der aggregerer de vigtigste markedsprodukter og garanterer interoperabilitet mellem versioner, automatiske opgraderinger og kontrahering som en service. Dette er Watsons vigtigste fordele, og i denne rent praktiske workshop vil vi opdage, hvordan vi skaber et miljø til vores datavidenskab, hvor vi kan styre løsninger og omkostninger.

Værktøj

I løbet af kurset vil vi nærme os de vigtigste markedsløsninger i hvert af de lag, der udgør en Big Data-løsning. De vigtigste løsningspartnere (IBM, Amazon, Google Cloud, Azure), databaser (Neo4J, HDFS, Cassandra, MongoDB), ETL'er (Kafka, Pentaho, Powercenter), præsentation (Tableau, Qlik) blandt andre.

Skibsføreren forsøger ikke at teknologisk uddanne deres studerende i hvert af disse værktøjer, men at gå ud fra et teoretisk synspunkt, se PRO og CONs for hver af dem og udføre små praksis for at forstå første hånd dens funktion. Praksiserne vil være enkle og lette at løse, ikke at være hovedfokus, men ser ud til ikke at være en rent teoretisk master.

Masterkrav

Studentprofil og adgangskrav

Programmets moduler er designet til fagfolk fra enhver sektor, der ønsker at implementere et Big Data-projekt i deres virksomhed, identificere, hvilke typer projekter der er af denne type og definere det bedste køreplan for projektet for at løse det med succes.

Oprindelsesprofilerne er:

  • Kandidater i teknisk teknik, ADE og naturvidenskab (Medicin, matematik, fysik, kemi).
  • Fagfolk, der arbejder inden for ikt-sektoren.
  • Mellemstillinger af virksomheder, der ønsker at have en fordelagtig position i lyset af fremtidige muligheder i deres virksomhed.
  • Professionelle BI (Business Intelligence) fagfolk, der ønsker at udvide deres viden.
  • Tekniske profiler / konsulenter, der i øjeblikket arbejder med data, og som ønsker at have en ende-til-ende ledelsesvision.
titrering

Efter afslutningen af programmet får de studerende:

  • En titel på tre point.
  • En egen grad akkrediteret af UPC, hvis universitetets krav er opfyldt ved afslutningen af programmet
Senest opdateret Mar 2020

Om skolen

OBS Business School nace en 2006 como la primera escuela de negocios 100% online en lengua española. Se funda en el entorno del Grupo Planeta, líder mundial en la publicación de contenidos para el mer ... Læs mere

OBS Business School nace en 2006 como la primera escuela de negocios 100% online en lengua española. Se funda en el entorno del Grupo Planeta, líder mundial en la publicación de contenidos para el mercado de habla hispana y con un importante know-how en e-learning, con la colaboración del partner estratégico: Minimer
Barcelona , Madrid + 1 Mere Mindre