Analyseoplossing ontwikkelen op basis van Open Source-software (OSS) met Azure HDInsight

Gevorderd
Data Engineer
Data Scientist
HDInsight

In dit leertraject maakt de student kennis met HDInsight en manieren om deze technologie toe te passen om tal van praktische uitdagingen op te lossen.

Vereisten

Er moet aan de volgende vereiste worden voldaan

  • Succesvol aanmelden bij Azure Portal
  • De opslagopties in Azure begrijpen
  • De berekeningsopties in Azure begrijpen

Modules in dit leertraject

Aan het einde van deze module leert u dat Azure HDInsight een volledig beheerde cloudservice is waarmee u efficiƫnt enorme hoeveelheden gegevens kunt verwerken met behulp van de populairste open source frameworks.

In deze module leert u de verschillende configuraties voor een optimaal gebruik van HDInsight vanuit zowel het oogpunt van prestaties als kosten.

In deze module leert u hoe u een HDInsight-cluster maakt, een cluster bewaakt en op de hoogte bent van veelvoorkomende inrichtingsproblemen.

Meer informatie over hoe HBase willekeurige toegang en sterke consistentie biedt voor grote hoeveelheden ongestructureerde en semi-gestructureerde gegevens in een schema zonder database, geordend op kolomfamilies.

In deze module leert u hoe u pijplijnen en toepassingen voor realtime streaminggegevensanalyse kunt maken in de cloud met behulp van Azure HDInsight met Apache Kafka en Apache Spark.

Aan het einde van deze module kunt u ad-hocquery's uitvoeren op een big data-set. Het gebruik van HDInsight Interactive Query om querylatentie van minder dan een seconde te bereiken.

Azure HDInsight in combinatie met andere Azure-services biedt een uitgebreide beveiligingsoplossing met meerdere lagen en is een gedeelde verantwoordelijkheid tussen Microsoft en de klant.