Online cursus – gecertificeerde professionele specialisatie in NoSQL, Big Data en Spark door IBM Institute

Geef uw big data-carrière een vliegende start. Beheers de grondbeginselen van NoSQL, Big Data en Apache Spark met praktische, marktklare vaardigheden op het gebied van machine learning en data-engineering.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

starten

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • Clouddatabases
  • Mongo DB
  • Cassandra
  • GeenSQL
  • Claudent
  • machinaal leren
  • Machine learning-pijplijnen
  • Gegevensingenieur
  • Spark ML
  • Apache-vonk
  • grote gegevens
  • Spark-SQL
  • Apache de dope

What you will learn in the course

Courses for which the course is suitable

  • Gegevensingenieur
  • Software-ontwikkelaar
  • Architect van informatiesystemen
  • data wetenschapper
  • IT-manager

De specialisatie – een cursusreeks van 3 cursussen

Er is veel vraag naar data-ingenieurs en professionals met NoSQL-vaardigheden in de databeheerindustrie. Deze specialisatie is bedoeld voor degenen die basisvaardigheden willen ontwikkelen voor het werken met Big Data-, Apache Spark- en NoSQL-databases. Drie informatierijke cursussen behandelen populaire databases zoals MongoDB en Apache Cassandra, evenals de veelgebruikte Apache Hadoop-toolkit voor big data, en natuurlijk de Apache Spark-analyse-engine voor grootschalige gegevensverwerking.

Overzicht

  • Overzicht van verschillende categorieën NoSQL-databases (niet alleen SQL)
  • Praktisch werken met verschillende databases, waaronder:
    • IBM Cloudant
    • MongoDB
    • Cassandra
  • Gegevensbeheertaken, zoals:
    • Databases maken
    • hun wederopbouw
    • Gegevensinvoer
    • bijwerken
    • verwijdering
    • Vragen
    • Index
    • Aggregatie
    • gegevens delen
  • Basiskennis van Big Data-technologieën zoals:
    • Hadoep
    • KaartVerminderen
    • HDFS
    • Bijenkorf
    • HBase
  • Diepere kennis van Apache Spark, waaronder:
    • Spark’s dataframes
    • Spark-SQL
    • PySpark
    • De Spark-toepassingsinterface
    • De belasting schalen met Kubernetes
  • Werken met Spark Structured Streaming en Spark ML om ETL-verwerking (Extract, Transform, Load) en machine learning-taken uit te voeren.

Een praktisch leerproject

De nadruk in deze specialisatie ligt op praktisch leren. Daarom bevat elke cursus praktische labs om de tijdens de lessen geleerde NoSQL- en Big Data-vaardigheden te oefenen en toe te passen.

eerste cursus
  • Werk met verschillende NoSQL-databases – MongoDB, Apache Cassandra en IBM Cloudant om verschillende taken uit te voeren:
    • Een databank maken
    • Documenten toevoegen
    • Gegevensquery’s
    • Met behulp van de HTTP-API
    • Uitvoeren van bewerkingen voor maken, lezen, bijwerken en verwijderen (CRUD).
    • Records beperken en sorteren
    • Index
    • Aggregatie
    • wederopbouw
    • CQL-shell gebruiken
    • Operaties in sleutelruimte
    • Extra bewerkingen op tafels
Tweede cursus
  • Een Hadoop-cluster lanceren met behulp van Docker en Map Reduce-taken uitvoeren.
  • Ontdek het werken met Spark met behulp van Jupyter-logboeken op Python core.
  • Het opbouwen van Spark-vaardigheden met behulp van DataFrames, Spark SQL en het schalen van taken met Kubernetes.
Derde cursus
  • Spark gebruiken voor ETL-verwerking.
  • Machine learning-modellen trainen en uitvoeren met behulp van IBM Watson.

Deze specialisatie is geschikt voor beginners op het gebied van NoSQL en Big Data – ook als je al werkt als data engineers, ontwikkelaars, informatiesysteemarchitecten, datawetenschappers of IT-managers.

Details of the courses that make up the specialization

Inleiding tot NoSQL-databases

  • Cursus 1
    • 18 uur
    • 4,6 (293 beoordelingen)

Cursusdetails

Wat je gaat leren:
  • Maak onderscheid tussen de vier hoofdcategorieën van NoSQL-databases.
  • Beschrijf de kenmerken, voordelen, beperkingen en toepassingen van populaire tools voor het verwerken van big data.
  • Voer algemene taken uit met MongoDB, inclusief bewerkingen voor maken, lezen, bijwerken en verwijderen (CRUD).
  • Sluit Keyspace-, Table- en CRUD-bewerkingen af ​​in Cassandra.
vaardigheden die je gaat verwerven
  • Categorie: Clouddatabase
  • Categorie: Mongodb
  • Categorie: Cassandra
  • Categorie: NoSQL
  • Categorie: Cloudant

Inleiding tot Big Data met Spark en Hadoop

  • Cursus 2
    • 19 uur
    • 4.4 (377 beoordelingen)

Cursusdetails

Wat je gaat leren:
  • Leg de impact van big data uit, inclusief gebruiksscenario’s, tools en verwerkingsmethoden.
  • Beschrijf de Apache Hadoop-architectuur, het ecosysteem, de praktijken en gebruikersgerelateerde applicaties, waaronder Hive, HDFS, HBase, Spark en MapReduce.
  • Pas de basisprincipes van Spark-programmering toe, inclusief de basisprincipes van parallelle programmering voor DataFrames, datasets en Spark SQL.
  • Gebruik Spark RDD’s en datasets, optimaliseer Spark SQL met Catalyst en Tungsten en profiteer van de ontwikkelingsopties en runlevels van Spark.
vaardigheden die je gaat verwerven
  • Categorie: Bigdata
  • Categorie: SparkSQL
  • Categorie: SparkML
  • Categorie: Apache Hadoop
  • Categorie: Apache Spark

Machine learning met Apache Spark

  • Cursus 3
    • 15 uur
    • 4,5 (79 beoordelingen)

Cursusdetails

Wat je gaat leren:
  • Beschrijf ML, leg de rol ervan in data-engineering uit, vat generatieve AI samen, bespreek het gebruik van Spark en analyseer ML-pijplijnen en modelretentie.
  • Evalueer ML-modellen, maak onderscheid tussen regressie-, classificatie- en distributiemodellen en vergelijk data-engineering-pijplijnen met ML-pijplijnen.
  • Bouw data-analyseprocessen met Spark SQL en voer regressie, classificatie en distributie uit met SparkML.
  • Realiseer verbinding met Spark-clusters, bouw ML-pijplijnen, voer functie-extractie en -transformatie uit en sla modellen op.
vaardigheden die je gaat verwerven
  • Categorie: machinaal leren
  • Categorie: machine learning-pijplijnen
  • Categorie: Data-ingenieur
  • Categorie: SparkML
  • Categorie: Apache Spark