دورة عبر الإنترنت – تخصص احترافي معتمد في NoSQL وBig Data وSpark من معهد IBM

ابدأ مسيرتك المهنية في مجال البيانات الضخمة. أتقن أساسيات NoSQL وBig Data وApache Spark من خلال مهارات عملية جاهزة للسوق في التعلم الآلي وهندسة البيانات.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

البدء

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • قواعد البيانات السحابية
  • مونجو دي بي
  • كاساندرا
  • NoSQL
  • كلودنت
  • التعلم الآلي
  • خطوط أنابيب التعلم الآلي
  • مهندس بيانات
  • سبارك مل
  • أباتشي سبارك
  • بيانات كبيرة
  • شرارة SQL
  • أباتشي المخدر

What you will learn in the course

Courses for which the course is suitable

  • مهندس بيانات
  • مطور البرمجيات
  • مهندس نظم المعلومات
  • عالم البيانات
  • مدير تكنولوجيا المعلومات

التخصص – سلسلة دورات من 3 دورات

هناك طلب كبير على مهندسي البيانات والمهنيين ذوي مهارات NoSQL في صناعة إدارة البيانات. هذا التخصص مخصص لأولئك الذين يرغبون في تطوير المهارات الأساسية للعمل مع قواعد بيانات Big Data وApache Spark وNoSQL. ثلاث دورات مليئة بالمعلومات تغطي قواعد البيانات الشائعة مثل MongoDB وApache Cassandra، بالإضافة إلى مجموعة أدوات Apache Hadoop المستخدمة على نطاق واسع للبيانات الضخمة، وبالطبع محرك تحليلات Apache Spark لمعالجة البيانات على نطاق واسع.

ملخص

  • نظرة عامة على فئات مختلفة من قواعد بيانات NoSQL (وليس SQL فقط)
  • العمل العملي على العديد من قواعد البيانات، بما في ذلك:
    • آي بي إم كلاودانت
    • MongoDB
    • كاساندرا
  • مهام إدارة البيانات، مثل:
    • إنشاء قاعدة البيانات
    • إعادة إعمارهم
    • إدخال البيانات
    • تحديث
    • الحذف
    • الاستعلامات
    • فِهرِس
    • تجميع
    • مشاركة البيانات
  • المعرفة الأساسية بتقنيات البيانات الضخمة مثل:
    • هادوب
    • MapReduce
    • HDFS
    • خلية
    • HBase
  • معرفة أعمق بـ Apache Spark، بما في ذلك:
    • إطارات بيانات سبارك
    • شرارة SQL
    • باي سبارك
    • واجهة تطبيق سبارك
    • توسيع نطاق الحمل باستخدام Kubernetes
  • العمل مع Spark Structured Streaming وSpark ML لأداء مهام معالجة ETL (الاستخراج والتحويل والتحميل) والتعلم الآلي.

مشروع التعلم العملي

وينصب التركيز في هذا التخصص على التعلم العملي. لذلك، تشتمل كل دورة على مختبرات عملية لممارسة وتطبيق مهارات NoSQL والبيانات الضخمة التي تم تعلمها خلال الفصول الدراسية.

الدورة الأولى
  • العمل مع العديد من قواعد بيانات NoSQL – MongoDB، وApache Cassandra، وIBM Cloudant لتنفيذ مجموعة متنوعة من المهام:
    • إنشاء قاعدة بيانات
    • إضافة المستندات
    • استعلامات البيانات
    • باستخدام HTTP API
    • إجراء عمليات الإنشاء والقراءة والتحديث والحذف (CRUD).
    • تقييد وفرز السجلات
    • فِهرِس
    • تجميع
    • إعادة الإعمار
    • باستخدام قذيفة CQL
    • العمليات في الفضاء الرئيسي
    • عمليات إضافية على الجداول
الدورة الثانية
  • إطلاق مجموعة Hadoop باستخدام Docker وتشغيل وظائف Map Reduce.
  • استكشف العمل مع Spark باستخدام سجلات Jupyter على Python الأساسية.
  • بناء مهارات Spark باستخدام DataFrames وSpark SQL وتوسيع نطاق المهام باستخدام Kubernetes.
الدورة الثالثة
  • استخدام Spark لمعالجة ETL.
  • تدريب وتشغيل نماذج التعلم الآلي باستخدام IBM Watson.

هذا التخصص مناسب للمبتدئين في مجال NoSQL والبيانات الضخمة – حتى لو كنت تعمل بالفعل كمهندسي بيانات أو مطورين أو مهندسي نظم معلومات أو علماء بيانات أو مديري تكنولوجيا المعلومات.

Details of the courses that make up the specialization

مقدمة إلى قواعد بيانات NoSQL

  • الدورة 1
    • 18 ساعة
    • 4.6 (293 تقييمًا)

تفاصيل الدورة

ماذا ستتعلم:
  • التمييز بين الفئات الأربع الرئيسية لقواعد بيانات NoSQL.
  • وصف خصائص ومزايا وقيود وتطبيقات الأدوات الشائعة لمعالجة البيانات الضخمة.
  • تنفيذ المهام الشائعة باستخدام MongoDB، بما في ذلك عمليات الإنشاء والقراءة والتحديث والحذف (CRUD).
  • اخرج من عمليات Keyspace وTable وCRUD في Cassandra.
المهارات التي سوف تكتسبها
  • التصنيف: قاعدة بيانات سحابية
  • الفئة: Mongodb
  • الفئة: كاساندرا
  • الفئة: NoSQL
  • التصنيف: سحاب

مقدمة للبيانات الضخمة باستخدام Spark وHadoop

  • الدورة 2
    • 19 ساعة
    • 4.4 (377 تقييمًا)

تفاصيل الدورة

ماذا ستتعلم:
  • شرح تأثير البيانات الضخمة، بما في ذلك حالات الاستخدام والأدوات وطرق المعالجة.
  • وصف بنية Apache Hadoop والنظام البيئي والممارسات والتطبيقات ذات الصلة بالمستخدم، بما في ذلك Hive وHDFS وHBase وSpark وMapReduce.
  • تطبيق أساسيات برمجة Spark، بما في ذلك أساسيات البرمجة المتوازية لـ DataFrames ومجموعات البيانات وSpark SQL.
  • استخدم Spark RDDs ومجموعات البيانات، وقم بتحسين Spark SQL باستخدام Catalyst وTungsten، واستفد من خيارات تطوير Spark ومستويات التشغيل.
المهارات التي سوف تكتسبها
  • الفئة: البيانات الضخمة
  • الفئة: سبارك إس كيو إل
  • الفئة: سباركمل
  • الفئة: أباتشي Hadoop
  • الفئة: أباتشي سبارك

التعلم الآلي مع أباتشي سبارك

  • الدورة 3
    • 15 ساعة
    • 4.5 (79 تقييمًا)

تفاصيل الدورة

ماذا ستتعلم:
  • وصف تعلم الآلة، وشرح دوره في هندسة البيانات، وتلخيص الذكاء الاصطناعي التوليدي، ومناقشة استخدامات Spark، وتحليل مسارات تعلم الآلة والاحتفاظ بالنموذج.
  • قم بتقييم نماذج تعلم الآلة، والتمييز بين نماذج الانحدار والتصنيف والتوزيع، ومقارنة خطوط أنابيب هندسة البيانات بخطوط أنابيب تعلم الآلة.
  • بناء عمليات تحليل البيانات باستخدام Spark SQL، وإجراء الانحدار والتصنيف والتوزيع باستخدام SparkML.
  • تحقيق الاتصال بمجموعات Spark، وإنشاء خطوط أنابيب ML، وإجراء استخراج الميزات وتحويلها، وحفظ النماذج.
المهارات التي سوف تكتسبها
  • التصنيف: التعلم الآلي
  • الفئة: خطوط أنابيب التعلم الآلي
  • الفئة: مهندس بيانات
  • الفئة: سباركمل
  • الفئة: أباتشي سبارك