دورة عبر الإنترنت – تخصص احترافي معتمد في معالجة البيانات بدون خادم من معهد Google Cloud

تطوير تطبيقات البيانات الضخمة القابلة للتطوير باستخدام التقنيات المتقدمة والحلول المخصصة.

Suggested by: Coursera (What is Coursera?)

Professional Certificate

البدء

No prior knowledge required

Time to complete the course

7-day free trial

No unnecessary risks

Skills you will acquire in the course

  • خطأ تقريبي
  • رسم بياني
  • تحديد السببية
  • نموذج البيانات
  • الاستخراج والتحويل والتحميل (ETL)
  • التحليلات
  • الوضع (علوم الكمبيوتر)

What you will learn in the course

Courses for which the course is suitable

  • مطور البيانات الكبيرة
  • مهندس بيانات
  • محلل البيانات
  • مدير مشروع البيانات
  • خبير جوجل السحابي
  • مطور تطبيقات معالجة البيانات
  • مدير نظم المعلومات
  • أخصائي حلول البيانات

التدريب – سلسلة من 3 دورات

مع تزايد الطلب على الأعمال التجارية التي تعتمد على البيانات، يصبح من الصعب مواكبة أحدث التقنيات. جميع المتخصصين في البيانات الضخمة على دراية بالعناصر الثلاثة للبيانات الضخمة: الحجم والسرعة والتنوع. ماذا لو كانت هناك تكنولوجيا لا تخشى القيود، ومصممة لتلبية هذه المتطلبات؟

تعرف على تدفق بيانات Google Cloud. يعمل Google Cloud Dataflow على تبسيط عملية معالجة البيانات من خلال توحيد المعالجة المجمعة ومعالجة التدفق، مما يوفر تجربة بدون خادم تسمح للمستخدمين بالتركيز على التحليلات بدلاً من البنية التحتية. هذا التدريب مخصص للعملاء والشركاء الذين يرغبون في تحسين فهمهم لـ Dataflow لتطوير تطبيقات معالجة البيانات الخاصة بهم.

يتضمن التدريب ثلاث دورات:

  • الأساسيات
    – وهو ما يشرح كيفية عمل Apache Beam وDataflow معًا لتلبية احتياجات معالجة البيانات دون الاعتماد على مزود الخدمة.
  • تطوير الطريق
    – والتي تدور حول كيفية تحويل منطق أعمالنا إلى تطبيقات معالجة البيانات التي يمكن تشغيلها على Dataflow.
  • العمليات
    – والذي يتناول أهم الدروس لإدارة تطبيق البيانات في Dataflow، بما في ذلك المراقبة واستكشاف الأخطاء وإصلاحها والاختبار والموثوقية.

مشروع التعلم العملي

يتضمن هذا التدريب مختبرات عملية باستخدام منصة Qwiklabs. تعتمد المعامل على المعلومات التي تم تعلمها في وحدات الدورة. يتم توفير إصدارات Java وPython للمختبرات عند الحاجة. بالنسبة للمختبرات التي تتطلب إضافة/تحديث التعليمات البرمجية، فإننا نقدم حلاً موصى به لاستخدامك.

Details of the courses that make up the specialization

معالجة البيانات بدون خادم باستخدام تدفق البيانات: الأساسيات

الدورة 1 • 3 ساعات

تفاصيل الدورة

ماذا ستتعلم:
  • اشرح كيفية عمل Apache Beam وCloud Dataflow معًا لتلبية احتياجات معالجة البيانات في مؤسستك.
  • تلخيص فوائد إطار التنقل Beam وتمكينه من العمل مع خطوط أنابيب تدفق البيانات.
  • قم بتشغيل Shuffle & Streaming Engine لخطوط معالجة البيانات، سواء على دفعات أو متدفقة، للوصول إلى أقصى قدر من الأداء.
  • تمكين التخطيط المرن للموارد لتحقيق أداء أكثر فعالية من حيث التكلفة.

معالجة البيانات بدون خادم باستخدام تدفق البيانات: تطوير خطوط الأنابيب

الدورة 2 • 18 ساعة

تفاصيل الدورة

ماذا ستتعلم:
  • في الجزء الثاني من سلسلة الدورات التدريبية حول Dataflow، سنقوم بتحليل متعمق لتطوير خطوط الأنابيب بمساعدة Beam SDK. لنبدأ بإلقاء نظرة عامة على مفاهيم Apache Beam.
  • بعد ذلك، سننظر في معالجة البيانات في تدفق باستخدام النوافذ والعلامات المائية والمشغلات.
  • بعد ذلك، سنراجع خيارات المصادر والمصارف في مساراتك، واصطلاحات التعبير عن البيانات التي يمكن تنظيمها، وكيفية إجراء تحويلات ذات حالة باستخدام واجهات برمجة تطبيقات الحالة والمؤقت.
  • في الخطوة التالية، سنراجع أفضل المنهجيات لتحويل الأداء في خطوط الأنابيب.
  • في نهاية الدورة، سنقدم SQL وDataframes لتمثيل منطق عملك في Beam وكيفية تطوير خطوط الأنابيب بشكل متكرر باستخدام دفاتر ملاحظات Beam.
المهارات التي سوف تكتسبها:
  • الفئة: نموذج البيانات
  • الفئة: الاستخراج والتحويل والتحميل (ETL)
  • التصنيف: تحليلات
  • الفئة: الحالة (علوم الكمبيوتر)

معالجة البيانات بدون خادم مع تدفق البيانات: العمليات

الدورة 3 • 9 ساعات

تفاصيل الدورة

ماذا ستتعلم:
  • إجراء المراقبة واستكشاف الأخطاء وإصلاحها والاختبار وعمليات CI/CD على خطوط أنابيب Dataflow.
  • قم بتنفيذ خطوط أنابيب Dataflow مع وضع الموثوقية في الاعتبار لتحقيق أقصى قدر من استقرار النظام الأساسي لمعالجة البيانات لديك.
المهارات التي سوف تكتسبها:
  • التصنيف: خطأ القرب
  • الفئة: الرسم البياني
  • الفئة: الانحدار
  • التصنيف: السببية