بناء أدوات أفضل لعلم البيانات. تعلم كيفية تصميم برامج لأدوات البيانات، وتوزيع حزم R، وإنشاء تصورات مخصصة.
Suggested by: Coursera (What is Coursera?)
No prior knowledge required
No unnecessary risks
R هي لغة برمجة وبيئة برمجية مجانية للحسابات والرسومات الإحصائية، والتي تستخدم على نطاق واسع من قبل المحللين وعلماء البيانات والإحصائيين.
يتعامل هذا التخصص مع تطوير البرمجيات في R لبناء أدوات علم البيانات. مع تطور مجال علم البيانات، أصبح من الواضح أن مهارات تطوير البرمجيات ضرورية لإنتاج نتائج ومنتجات مفيدة لعلم البيانات وتوسيع نطاقها.
سوف تتعلم أساليب تطوير البرمجيات الحديثة لبناء أدوات قابلة لإعادة الاستخدام ونموذجية ومناسبة للاستخدام في بيئات الفريق أو مجتمعات المطورين.
في كل دورة من الدورات، سيقوم الطلاب بتطبيق مهارات البحث المتقدمة التي اكتسبوها من أجل:
ستنتج هذه المشاريع مجموعة من أكواد البحث والتطوير التي يمكن إعادة استخدامها والبناء عليها للنشر في العالم الحقيقي.
تقدم هذه الدورة مقدمة متعمقة للغة البرمجة R، مع التركيز على استخدام R لتطوير برمجيات علوم البيانات. سواء كنت جزءًا من فريق علوم البيانات أو تعمل بشكل مستقل في مجتمع المطورين، ستمنحك هذه الدورة معرفة البحث التي تحتاجها للمساهمة بشكل هادف في هذه المجالات. باعتبارها الدورة الأولى في الخبرة، فهي توفر أساسيات R اللازمة للدورات اللاحقة. سنقدم المفاهيم الأساسية في R، ومبادئ اللغة، والمفاهيم الأساسية مثل البيانات المطلوبة والأدوات ذات الصلة في Thediaverse، ومعالجة مجموعات البيانات المعقدة والكبيرة ومعالجتها، والتعامل مع البيانات النصية ومهام علم البيانات الأساسية. بعد الانتهاء من الدورة، سيتقن الطلاب استخدام وحدة التحكم R وسيتمكنون من إنشاء مجموعات بيانات مرتبة من مجموعة واسعة من مصادر البيانات المحتملة.
تغطي هذه الدورة موضوعات متقدمة في برمجة البحث المطلوبة لتطوير أدوات علوم بيانات قوية وقوية وقابلة للاستخدام. تشمل المواضيع البرمجة الوظيفية في R، والتعامل المرن مع الأخطاء، والبرمجة الموجهة للكائنات، وتوصيف الأداء واختباره، وتصحيح الأخطاء، وتصميم الوظائف المناسب. بعد الانتهاء من الدورة التدريبية، ستتمكن من تحديد مهام تحليل البيانات الشائعة وإدراجها ضمن الوظائف المخصصة للمستخدمين. نظرًا لأن كل بيئة لعلم البيانات تواجه تحديات بيانات فريدة، فمن الضروري دائمًا تطوير برامج مصممة خصيصًا لتقرير مؤسستك. يمكنك أيضًا تحديد أنواع بيانات جديدة في R وتطوير خطوط عمل فريدة لأنواع البيانات هذه لتمكين التنفيذ الأكثر وضوحًا لمهام علم البيانات سهولة الاستخدام أقوى داخل الفريق.
إن كتابة كود جيد لعلم البيانات ليس سوى جزء من الوظيفة. لتحقيق أقصى قدر من سهولة الاستخدام وإعادة الاستخدام لبرامج علوم البيانات، يجب تنظيم التعليمات البرمجية وتوزيعها بطريقة تلبي المعايير المجتمعية وتوفر تجربة مستخدم جيدة. تغطي هذه الدورة الطرق الرئيسية التي يتم من خلالها تنظيم برامج R وتوزيعها على الآخرين. نحن نغطي تطوير حزم R، وكتابة وثائق جيدة ومتوازنة، وكتابة برامج مرنة، والتطوير عبر الأنظمة الأساسية، وأدوات التكامل المستمر، وتوزيع الحزم عبر CRAN وGitHub. سيقوم الطلاب بإنتاج حزم R التي تلبي معايير التقديم إلى CRAN.
أنتجت ثورة علم البيانات كميات كبيرة من البيانات من مجموعة واسعة من المصادر الجديدة. يتم استخدام هذه البيانات الجديدة للإجابة على الأسئلة الجديدة بطريقة لم يتم وصفها من قبل. يظل التصور أحد أقوى الطرق لاستخلاص النتائج من البيانات، ولكن تدفق أنواع جديدة من البيانات يتطلب تطوير تقنيات تصور جديدة. توفر لك هذه الدورة المهارات اللازمة لإنشاء أدوات التصور تلك. سنركز على إطار عمل ggplot2 ونوضح كيفية استخدام النظام وتوسيعه وفقًا للاحتياجات المحددة لمؤسستك أو فريقك. عند الانتهاء من الدورة، سيكون الطلاب قادرين على بناء الأدوات اللازمة لتصور مجموعة واسعة من أنواع البيانات وسيكون لديهم المعرفة الأساسية اللازمة للتعامل مع أنواع البيانات الجديدة عند تلقيها.
دورة ملخصة لبرمجة R



