Takviyeli öğrenme kavramlarına hakim olun. Eksiksiz bir RL çözümü uygulayın ve gerçek dünyadaki sorunları çözmek için yapay zeka araçlarının nasıl kullanılacağını anlayın.
Suggested by: Coursera (What is Coursera?)
No prior knowledge required
No unnecessary risks
Takviyeli öğrenmede uzmanlaşma, uyarlanabilir öğrenme sistemlerinin ve yapay zekanın (AI) gücünü araştıran 4 ders içerir. Yapay zekanın tüm potansiyelinden yararlanmak için uyarlanmış öğrenme sistemlerine ihtiyaç vardır. Takviyeli öğrenme (RL) çözümlerinin, baştan sona eksiksiz bir RL çözümü uygulayarak, deneme yanılma etkileşimi yoluyla gerçek dünyadaki sorunları çözmeye nasıl yardımcı olduğunu öğreneceksiniz.
Stajın sonunda öğrenciler, yapay zekadaki (AI) birçok modern teknolojinin temellerini anlayacak ve daha ileri düzey kurslara geçmeye veya yapay zeka fikir araçlarını gerçek dünya sorunlarına uygulamaya hazır olacaklar. İçerik, Alberta Üniversitesi Fen Fakültesi’nden dünyaca ünlü uzmanlar tarafından öğretilirken, takviyeli öğrenmenin temellerini anlamak için “küçük ölçekli” problemlere odaklanacak.
Programlama ödevleri ve sınavlar aracılığıyla öğrenciler:
Bu kursta, çevreyle etkileşime dayalı olarak optimale yakın politikaları öğrenebilen, aracının kişisel deneyiminden öğrenebilen çeşitli algoritmalar hakkında bilgi edineceksiniz. Uygulamalı deneyimlerden öğrenmek etkileyicidir çünkü çevrenin dinamikleri hakkında önceden bilgi gerektirmez, ancak yine de en uygun davranışı elde edebilir. Basit ama güçlü Monte Carlo yöntemlerini ve Q-öğrenme dahil zaman farkı öğrenme yöntemlerini tartışacağız. Dersi, iki dünyayı nasıl birleştirebileceğimizi keşfederek sonlandıracağız: öğrenmeyi önemli ölçüde hızlandırmak için model tabanlı planlamayı (dinamik programlamaya benzer) ve hızlandırılmış güncellemeleri birleştirebilen algoritmalar.
Bu derste büyük, çok boyutlu ve sonsuz olası durum uzaylarıyla ilgili problemlerin nasıl çözüleceğini öğreneceksiniz. Değer fonksiyonlarının değerlendirilmesinin, ödülü en üst düzeye çıkarmak için genelleştirme ve farklılaşmayı dikkatli bir şekilde dengeleyen aracılar oluşturmanıza olanak tanıyan denetimli öğrenme – işlev optimizasyonu – sorunu olarak sunulabileceğini göreceksiniz. Bu yolculuğa Monte Carlo ve TD gibi politika değerlendirme veya tahmin yöntemlerinin fonksiyon optimizasyonunu tanımlamaya nasıl genişletilebileceğini keşfederek başlayacağız. RL için özellik oluşturma teknikleri ve sinir ağları ve tekrarlama kullanılarak temsillerin öğrenilmesi hakkında bilgi edineceksiniz. Bu kursu politika değişim yöntemlerine derinlemesine bir bakışla bitireceğiz; Bir değer fonksiyonunu öğrenmeden politikayı doğrudan öğrenmenin bir yolu. Bu kursta iki sürekli mod kontrol görevini çözecek ve sürekli çalışma ortamında politika gradyan yöntemlerinin avantajlarını keşfedeceksiniz. Önkoşullar: Bu kurs, kurs 1 ve 2’nin temelleri üzerine kuruludur ve öğrencilerin bu kursa başlamadan önce bunları tamamlamaları gerekir. Öğrenciler ayrıca olasılıklar ve beklentiler, temel doğrusal cebir, temel matematik, Python 3.0 (en az bir yıl) ve sözde kod algoritmalarının uygulanması konusunda da rahat olmalıdır.
Bu son kursta, bir soruna eksiksiz bir RL çözümü uygulamak için 1, 2 ve 3. kurslardaki bilgilerinizi birleştireceksiniz. Bu özet, her bileşenin (problem formülasyonu, algoritma seçimi, parametre seçimi ve gösterim tasarımı) eksiksiz bir çözümde nasıl bir araya geldiğini ve gerçek dünyada RL’yi uygularken uygun seçimlerin nasıl yapılacağını görmenizi sağlayacaktır. Bu proje, hem sorununuz için uyarım ortamını hem de sinir ağı işlevi optimizasyonuna sahip bir kontrol aracısını uygulamanızı gerektirecektir. Ayrıca Aganti RL’nin sağlamlığını değerlendirme yeteneğinizi geliştirmek için öğrenme sisteminiz üzerinde bilimsel bir çalışma yürüteceksiniz. RL’yi gerçek dünyada kullanmak için (a) sorunu bir Markov karar süreci olarak doğru bir şekilde formüle etmek, (b) uygun algoritmaları seçmek, (c) uygulamanızdaki hangi seçimlerin performans üzerinde büyük bir etkiye sahip olacağını belirlemek, ve (d) ) algoritmalarınızın beklenen davranışını doğrulamak için. Bu kapak taşı, gerçek dünyadaki sorunları çözmek için RL’yi kullanmayı planlayan herkes için faydalıdır. Bu kursta başarılı olmak için bu uzmanlığın 1, 2 ve 3 numaralı kurslarını veya eşdeğerlerini tamamlamanız gerekecektir.



