Name: آموزش یادگیری تقویتی با پایتون
SKU: 3193
Availability: InStock
Rating: 3.50 (6 reviews)

مشاهده سبد خرید شما

الگوریتم های یادگیری ماشین؟

یادگیری ماشین ML الگوریتم‌های بسیار زیادی دارد اما می‌توان آن‌ها را در سه دسته اصلی زیر طبقه‌بندی کرد.

یادگیری با نظارت (Supervised ML): یادگیری با استفاده از نمونه داده ها و برچسب آنها
یادگیری بی نظارت (Unsupervised ML): یادگیری با استفاده از شباهت بین نمونه داده ها
یادگیری تقویتی (Reinforcement ML): یادگیری براساس آزمون و خطا و در تعامل با محیط

یادگیری تقویتی چیست؟

یادگیری تقویتی (Reinforcement Learning) نوعی روش یادگیری در حوزه‌ی یادگیری ماشین (Machine Learning) است. در یادگیری ماشین دو نوع یادگیری با ناظر (Supervised Learning) و بدون ناظر (Unsupervised Learning) هم داریم. در مقایسه این سه روش، یادگیری تقویتی کمی با دو روش دیگر متفاوت است. تفاوت اصلی میان یادگیری تقویتی (Reinforcement Learning) با روش های دیگر یادگیری ماشین، در این است که در یادگیری تقویتی، هیچ گاه به عامل (Agent) گفته نمی‌شود که کار درست در هر وضعیت کدام است و فقط به وسیله‌ی معیاری، به عامل فهمانده می شود که یک عمل (Action) به چه میزان خوب و یا به چه میزان بد می باشد. این وظیفه‌ عامل یادگیرنده (Learner) می باشد که با در دست داشتن این اطلاعات، یاد بگیرد که بهترین عمل در هر وضعیت کدام است. این موضوع، بخشی از نقاط قوت خاص یادگیری تقویتی است. در یادگیری تقویتی یک هوش مصنوعی (Artificial Intelligence) با موقعیتی شبیه به یک بازی روبه‌رو می‌شود. کامپیوتر برای یافتن راه‌حلی برای مسئله از روش آزمون‌وخطا استفاده می‌کند. برای اینکه ماشین بتواند آنچه برنامه‌نویس می‌خواهد انجام دهد، پاداش یا مجازاتی را برای اعمال خود دریافت می‌کند. هدف ماشین به‌ حداکثر رساندن پاداش‌های دریافتی است. اگرچه برنامه‌نویس سیاست‌هایی را برای دریافت پاداش (منظور همان قوانین بازی است) تعیین می‌کند، هیچ پیشنهادی به مدل برای نحوه‌ی حل بازی نمی‌دهد. ماشین یا همان هوش مصنوعی باید تشخیص دهد چطور از نتایجی که در هر اقدام به دست می‌آورد برای رسیدن به هدف نهایی استفاده کند. از این طریق، مسائل پیچیده‌ی تصمیم‌گیری در اغلب اوقات می‌توانند با فراهم کردن کمترین میزان اطلاعات مورد نیاز برای حل مسأله، حل شوند. در بسیاری از حیوانات، یادگیری تقویتی، تنها شیوه‌ی یادگیری مورد استفاده است. همچنین یادگیری تقویتی، بخشی اساسی از رفتار انسان‌ها را تشکیل می‌دهد. هنگامی که دست ما در مواجهه با حرارت می‌سوزد، ما به سرعت یاد می‌گیریم که این کار را بار دیگر تکرار نکنیم. لذت و درد مثالهای خوبی از پاداش‌ها هستند که الگوهای رفتاری ما و بسیاری از حیوانات را تشکیل می‌دهند. در یادگیری تقویتی، هدف اصلی از یادگیری، انجام دادن کاری و یا رسیدن به هدفی است، بدون آنکه عامل یادگیرنده، با اطلاعات مستقیم بیرونی تغذیه شود.Q-learning و SARSA دو الگوریتم محبوب و مستقل از مدل برای یادگیری تقویتی هستند. تمایز این الگوریتم‌ها با یکدیگر در استراتژی‌های جست‌و‌جوی آن‌ها محسوب می‌شود. در حالیکه استراتژی‌های استخراج آن‌ها مشابه است. در حالیکه Q-learning یک روش مستقل از سیاست است که در آن عامل ارزش‌ها را براساس عمل a* که از سیاست دیگری مشتق شده می‌آموزد.SARSA یک روش مبتنی بر سیاست محسوب می‌شود که در آن ارزش‌ها را براساس عمل کنونی a که از سیاست کنونی آن مشتق شده می‌آموزد. پیاده‌سازی این دو روش آسان است اما فاقد تعمیم‌پذیری هستند زیرا دارای توانایی تخمین ارزش‌ها برای حالت‌های مشاهده نشده نیستند. با استفاده از الگوریتم‌های پیشرفته‌تری مانند Deep Q-Networks که از شبکه‌های عصبی برای تخمین Q-value‌ها استفاده می‌کنند می‌توان بر این چالش‌ها غلبه کرد.

اجزای یادگیری تقویتی (Reinforcement Learning)

عامل (Agent): الگوریتم یا مدلی است که قرار است اقدامات را انجام دهد و با گذشت زمان از آن‌ها یاد بگیرد.
محیط (Environment): محیطی است که عامل با آن ارتباط برقرار می‌کند و اقدامات را در آن انجام می‌دهد.
اقدام (Action): همان کاری است که عامل انجام می‌دهد. اقدامات اساساً فعل‌وانفعالات عامل در یک محیط هستند.
پاداش (Reward): نتیجه یک اقدام است. هر عملی پاداشی دارد. پاداش می‌تواند مثبت یا منفی (پنالتی) باشد.
وضعیت (State): وضعیت فعلی عامل در محیط است. اعمالی که عامل انجام می‌دهد می‌تواند وضعیت آن را تغییر دهد.
سیاست (Policy): استراتژی یا رفتاری است که اقداماتی را دربرمی‌گیرد که عامل برای دست‌یابی به نتیجه‌ی موردنیاز باید انجام دهد.
تابع ارزش (Value Function): این تابع اساساً عامل را از حداکثر پاداشی که برای هر یک از وضعیت‌ها در آینده دریافت می‌کند، مطلع می‌کند. تابع ارزش می‌تواند عامل را در انتخاب عملکرد بهینه راهنمایی کند.

هدف از این دوره آموزشی؟

در این دوره آموزشی تئوری و عملی یادگیری تقویتی با زبان پایتون آموزش داده می شود و نحوه عملکرد یادگیری ماشین را می آموزید. مهم‌ترین الگوریتم‌ها و موارد کاربرد هر کدام را یاد خواهید گرفت و با نمونه‌های استفاده شده از یادگیری تقویتی در دنیای واقعی آگاه می شوید.در دوره آموزش یادگیری تقویتی بیگ لرن سعی داریم تا با ارائه مسیری مشخص در دنیای آموزش یادگیری تقویتی قدم گذاشته و با حل تمرین و مثال هایی در زبان برنامه نویسی پایتون (یادگیری تقویتی در پایتون) به کاربردی تر شدن این دوره کمک کنیم. در این دوره مباحث مهم و بنیادی در یادگیری تقویتی در اختیار شما قرار خواهد گرفت تا شما بتوانید مسائل مدل سازی را با یادگیری تقویتی حل کنید. در این دوره ابتدا مرور کامل روی پایتون انجام می شود. سپس تئوری یادگیری تقویتی در قالب مثال هایی بحث و بررسی می شود. در نهایت، پیاده سازی یادگیری تقویتی روی محیط های آماده و محیط های Custom بررسی و پیاده سازی می شود. جزئیات این دوره آموزشی در زیر لیست شده است. بدون شک یکی از بهترین دوره های یادگیری تقویتی با پایتون است که با زبان فارسی و روان توضیح داده شده است. امیدواریم که این آموزش از “بیگ لرن” هم مثل سایر آموزش ها مورد تایید و رضایت شما مخاطبان گرامی قرار گیرد.

مشاهده پیش نمایش این دوره در آپارات

بخش صفر: مرور کامل روی پایتون

نصب پایتون روی ویندور و لینوکس

خصوصی

کار با عملگرها و متغیرها در پایتون

خصوصی

کار با توابع و کلاس ها در پایتون

خصوصی

کار با ماژول ها و کتابخانه ها در پایتون

خصوصی

کار با انواع ساختمان دادها در پایتون

خصوصی

کار با زمان و تاریخ در پایتون

خصوصی

مدیریت استثنائات در پایتون

خصوصی

شی گرایی و ارث بری در پایتون

خصوصی

کار با دیتابیس MySQL در پایتون

خصوصی

برنامه نویسی چندنخی در پایتون

خصوصی

دریافت اطلاعات از کاربر با ماژول در پایتون

خصوصی

بخش پیشنیاز: مرور کامل روی یادگیری ماشین

بخش اول: معرفی کامل یادگیری تقویتی و پیاده سازی با pybrain

معرفی الگوریتم های یادگیری ماشین

خصوصی

چرا یادگیری ماشین تقویتی

خصوصی

معرفی الگوریتم های تقویتی

خصوصی

مولفه های الگوریتم های تقویتی

خصوصی

خصوصیات الگوریتم های تقویتی

خصوصی

مقایسه یادگیری تقویتی با یادگیری با ناظر

خصوصی

مراحل الگوريتم يادگيري تقويتي

خصوصی

اهداف يادگيري تقويتي

خصوصی

چالش های یادگیری تقویتی

خصوصی

الگوريتم يادگيري تقويتي محیط و عامل

خصوصی

روش های یادگیری تقویتی

خصوصی

مشهورترین روش های یادکیری تقویتی

خصوصی

تعریف پاداش در یادگیری تقویتی

خصوصی

معرفی Q-learning یادگیری تقویتی

خصوصی

تابع ارزش در روش مونت کارلو و روش TD

خصوصی

معرفی و نصب کتابخانه pybrain برای یادگیری تقویتی

خصوصی

پیاده سازی مثال عملی یادگیری تقویتی در pybrain

خصوصی

بخش دوم: الگوریتم های یادگیری تقویتی

بخش سوم: پیاده سازی عملی یادگیری تقویتی با پایتون

بخش چهارم: ایجاد محیط Custom برای Agent

مشاهده بیشتر

موارد مرتبط

افزودن به علاقه‌مندی‌ها

تشخیص و شناسایی بیماری مالاریا با هوش مصنوعی

بدون امتیاز 0 رای

اساتید بیگ لرن

13 ساعت

120,000 تومان

افزودن به علاقه‌مندی‌ها

آموزش شبکه عصبی با پایتون

پیش نیاز: ندارد

4.67 3 رای

اساتید بیگ لرن

23 ساعت

180,000 تومان

افزودن به علاقه‌مندی‌ها

پیش بینی بهره هوشی (IQ) با هوش مصنوعی

بدون امتیاز 0 رای

اساتید بیگ لرن

12 ساعت

120,000 تومان

افزودن به علاقه‌مندی‌ها

پیش بینی آب و هوا با هوش مصنوعی

بدون امتیاز 0 رای

اساتید بیگ لرن

13 ساعت

120,000 تومان

نظرات

متوسط امتیازات

3.5

3.50 6 رای

160,000 تومان

6 نقد و بررسی

جزئیات امتیازات

5 ستاره

4 ستاره

3 ستاره

2 ستاره

1 ستاره

6 دیدگاه برای آموزش یادگیری تقویتی با پایتون

شادمان

نمره 4 از 5

ممنون از آقای دکتر. دوره جالبی بود. منتظر دوره های بعدی شما هستم

برای پاسخ دادن وارد شوید
کامیار

نمره 4 از 5

آموزش خوب و مفیدی بود ولی با توجه به اینکه این اموزش درس سختی هست می توانست نحوه تدریس بهتر و با مثال بیشتری باشد.

برای پاسخ دادن وارد شوید
مهدی عموهادی(مالک تایید شده)

نمره 4 از 5

باسلام و تشکر از استاد
دوره ی خوب و کاربردیه و قیمت واقعا کم
بنطرم روی تمام مباحث پایه کار شده بود و برای شروع و کسب اطلاعات reinforcement learning خوبه . ممنون

برای پاسخ دادن وارد شوید
reza(مالک تایید شده)

نمره 3 از 5

سلام وقتتون بخیر. آیا از روش یادگیری تقویتی میشه برای classification یا regression استفاده کرد. درواقع کاری که با روش با نظارت انجام میشه رو میشه با روش یادگیری تقویتی انجام داد؟؟ و اینکه آیا این مباحثی که گفتم توی آموزش وجود داره؟؟
ممنون.

برای پاسخ دادن وارد شوید
- biglearn(مالک تایید شده)
  
  سلام وقت بخیر
  بله می توان از یادگیری تقویتی برای مسائل طبقه بندی و رگرسیون نیز استفاده کرد. اما ذاتا یادگیری تقویتی برای مسائلی استفاده میشه که لیبل کلاس ها در هر حالت تغییر می کند و ثابت نیست. در این دوره فقط مباحث عنوان شده در سایت گفته شده است. با تشکر
  
  برای پاسخ دادن وارد شوید
navid

نمره 4 از 5

سلام و عرض ادب آیا شما تدریس خصوصی یادگیری تقویتی انجام میدین

برای پاسخ دادن وارد شوید
- biglearn(مالک تایید شده)
  
  سلام و احترام بله
  
  برای پاسخ دادن وارد شوید
تهران حمیدرضا حیدری(مالک تایید شده)

نمره 2 از 5

مطالب دوره به نظرم قدیمی است و بیشتر تئوری رو میگن

برای پاسخ دادن وارد شوید

دیدگاه خود را بنویسید

برای ثبت نقد و بررسی وارد حساب کاربری خود شوید.

قیمت 160,000 تومان

افزودن به علاقه‌مندی‌ها

213 دانشجو

زبان: پایتون

16 ساعت

پیش نیاز: یادگیری ماشین

ناشر: بیگ لرن

زبان آموزش: فارسی

سطح مطالعه: حرفه ای

3 گیگ

نحوه دریافت: لینک دانلود

تاریخ انتشار: 3 آبان 1400

امتیاز کاربران:

3.50 6 رای

لینک کوتاه :

https://biglearn.ir/?p=3193

اساتید بیگ لرن

دکتری کامپیوتر

نمایش پروفایل

درباره مدرس

دکترای مهندسی کامپیوتر (گرایش هوش مصنوعی و رباتیکز) هستم. عمده فعالیت من در حوزه یادگیری عمیق، علم داده، پردازش تصویر و پردازش متن با زبان های برنامه نویسی پایتون و جاوا است.

از این مدرس

افزودن به علاقه‌مندی‌ها

آموزش مقاله نویسی برای ژورنال

بدون امتیاز 0 رای

اساتید بیگ لرن

5 ساعت

150,000 تومان

افزودن به علاقه‌مندی‌ها

آموزش طراحی سایت با وردپرس

بدون امتیاز 0 رای

اساتید بیگ لرن

11 ساعت

150,000 تومان

افزودن به علاقه‌مندی‌ها

آموزش سری های زمانی در پایتون

پیش نیاز: یادگیری عمیق

بدون امتیاز 0 رای

اساتید بیگ لرن

27 ساعت

195,000 تومان

افزودن به علاقه‌مندی‌ها

آموزش طراحی سایت با php

بدون امتیاز 0 رای

اساتید بیگ لرن

11 ساعت

رایگان!

کاربران محترم سایت، به دلیل قرارگیری فایل های دانلود روی گوگل درایو، بعد از خرید فعلا امکان دانلود فراهم نیست. لطفا فعلا خرید انجام ندید. با تشکر و احترام

آموزش یادگیری تقویتی با پایتون

الگوریتم ­های یادگیری ماشین؟

یادگیری تقویتی چیست؟

اجزای یادگیری تقویتی (Reinforcement Learning)

هدف از این دوره آموزشی؟

بخش صفر: مرور کامل روی پایتون

نصب پایتون روی ویندور و لینوکس

کار با عملگرها و متغیرها در پایتون

کار با توابع و کلاس ها در پایتون

کار با ماژول ها و کتابخانه ها در پایتون

کار با انواع ساختمان دادها در پایتون

کار با زمان و تاریخ در پایتون

مدیریت استثنائات در پایتون

شی گرایی و ارث بری در پایتون

کار با دیتابیس MySQL در پایتون

برنامه نویسی چندنخی در پایتون

دریافت اطلاعات از کاربر با ماژول در پایتون

بخش پیشنیاز: مرور کامل روی یادگیری ماشین

معرفی یادگیری ماشین

چالش ها و الگوریتم های یادگیری ماشین

پیش پردازش داده ها با یادگیری ماشین

پیاده سازی عملی یادگیری ماشین

بخش اول: معرفی کامل یادگیری تقویتی و پیاده سازی با pybrain

معرفی الگوریتم های یادگیری ماشین

چرا یادگیری ماشین تقویتی

معرفی الگوریتم های تقویتی

مولفه های الگوریتم های تقویتی

خصوصیات الگوریتم های تقویتی

مقایسه یادگیری تقویتی با یادگیری با ناظر

مراحل الگوريتم يادگيري تقويتي

اهداف يادگيري تقويتي

چالش های یادگیری تقویتی

الگوريتم يادگيري تقويتي محیط و عامل

روش های یادگیری تقویتی

مشهورترین روش های یادکیری تقویتی

تعریف پاداش در یادگیری تقویتی

معرفی Q-learning یادگیری تقویتی

تابع ارزش در روش مونت کارلو و روش TD

معرفی و نصب کتابخانه pybrain برای یادگیری تقویتی

پیاده سازی مثال عملی یادگیری تقویتی در pybrain

بخش دوم: الگوریتم های یادگیری تقویتی

هدف یادگیری تقویتی و اختلاف با یادگیری نظارتی

مدل تعامل عامل و محیط

روش های یادگیری تقویتی

مکانیزم احتمالاتی یادگیری تقویتی در حالت کلی

معرفی کامل روش های (𝑽𝒂𝒍𝒖𝒆−𝒃𝒂𝒔𝒆𝒅) روش ارزش محور

تعریف پاداش در یادگیری تقویتی ارزش محور

روش ارزش محور Bellman

مثال عملی با معادله بلمن

یادگیری تقویتی فعال و غیرفعال Active and passive

روش مونت کارلو و روش TD

معرفی کامل (𝑸−𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈)

روش های Policy-based سیاست محور

روش های Model-based مدل محور

روش های Actor-critic بازیگر-منتقد

فرآیند تصمیم مارکوف مرتبه ای

مسائل و محیط های غیرقطعی در یادگیری تقویتی

بیان مسائل غیرقطعی برای عامل (فرموله سازی مسئله)

هدف یادگیری یا تخمین تابع Tو R

تابع سیاست در مسائل غیرقطعی

چالش روش های قبلی در مقابل روش های یادگیری عمیق تقویتی

یادگیری عمیق تقویتی

انواع روش های یادگیری عمیق تقویتی

یادگیری عمیق تقویتی Value-Based

یادگیری تقویتی عمیق Policy-Based

یادگیری تقویتی عمیق Model-Based

بخش سوم: پیاده سازی عملی یادگیری تقویتی با پایتون

معرفی گوگل کولب برای کدنویسی

معرفی کتابخانه GYM

پیاده سازی عملی اول یادگیر تقویتی با پایتون

پیاده سازی عملی دوم یادگیر تقویتی با پایتون

بخش چهارم: ایجاد محیط Custom برای Agent

تنظیم دمای محیط با Agent

تعریف کلاس custom براساس action و state

تعریف لایه های شبکه عمیق برای یادگیری action ها

پیاده سازی step های عامل برای تنظیم دمای محیط

آموزش عامل براساس DQN

ارزیابی عامل روی محیط Custom

موارد مرتبط

الگوریتم های یادگیری ماشین؟