Kí ni Reinforcement learning (RL)

Reinforcement learning (RL) jẹ́ ẹ̀ká ẹ̀ká tí ó wà lábẹ́ Machine Learning tí ó ṣé ẹ̀gbẹ́ àti Optimal control, ó ń kọ́ nípa bí ọ̀rọ̀ àgbà á ṣe gbà ní ọ̀rọ̀ tó ṣẹ̀bẹ̀.

Reinforcement learning (RL) jẹ́ ẹ̀ká tí ó kọ́ ètò ìrọ̀rùn láti ṣe ìpinnu ọ̀rọ̀ tí ó dájú àti ìpinnu tó dára jùlọ. Ó má mọ́ nípa rírò bí ọ̀rọ̀ yóò ṣẹ̀ fún ún tí yóò sì fi ọ̀rọ̀ tó yàtò̀ ṣe nígbà mìíràn láti lè mú ọ̀rọ̀ náà ṣẹ̀. Nígbàtí yóò bá ti ṣe ìpinnu tí ó tọ́, ó má a rí èrè, tí yóò bá ṣe ìpinnu tí ó fi máa dùn ún, ó má a rí àbùkù tàbí kúlèkúlè. Bákan náà, Reinforcement learning (RL) ma á máa kọ́ láti inú awọn ìpinnu tó ti ṣe rí. Òun ma á máa gbà àgbà sínú rè jẹ́ fún ìpinnu tó ṣe fún ún, tí ó bá wá ṣe ìpinnu tó fi máa gbà á sínú rè jẹ́, yóò máa gbà á sínú rè kúrúkúrú.

Ìgbà gbogbo nígbàtí ọ̀rọ̀ bá ti wáyé, Reinforcement learning (RL) má a máa kọ́ wo ètò tí ó wà, fún àpẹẹrẹ, bí ọ̀rọ̀ bá jẹ́ nípa bí a ó ṣe ta gbɔ̀n gbɔ̀n, ètò náà má a máa kọ́ láti inú gbígbé gbɔ̀n.

Ìgbésẹ̀ tí Reinforcement learning (RL) má a máa gbà, ó gba ìgbésẹ̀ kan.

Ìgbésẹ̀ náà má a máa fa ìyípadà kan láti inú ètò náà

Ètò náà má a máa rí ìgbésè tó ṣe yìípadà tó dára jùlọ láti inú ìgbésẹ̀ tó ṣẹ̀.

Ètò náà má a máa kọ́ láti inú ìgbésẹ̀ tó ṣe yìípadà tó dára jùlọ, tí ó bá ṣe ìgbésẹ̀ tó rí, yóò máa ṣe bàlà.

Reinforcement learning (RL) ní àwọn ìlò púpọ̀, fún àpẹẹrẹ:

Ìbùgbé ẹ̀rọ
Ìgbàgbé ẹ̀rọ
Ìgbimọ̀ ẹ̀rọ
Àgbàádá ẹ̀rọ
Àwọn ìpolowo ìmọ̀ ẹ̀rọ

Reinforcement learning (RL) jẹ́ ẹ̀ká tí ó ṣe pàtàkì tó n ní ìgbésẹ̀ tó dára nínú ìgbésẹ̀ rẹ̀ ní ti ìfihàn tó dára nínú ìmọ̀ ẹ̀rọ.