Nígbà tí ọ̀rọ̀ bá kàn reinforcement learning, ó tún ṣe pàtàkì láti fi yé ẹ̀kọ́ tí a kọ́ rí ni reinforcement learning, bẹ́ẹ̀ bákan náà àgbà reinforcement learning yìí ńfẹ́ láti máa ṣiṣé ní ọ̀nà tí ó dára jùlọ, ọ̀nà tí ó tọ́jù jùlọ àti ọ̀nà tí ó yẹ kọ̀ọ̀kan láti lè mọ̀ ọ̀nà tí ó yẹ kọ̀ọ̀kan.
Kí ni reinforcement learning?
Reinforcement learning jẹ́ ọ̀rọ̀ tí ó wà lẹ́nu iṣẹ́ kíkọ́ kọ̀mpútà, iṣẹ́ yìí ńkọ́ àwọn kọ̀mpútà láti máa yan àwọn ohun tí ó tọ́ bákan náà tí ń wọ́pọ̀ jùlọ nínú àwọn ohun gbogbo tí wọn bá kọ. Ó tún ńkọ́ wọn láti rí ìyàtọ̀ àárín àwọn ohun tí ó dára àti àwọn ohun tí kò dára. reinforcement learning ńkọ́ àwọn kọ̀mpútà láti kẹ́kọ̀ọ́ láti inú àwọn ìṣètò tí ó ti tẹ́lẹ̀ ṣe àti àṣìṣe tí ó ti kọ́.
Jẹ́ kí á wo àpẹẹrẹ kan, jẹ́ kí á sọ pé ìwọ gbà ọ̀rọ̀ sí kọ̀mpútà láti máa wo sínú kátà, eléyìí yóò jẹ́ kí ẹ̀rọ kọ̀mpútà náà lè mọ̀ báwo láti wo sínú kátà. Nígbà tí ẹ̀rọ kọ̀mpútà náà bá ń wò sínú kátà, ó máa ń gbà àbíkún, ó sì máa ń ṣiṣé àwọn ìgbésẹ̀ mìíràn láti wo sínú kátà, èyí yóò jẹ́ kí ó mọ̀ báwo àti ìgbà tí ó yẹ láti wo sínú kátà. Nígbà tí ẹ̀rọ kọ̀mpútà náà bá n wò sínú kátà, ó máa ń rí àwọn àbíkún àti ìgbésẹ̀ mìíràn lọ́wọ́ ọ̀rọ̀ tí ìwọ náà gbà sí i, eyí yóò jẹ́ kí ó lè ṣiṣé lati rí báwo àti ìgbà tí ó yẹ láti wo sínú kátà.
Àwọn ohun mìíràn tí reinforcement learning gbà laaye
Ẹ̀kúnrẹ́́rẹ̀ reinforcement learning
Ohun tí o gbọ́dọ̀ mọ̀
Nígbà tí ọ̀rọ̀ bá kàn reinforcement learning, ó tún ṣe pàtàkì láti fi yé ẹ̀kọ́ tí a kọ́ rí ni reinforcement learning, bẹ́ẹ̀ bákan náà reinforcement learning ńfẹ́ láti máa ṣiṣé ní ọ̀nà tí ó dára jùlọ, ọ̀nà tí ó tọ́jù jùlọ àti ọ̀nà tí ó yẹ kọ̀ọ̀kan láti lè mọ̀ ọ̀nà tí ó yẹ kọ̀ọ̀kan.