逆強化学習

逆強化学習とは

強化学習逆強化学習

強化学習は，長期的な報酬を最大化するような方策を求めることを目的としていました．囲碁の場合は勝つ（相手より陣地をとる）と報酬がもらえ，迷路の場合はゴールにたどり着けば報酬がもらえます．このように囲碁や迷路では報酬の設計が簡単です．しかし…