強化学習と言うと最近はコンピューターの文脈でよく聞くようになった。しかしそれ以前はもともと心理学の言葉だったように思う。例えば動物を使った実験なんかで何かの行動に対して報酬もしくはバツのようなフィードバックを与える。それによってさらなる学習をしていくという構造。難しそうに言っているけれども実際にはみんな普段からやっていることで友人関係だとか親子関係だとかもしくはペットとの関係または仕事あらゆる環境で無意識にそういうことは自分が行っていたりまたはされていたりするだろう。 例えば考えてみたがペットに何か行動をさせてそれに対しての報酬がないとする。当然ペットはその行動を続けないだろう。ちょっとうまく言い表せてないねこの例は。私が言いたかったのはそうだな例えばこれは絶対にあってはいけないことなんだけど親が子供に対して食事を与えないとする。まあ食事を求めていることは聞かなくても分かっているわけでね。
#257 表面的なポジティブフィードバックと本質的なネガティブフィードバックを同時に与えること
#257…
#257 表面的なポジティブフィードバックと本質的なネガティブフィードバックを同時に与えること
強化学習と言うと最近はコンピューターの文脈でよく聞くようになった。しかしそれ以前はもともと心理学の言葉だったように思う。例えば動物を使った実験なんかで何かの行動に対して報酬もしくはバツのようなフィードバックを与える。それによってさらなる学習をしていくという構造。難しそうに言っているけれども実際にはみんな普段からやっていることで友人関係だとか親子関係だとかもしくはペットとの関係または仕事あらゆる環境で無意識にそういうことは自分が行っていたりまたはされていたりするだろう。 例えば考えてみたがペットに何か行動をさせてそれに対しての報酬がないとする。当然ペットはその行動を続けないだろう。ちょっとうまく言い表せてないねこの例は。私が言いたかったのはそうだな例えばこれは絶対にあってはいけないことなんだけど親が子供に対して食事を与えないとする。まあ食事を求めていることは聞かなくても分かっているわけでね。