
Discover more from PUBLISH
#257 表面的なポジティブフィードバックと本質的なネガティブフィードバックを同時に与えること
強化学習と言うと最近はコンピューターの文脈でよく聞くようになった。しかしそれ以前はもともと心理学の言葉だったように思う。例えば動物を使った実験なんかで何かの行動に対して報酬もしくはバツのようなフィードバックを与える。それによってさらなる学習をしていくという構造。難しそうに言っているけれども実際にはみんな普段からやっていることで友人関係だとか親子関係だとかもしくはペットとの関係または仕事あらゆる環境で無意識にそういうことは自分が行っていたりまたはされていたりするだろう。
例えば考えてみたがペットに何か行動をさせてそれに対しての報酬がないとする。当然ペットはその行動を続けないだろう。ちょっとうまく言い表せてないねこの例は。私が言いたかったのはそうだな例えばこれは絶対にあってはいけないことなんだけど親が子供に対して食事を与えないとする。まあ食事を求めていることは聞かなくても分かっているわけでね。
けれども親はその子供に対してそれ以外の部分ではポジティブなフィードバックをする。つまり例えばめちゃくちゃ褒めるとかね。めちゃくちゃ褒めるけど一番欲しいものはなぜかくれないと。ご飯くれないと。ご飯欲しいよね。
これを動物に置き換えて考えるとどうだろうか、成り立つだろうか。まあ何か芸をさせてもしくは動物が自発的にした行動に対して非常にこう好意的にポジティブに反応する褒める。けれども一番の報酬は与えない。餌は与えない。困ったね。
こういう状況で人間がどういう心理に陥るのか。例えば人間じゃなくてもいいんだけど今さっきは動物が例だったし。行動に対して非常に褒めるけれども最も求めている報酬は与えない。これは多分何だろうね今すごい曖昧な話になってるわけですが。
ホストと客の例で言うと、これはホストクラブに行ったことないのでただのイメージというかあくまで思考のための架空の存在だと思って欲しいけれども、本当はポストから客は一番にこう愛されたいと仮定する。自分は客じゃないので本質的にはわからないけど仮定します。
お金使ってくれたらすごい喜ぶわけだよね、まあ喜ぶし褒めてくれるしなんかもしかしたらデートとかしてくれるのかもしれないしそういうポジティブな報酬があると。しかし最も求めているはずの独占というものは与えられないし叶わないと。これがまさに今自分がイメージしている2つの逆方向のメッセージが与えられることによる人間の心理や行動に与える影響の例なんだろうか。
まあ何でそういうこと思ったかって言うと、この間仕事上でこれは2つの異なる逆方向のメッセージを発してしまっているのではないかこの人は、と思ったようなことがあって、もちろん結果として人は混乱するわけ。混乱して無気力になったりもしくは何が正解かわからなすぎて右往左往したり、もしくはそもそも表面的にポジティブなフィードバックと本質的にネガティブなフィードバックが共存していると人はどうなってしまうのか。
多分良くないんだよね、という例を見たのかもしれない。