-학습의 과정 : 행동의 습득

  `Skinner ‘효과의 법칙은 반응과 결과의 관계를 일시적으로 설명하고 있지만, 새롭고 복잡한 유형의 개발 혹은 행동의 형태는 복잡하고 세련된 강화로부터 생겨난다.’

  `차별강화(differential reinforcement): 여러 행동 중 어느 하나만을 선택적으로 강화하는 것

 

1) 행동조형(Shaping Behavior)

- 복잡한 행동의 습득은 조형 과정의 결과이다. → 변별자극, 강화를 포함하고 있다

- 조형은 자연적인 상태에서 일어날 가능성이 없는 복잡한 행동도 성공적으로 이끌 수 있어서 중요하다.

- 복잡한 행동은 프로그램이라 불리는 일련의 체계적 강화계획에 의해 만들어진다.

→ 프로그램의 각 단계는 반응을 일으키고, 다음 단계에 반응할 준비를 하게 한다.

→ 행동 조형과정에서 알맞은 강화가 주어져야 한다.

 

*변별자극 : 어떤 행동이 강화를 받게 될 것인지 혹은 강화를 받지 않게 될 것인지를 암시해 주는 단서이다. 변별 자극은 어떤 행동과 자극이 반복적으로 관련될 때 발생한다. 예를 들어 쥐가 레버를 누를 때마다, 그렇지만 불빛이 켜져 있는 경우에만 먹이를 받도록 실험 상자를 조정한다고 하자. 결과는 쥐가 불빛이 켜져 있을 때(S)에는 레버를 누르고 꺼져 있을 때(S-)에는 누르지 않는 것이 될 것이다. 이때 쥐가 ‘불빛 켜짐’ 상황과 ‘불빛 꺼짐’ 상황을 변별한다고 말한다. [네이버 지식백과] 변별 자극 [discriminate stimuli] (실험심리학용어사전, 2008., 시그마프레스㈜)

 

2) 강화계획(강화 스케줄)

(1) 고정간격 강화계획(fixed interval: FI)

일정한 시간 간격이 지난 다음에 유기체가 한 반응에 대하여 강화한다. Ex) 변기

기본단위: (‘)

Ex) FI5’ = 고정 간격이 5

    FI5” = 고정 간격이 5

(2) 고정비율 강화계획(fixed ratio: FR)

유기체가 하는 일정한 반응 횟수마다 보상할 때 고정비율 강화가 일어난다.

Ex) 칭찬스티커, 음식점 쿠폰

기본단위: 횟수

Ex) FR5 = 5번마다 강화

 

강화 후 휴지(post-reinforcement pause): 고정간격과 고정비율 강화계획에서는 어떤 반응이 보상을 받게 되면 대개 그 다음에는 반응률이 하락하게 된다.

 

(3)변동간격 강화계획(variable interval : VI)

시간 간격이 불규칙하나 수시로 보상을 받는 경우 → 고정간격 강화에서 나타나는 선형 효과도 제거되고 안정되면서 적절하게 높은 반응률을 보인다.

Ex) 마트 타임세일

 

(4) 변동비율 강화계획(variable ratio : VR)

강화를 얻는데 필요한 반응의 수가 항상적이지 않다→ 변동비율 계획의 대상자는 언제 강화가 일어나는지 알지 못하기 때문에 강화를 받은 다음에도 휴식을 취하지 않고 장기간 동안 높은 반응률을 보여 주는 경향이 있다.

Ex) 슬롯머신, 밀당

 

 

 

**강화계획 (강화스케쥴)

 

간격<비율, 고정<변동

→ 상황에 따라 효과가 좋은 강화는 다르다.

+ Recent posts