Chapter 7

Chris Sturdy

Associative Structure of Instrumental Conditioning Traditionally there has been two perspectives: 1. Associative structure 2. Behavioral regulation (how is it that animals behavior is influenced by things in environment  that changes its behavior) Associative structures: Three­term Contingency or instrumental conditioning  or operant conditioning. • More than just a response and reinforce (You  don’t just have a response and reinforce. You have  a context) • Stimulus context (S)  • Instrumental response (R)  • Response outcome (O) Law of Effect and S­R Association • Thorndike thought that the S­R association was key to instrumental conditioning. Reinforces  merely work to develop the association between S and R. He Says nothing about the R­O  association • New interest in S­R associations and habit formation (especially for drug addiction)  S­O Association and Expectancy • Pavlov Ian conditioning may be involved in instrumental learning via S­O pairings • Instrumental response motivated by two factors and that is why we see increase responses that  are Precursor to modern two­process theory. 1. S­R association (straight arrow in the diag) 2. S­O association (­­­­­­­­­ arrow in the diagram) Modern Two­Process Theory • Two learning processes, Pavlovian and instrumental/operant are related to one another • Through S­O association, S motivates instrumental behavior via the central emotional state.  The Nature of the state depends on nature of reinforce ( if you feel good after receiving a  stimuli, you are more likely to perform the instrumental behavior now) Applied to piano example: Stimulus (pissed off at the piano which is a negative state) (S)  ▯Response (you fly it off) (R ) ▯ utcomes/consequences: broken piano or the satisfaction of getting rid of that piana (O) How would you test two­process assumptions? (EXAM) • Pavlovian  expectancy   motivates   instrumental behavior ( emotional state generate. If the CS  increases Hope= increasing in response Fear=decrease in responding) • Thus then presenting a CS should alter instrumental behavior in some way. We Test with a  transfer­of­control experiment Transfer of control: • It is Used to test the two­process theory assumptions. There are Two distinct types of  learning : 1) Pavlovian Conditioning, 2) Instrumental Conditioning – S­O association activates an emotional state which motivates instrumental behaviour (R).  This Emotional state will be positive or negative depending on if the reinforce (O) is  appetitive (eg food) or aversive (eg shock) Transfer­of­control Experiment Setup 1. Instrumental conditioning of an operant response ( lever press▯food) 2. Classical conditioning with a CS signaling the presence (CS+) or absence (CS­) of a US   (tone▯food) 3. Transfer phase – perform the operant response and test with the CS (tone lever presented  together. It will now either increase or decrease responses depending on the emotional state it  generates) Predictions:  If Pavlovian S­O motivates behaviour, then responding should increase when CS is  presented ( assuming this is a positive CS association) Potential Caveats of Transfer of Control Experiments:  Response Interactions • Need to ensure that the CSs are not causing responses that would seemingly involve a central  emotional state • This could either: 1. Decrease instrumental response ~ “fear” 2. Increase the instrumental response ~ “hope” Actual experiment Procedure: • Trained rabbits: 1. Instrumental conditioning (head­raising to hit lever) 2. Pavlovian conditioning (movement of lower jaw; part of drinking response) • Exp. 1 & 2: CS+ • Exp. 3: CS+ and CS­ 3. Transfer test phase: tested effects of CSs on operant responding Finding: Effects of  Excitatory CS (in Pavlov  conditioning) on Operant  Responding Finding #2: Effects of an Inhibitory CS on Operant Responding Central Emotional States vs. Reward­Specific Expectancies • Changes in instrumental behaviour are mediated by activating central emotional states…or  are they???In some cases, there are specific reward expectancies that are acquired. For  Example: • Instrumental response reinforced for food • Instrumental response reinforced for sucrose • CS+ for food will increase the instrumental response for food, but not for sucrose. It is  Not a “general positive emotional state” (both appetitive stimuli but each one is specific  for certain ones R­O and S(R­O) Relations • What about the R­O (Response­Reinforcer) association?  The Two­process theory doesn’t  take this into account sincei t only focuses on SO and SR. • Instrumental conditioning: reinforcer (O) is not predicted by S alone. The O happens if  organism makes response (R) in presence of S. without making a response (R) you DO NOT  get any O. so R­O are equally important.  • Conditionality of S­O (via R) is ignored by two­process theories • But,  *CS­US pairings alone are not enough to produce classical conditioning Are there R­O Associations? • Common method to test this is reinforcer (O) devaluation • If devaluing the reinforcer changes instrumental responding, one can assume that the response  is mediated by an R­O association ( just like the CS­US. Changing the value of CS effect US  thus it means CS must be associated with it Experiment for checking R­O association: using devaluation • Rats reinforced for pushing a rod to the left or right • One direction = food; other direction = sugar water • After training, devalue one reinforcer via LiCl injections (conditioned an aversion) and this  time No rod present so the direction of pressing is not associated with the aversion. • Test preference  (In extinction i.e. no food is present as this time) Devaluation prediction: • IF S­O association:  Decrease in responses to both levers if changing the reinforce change  the Stimuli because devaluation would have had affected the properties of S (the lever, the  chamber, etc.). Stimuli have remained the same • IF S­R association: S­R assoc. do not include the reinforce. Devaluing the reinforcer cannot  change behaviour mediated by an S­R assoc.  • IF R­O association: The devalued response would be decreased (lowered); the other  response would remain unchanged. This suggests that each response was associated  separately with its own reinforce (separate  R­O associations were formed) Finding: changing the consequences/reinforce/O▯   affected the subsequent Response that was being  made (R). Thus RO seems to be true. Hierarchical S­(R­O) Relations • R­O associations can’t act alone to  produce instrumental behavior. Just  because the response activates an  expectancy of a reinforcer does not tell us why the response happens in the first place •  R­O association  is activated by the stimuli (S) that are present when response is reinforced.  I.e. you see S ▯ activate the (R­O) association. Thus so far  • Associative structure: view Behaviour in terms of stimuli, responses and associations. Such  as Pavlov and Thorndike • Behavioural regulation: Focuses on how instrumental conditioning procedures put  limitations on individual's activities  Precursors of Behavioural Regulation • Consummatory Response Theory: Thought of reinforcers as behaviours, not stimuli as  Thorndike did. They argued that Species­typical consummatory responses are the critical  features of reinforcers. e.g., saccharin can be used as a reinforcer even without nutritive value  (cannot satisfy a biological need) because it still involves consumatory response •  In contras  Premark argued that reinforcer responses (e.g., eating) ar
