學習「學習」的定義•指經由訓練或經驗,使個體在行為上產生較持久改變的歷程.•學習是指較為持久的行為改變•學習可因訓練或生活經驗而來•學習有多種類型•學習會造成大腦構造的改變行為學習•古典制約或操作制約中的「刺激-反應」聯結是所有學習的基礎•所有動物都遵循相同的學習法則•環境事件,特別是具懲罰性或酬賞性的事件,是行為產生的原因認知學習•認知心理學家認為學習可分為兩種:–為保有而學習•若小朋友被傳授正確的知識,並期待他們日後可以表現所學的學習,稱之。•古典制約和操作制約屬之。–為解決問題而學習•如果給兒童機會,讓他們自己去發現問題的正確答案或是解決方式,稱之。•認知學習屬之。聯結論•透過聯結學習–我們很自然地會把同時發生的事情聯想在一起•聯結學習–習得二事件同時發生•二刺激•一個反應和它帶來的後果古典制約學習巴夫洛夫的偶然發現古典制約學習•古典制約學習實驗–非制約刺激(unconditionedstimulus,US):不需經過學習就能引起反應的刺激。–非制約反應(unconditionedresponse,UR):不需經過學習就能對非制約刺激起的反應。–制約刺激(conditionedstimulus,CS):本為中性刺激,與非制約刺激連結,能引起反應的刺激。–制約反應(conditionedresponse,CR):由制約刺激所引起的反應。古典制約學習US(meat)produces:Clickarrow古典制約學習古典制約學習古典制約學習Watson'sLittleAlbertStudy•JohnB.Watson在他的實驗中利用11個月大的小亞柏(LittleAlbert)來研究恐懼制約。•他給小亞柏看一隻白老鼠(US)和同時給一個很大的聲音(CS)。•在數次配對之後,小亞柏開始會害怕白老鼠(CS)。•之後,小亞柏開始對那些類似CS的東西產生害怕(類化),也就是出現CR。生活上的古典制約•如果你都用罐頭食物餵狗,當你在使用開罐器時會發生什麼事?當然,狗會跑過來,即使你開的是水果罐頭。這是因為狗已經把開罐的聲音和牠們的食物形成聯結了。•很多啤酒廣告使用穿比基尼的美女當廣告主角。這些年青的美女(非制約刺激)會讓多數男性感到愉悅,而啤酒就和這個效果做聯結。相同的現象也適用於許多廣告採用的音樂等等。NauseaConditioninginCancerPatientsUCS(drug)UCR(nausea)CS(waitingroom)CS(waitingroom)CR(nausea)UCS(drug)UCR(nausea)古典制約學習的現象與原則•古典制約學習中的一般現象–類化(generalization):•與CS性質相似之的刺激,無須經過制約學習歷程,即可引起同樣的CR。•如果狗一旦對鈴聲形成制約反應,對其近似鈴聲的聲音,一樣可以產生流口水反應•一朝被蛇咬,十年怕草繩古典制約學習的現象與原則•古典制約學習中的一般現象–辨別(discrimination):•與CS類似之刺激和CS同時出現時,個體將表現出選擇性反應,只向CS反應。•就是個體能夠對不同的刺激做不同的反應,或是在多種刺激中選取某一刺激去反應。•Eg.紅燈反應(有食物);綠燈反應(電擊)古典制約學習的現象與原則•古典制約學習中的一般現象–消弱(extinction):•制約建立後,CS單獨出現,且不伴隨US出現,制約反應將逐漸減弱,甚至完全消失。古典制約學習的現象與原則•古典制約學習中的一般現象–自動恢復(spontaneousrecovery):•消弱現象出現後,過一段時間,再單獨呈現CS,仍會引發CR。古典制約學習StrengthofCRPauseAcquisition(CS+UCS)Extinction(CSalone)Extinction(CSalone)SpontaneousrecoveryofCR古典制約學習的現象與原則•古典制約學習中的一般現象–保存(saving):•CS與US再次伴隨出現,時間雖不長,CR可以回到最初獲得的狀態,saving指的是此時所需要的配對次數較原先習得時配對次數少,減少的配對次數就是所謂的saving,也就是省下一些力氣的意思古典制約學習的現象與原則•古典制約學習中的一般現象–高階制約作用(higherorderconditioning):•CS引起CR後,CS可當作US與另一CS(CS2)配對,形成另一層次的制約•次級制約學習(second-orderconditioning)–代幣(CS)-換食物(US)–燈光(CS)-代幣(US)•高階制約學習(higher-orderconditioning)–食物,房子,車子(US1)-錢(CS1,US2)-工作(CS2,US3)-唸書(CS3,US4)-…..各種形式的制約:•依CS、US呈現的時間先後分:•以US的性質分:各種形式的制約:•依CS、US出現的時間先後分:–同時制約作用(simultaneousconditioning)–延宕制約作用(delayedconditioning)–時間制約作用(–逆向制約作用(backwardconditioning)–遺跡制約作用(traceconditioning)CS和US的時間順序CSUS(同時制約作用)SimultaneousConditioning:CS和US同時開始CS和US的時間順序CSUS延宕制約作用(DelayConditioning):CS先於US,並和US重疊。CS和US的時間順序CSUS遺跡制約作用(TraceConditioning)CS在US開始之前開始,並結束CS和US的時間順序CSUS關鍵因素:CS-US的時間間隔CS開始到US開始之間的時間間隔每個情境都有它最適的CS-US的時間間隔,太長或太短都會減緩制約成功的時間。CS和US的時間順序CSUS逆向制約作用(BackwardConditioning)CS在US出現後才開始CS和US的時間順序將這些制約作用依照有效性排列:最佳最糟延宕制約作用遺跡制約作用逆向制約作用同時制約作用各種形式的制約:•以US的性質分:–可欲制約(appetitiveconditioning):•以引起個體快樂的US為基礎的制約–厭惡制約(aversiveconditioning):•以引起個體厭惡的US為基礎的制約。操作制約學習•桑代克的學習理論–嘗試錯誤學習(TrialandError)–在問題情境中,個體表現出多種嘗試性的反應,直到其中有一個正確反應出現,將問題解決為止。–三個定律•練習律、效果律、準備律Thorndike’sPuzzleBox~psych/psycweb/history/thorndike.htm#Theory練習律(lawofexercise)–練習次數愈多,個體的某種反應與某一刺激間的連結則愈加強。–也就是說,任何刺激與反應間之聯結,一經應用或練習,較未經應用換練習以前為強,聯結愈強則反應愈敏捷。–就是「熟能生巧」啦!效果律和準備律–效果律(lawofeffect)–反應後獲得滿足效果者,反應將被強化,刺激反應間之連結加強,反之,無效果或是有不好效果之反應將逐漸減弱。–準備律(lawofreadiness)–個體要反應,可讓他反應滿足–個體正要反應,不讓他反應苦惱–個體不想反應,強迫它反應苦惱效果律(lawofeffect)行為表現效果良好增加行為再次出現的機率行為表現效果欠佳減少行為再次出現的機率行為甲行為乙行為丙效果良好行為丙常會出現行為丁Skinner和他發明的Skinnerbox史金納的操作制約學習(=工具制約學習)•Skinner認為古典制約只解釋了既存的行為可能如何和刺激配對,但是沒有解釋如何獲得操作行為。•操作制約:–以有效的反應,作為達到目的的工具。–必需「主動的操作」,這類反應稱為「操作行為」•操作行為的目標,大部分為穫取想要的東西,但也可能是學習逃脫或避免厭惡的情境。•具有操縱環境因素滿足某種需求的功用。如老鼠壓桿得食物,故又稱「工具制約作用」操作制約的學習過程•制約前S...R(槓桿)(壓桿)•制約中S...RSR+(槓桿)(壓桿)(食物的出現)•制約後SR(槓桿)(壓桿)操作制約學習的增強原則原增強物:直接滿足個體需求的刺激物原增強作用:由原增強物的出現對反應產生的強化作用次增強物:經學習而間接使個體滿足的刺激物次增強作用:次增強物的出現對反應所產生的強化作用。正增強物:個體反應後帶來的刺激物能強化該反應者如食物,水正增強作用:正增強物的出現對個體反應所產生的強化作用負增強物:個體反應能使厭惡性刺激物停止,因而強化了該反應者。一種嫌惡刺激,如電擊負增強作用:因負增強物的消失度個體反應所產生的強化作用。增強物的安排:立即增強:表現正確反應時立刻給獎賞效果較好延宕增強:表現正確反應後過一段時間再給獎賞效果較差連續增強:只要反應正確,皆給獎賞效果較差部分增強:只有部分正確的反應會得到獎賞效果較好強化行為削弱行為增強作用時間表(Schedulesofreinforcement)•固定比率(fixed-ratioschedule,FR)•變動比率(variable-ratioschedule,VR)•固定時距(fixed-intervalschedule,FI)•變動時距(variable-intervalschedule,VI)增強作用時間表Schedulesofreinforcement•固定比率(fixed-ratioschedule,FR)–每隔固定之反應次數即予增強的安排–例每隔五次反應就給增強,則第五次、第十次、第十五次,...即予增強。FixedRatio•areinforcerisgivenafteraspecifiednumberofcorrectresponses.Thisscheduleisbestforlearninganewbehavior•Eg.按件計酬增強作用時間表Schedulesofreinforcement•變動比率(variable-ratioschedule,VR)–若干次的反應才予以增強,但是究竟要多少次數則無固定比率。–所以,雖然有部分的反應可予增強,但卻沒有一個固定的、可以預測的比率。–但,還是需要一個平均數做為準則Variableratio•areinforcerisgivenafterasetnumberofcorrectresponses.Afterreinforcementthenumberofcorrectresponsesnecessaryforreinforcementchanges.Thisscheduleisbestformaintainingbehavior.•Eg.買六合彩;角子機增強作用時間表Schedulesofreinforcement•固定時距(fixed-intervalschedule,FI)–每隔固定的時間就給增強的安排。–例:每隔三分鐘即予增強,那麼時間到了第三、六、九...分鐘,應予增強。Fixedinterval•thefirstcorrectresponseafterasetamountoftimehaspassedisreinforced(i.e.,aconsequenceisdelivered).Thetimeperiodrequiredisalwaysthesame.•eg.月考,周考增強作用時間表Schedulesofreinforcement•變動時距(variable-intervalschedule,VI)–雖然是間隔若干時間予以增強,但是間隔時間之長短並無固定。Variableinterval•thefirstcorrectresponseafterasetamountoftimehaspassedisreinforced.Afterthereinforcement,anewtimeperiod(shorterorlonger)isse