4月25日,以“評價、創(chuàng)新、發(fā)展”為主題的上海市小學校長學術論壇在大寧國際小學舉行。滬上小學校長、專家學者齊聚一堂,共話教育評價改革新趨勢。 論壇現場,上海市教育科學研究院副院長陸璟發(fā)表了《PISA發(fā)展對改進評價的啟示》的主題演講,從評價21世紀能力、元認知測評、情境設計、能力分類幾個維度展開,進行了詳細闡述,前沿的觀點給大家?guī)砗艽髥l(fā)。 “第一教育”整理了陸璟的現場發(fā)言,與讀者分享。 上海市教育科學研究院副院長陸璟發(fā)表主題演講 今天我主要講一講PISA與21世紀能力評價的關系,然后針對其中的元認知測評、情境設計、能力分類等舉一些具體的例子來講。 PISA測評到現在已經做了八輪,從2000年開始,每一輪都有閱讀、數學和科學三個領域,但是主要的測試領域是變化的。 (點擊圖片可放大查看) 這里的粗體字就是它的主要領域,比如,2000年的主要領域是閱讀,其他的就是次要領域。PISA測評的主要領域是輪的,從閱讀到數學到科學。 除了這個主要的測試領域之外,我們看到它對于突破傳統的認知能力越來越關注。 比如,2003年增加了問題解決測評,當時只是紙筆測試,到了2009年開始引入數字化的測試,在部分國家做了一個數字閱讀的選項;為了了解計算機相關問題,又增加了ICT,就是信息通訊技術熟悉度的背景問卷調查。 到了2012年,我們可以看到,計算機化的測試更加被強化了,增加了計算機化問題解決,這是必試的,只要有條件,是一定要參加的,還有計算機化的閱讀和數學,這是可選項,但是建議大多數國家盡量參加,還有一個是財經素養(yǎng),它是對于跨學科的主題學習的評價,ICT問卷仍然有。 到了2015年,問題解決又深化為協作問題解決,它主要來測評合作能力。學生和計算機當中的模擬人物,通過對話溝通來解決問題。學生掌握一部分信息,機器模擬人物掌握另一部分信息,或者它可以控制另外一些條件,只有通過溝通,共同合作,你們才能夠完成解決問題的任務,同時也有財經素養(yǎng)和ICT問卷的選項。 到了2018年,增加了全球勝任力的問卷調查,還增加了幸福感問卷。2015年,已經有幸福感調查,那個時候主要一些問題,還沒有專門的系統選項。 2021年,在這個基礎上,又將增加創(chuàng)造性思維的評價。 所以從PISA測評整個發(fā)展趨勢來看,有三個特點: 第一,關注的問題突破了傳統的閱讀、數學和科學等認知能力的范疇,重視創(chuàng)新思維、問題解決、合作能力、信息素養(yǎng)、財經素養(yǎng)的測評。 第二,開始關注到重要的非認知能力,比如說全球勝任力、幸福感,這些都是采用問卷調查的方式進行測評。 第三,在測試的方式上,從2015年開始,全部采用計算機化的測評,沒有紙筆測試了。 從這樣的變化過程中,我們可以看到PISA更多體現21世紀能力,在21世紀能力評價上,有很多國際組織關注,其中一個比較有影響力的叫做21世紀技能合作組織,它關注的能力包括表中所列的四大塊。 (點擊圖片可放大查看) 北師大教育創(chuàng)新協會中心劉堅教授牽頭做了一個關于21世紀能力的全球比較,叫做面向21世紀的核心素養(yǎng)。他把各個國家做的21世紀能力框架合在一起,總結、梳理出了18種最重要的能力,這里面有14種在PISA測評當中得到了體現。 我們從表的對照可以看到,21世紀技能合作組織關注的很多內容,在PISA測評里面也有體現。 各國所關注的21世紀能力通常有三個特點:跨領域、多維度、高層次。所以我自己界定了21世紀能力,是指將知識和技能遷移或應用到新情境中,解決復雜問題以及有效參與社會的能力,這里面包括了情境的適應,也包括了解決復雜問題的能力,還包括了一些參與社會的態(tài)度,社會責任感等非認知能力。 因為涉及的內容比較多,所以我只舉其中一個我們比較關注的部分。21世紀能力是高層次的,也就是我們常常說的高階思維。什么叫做高階思維?比較多的研究者會提到布魯姆的創(chuàng)造、評價、分析、運用、理解、記憶的高階思維。馬扎諾提出了自我系統、元認知系統、認知系統、知識系統,從這個系統來看,布魯姆的教育目標分類主要涉及到教育和認知,他很少涉及元認知。 (點擊圖片可放大查看) 但是我們從馬扎諾的四大系統來看,他怎么看待一個人解決問題的過程?比如說我們有一個新任務,首先由自我系統來決定我是否要做這個任務,由元認知系統提出相關的目標和策略,接著有由認知系統處理相關的信息,這三個系統的運作都要借助已有存儲的知識系統。 我們用通俗的話來解釋,自我系統就是判斷這個任務重要不重要,做了對我有好處嗎?有意義嗎?我能不能做,我有沒有能力做,我想不想做,我有沒有動機來做?如果判斷這個任務很重要,而且我有可能做成功,然后我也很想做,能夠產生積極效果,我就會把這個任務接下來。決定要做了以后,就要啟動元認知系統,元認知系統決定怎么做,我要確定目標、制定計劃,分步驟達到這個目標,我采用什么方法和策略達到這個目標,最后評價這個目標有沒有實現。 我們的教學首先看大的目標是什么,然后把這個目標分解成一系列的過程,然后研究我們要達成目標的策略,然后是我怎么搜集證據來證明我達到了這個目標,其實這就是元認知。 上海很多學生沒有經歷這樣的環(huán)節(jié),可能和老師平時把任務切得太碎了有關系。這個任務能不能完成,取決于他掌握的知識量,知識是很重要的,但是僅有知識是不行的。所以,我理解的高階思維既包括布魯姆認知目標分類當中的分析評價和創(chuàng)造,也包括了元認知和自我系統,它并不完全是認知性的,它還涉及到一些非認知,自我態(tài)度動機的這些成分。 舉一個例子,我們從閱讀素養(yǎng)來看一下元認知為什么很重要,并且在PISA測評中,怎樣體現元認知。PISA在2000年把閱讀素養(yǎng)作為主要框架領域,它的框架里面提到了閱讀的參與和元認知,它對閱讀素養(yǎng)有很重要的作用,到了2009年的閱讀框架里面,更加突出了閱讀的參與和元認知,不僅因為它對閱讀素養(yǎng)有影響而顯得重要,而是它本身就是一個重要的評價內容,所以在PISA2009的學生問卷中調查了學生的元認知策略。PISA2009框架的第二個重大修改涉及納入數字文本,PISA2009是第一個測評數字閱讀能力的大規(guī)模國際研究。 到了2018年,這個閱讀框架又重新修改了,把閱讀過程分成了兩個部分,一個叫做文本處理過程,包括怎么查找信息,怎么理解文本,怎么評價反思,另外,還有一個任務管理的過程,現在越來越注重關注多任務的閱讀和管理,你要看多個文本以后,才可以得出一個分析和判斷。多個文本同時處理或任務目標需要多個步驟,就要涉及到一個任務管理,通過計算機的測評可以搜集學生在后臺處理多個文本或多個步驟的一些過程性信息,比如,你是仔細讀了題目以后,仔細想了以后再去做的?還是拿上來就做的? 元認知能力怎么測評?PISA采用了兩種方法,一種是問卷調查,舉一個例子來說,怎么樣評價學生是不是知道哪一些方法對閱讀成功很重要,其中有一個策略叫做理解和記住信息的策略,測試就給學生一個問題,這個問題列了六個策略,讓學生來評價這個策略對你的理解和記住文章是不是有用,最有用的就是6分,沒有用的就是1分,學生打完分以后,就把學生的評價和閱讀專家的評價去比較,看其中的一致性。如果一致性高,說明這個學生掌握策略程度比較好。 你必須理解并記住文章中的信息。對于理解和記住文章而言,你如何評價下列策略的有用性? A.我將注意力集中在文章中容易理解的部分 B.我快速地把文章讀兩遍 C.讀完文章后,我與別人討論文章的內容 D.我劃出文章的重要部分 E.我用自己的話總結文章 F.我大聲地把文章朗讀給另一個人聽 上海學生在這個上面,剛剛超過OECD平均,掌握程度是中等。還有包括概括信息的策略,監(jiān)控策略也是元認知。監(jiān)控策略非常重要,但是我們上海學生的指數顯著低于OECD平均。 方法二,就是剛才說到的后臺數據分析。我舉一個例子,我們有數字閱讀的選項,通過學生在計算機上點擊的鏈接可以看到,學生為了完成這個任務,他點過哪一些鏈接。 (點擊圖片可放大查看) 左邊的這張表就是學生點過的鏈接數量,我們可以看到,上海的學生和新加坡的學生都排在上半部分,說明大家的積極性都很高,點了很多的鏈接。右邊這張圖是評價你點擊鏈接的質量,即你點的鏈接和你最后解決任務的目標是不是一致的,你點的是否是有用的鏈接,還是你看到好玩的都嘗試一下。我們可以看到新加坡學生點擊的鏈接的質量最高,全部集中在他要解決的目標上,上海學生就是東看看,西看看,走到一半可能都忘記了最后我到底要解決什么問題,說明他頭腦中沒有這樣一個目標認識,在過程當中也不會檢查自己有沒有朝著這個目標去走,這就是為什么我們紙筆測試成績遠遠高于新加坡,但是數字化閱讀成績顯著的低于新加坡,通過計算機的測評我們就可以發(fā)現這些問題。 我們不能說21世紀能力只關注創(chuàng)造性思維、合作能力等,其實,閱讀數學和科學也是最基礎的能力。所以,PISA在閱讀、數學、科學測評當中,也采用了問題解決的方式來考察在新情境當中的應用。 這是日本借鑒了PISA測評重新設計了他們的評價,數學A卷考知識,B卷靠應用,A卷中這個平行四邊形的面積,學生的正確率達到了96%,但是B卷同樣用這樣一個概念來比較兩個公園面積的大小,正確率只有18%。 所以在現實情境當中的應用涉及到了一個轉化,要到實際環(huán)境當中去找這個高究竟在哪里,這就是一個難點,學生就不會去找。所以我們如果考試只把式子列好給他,或者把最重要的信息挑好給他,沒有干擾信息,學生做起來很容易。但是如果現在有很多干擾信息,你要找出哪一個是你需要的,就增加了難度。 還有PISA測試中一道小學水平的數學樣題: 艾瑞克是個滑板迷,他到一家名為“滑冰者”的商店看一些商品價格。 在這個店里,你可以買一個完整的滑板,也可以買一個板,一套4個輪子,一套2副轉向架,一套配件,再自己組裝成滑板。 商店里商品的價格如圖所示。 艾瑞克想自己組裝滑板。要是在這個店里自己組裝滑板,最高價和最低價是多少呢? 這其實就是一個加法。如果你只列一個算式給學生,我估計正確率可以達到95%,但是從全球的情況來看,很多學生可能只能答對其中的一個。 再比如,我們參加PISA測試之前,我拿了一道旋轉門的題目,問我們教研室的老師,這樣一道題,學生的正確率可以達到多少?老師的判斷是70%到80%。實際上,上海學生最后正確率只有14%,由此可見,換了一個生活的情境,其實影響還是挺大的。 我們以數學問題為例,他給你的是一個現實背景的問題,然后要把現實問題變成一個數學問題,比如說你要知道,這個是可以列一個方程的,你把這個方程列出來,把現實問題抽象出一個數學模型。你列出了這個數學的式子,或者你找到了數學的方法,然后去解決,這就變成解決數學問題了。 得到了結果以后,你還要解釋這個結果在現實當中是什么意義,是不是切實可行?整個過程,PISA測評把它分為三個能力,數學的表述,數學的應用,數學的闡釋。 以我們經常會看到的數學試卷為例,一般我們根據題型來分,分為填空題,選擇題,文字題,計算題,應用題等,老師講解的時候,一種是一題一題講下來,另外有一種,會根據題型,分析每一個大塊的得分率是多少,看學生哪一個環(huán)節(jié)比較薄弱。但是如果你真的要解決學生的問題,你必須對每一個小題,去做這個題目評價了什么能力的細致分析,比如,這幾題考查的是估算能力,那幾題考查的是概念理解,要根據具體的分析然后重新歸類,看看到底是哪一方面的能力不足,因為可能有一些填空題或者選擇題,它評價的也是計算的能力。 比如,有些小學數學試卷80%以上的題目評價的都是計算能力,所以如果不用能力的框架對它分析,你測評的內容很可能會有所偏頗。怎么對能力做分析,這個我不是完全根據PISA,我是和實際結合,在高中新課標修訂過程中測評學生核心素養(yǎng)的時候,我采用了這樣一個框架,我們用題目分析特征的方法分析這個題是考哪一種能力,寫出每一個題目的主要解題步驟,看看這里面最難的是哪一個步驟,要求最高的能力就是這一道題目測評的主要能力,如果這樣還分不清楚,那就說明你出的這個題太綜合了,你要分成若干小題。你命的題指向要清楚,一道題就是評價一個能力,或者一個小題就評價某一方面的能力,這樣你最后就可以分析了。然后,還會分析它的情境,是不是熟悉,這就涉及到他是否會在新的情境當中遷移,它的條件線索的明確度就是它的難度,解題方法是不是常規(guī)的,這些就涉及到他的創(chuàng)造性。 編輯丨欣馳 關注“第一教育” |
|