前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇學生考試成績分析總結范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
[關鍵詞] Excel;成績分析;教學評價
【中圖分類號】 TP3 【文獻標識碼】 A 【文章編號】 1007-4244(2014)08-187-1
每學期結束時,教師經常要對各門課程的成績進行統計和分析,以綜合評價學生對課程的掌握情況,發現教學中存在的問題,以利于教師改進教學工作,提高教學質量。由于每學期每門課程都要重復做這項工作,給教師帶來很大的工作量,而且容易造成統計錯誤。EXCEL強大的數據處理能力完全可以勝任成績統計工作,且其豐富的圖表功能,還能使統計數據更加直觀。借助EXCEL的模板功能,可以使設計好的成績統計功能重復應用于每門課程,這不僅大大地減少了教師的工作量,而且避免了錯誤統計數據的產生。
考試是教學評估中檢查教學效果的手段之一,考試成績是對學生知識掌握情況和教師教學水平的一種直接體現。試卷內容和質量不僅影響考試的可靠度和準確度,還會影響學生的學習態度和學習行為。成績分析是教學工作中的重要組成部分,也是每個教師必須完成的工作,通過對考試成績進行分析,可以幫助教師發現教學活動中的薄弱環節、提高教學質量。因此只有對學生的考試成績做出正確、合理的分析,我們才能客觀、公正地進行教學評估和教學分析。本文使用Excel軟件對我院13級電子專業80名學生的高等數學成績進行了數理統計量化分析,并據此對學生學習情況和教師教學效果進行評價。
一、數據取樣
我院13級電子專業80名學生的高等數學成績:
二、數據分析
假設高等數學考試內容與教學大綱一致,試卷質量良好。
(一)均值
實踐表明,若70
(二)離散度
標準差S=是描述學生考試成績離散程度的最常見、最重要的統計量。標準差越小,表明成績越集中;標準差越大,表明成績越分散。一般認為,標準差S=10較為適中。我們利用Excel軟件中的統計函數VAR對上述數據進行計算,得S2=231.8783,則S=15.22755,可見成績離散度偏高,這說明學生高等數學學習情況差異性較大。
(三)偏度
如果試卷內容設計合理,學生的成績會服從或近似服從正態分布。一般來說,當偏度系數g1=0時,學生成績呈標準正態分布;當g10時,曲線向右偏,即呈正偏態分布,表明高分段人數較多,低分段人數較少。我們利用Excel軟件中的統計函數SKEW對上述數據進行計算,可得偏度g1=-1.81536
(四)峰度
峰度系數(g2)可以定量描述正態分布的陡峭程度。當g2=0時,成績服從標準正態分布;當g20時,曲線呈尖峰態,顯得較陡峭,表明學生成績分布較集中。我們利用Excel軟件中的統計函數KURT對上述數據進行計算,可得峰度g2=4.57311,這表明學生成績分布較為集中。
三、教學評價
從上述考試成績分析不難看出:(1)學生的學習狀況。我院電子專業大多數學生已經掌握了高等數學的基本知識,且成績較為集中,但學生個體差異較大,個別學生成績過低。(2)教師的教學效果。教學過程中,教師重視基本概念、基本理論的教學,注重學生基本技能的培養,但對個別落后生關心不夠。針對這些情況,教師應稍微調整一下自己的教學方式方法。在培養學生基本技能的同時,應拔高尖子生,提高落后生,從而提高教學質量。
四、結語
在上述分析中,Excel軟件處理各種數據所帶來的方便是顯而易見的。通過高等數學成績分析可以看出,成績在一定程度上可以反映教與學的情況,它是前期教學的事后反饋,我們需重視成績分析對今后教學的指導作用。通過對統計結果進行分析、調查、研究,教師可以及時發現、解決教學中存在的各種問題,并有針對性地做出教學調整,總結經驗,使得自身教學水平更上一個新的層次。
參考文獻:
[1]賈俊平.統計學[M].清華大學出版社,2008.
[2]岳糧躍.Excel在學生成績統計分析中的綜合應用[J].廣西大學學報(自然科學版),2007(S1):197-199.
[3]盧越萍,林企.微機自動選題及學生成績分析系統[J].信息與控制,2008,(05).
關鍵詞:護理專業;婦產科護理;成績;分析與評價
1對象與方法
1.1對象以我校2014級護理專業中職起點班(3個班,131人)與普高起點班(3個班,140人)共271名學生為研究對象,對其婦產科護理考試成績進行統計分析。1.2方法6個班的學生均由筆者擔任任課教師,使用統一的教材、教學大綱和授課計劃,教學重點無差別。考試采用相同試卷,命題教師嚴格按照教學大綱及課程標準出卷,題型包括單項選擇題、填空題、名詞解釋、簡答題和案例分析題,各題型分值分配見表1。試題基本涵蓋教學大綱要求的內容,試卷難易程度適中,6個班的考試內容、考試方法、考試時間均無差別。考試結束后,筆者采取統一標準閱卷評分,保證閱卷的公正、公平,并應用Excel進行數據處理,對不同生源學生考試成績進行統計分析。
2結果
2.1成績分布本次婦產科護理考試參加人數為271人,其中,中職起點班131人,最高分90分,最低分37分,平均分65.36分;普高起點班140人,最高分93分,最低分46分,平均分76.65分。考試成績各分數段分布見表2。2.2成績分析表2顯示,普高起點班和中職起點班的絕大多數學生分數集中在70~89分數段,成績呈正態分布,能反映大多數學生婦產科護理基本知識和技能的實際掌握水平。從高分數段(80分以上)人數和及格率來看,普高起點班的高分數段人數明顯多于中職起點班,及格率也明顯高于中職起點班。
3討論
從考試成績分析結果可以看出,普高起點班與中職起點班學生婦產科護理考試成績存在顯著性差異,究其原因主要有以下幾點。3.1基礎知識和自主學習能力普高起點班學生所學科目較多,基礎知識相對較扎實,思路開闊,適應能力、自主學習能力較強;而中職起點班學生未經過高中階段的學習,基礎知識欠缺,而且由于受專業限制,知識面相對較窄[2],思考問題的深度與廣度不夠,思維方式較固定,容易被以往的教學方式桎梏,形成定向思維,自主學習能力相對較差。3.2學習目標和學習態度普高起點班學生在高中階段未接觸過醫學科目,尤其是婦產科護理,加之絕大多數為女生,對婦產科護理有濃厚的興趣,學習目標明確、態度端正、上課認真、缺勤較少,能按時完成作業,課后主動溫習功課,即使遇到困難也能迎難而上,考前能根據教師講課重點進行全面復習,認真應考。而中職起點班學生在中職階段已經初步學習了婦產科護理的基本理論和基礎知識,學習興趣較低,學習態度不端正,組織紀律性差,上課缺勤較多,課堂參與度不高,甚至有少數學生對考試成績持無所謂態度。
4思考與對策
(1)做好中高職課程銜接,根據中高職銜接護理專業教學標準,制定教學大綱、授課計劃及課程標準。對不同生源學生既要“因材施教”,也要“因才施教”,即使在師資配備相同、教學資源同步共享、學時一樣的前提下,對于普高起點班和中職起點班,教師也要分別組織試卷[3]。(2)興趣是最好的老師。教師在教學過程中應積極鼓勵,正確引導,激發學生學習興趣,培養學生學習主動性和積極性。可根據不同生源學生知識、能力和學習方法等特點,調整教學模式。如中職起點班學生已經過本課程的理論學習和臨床見習,因此,教師可利用藍墨云班課、翻轉課堂等信息化教學手段,不僅能提高學生自主學習能力,還能讓其隨時隨地學習,并向教師反饋學習效果;可讓學生參與授課,給學生提供展示自我的平臺,讓學生在體驗成就感的同時意識到自身的不足,從而激發學習動力;對于基礎較差的學生,可通過開展學習經驗交流會,使學生間增加溝通、相互借鑒好的學習方法和思維模式。另外,教師還可針對學生課堂知識掌握情況進行有計劃的輔導,幫助學生理解、內化所學知識,提高教學效果。(3)婦產科護理是一門知識面廣且較為抽象的臨床學科,學生在學習過程中往往會因無法理解知識點而產生挫敗感,甚至失去學習動力。因此,教師在教學過程中應根據教學內容調整教學方法和技巧,如正常分娩,可借助多媒體課件、視頻等將抽象的分娩過程具體、形象、生動化,幫助學生理解;骨盆測量、四步觸診等實訓項目,可采用角色扮演法,讓學生參與其中,充分調動學生學習積極性和主動性,同時提高學生操作能力;對于疾病的講解,教師可采取問題—啟發式教學、案例教學等,在問題的驅動下,學生主動分析思考,最后由教師歸納總結,幫助學生構建知識體系。通過上述教學方法,不僅可以使學生提高學習興趣,變被動的“灌輸”式學習為主動的“汲取”式學習,還可以培養學生分析、解決問題能力,使每個學生都能得到全面發展。同時,教師也應不斷學習,提高學歷和文化層次,學習新的教學理念,探索新的教學模式,從整體上提高護理教育質量。
參考文獻:
[1]張志祥,李志芬.運用試卷分析提高題庫命題質量[J].西北醫學教育,2004,12(2):107-108.
[2]陳建梅.國內護理臨床教學方法現狀[J].護理學雜志,2003,18(4):316-317.
關鍵詞:考試管理教學事理管理提高質量
Abstract:As an important tool to inspect teaching affairs,examination is one necessary part in teaching affairs management circle.The aims of examination are:firstly,to check the teaching quality and the process of teaching plan;secondly,to absorb the related teaching information.But in the teaching processing,there are two quality problems in examination,one is examination paper problem,another one is checking paper processing.The two problems are directly related to enhance teaching quality and show the teachers’ teaching level and teaching attitude.As for teaching affairs management,solving the two problems are the important prerequisite for enhance teaching quality.In this paper,it introduces the ways from four aspects to improve the quality of teaching affairs management:to improve the quality of titles is the key to improve the quality of whole examination;to enhance the test management work is the protection to improve the quality of whole examination;to build and complete the examination question bank is the development trend to improve the work of examination scenically and stander;to build the evaluation system for examination quality is the necessary condition to improve the examination quality.
Keywords:Test managementTeaching affairs managementEnhance quality
考試是高等學校學生學業成績考核的主要形式。作為高校教學活動的重要一環,其主要目的在于:① 檢查教學計劃執行情況和教學目標達到的程度;② 獲取教學信息,發現教師的教、學生的學和教學管理中存在的問題,并反饋到教師、學生和教學管理部門加以改進。長期以來,由于各種原因,很難真正將考試與教學融合一體。一方面,人們重視考試過程管理,制定了諸多規章制度;另一方面,人們卻從未知道這些考試的可靠性、有效性程度。一方面,強調學生及格率、平均分;另一方面,卻很少研究學生成績反映出的真實差異。一方面,要求教師認真命題、客觀閱卷;另一方面,卻很少檢查實際運作情況等等。2001年和2007年我校分別接受了教育部本科教學工作隨機性水平評估和教學水平評估,評估專家把我校學生考試質量納入評估范圍。告訴我們,考試作為一門科學,已納入教育評價范圍。這就需要我們在重視考試過程管理的同時重視考試評價。為此,在學校領導重視和相關部門的鼎力協助下,從2001年開始,根據過去試卷抽查的經驗,我校在每期期末考試之后便舉行了系統、全面的試卷抽檢和考試工作質量評估。
試卷抽檢我們主要按公共必修課、專業基礎課、專業課、選修課四大類按比例隨機抽取課程試卷。在取樣群體方面全面涉及各系、各年級;樣本數上,一般是專業基礎課和專業課按參考人數全抽、公共必修課按一個系一個年級全部抽檢、選修課按參考人數60%抽檢。抽檢測評點主要從六個方面進行:①試卷的命題質量;②教師的閱卷水平;③試卷難度(小題難度和試卷平均難度);④試卷區分度;⑤考試平均成績、及格率;⑥學生考試成績分布狀態。其中,第①②項由教務處組織專家根據評估指標進行測評,第③~⑥項由教務處根據教育測量學、教育統計學原理開發的“考試質量分析系統軟件”完成,考試工作質量評估我們主要依據所建立的評估指標體系進行測評。
檢查的結果基本情況是:①75%的課程情況良好:試卷命題符合教學大綱,無偏題、怪題;試卷綜合效度均在0.4~0.7之間;學生考試成績呈正態分布;平均成績、及格率比較理想;教師閱卷比較客觀、公正,無多加少算現象。②考務工作通過嚴謹的試卷管理程序、嚴格的考場次序以及考后工作的認真組織,此項工作評估成績較好。但是,部分課程評估的結果卻不令人樂觀:①命題質量、試卷綜合效度不高。其中命題難易程度掌握不準顯得特別突出,由此產生試卷難度系數懸殊較大、考試成績不理想,及格率偏低,學生成績分布曲線呈偏態分布;②教師閱卷評分寬嚴尺度把握不準;③個別課程試題庫管理不規范。本文試圖通過我校考試工作的具體實踐,主要探討:①提高命題質量;②加強考試組織管理工作;③建立和完善試題庫;④建立考試工作質量評價及信息反饋系統。
1.提高命題的質量是提高整個考試質量的關鍵
命題是考試工作的核心環節。整個考試工作應以命題為中心分作前后兩個部分:第一,確定考試目標、考試內容和考試方法,編制考試計劃;第二,印題、考試、評卷和成績的分析與處理。前一部分所完成的只是關于考試的設想和計劃,它只有經過命題才能轉化為可以實際執行的東西;后一部分工作,是以命題的結果為依據,來實施考試、閱卷和成績分析。考試設計得再合理,計劃編制得再完善,如果命題工作沒做好,也不會產生好的考試結果;考試過程再嚴密,考試成績處理得再科學,如果試卷編制得不好,也不可能很好地實現考試目標。所以,提高考試工作質量,必須首先提高命題質量。在進行教學試卷的抽檢時,我們抽檢了某學院的《高等數學》試卷,并選擇了數學基礎較好的大一學生150人做樣本,但利用“考試質量分析系統軟件”測評的結果卻出乎人的意料:雖然學生考試成績呈正態分布,但學生平均成績卻只有54.99、及格率42.7%。此結果引起管理者的高度重視,在對該校專家進行了解時才知道,從試題庫中隨機抽出的這套考試題是98年“擴招”前所出,是“精英教育”時代的“產品”。擴招后,即使學校通過努力提高了教學質量,但也有一個過程,如果從大一到大二兩學年的四學期中,沒有一個合理的過渡期,考題難度一步到位,其考試成績必然會產生“不合理”結果。
命題是一項復雜的智力勞動,考什么和怎樣考對學生起著“指揮棒”的作用。如果考題只要求記憶教材便能作答,就會導致學生養成死記硬背的學習習慣,抑制學生分析、歸納、綜合、創新能力的培養;如果考題不要求掌握基本觀念、基本原理,只憑常識就可以作答,就會使學生不重視復習,依賴于臨場發揮。因此,必須十分認真慎重地對待考試命題,正確發揮考試的導向作用。編制一個好的試題和一份好的試卷,不僅要求命題者完全熟悉考核課程的全部內容,還要具有一定的命題技巧。那么,什么樣的試題才算作“一道好試題”?什么樣的試卷才算作一份“好試卷”呢?
筆者認為,不論何種題型,一道好試題,除了題目本身的科學、合理外,還應該同時具備這樣幾個條件,符合這樣的要求:①按照教學大綱要求,不出超綱題、偏題、怪題和沒有考查意義的題目,這是一道好的試題必須具備的首要條件。②試題的形式要靈活:問題的提出要有創新感、問題的含意需明確、多角度提出問題。③試題的正確答案是有定論的,而不是模棱兩可。④有適當的難度和較高的區分度。
此外,一份好試卷,不論它由何種題型所構成,除了每一試題都科學、合理外,還應具備下述條件,符合下列要求:
第一,試卷中試題以課程教學大綱作為基本依據,試題應能體現教學大綱的基本要求。
第二,覆蓋面與測重點相結合,考試要達到全面了解學生對課程的掌握情況這一目的,試題就必須有相應的覆蓋面,宜寬不宜窄,要覆蓋課程的基本內容。同時,全面考核在有限時間內又是不現實的,所以,試題又要著重測驗課程的重點內容,做到“點”、“面”結合,以保證考試具有較高的內容效度。
第三,試卷中試題不應當是課程教學內容的簡單重復,而應該是在原來基礎上的提高。為此,試卷中只需要機械記憶和簡單模仿便能作答的題目應盡量減少,大量的試題應該是需要學生經過分析、綜合、歸納才能作答的。
第四,試卷中試題量不宜過大,但是題目的數量要適當多一些。多少稱為試卷的長度(一份試卷中試題數量的多少稱為試卷的長度),對提高考試的信度是有利的。
第五,試題獨立性與試卷整體性相結合。在一個題目中考過的內容,其它題目不應重復,題目之間不可互相暗示,保持題目獨立性是為了判定學生對課程各個內容的掌握程度。另一方面,還應照顧試卷的整體性,考題間要有分值大小、難易程度、費時多少的合理搭配。
第六,立足考試對象的知識基礎,正確把握試題的難易度比例,掌握好合格的標準線。教育部原總督學柳斌同志曾說過:“素質教育的第一要義是面向全體學生”[1],我們推行素質教育就不能不正確把握試題的難易度,大面積高分或大面積低分不僅會影響考試可信度,而且會誘使考生產生某些本可避免的心理問題。所謂考題必須面對全體考生,并非指不顧質量和大綱的要求,而是指面對考試對象知識基礎的實際,從一個水平提升到另一個更高水平要有一個過渡期,要有一個相對應的、適合考試過渡的“面”,力求使成績合格的都能達到合格的標準線。一份科學合理的試卷在試題量及其難易的程度上應呈正態分布。容易題目、較容易題目、中等題目、較難題目、很難題目各占比例分別為5%、15%、60%、15%、5%。
如果違背了上述基本要求,考題出得過難或過簡單,其通過考試檢查學生的學習情況與教師的教學情況都會存在問題,考試的科學性和作為檢驗教學狀況的可信度,將會受到懷疑。在試卷抽檢總結會上,學校對《結構設計原理》等10門課程試卷給予了充分肯定,理由是:這些試卷命題時不僅體現了小題質量要求,而且整套試卷“質”和“量”都令評估專家滿意,抽檢結果所反映的各項參數都符合教育測量學原理。相反,《審計學》課程試卷雖然102個抽樣樣本平均成績79.5分、及格率達到971%,卻被要求限期整改,原因是:①試卷難度偏底,平均難度系數只有0.215;②小題難度系數區間為:0.290~0.079;③試卷綜合效度0.275;④學生考試成績呈正偏態分布。
2.加強考試組織管理工作是提高整個考試質量的保障
考試組織管理工作也就是通常所說的考務工作。它的具體目標是:使考試能夠正確地實施,順利地進行,減少和避免各種偶然因素和工作過失對考試的干擾,保證考試過程的客觀性、可靠性;同時,盡量減少考試過程中人力、物力和財力的消耗。做好考試的組織管理工作對于保證和提高考試的可靠性和有效性具有重要的意義。
轉貼于 我校在考試組織管理工作方面,應主要抓住三個階段性工作:考前階段、考試階段、考后階段。
2.1考前階段:很抓命題工作,在“質”上大做文章,嚴格按照“一道好試題”、“一份好試卷”的標準驗收課程試題。同時對試卷的印制工作、試卷的運送和保管工作等建立了相應的規章制度。該階段工作質量強調的是:保密性。
2.2考試階段:很抓監考人員的選聘和培訓工作,學校抓考場紀律,院(系)抓考試動員和考試規章制度的學習。該階段工作質量強調的是:考場編排的準確性和考場紀律的嚴明性。
2.3考后階段的主要工作是試卷評閱的組織和考試成績的統計、分析與處理。對于教師的閱卷水平和課程考試質量,每期都要進行試卷抽檢,并將結果在全校公布。該階段工作質量強調的是:試卷評閱的客觀、公正性和成績分析、處理的科學性。
加強考試組織管理,做好三個階段性工作,必須建立相應的考試管理機構;建立一支素質高、精通業務的考試工作隊伍;建立一套嚴密的規章制度。為此,我校教務處“教學質量科”和“考試中心”對考試的組織和試卷抽檢全面負責。
3.建立和完善試題庫是促進考試工作向科學化、標準化方向發展
試題庫,就是歸類儲存質量合格的各種試題的倉庫。題庫的建立和完善是使考試向著科學化、標準化方向發展的重大工程,是高等學校深入教改的重要步驟。當然,高校課程繁多,要求所有課程都建立題庫是不現實的,也不經濟,但對于一些大面積的課程(如:公共必修課、專業基礎課)建立試題庫是很有必要的。
我校在建設試題庫方面,作了以下七條規定:
一是在題質上難易適度的原則:每一個試題都應該有合適的難度和較高的區分度;試題的各項參數要準確,用語要準確,并備有答案和評分規定。
二是在題量上要有一定程度覆蓋率面的原則:所儲試題的總目能夠覆蓋教學大綱要求掌握的這門課程的全部內容,有多角度考查的內容和從不同角度考查的試題。
三是組卷形式上的科學規范原則:目前采用計算機組卷是可行、科學的,但是試卷的難度把握一定要準。
四是在管理上要遵循便于統計、檢驗和質量分析的原則:試卷的成績要便于進行統計、檢驗和質量的分析與評價。
五是各種題型在量上要關注,樣本數越大,所組卷的科學性越高。
六是要具備教學大綱、教材等考試命題材料和題庫組建使用的詳細材料。
七是與時俱進的原則:題庫在使用過程中,還要根據使用的實際情況、學科的發展、考核對象變化等不斷地補充、修改和更新。
4.建立考試工作質量評價及信息反饋系統推動考試質量不斷提高
任何一項有意義的工作,工作結束之后都要進行一番總結,評價工作的質量和實際效果,鼓勵先進,找出問題并加以解決。考試也是這樣,一次考試之后,考務工作是否達標?學生成績有多大的可靠性?教學計劃和教學目標實現到何種程度?哪些試題質量較好,好在哪里?哪些試題較差,差在何處?這些都需要進行總結和評價。評價的目的在于為改進今后考試工作、提高考試工作質量提供重要參照系數。
我校在建立考試工作評價及信息反饋系統方面,做了以下工作:
(1)從考試設計、考試組織管理、命題、題庫建設、考試質量、學生成績分析六個方面建立評估指標體系。
(2)對于評估的結果學校每學期召開專題工作會,將存在的問題通過《意見反饋表》通知課程負責人和課程所在系(部),要求提出整改意見,限期整改,學校按照整改意見定期組織人員檢查落實情況。
評價項目評價內容評價方式考試設計
工作①考試目標、內容和考試標準的制定;②考試方法和類型的選擇;③命題計劃的編制。考試組織管理工作 ①試卷編、印、送的管理;②考場編排;③試卷裝訂;④考場紀律、秩序;⑤閱卷、評估。建立考試管理機構
組織管理人員根據評估指標體系測評命題質量①試題質量;②試卷質量。題庫建立和完善①題庫的建立;②題庫的完善。組織課程專家根據評估指標體系測評考試質量①考試效度;②考試信度。學生成績分析①平均成績;②及格率;③成績分布曲線。運用教育測量理論開發評估軟件,利用計算機統計處理考試作為高校教學管理工作的重要內容之一,是一項系統工程,考試工作質量的全面提高需要學校各教學單位和全體教師的精心協作和緊密配合。隨著高校考試評估體系的不斷完善和認真組織落實,考試質量將會得到不斷提高。
【 關鍵詞 】 模糊聚類:遺傳算法;FCM算法;考試分析
Application of Fuzzy Cluster Analysis in Student’s Exam Results Based on Genetic Arithmetic
Zhai Jian-feng
(Computer Center, China Youth University For Political Science Beijing 100089)
【 Abstract 】 Genetic algorithm can solve the fuzzy C-means clustering algorithm to initialize the sensitive issue. Combining genetic algorithm with the FCM not only plays the genetic algorithm ability in global optimization, but also takes into account the capacity of local optimization of FCM. Hence it can improve the convergence rate and solve the clustering problem better. The empirical study shows that the mentioned algorithm in the paper is used to examination results for fuzzy clustering analysis, bring to light the level of knowledge and capability of students more objectivity and more correctly, the fuzzy clustering results reflect the significance and role of the Teaching and Learning.
【 Keywords 】 fuzzy clustering; genetic algorithm; FCM algorithm; examination analysis
0 引言
考試作為教學管理過程不可或缺的環節之一,具有教與學的雙重功能,既是對學生應掌握的知識和能力的測試,也是對教師教學質量和效果的同步檢驗。為充分發揮考試的效能,綜合評價命題質量,及時反饋教學效果,溝通教學信息,教學部門對考試成績進行統計分析和總結是非常必要的。如果只統計考試成績,不分析試題、試卷和考試過程,則無法確認成績的可信性和有效性,因此把數據挖掘技術引入到考試成績分析中,找出影響考試的真實原因,有針對性地指導教學,提高教學質量和教學效果。
本文利用學校大一學生某學期《大學計算機基礎》的期末考試成績,采用基于遺傳算法的模糊聚類進行考試成績分析,分析結果可以更好的評價學生對不同知識點的掌握,同時指導教師的教學活動。
1 基于遺傳算法的模糊聚類算法
1.1 模糊C-均值算法(FCM)
模糊C-均值算法把n個向量xi(i=1,2,…,n)分為c類,采用模糊矩陣U=(uij)描述,使得被劃分到同一簇的對象之間相似度最大,而不同簇之間的相似度最小。其中uij是矩陣U的第i行,第j列元素,代表xi屬于第j(1?蕎j?蕎c)類的隸屬度,且uij=1。
FCM算法是一個簡單的迭代過程,用下列步驟確定聚類中心ci和模糊矩陣U:
步驟1:用[0,1]間的隨機數初始化模糊矩陣U,使其滿足uij=1,0
步驟2:用ci=計算c個聚類中心ci(i=1,2,…,c);
步驟3:根據J(U,c1,…,cc)=Ji=ud計算目標函數。如果它小于某個確定的閥值,或它相對上次目標函數值的改變量小于某個閥值,則算法停止。這里uij介于0,1間;ci為聚類中心,d=|| ci-xj ||為第i個聚類中心與第j個數據點間的歐式距離;且m∈[1,∞)是一個加權指數。
步驟4:用uij=計算新的U矩陣。返回步驟2。
1.2 基于遺傳算法的模糊C-均值聚類
FCM算法采用一種迭代的爬山方法來尋找最優解,因此對初始化非常敏感而容易陷入局部極小值。遺傳算法是一種應用廣泛的全局優化方法,利用交叉操作和變異操作可以將個體之間的信息進行交換,通過多次迭代得到最優解。因此將遺傳算法和FCM算法結合起來,利用遺傳算法的全局優化能力更好的進行聚類分析。
遺傳算法一般需要進行以下幾個操作:首先采用合適的方法將問題的解編碼到基因串中,即將種群進行初始化;設置合適的適應度函數,并根據適應度函數值的大小挑選個體進行選擇操作、交叉操作和變異操作等進行一代一代的演化,逐步逼近問題的最優解。因此需要根據不同的優化目標,對遺傳算法的染色體編碼、適應度函數、遺傳操作以及停止準則進行相應的分析設計。
關鍵詞 數據挖掘 決策樹 成績分析
中圖分類號:TP311.13 文獻標識碼:A
0引言
隨著我國高等教育信息化建設的快速發展,許多高校都已經建立起了校園精品課程、數字化圖書館、網絡實驗室等信息化應用,在知識共享上不斷完善求新。同時,校園服務、校園信息、在線教學等數字化校園平臺的建設實現了數據的共享與系統的整合。
傳統的學生成績分析還停留在簡單的查詢及簡單的數字統計階段。如查詢某個學生的某門課程的成績,統計某門課程的優、良、中、差各個成績段的學生人數,統計成績的均值、方差、置信度等。己有的分析研究僅僅從理論上對可行的評價機制進行討論,而隱藏在這些數據后的其他有用信息很難能夠發掘出來。
另一方面,信息化應用中獲取的大量教學信息使得各種新的屬性不斷出現,增加了學生的信息存量,大量的學生信息以及學習數據沒有發揮其相應的作用。這些信息從一定的角度上反映了學生在新的教學模式下所特有的學習行為,為研究學生的學習行為提供了依據與基礎。本文就是在這些大量的數據基礎上,結合數據挖掘的決策樹分類技術,從學生的學習成績入手,收集、整理和分析學生的行為信息,總結和發掘在新的學習模式下對教學質量及其學習效果的影響,為教師日常教學和學生學習的改進提供依據。
1數據挖掘技術綜述
數據挖掘(Data Mining),就是從大量的、不完全的、有噪聲的、模糊的、隨機的原始數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用、可信的信息和知識的過程 。是一門廣義的交叉學科,它的發展和應用涉及到不同的領域,尤其是數據庫、人工智能、數理統計、可視化、并行計算等 。
數據挖掘技術有兩大基本功能,即描述功能和預測功能。描述功能是指描述數據庫中數據的一般性質。預測功能是指對當前數據進行推斷,以便做出預測。
數據挖掘研究的對象是大量隱藏在數據內部的有價值的信息,如何獲取有價值感興趣的信息是我們所要解決的主要問題。接下來簡單介紹數據挖掘中應用較為廣泛的常用的一些技術。
1.1決策樹方法
決策樹算法的目的是通過向數據學習,獲得輸入變量和輸出不同取值下的數據分類和預測規律,并用于對新數據對象分類的預測。
1.2關聯規則
關聯規則用來揭示數據與數據之間未知的相互依賴關系。由一個條件和一個結果組成的,形如 IF...THEN 的簡單形式就叫做規則,關聯規則挖掘就是掃描整個數據集,從中找出具有給定的最小支持度和最小置信度的關聯規則。其中最具代表性的是R.Agrawal 提出的 Apriori 算法。
1.3神經網絡
神經網絡是以人腦為基礎的抽象模型,它模擬真實人腦神經網絡的結構和功能,將眾多結構和功能極其簡單的神經元通過各種方式聯接成一個復雜的網絡結構,以實現復雜的智能行為,構成一個類似于人腦結構的非線性預測模型,通過學習進行模式識別。神經網絡具有兩大特點――自學能力和自適應能力。
1.4聚類分析
聚類是將數據集分成若干不同的類,使得在同一類的數據對象盡可能相似,而不同類中的數據盡可能相異。聚類與分類的根本區別在于:分類需要事先知道所依據的對象特征,而聚類是在不知道對象特征的基礎上要找到這個特征。
以上介紹了數據挖掘的基本知識,包括數據挖掘的概念、數據挖掘的功能、數據挖掘的過程及步驟,以及數據挖掘中常用的各種技術。而且現在的數據挖掘軟件,不管是開源還是商用都已經很成熟了,也提供易用的可視化界面,集成了數據處理、建模、評估等一整套功能。本文嘗試使用Spss modeler[7,8]數據挖掘工具,采用決策樹分類技術,對所采集的學生考試成績數據進行分析挖掘,形成分類規則,從而更好的分析和預測成績數據。
2高校學生成績的決策樹模型
2.1決策樹技術
決策樹技術是通過學習,獲得輸入變量和輸出變量不同取值下的數據分類和預測規律,并用于對測試集的分類預測。它主要由兩個階段組成。
第一階段,建樹階段。選取訓練數據集進行學習,導出決策樹。建樹的流程圖如圖1所示:
第二階段,剪枝階段。用測試數據集檢驗決策樹,如果所建立的決策樹不能正確的回答所研究的問題,我們要對決策樹進行剪枝以解決過分適應數據的問題,直到建立一棵正確的決策樹。剪枝的目的是降低由于訓練集的噪聲而產生的起伏。
決策樹技術之所以是數據挖掘領域中運用較多的分類和預測主要技術,原因有三:一是決策樹構造的分類器易于理解;二是采用決策樹分類,其速度快于其他分類方法;三是采用決策樹的分類方法得到的分類準確性優于其他方法。
SPSS Modeler提供了包括C5.0、CHAID、CART和QUEST在內的經典決策樹算法,C5.0是在決策樹的ID3算法基礎上發展起來的。決策樹的核心問題之一是決策樹分枝準則的確定,C5.0以信息增益率為標準確定最佳分組變量和分割點。其關鍵的概念是信息熵。
2.2學生成績分析
分析影響學生成績的因素,可以通過數據挖掘技術從定量的角度精確展現學生成績分析的多個方面,找出影響學生成績的主要因素,以此來幫助教師和教學部門制訂相應的措施,有利于提高教學質量和增強教學效果。因此,本文采用SPSS Modeler14.1數據挖掘工具,對采集的學生考試成績數據進行分析挖掘,形成分類規則,從而更好的分析和預測成績數據。具體的信息挖掘的操作步驟如下:
2.2.1確定挖掘對象、目標及其數據采集
以本校2014-2015 年度第一學期所講授的“計算機大學基礎”為例,對象是 2014 的部分學生,共 931人。希望根據學生的考試情況來分析挖掘出哪些因素對學生成績有影響。數據的采集來自于考試系統中導出的數據。計算機大學基礎考點所占的分數如下:單項選擇15分、填空5分、windows基礎知識10分、計算機網絡10分、word操作20分、excel操作20分、ppt制作10分、access數據庫10分,總計100分。由考試系統導出的數據中包含了考生的基本信息如姓名、班級、學號和機器號等信息。也包含了考生所做試卷的編號及其交卷后的剩余時間等重要信息。
2.2.2數據的預處理
所收集的原始數據還不能直接用于挖掘,因為這些數據一般是不完整的、含噪聲的、不一致的,需要對這些數據進行預處理,以提高數據挖掘對象的質量,有助于提高后面挖掘過程的精度和性能。因此,對數據變量的管理和樣本管理是建立數據模型的前提和基礎。圖2表示了對學生成績數據進行的預處理數據流,其中包含了對數據源的追加、合并、填充和過濾。最終確定了進行分類的重要輸入字段為:單選、填空、widows、網絡、word、excel、ppt、access、試卷編號和剩余時間(已經將時間格式轉換為以秒為單位);分類的輸出即目標確定為考生的大學計算機基礎成績(已經將其離散化為好、中、不及格),為后續的建模做準備。
2.2.3決策樹在學生成績分析中的應用
決策樹的生長過程本質是對訓練樣本反復不斷遞歸過程, 根據SPSS Modeler提供的的C5.0算法、QUEST算法、CHAID算法和CART算法,對預處理后的數據流分別進行建模和比較,具體的算法思想和內容不再贅述,其建模的流程和C5.0算法結果如圖3所示:由圖3(b)中的模型結果可以看出評估模型中每個預測變量的相對重要性。通過這一點,我們看到Excel成績在此個案中最顯著,而其他變量的因子依次為:Access、填空、單選、ppt、word等成績。這也說明了Excel,Access和填空對學生來說不容易得分,大部分同學掌握還有待加強。而學生對ppt、word、網絡和windows題目掌握較好。
由圖4所示的分析結果可以看出:經過剪枝的決策樹模型的準確率為達到了88.1%,模型提取的分類的成績結果為“好”的規則如圖4(a)所示。由決策樹提取的分類規則對大學生英語學習有著重要的指導作用,同學們可以根據自己實際學習情況,參考決策樹挖掘結果,找出自己的學習薄弱環節,進行針對性的學習訓練,對通過大學計算機考試的幾種情況有所了解,為自己制定學習計劃和學習目標提供參考。從上面的規則我們可以看出:在考試中,單選、excel和Access部分的得分對考試成績為“好”的影響是最為重要的,其次是填空和word,其余部分對考試的影響較小。因此,同學們在準備考試的時候可以將excel和Access作為重點來進行強化訓練,提前調整自己的學習計劃、完善自己的學習方法、科學的提高學習成績。
此外,由圖4(b)和圖5所示的模型對比結果可以看出:經過剪枝的決策樹C5.0算法模型的測試和訓練的準確率比其他幾個分類算法要高。模型一致性誤差對比可以看出:在檢驗的樣本集合上,4個模型對255個樣本有相同的預測值,占52.9%。225個樣本預測結果不同,占47%。可見,4個模型預測結果相同的比例屬于中等水平;進一步,在相同預測結果的255個樣本中,有232個預測正確,占91.7%,21個預測錯誤占8.3%。因此,模型的總體預測精度一般,根據分析可進行樣本的平衡處理或在模型參數上更細致的調整。
3小結
本文研究數據挖掘技術中的決策樹模型,采用SPSS Modeler工具軟件對大學計算機基礎的考試成績進行分析,通過數據預處理,為決策樹模型準備數據,實現了成績分類挖掘的全過程,通過生成的決策樹規則分析計算機大學基礎考試中的題型對考試成績的影響情況,從中找出規律指導考生調整學習計劃、完善學習方法、科學有效提高學習成績。從實驗分析的結果和模型的對比可以看出,該決策樹模型的分類效果是良好的。
參考文獻
[1] 伍順比.新世紀我國高等教育信息化的回顧與展望[J].教育探索,2011(6):135-137.
[2] 孫名松,周夢熊,李勝利,基于UML的高校教育信息化評價系統的模型研究[J].大連理工大學學報,2005(45):287-290.