读写算杂志征稿投稿论文范文参考

所属栏目:教育学论文 发布日期:2014-06-10 08:25 热度:

  以成绩为导向推荐体育选项的基本思路是:根据往届学生的体质健康数据和体育选项课成绩,建立体质健康数据与选项课成绩的关系模型;然后预测待选课学生选择特定选项后可能获得的成绩,由学生按照自己的意愿做出选择。

  摘要:本文使用数据挖掘方法,基于学生的体质健康数据预测其在各个体育选项上可能获得的成绩,以吸引学生积极参与到体育选项推荐当中来。成绩预测的基础是体质健康数据与选项成绩的挖掘模型,其建立步骤包括分割数据集、建立细分模型和挖掘预测模型。实验研究表明,成绩预测的结果符合传统经验对于体质健康状况与体育选项匹配度的判断。

  关键词:读写算杂志征稿投稿,体育选项推荐,数据挖掘,成绩预测,细分模型

  追求高分的选课诉求在学生当中普遍存在,成绩导向的选项推荐能使这种诉求得到满足,从而激发学生参与选课指导的热情。提供这种推荐模式,表面看是迎合学生追求高分的心态,实则是为了引起学生的关注。

  实际上,如果学生具有某个选项所需的良好身体素质,那么他就比较容易取得好成绩;相反,基础较差的学生选项成绩一般也比较低。所以,预测成绩低的选项往往是符合学生体质发展需求的选项。在选课期间应通过各种方式宣传促进身体素质发展的选课导向,引导学生按照反向思维选择适合自己的体育选项。

  1选项推荐的实施过程

  基于成绩导向的选项推荐运用数据挖掘方法,其实施分三个阶段。下面假定有m个运动项目可供选择。

  首先,按选项和性别将学生的体质健康数据划分为m个数据集。每个数据集对应特定选项、特定性别学生的体质健康数据。其次,对于每个数据集,针对《国家学生体质健康标准》①(以下简称《标准》)测试指标和选项成绩进行相关分析,找出与选项成绩密切相关的一项或多项测试指标。接着,以相关系数高的测试指标为依据,使用聚类算法将数据集划分为若干个子集合,即数据集的细分模型。然后,在每个子集合中导入学生的选项成绩,挖掘体质健康数据与选项成绩之间的关系,生成个性化选项推荐知识库。一个数据集对应的知识库由多个预测模型构成,每个预测模型对应一个子集合,蕴含的知识就是该子集合中体质健康数据与选项成绩之间的关系。最后,基于每一位选课学生的体质健康数据,逐个选项地匹配该学生所对应的数据子集;然后依据相应的预测模型预测他可能得到的成绩,按成绩由高到低的顺序向学生推荐。

  1.1建立细分模型

  1.1.1建立细分模型的原因

  选择同一选项的学生个体之间,体质健康状况和选项成绩的差异都很大。如果为每个数据集建立单一的预测模型,会大大降低成绩预测的准确率。这一结论在前期实验中得到了充分的论证。②

  1.1.2测试指标与选项成绩的相关性

  建立细分模型的实质是将数据集分类。理想的分类依据应缩小学生个体之间的差异,即学生可能获得的选项成绩上的差异。但是,我们不能根据选项成绩去分割数据集,这是因为它只能充当数据挖掘算法的预测项,而不是输入项。

  体质健康状况是学生获得选项成绩的基础,我们可以使用一项或多项体质健康测试成绩作为分类依据,前提是这些测试指标与选项成绩是密切相关的。通过分析体质健康测试指标(除身高体重指数)和选项成绩之间的相关性,能够找出符合条件(相关系数大于阈值)的测试指标。以这些指标替代选项成绩充当数据集的分类依据,就能减少子集合内部元素之间的差异。

  1.1.3建立细分模型的方法

  在数据挖掘的常用方法中,分类③和聚类④都可以实现将特定选项、特定性别的体质健康数据划分为多个子集合的目的。建立细分模型是要最小化相同子集合内部元素之间的差异,同时最大化不同子集合元素之间的差异。由此可见,聚类方法天然符合这一目标。相关分析可能得到两种结果:一是与选项成绩密切相关的测试指标只有一项;二是有多项。这两种情况下都可以使用聚类算法,以密切相关的测试指标为输入项、以选项成绩为预测项将数据集划分为若干个子集合。对于子集合的数目,应控制在3~6个之间,4~5个为宜。

  1.2挖掘预测模型

  接下来是最重要的阶段——挖掘预测模型,即生成知识库。每个子集合对应一个预测模型。在执行这项工作时,有以下问题需要解决:

  (1)选择哪些测试指标作为预测模型的输入。不能仅选择与选项成绩相关系数高的指标,因为其他指标对选项成绩也会产生一定影响。如果挖掘预测模型时仍然将它们排除在外,会影响输入信息的全面性,从而降低预测的准确率。后面的实验结果也验证了这一点。

  (2)使用测试指标的测试成绩还是其相应的分数。大多数情况下分数与成绩成正比例关系。《标准》在60分以上的分档虽然比较细,但依然存在不同成绩得分相同的情况。因此,使用测试成绩作为输入数据更能反映学生体质健康状况的差异。

  (3)使用哪种数据挖掘算法。首先,分类比聚类更为符合挖掘预测模型的要求,而其他诸如回归、时间序列分析等方法则完全不符合要求。其次,使用分类中的哪种算法取决于数据集的特点,不同数据集可能有各自适合的分类算法,具体可以通过实验验证。

  2实验分析

  实验选取足球和瑜伽两个比较典型的项目,待预测对象为137名男生和90名女生。男生台阶试验、立定跳远和坐位体前屈获得优秀、良好、及格和不及格的人数分别为16、47、48、26;4、20、80、33;21、49、54、13人。女生三个项目取得不同成绩等级的人数分别为1、3、72、14;5、19、59、7;27、36、19、8。

  根据传统经验,耐力和力量素质较好的学生比较容易在足球项目上获得高分,而柔韧素质较好的学生则更容易在瑜伽项目上获得好评。本节实验的主要目的就是建立足球和瑜伽项目的成绩预测模型,并为实验对象预测两个项目的成绩,以验证这一结论的正确性。

  2.1预测模型分析

  随机抽取C大学足球项目126名男生和77名女生、瑜伽项目66名男生和138名女生的历史数据(含大一下学期测得的《标准》数据和大二上学期的体育选项成绩),用以建立两个项目的成绩预测模型。

  经过相关分析发现,与足球成绩相关系数较高的测试指标是台阶试验和立定跳远;与瑜伽成绩相关系数较高的测试指标则是坐位体前屈。在建立细分模型时,4个数据集(足球-男、足球-女、瑜伽-男、瑜伽-女)被分别划分为4、4、4和5个子集合。

  在此基础上,为足球-男、足球-女、瑜伽-男、瑜伽-女的每一个子集合建立了成绩预测模型。在验证模型的准确性时,仍然使用这些学生的体质健康数据。4个数据集预测错误的人数分别只有1、2、3和3人,准确率达到99.2%、97.4%、95.5%和97.8%。

  2.2预测结果讨论

  将137名男生和90名女生的体质健康数据分别导入相应的成绩预测模型,为每名学生预测足球和瑜伽两个项目的成绩,结果如表1所示。对比他们的体质测试成绩可以看出,成绩预测的结果与学生的体质健康水平基本一致。

  表1成绩预测的人数分布

  从项目之间的比较来看,瑜伽项目的预测成绩明显高于足球项目,因为学生的柔韧素质明显好于耐力和力量素质。从男女之间的对比来看,女生的足球成绩好于男生;虽然男生的柔韧素质普遍比女生差,但他们的瑜伽成绩并不输于女生。究其原因,可能是因为足球和瑜伽两个项目的性别倾向较为明显,所以教师会照顾弱势的性别群体,给他们较高的分数。

  下面以选择足球的男生为例,分析成绩预测结果与体质健康水平的关系。

  (1)台阶试验测试成绩不及格和及格者共74位,表1中预测成绩在75分以下者有84人;两者间存在一定差距,主要是因为足球成绩还受立定跳远成绩的影响(该指标不及格和及格者总计113人)。(2)台阶试验测试成绩良好者47人,与成绩预测70~89分者人数(47人)恰好一致;但与立定跳远成绩良好者(20人)存在一定差距,主要是因为立定跳远及格者中有许多人的成绩接近良好,只是按评分标准被划分到及格范围。(3)台阶测试成绩优秀者16人、立定跳远成绩优秀者4人,综合来看多于成绩预测90分以上者的人数(6人),这可能与教师对优秀者评分较严格有关。

  一般认为,足球项目的成绩主要受耐力素质(台阶试验)影响,同时也与力量素质(立定跳远)有一定关系。表1的预测结果与该结论基本一致,这说明成绩预测的思路和方法是正确的。

  3结论

  本文提出了基于学生的体质健康数据预测其体育选项成绩的方法,并通过实验研究验证了该方法的准确性。

  基金资助:江西省社会科学“十一五”规划项目(10JY64);江西省教育科学“十一五”规划项目(09YB282);江西省教育厅科技计划项目(GJJ11091)

  注释

  ①《国家学生体质健康标准解读》编委会.国家学生体质健康标准解读[M].北京:人民教育出版社,2007.

  ②LanYu.StatisticalAnalysisandDataMiningCombinedYogaGradePrediction.20122ndInternationalConferenceonEconomic,EducationandManagement,pp.657-660,June2012.

  ③朱明.数据挖掘(第2版)[M].中国科学技术大学出版社,2008.

  ④吕晓玲,谢邦昌.数据挖掘方法与应用[M].中国人民大学出版社,2009.

文章标题:读写算杂志征稿投稿论文范文参考

转载请注明来自:http://www.sofabiao.com/fblw/jiaoyu/jiaoyuxue/21265.html

相关问题解答

SCI服务

搜论文知识网的海量职称论文范文仅供广大读者免费阅读使用! 冀ICP备15021333号-3