大数据精准教学系统
建设内容
1. 建设框架
随着大数据、人工智能等技术的发展,教育信息化行业从业者、学校及科研机构的积极探索与实践,基于大数据驱动的精准教学产品取得了长足进展。
科大讯飞股份有限公司作为首批四大国家级人工智能开放创新平台之一,其语音识别、语音合成、机器翻译、图像识别、阅读理解等核心技术在国际保持领先地位,在教育领域开发的“大数据精准教学系统”,整合大数据采集、基础数据分析、精准教学、智能练习、教学监管模块,依托人工智能+大数据技术、知识图谱技术及大量优质教学资源,基于对学校日常考试、测练、练习业等全场景学业数据的采集和精准分析,为教师讲评、备课、教研,为学生个性化学习,为管理者科学管理等提供有力数据支持。
大数据精准教学系统架构图
2. 基础信息管理
在充分考虑适应不同规模学校、适应不同学校管理办法及业务流程的基础上,科大讯飞为学校提供基础信息管理功能,实现数据统一存储和管理权限分级,从而从各个方面跟踪、了解教师和学生的学业数据动态。同时,为满足学校分层教学及走班教学的需求,系统支持分层走班设置,进行新高考教学配置,实现分层教学。
(1)用户信息与管理
系统可实现学生、家长、教师信息的一键导入,包括学生账号、学籍号、、学生班级信息等,实现用户信息的便捷管理。
(2)班级信息与管理
系统支持批量导入班级,并自定义班级名称。针对学生班级变动、年级变动,系统提供转班及升年级等功能,对批量转班学生,支持导入excel添加说明,可以批量下载学生名单。
(3)角色权限管理
支持教研员、学校管理员、子管理员、校长、年级主任、学科组长、班主任、授课教师、学生、家长等全方位、多角色的权限管理与控制。支持对角色进行添加、删除、修改、管理与控制,不同角色匹配不同权限。
(4)成绩管理
支持学校控制成绩发布:支持考试成绩保密,按照角色、科目、部分教师选择屏蔽或发布成绩;支持对单科成绩结束阅卷立即发布或延迟发布;支持成绩批量检查及监控:支持按学生检查或按成绩区间批量检查和监控学生的成绩,并可以直接在网页上修改后提交,重新生成评价分析报告。
(5)新高考模式下的班级管理
系统可导入学校的走班教学信息表,进行新高考教学配置。也可以通过自定义班级名称、设置学科等级进行新高考教学学科分层教学配置,实现分层教学。
3. 大数据采集
系统提供先扫后阅、先阅后扫、智能批改、拍照采集多种数据采集方式,满足不同场景的采集需求。针对英语作文、英语填空题、数学填空题,系统自动评分。
3.1练习数据采集
手机拍照是对学生日常练习进行采集的数据采集方式之一,主观题支持学生拍照上传,教师选择按人或按题批改,批改完成后即可生成分析报告。练习数据采集具有高频采集、科学统计、动态评估等特点,通过对学生练习数据的伴随式采集与分析,帮助教师精准掌握班级和每个学生的练习情况,进行针对性讲评及辅导。
3.2网阅数据采集
网阅数据采集方式,通过先扫描后阅卷的方式实现阶段性测试、考试、校际联考等全场景数据采集。客观题系统智能评测,扫描结束后即可获得分析数据;主观题教师可通过手机、Pad、电脑实现随时随地批阅,阅卷结束后系统自动生成分析报告,实现阅卷分析做自动化、智能化,减轻教师阅卷及统计分析负担。
阅卷过程中依托图像加密技术,确保阅卷保密性及公平性;为解决主观题评卷误差问题,提供阅卷监控功能,支持巡考员查看每个是阅卷情况,包括阅卷进度、阅卷质量等,发现异常,可以打回重阅,全面提升阅卷速度和阅卷质量,有效评估阅卷教师水平。
网阅流程示意图
(1)考试管理
系统提供便捷的考试管理工具,如智能排考场、新高考模式下的班级管理、阅卷进度监控、成绩核查及发布控制等,助力学校优化考试组织流程,缩减考试组织时间,降低成本。系统支持快速创建考试,支持单校考试及多校联考等不同规模的考试类型。在创建考试时,可以快速选择参加考试的学校和班级、学科、考试类型等。新高考学校,支持行政班考试和分层走班考试两种类型。
系统提供便捷的答题卡制作工具,答题卡排版方式及空间可灵活设置。系统全面兼容学校多元考试场景下的试卷及配套的答题卡。答题卡印刷,无需专用答题纸,50克以上A3、A4、8K、16K、B4、B5格式的市场通用规格皆适用。
(2)扫描及阅卷
支持本地扫描识别客观题结果、处理准考证异常、客观题填涂异常、图像不合格等。另外,支持云端二次识别客观题结果,支持在云端进行异常处理。在阅卷设置中,管理员可以设置每一题的答案和分值,按照阅卷安排分配各题的评卷员。系统支持按照区域、学校分配每个教师的阅卷任务量,可以让教师动态进行阅卷,也可以固定每个教师的任务量,同时可以在阅卷过程中按照需要进行灵活调整。支持按班级阅卷,让每个教师批改本校学生的试卷,批改完成后即可以生成本班学生的分析报告。可以对阅卷方式进行设置,支持灵活设置单双评、仲裁分差,同时可以设置步骤分,自定义分值等。学生答题卡扫描后,教师可以进行网上批阅,系统支持电脑端和移动端两种阅卷方式,同时支持分散阅卷和集中阅卷。在电脑端或移动端阅卷时,教师都可以对试卷进行各类标记,包括线条、勾、圈、叉等,学生可以查看教师的阅卷痕迹,阅卷过程中教师可标记优秀卷和典型错误卷,为后期试卷讲评提供素材支撑;支持打分板、点击打分、快捷打分等多种打分方式。
(3)成绩管理
提供成绩管理功能,管理员可以按要求修改分数、纠正学生信息。支持成绩快速补录功能,可以将过往各期考试的数据补录到系统中去,统一进行数据分析,保持数据的连贯性。管理员可以按照要求灵活进行成绩发布控制,可以向指定角色、指定教师、指定学科发布成绩。
3.3手阅数据采集
过程性评价是教学的重要环节,手阅数据采集补全数据采集场景,对过程性数据进行采集,覆盖周测、随堂测练、课后练习、课前导学等,通过学生学习和教师教学效果评价的反馈信息,帮助教师及时调整教学计划和教学方法。手阅最大的特点是不改变教师的阅卷习惯,教师纸笔批改和圈划,阅卷留痕,让学生在以后复习的时候有据可依。
手阅流程示意图
(1)创建练习
系统为教师提供简单便捷的日常练习数据采集方式,教师无需创建练习记录可直接扫描答题卡。系统可通过准考证号、短学号、条形码三种方式识别学生信息,也可对学生答题卡个人信息自动校对。系统自动创建练习条目并对上传数据进行归类,自动统计分数,并生成练习分析报告。
支持初高中基础9学科一键导入word自动划题,自动识别试题题干、选项、题型、题量,支持初高中数学、物理、化学、历史学科自动标注知识点,准确率达95%以上,自动建立校本卷库、校本题库,实现自动化建设校本资源库。
(2)答题卡设置
客观题支持统一置顶布局、题干与填涂区域左右联动布局,客观题支持横排、竖排、混排、自定义行数等多形式排版。解答题支持打分条、打分框、对错框。
(3)手工批改
手阅模式不改变教师原有的批阅习惯,学生纸笔作答、教师纸笔批改,可以选择手写分数、够叉、分值栏多种赋分方式,保留教师批改的痕迹,批改意见。
3.4智能批改
系统可实现多场景英语作文智能批改并支持导出英语作文人机对比报告。
针对数学填空题及英语填空题,系统可实现自动批改及给分,切实帮助教师减轻批改负担。
3.5基础数据分析
联考、期中期末考、月考等考后,系统会形成联考报告、学校报告、学科报告、班级报告、学生报告等多层级分析报告,覆盖10多个模块,80多个指标,满足不同教学、教研场景的需要。同时,根据不同地区的评价模型,提供不同类型的分析报表,如新高考3+3模式、3+1+2模式、新高考等值赋分等。
基础数据分析工具可实现管理权限分级,根据权限大小配置查看校级报告、班级报告、学科报告、学生报告、练习报告的权限。
3.5.1练习报告
练习批改完成后,系统自动生成分析报告。
(1)教师报告
教师报告为教师展示学生练习提交情况、批改情况、学生情况及答题情况。其中,通过提交情况,教师可以查看已提交学生的名单和未提交练习的学生名单,通过批改情况教师可以查看班级练习中满分、平均分、客观题得分率及班级学生平均用时等指标,学生情况包含学生姓名、得分、得分率、提交时间点等,答题情况包含练习各题得分率、题面、题目难度、正确答案、试题解析等,详细展现学生作答情况。
(2)学生报告
练习批改完成后学生可自行查看个人练习报告,包括参考答案、答题情况、试题解析等。
3.5.2联考报告
校际间联考评价分析报告可实现指标、模块呈货架式自选,分段指标可自行划分,报告可自定义生成,也可自定义题组进行统计分析。
联考报告支持校际间联考的评价分析,指标、模块货架式罗列并开放自定义权限,分段指标自行划分,需求定制更灵活,报告可自定义设置和生成;支持跨省校际间联考报告自定义生成;支持联考成绩分档默认按照学校、地市进行配置;支持参加联考的单个学校评价报告查看联考成绩排名;评价报告(1)覆盖了考试情况概述、常见的分数分析指标;(2)包括新高考考情分析,基于知识点的学业评价、试卷质量分析;(3)指标覆盖学业等级分布、达线情况、临界生情况、分数分布形态、卷面答题情况、单科培优情况、学业水平分段(全科、单科)、名次段情况等各大类指标;(4)系统支持通过网页浏览数据分析指标,同时也可提供excel格式原始数据,便于二次加工; 支持一键导出excel版和pdf版报告;评价维度从宏观到微观涵括丰富细致的图表分析,例如支持雷达图展示联考各科的均衡情况,带负值柱状图展示各群体离均差对比结果,分组柱形堆叠图展示各分数段考生分布情况。
3.5.3校级报告
校级评价分析报告,主要为学校展示学生整体在考试中的考试情况,从学生整体情况和学生单科情况对学生进行了统计分析。校级管理者根据学校教学情况对分段指标自行划分标准,包含达线人数、分段人数、学业等级等。提供详细成绩分析,包括:多学科报告(全科统计、平均分对比、成绩分段对比、学科成绩对比、班级成绩对比、学业等级对比、进线分析、临界生对比、优劣势学科对比、班次和校次进退步对比);单学科报告(单科统计、成绩分档对比、成绩分段对比、班级成绩对比、学业等级分布;教师可选择多个班级进行优势学科对比);试卷分析,通过试卷分析,管理者可以了解试卷难度、区分度、信度、校级知识点掌握情况、以及小题得分情况等关心的主题;支持通过网页浏览数据分析指标,支持根据页面设置结果导出excel格式成绩数据以及每个学生的小题步骤分打分数据。
3.5.4班级报告
班级评价分析报告,主要为教师展示班级学生整体在考试中的考试情况,从学生整体情况进行了统计分析。学科评价分析报告,主要为教师展示班级学生整体的单学科考试情况。选科走班模式下,采用行政班+教学班评价,双重评价使评价更准确。
(1)学情总览
包括全科统计(各科目班级考试总体统计、各学科班级与校级平均分对比、班级总分分数段占比、班级优劣势学科对比)及单科统统计(概览、各分段人数、需关注学生、高频错题);试卷解析(包括答题情况、各题的选项统计、平均得分等)。
(2)试卷分析
包括试卷整体难度、信度等指标评测、大题题型分析、小题分析、知识点分析。
(3)成绩单
包含多学科(姓名、总分、校次、班次、各单科成绩)和单学科(准考证号、姓名、单科成绩、班级排名、班次进退步、查看报告、查看原卷)。
教师可以通过网页浏览报告数据分析指标,并可一键导出excel版报告和试卷原卷。同时,系统支持教师依托班级报告基于移动端开展试卷讲评,并将讲解内容录制微课上传分享给班级同学。在试卷讲评过程中,教师可以选择按得分率、知识点、题号等对试题进行重新排序,选择讲解顺序;试题答题统计可展现答错学生名单,教师在讲解错题讲解,可随时调取学生原卷、标注/调取/下载优秀解答以及典型错误解答,供课堂讲解使用。
针对中学数学、物理、化学、生物学科,系统可基于试题原题的举一反三试题资源推荐,为教师备课、讲评提供拓展资源,教师可挑选系统推荐的拓展资源供学生进行拓展练习。
3.5.5学科报告
学科报告提供(1)概览(平均分、最高分、优秀率、合格率、班级排名、缺考学生);(2)学业等级分布(优秀、良好、合格、不合格各分档的分数区间及人数、占比及学生名单),学校可根据学情自定义学业等级分段;需关注学生(大幅进步、大幅退步、临界生、波动生);(3)高频错题(题号、题型、知识点、班级得分率、与年级差值、高频错误项);(4)试卷分析,包括整体难度、信度、区分度分析和大题、小题、知识点及答题详情分析;教师可通过网页进行试卷讲评,试题题目以网页文本方式呈现,支持展示单题班级均分、年级均分/得分率、客观题选项答题统计(人数、占比、名单)、主观题得分统计(人数、占比、名单、学生原卷)、知识点、优秀卷、典型错误卷、订正统计;支持通过网页浏览数据分析指标;支持一键导出excel版报告及试卷讲评PPT;
教师可以通过网页浏览数据分析指标,一键导出excel版报告及试卷讲评PPT。
3.5.6学生报告
家长和学生可通过手机APP登录帐号了解学生学习情况。
3.5.7英语作文智批改报告
系统支持多种场景进行英语作文智能批改(在线提交批改、答题卡扫描识别批改、手机拍照上传批改)并提供班级英语作文智批改报告和学生个人报告。班级报告包括英语作文的总分与总评,诊断作文中单词拼写、语法表达等常见错误类型,统计分析学生犯错频次并显示学生具体的错误信息,教师可导出班级作文批改分析报告;学生报告包含作文分数、评语、作文批改结果等内容。
4大数据精准教学
学情是教学目标设定的基础,对学情的分析、判断与了解直接影响到教学的针对性和有效性。但目前大班制教学及一师多班使教师很难精准掌握执教的每个班级及每个学生的情况,给教学开展及精准辅导带来一定的困难。大数据精准教学系统通过阶段性的学科学情、学生学情、考点分析、学业分析、教学监管等模块分析,自动呈现每个班级、每个学生的学情,为学校管理者进行科学管理和授课教师进行精准教学提供数据支撑。
4.1学科学情
大数据精准教学系统不仅可以提供单次考试及测验报告,还可以为教师提供阶段性学科学情分析结果,包括一段时间范围内考试及练习开展情况、重点关注学生的进退步情况、班级知识点掌握情况及共性错题情况。
系统自动收录班级共性错题,支持按照错题收录时间、错题来源、得分率范围筛选错题,并支持根据错题自动推荐基于试题原题的相似题资源,系统支持根据错题原题或错题拓展题自动组卷供教师布置线上练习或线下考试使用;
薄弱项训练模块支持按照不同的统计时间段、知识点得分率、得分率排序方式筛选薄弱知识点,并支持教师自定义知识点交集或并集关系,自定义试卷模版或复用以往试卷模块,系统自动组卷供教师开展线上练习或线下考试。
4.2学生学情
每个班级都会有波动生、临界生以及需要重点关注的学生,一般教师也会有重点帮扶的教学任务。但由于缺乏精准数据支撑,教师往往很难准确判断学生的具体情况,故而难以开展针对性辅导。大数据精准教学系统通过班级学生知识点跟踪、历年成绩趋势跟踪等,为教师开展学生个性化辅导提供依据,以便及时辅导学生查漏补缺。
系统会自动收录学生的学业成绩,为教师提供每个学生的学业档案,支持按照标准分、年级名次和班级名次追踪学生学业发展状况;为教师提供每个学生的知识点掌握情况,支持多学生多知识点间对比,供教师精准定位学生问题;同时,系统可以自动收录学生错题,为教师提供每个学生的个人错题本,供教师精准辅导。针对一些波动较大的学生、临界生以及教师选择的关注生,系统会自动进行预警及提示。
4.3考点分析
期中期末、综合考等重要大型考试之后,考试的分析、备课和讲评变得更加重要,教师需要同区域内同类学校和区域整体比较来发现教学的薄弱点和遗漏点,通过往届数据来指导后续教学中可能遇到的教学重点和教学难点。但由于各校数据独立存储以及时间有限,凭借教师个人力量分析区域及往届学情,往往很难实现。
大数据精准教学系统通过对区域重难点、同类校学情的对比分析,直观呈现班级学生知识点掌握情况与区域平均及同类校之间的优势或差距,有效支撑教师及时调整教学计划。系统提供区校对比分析,通过对比本校、本区域、区域同类校考点考查情况,确定本班是否存在未考查的考点;通过对比上届学生及区域掌握情况,确定班级薄弱考点,辅助学校找到重点、发现问题、及时纠偏。
4.4学业分析
对学校管理者而言,学生过程性数据及结果性数据的分析和展现对教学指导具有重要意义,但传统教学分析由于缺少数据支撑,往往有失精确,无法提供科学的指导。大数据精准教学系统通过对学生历年成绩趋势跟踪、学科均衡分析以及班级学科分层分析,自动呈现学校教师教学成果,为学校教育资源均衡投入、制定和调整教学计划提供数据支撑。
学业分析模块可统计所有学年的考试和练习数据,并可按照标准分、班级得分率、班级优秀率、班级及格率等展现方式查看班级考试和练习成绩趋势,教师可以查看不同学年、不同学科以及不同班级的成绩趋势;基于大数据分析技术,系统自动统计每个班级在各个学科上的优劣势情况,并以雷达图的形式展现;同时,系统自动分析每个班级各学科学生分层情况,展示优秀、良好、合格和待合格各区间的人数,并给出建议。
4.5教学监管
对学校管理者而言,日常教学活动管理规范化对改善教学管理、完善教学干预具有重要意义,但由于教学活动的主观性导致教学活动数据很难系统性统计。
大数据精准教学系统教学监管模块支持从测验、练习、资源等多个维度,动态跟踪班级、年级、学校的教学活动应用情况,以数据和可视化图表的形式直观呈现教学活动中的各类教学活动情况;管理者可以自定义当前学年内每月应用数据并生成数据统计报告,支持测验、练习、和校本资源数据均以Excel格式导出用于二次加工并应用于其他教学、教研活动或统计汇报;而且系统支持统计每位教师测验、练习、校本资源贡献情况,统计范围涵盖教师的姓名、练习、组卷、分享试卷等情况,支持综合评价贡献程度较高的五位教师,从而实现科学监管、精准评价。
5智能题库
5.1题库资源
系统提供600万道以上试题资源和30万套以上试卷资源。试题均标注题型、答案、解析、知识点、难度、所属地区、所属试卷、被组卷次数、学生作答次数、平均得分率等信息,且实时更新;试卷均提供配套答案及详细解析,并支持下载打印,满足日常考试、布置作业的需求。
为满足学校资源建设及积累需求,提供公共-校本-个人资源三级资源体系。教师可通过题库选题组卷、上传word试卷、在线新建试题的方式进行资源选择与建设,通过共享试题试卷,形成校本资源库,实现线上线下资源的流转和公共-校本-个人资源的流转。
系统提供知识点组卷、同步组卷、学情组卷、专项组卷、模拟组卷五类智能组卷方式。
5.2学情组卷
通常阶段性复习和周测,教师会花费大量时间精力筛选试题资源,一方面试题内容是否符合班级实际学情往往凭借经验,另一方面经常是一套题多班级使用,很难实现专项训练。
学情组卷基于班级薄弱知识点、得分率等,系统推送相应试题生成符合学情的试卷试卷。针对同一个教师的多个班级,可以依据班级不同的知识点掌握情况生成不同的专项训练试卷。
学情组卷包括“错题训练”和“薄弱项训练”两种组卷形式,教师可以通过选择年级或班级、统计时间段、得分率范围、得分率排序、试题数量和训练模式设置试卷,再点击“生成试卷”。 “错题重做”会生成包含原错题的试卷,“错题拓展”会生成包含错题的变试题的试卷。通过“薄弱项训练”,教师可选择班级、统计时间段、知识点得分率、得分排序、选择知识点、知识点关系、试卷模板等组卷。
错题训练
薄弱项训练
5.3专项组卷
大数据精准教学系统支持教师通过选择试卷类型、适用年级、试卷题型题量、试卷名称、试卷难度和试题偏好,进行专项组卷。教师可以按知识点选题,或按章节选题,其中按知识点选题提供了知识点交集和知识点并集两种组合方式,方便教师挑选综合题。
专项组卷界面
5.4模拟组卷
针对模拟考试,大数据精准教学还支持模拟组卷。模拟组卷支持教师任意选择一张试卷,作为模板,重新匹配试题,快速模拟成一份新试卷。新生成的试卷会沿用原卷的知识点、题型、分数。
在精品卷库、校本卷库、我的卷库中,支持教师预览试卷并一键重新匹配组卷。在专项组卷中,教师也可使用成品试卷进行模拟组卷。系统支持所有试题重新匹配,也支持教师选定部分试题不更换。模拟组卷生成的试卷沿用原卷知识点、题型、难度、顺序,支持编辑、加题、减题、换题。
组卷完成后,支持教师查看原题及原卷,进行相关度对比。
查看原题
查看原卷
5.5同步组卷
支持教师在同步组卷界面选择所需教材版本及具体章节,系统会自动查询此章节下的试题,教师可通过题型、难度、所属试卷类型、试题来源等筛选试题。
同步组卷
5.6知识点组卷
知识点组卷模块提供知识点单选和多选两种方式,多选模式下既可以选择交集知识点,也可以选择并集知识点,通过选择题型、难度、所属试卷类型、试题来源等筛选试题,组卷考试。
6练习中心
针对日常教师选题难、批改难、统计难、拓展资源寻找困难等一系列难题,科大讯飞智能练习系统依托AI+大数据能力,基于网络环境为中学师生群体提供的一款“工具+内容”兼具的练习平台,提供同步课时练、校本练习、英语听说专练、英语智作文、打卡任务等五种练习模式。
6.1同步课时练
科大讯飞百万优质资源库为教师提供同步课时练习资源。教师通过题库选择系统推荐的题目布置练习,系统可生成配套练习答题卡。
教师用户可以通过题库选择系统推荐的题库布置练习、批改练习,并能够以word格式下载已经布置的练习原题。教师可以基于教材章节布置同步训练练习,让学生进行课前预习和课后练习练习。
教师可以在发布练习界面设置练习开始时间、截止时间、答案公布时间、是否发送知识卡片、是否允许补做等。学生线上作答,系统可实现客观题自动批改,主观题拍照上传后按学生或按题批改。批改、作答数据可实现云端同步及实时更新。
同步课时练布置示意图
6.3校本练习
针对传统纸质教辅收发低效、批改费时费力、统计困难、资源难找等问题,大数据精准教学系统为师生提供校本练习功能。教师线上布置教辅练习,可根据需要选择题目来源,如校本真题、教师共享、定制资源等。选择题学生线上作答,系统自动批改,主观题手机拍照提交后,教师可以选择按学生批改或者按题批改,系统自动输出批改报告。
学生可查看作答报告,包括得分情况及用时情况,同时可查看每道题作答结果及解析。
教师可以查看看班级练习提交情况、学生情况、学生的知识点掌握情况以及答题情况。其中学生情况除包含班级最高分、最低分、平均分、平均用时等基础信息外,还覆盖每个学生的整体得分率、客观题得分率、主观题得分率、练习用时等指标,知识点掌握情况包括每个知识点的分值及班级得分率。
6.3英语听说专练
在国家教育考试和评价制度改革方针的指引下,广东省、上海市高考以及江苏省、浙江省、山东省、广东省、辽宁省、湖南省、北京市、重庆市的地市中考,均将英语听说考试纳入到正式中高考成绩。另外,湖北省、广西、贵州省、云南省、天津市等的高考英语听说加试,也采用人机对话的形式进行。为满足师生英语听说练习需要,有效提高学生听说水平,系统支持英语听说专练,提供覆盖朗读、对话等单词及课文听说练习。
英语听说专练-课文
6.4英语智作文
针对日常教学过程中英语难批难改难提升这一问题,大数据精准教学系统依托手写识别、自然语言理解等人工智能技术,提供英语作文智能批改功能。
支持教师通过话题、书面表达形式、来源筛选作文题目,一键布置英语作文练习。
学生线下纸笔作答拍照上传,系统可自动将手写作文图片自动识别为印刷体并转换为电子文本;系统即可自动批改并智能打分,自动分析作文的优缺点和不足,及时反馈作文作答结果并进行标注,辅助教学活动开展;系统即可自动批改评分生成智能批改报告。学生可查看得分、词汇词组、篇章结构、语法句子、作文内容、机器评语及批改详情。
英语智作文学生提交结果
6.5打卡任务
为满足教师灵活选材、不依赖教辅加工及题库布置练习的需求,系统支持全学科打卡任务的布置。教师可以通过上传文字、图片及文档的形式灵活布置练习内容并上传答案,学生作答结束即可获得答案并自行批改,实现练习日日清,养成良好学习习惯。
打卡任务流程图
6.6答题卡练习
为满足教师灵活布置作业、减轻批改作业负担的需求,系统提供线上答题卡练习功能。教师可以通过文本、上传图片等形式自定义作业内容,并根据作业内容设置选择题、填空题、判断题、简答题等题型。教师在上传作业内容后,可上传作业整体答案。选择题、判断题答案设置完成后,学生提交作业系统即可进行自动批改,填空题、简答题等主观题,支持教师通过web端和app进行在线批改。针对作答错误的主观题,系统支持学生进行错题订正,帮助师生高效完成日常作业中的作答、批改统计等环节。
布置作业——作答作业——订正错题
6.7练习分析与讲评
练习完成后,教师可以查看学生练习提交情况、学生情况、批改报告及答题情况。系统提供多种类型练习的精准学情分析,教师可以查看平均分、得分率、优秀率和及格率、答题用时及学生的提交情况;系统提供练习各小题的分析及主客观题型的总体分析,教师可以查看不同成绩分段下学生人数及学生名单。系统提供多种题型的答题统计并以柱状图方式展现各个分段得分情况以及人数占比。
课堂讲解时,教师根据题号或答题情况对题目进行重新排序,并借助系统提供的举一反三资源进行拓展练习。教师可以利用系统提供的画笔、白板、互动等工具通过移动端进行练习讲评,支持试题原题白板讲解,展示优秀学生答案和典型错误答案;教师讲解错题时,可随时调取学生原卷、优秀解答以及典型错误解答,同时教师可调取不少于20张的学生练习进行对比讲解。
学生可自行查看个人报告,包括参考答案、答题情况、试题解析等。系统支持学生可以按学科查看自己的错题,学生可对错题进行筛选、查看解析、知识点,提升错题解决能力。
7配套硬件-A3高速阅卷仪
大数据精准教学系统配套高速A3扫描仪,具有高输出量、高速度和安全可靠等特性,提高考试阅卷效率,减轻学校扫描工作负担。其主要功能参数如下:
扫描仪进纸通道采用U型通道,支持自动进纸扫描。采用USB2.0或以上接口。
扫描速度:150 dpi和200dpi,黑白、灰度和彩色模式下都可达到每分钟100页/200个影像。
光学分辨率:支持100DPI、150DPI、200DPI、300DPI、400DPI、600DPI的图像输出。输出文件格式为PDF、BMP、JPEG、TIFF、PNG等常用图像格式,支持彩色/黑白/灰度情况的单面和双面出图。
为保障客户良好的使用体验,系统提供3年免费硬件报修及软件免费升级服务、免费更换耗材,厂商具备全国售后服务能力。
技术路线
智能教育希望给教师、学生等提供更好的教育服务。随着系统记录的学生学习数据的数据量越来越大,如何做到针对学生的精准教学是一个难题。大数据和人工智能让精准教学实现了可能。对于学生而言,可以利用大数据及时掌握自己的知识学习状态,从而实现学业预警,进行有针对性的练习。对于教师而言,借助大数据分析报表,一方面,可以从班级学生能力分析的共性结果中发现教育教学中的关键点,避免重复教学,提高效率 ;另一方面,可以通过个别学生能力分析的特性结果识别出典型学生,从而可以进行有针对性的辅导。
科大讯飞大数据精准教学系统流程基于学生学习(如答题)记录和资源标注(如试题 - 知识点标注)所产生的海量数据,对学生进行认知能力分析,理解学生的认知状态,生成学习能力的分析结果,并以报表形式反馈给学生 ;然后,基于认知诊断得到的学生能力,系统会对学生进行有针对性的学业辅导,应用到诸如教学资源推荐(如协同学习中的学友推荐、试题推荐等)、学习规划等不同的场景中,从而帮助教师提高教学效率,帮助学生提高学习效率。
整个流程的实现,主要依托以下技术:
3.1全学科智能阅卷技术
全学科智能阅卷技术应用业界最新技术架构,系统整体架构采用面向服务的架构(SOA),底层基础服务由CyCore提供统一资源服务、用户服务,Service端服务采用Java语言开发,Service端服务平台为Tomcat,Service端与底层服务通信采用Thrift框架,前端展现层由html、javascript实现,采用CFF框架,服务端数据库采用MySQL,服务端开发语言为Java,前端展现层由html、javascript、CSS实现。
全学科智能阅卷技术主要涉及手写识别技术、英语作文自动评分技术、英语作文自动批改技术、智能阅卷运算平台技术等四项核心技术:
3.1.1手写识别技术
科大讯飞手写识别引擎主要包含以下技术点:
功能点 |
详细说明 |
智能版面分析 |
自动识别分行、涂改、插入等情况 |
单行文本识别 |
基于深度神经网络,CNN、RNN、DNN等学习模型进行手写识别 |
如上图所示,手写试卷图像中所有中文文字的识别转写主要是进行已完成文本行分割的文本图像的识别转写,这个环节的主要步骤是:
1)单行文本行的预处理,这个过程主要包括图像尺寸归一化调整,将不同分辨率的扫描图像其大小放缩到同一尺度,我们通常选择300dpi标准,其次进行单一文本行行内文本图像的倾斜矫正。
2)单行文本行的特征提取,这里主要参考手写问题的特点,比如中文字符具有方向上的统计稳定特性,英文字符具有各个片段的矩规整后特征的稳定性,并且经过图像分帧滑窗的连续特征提取,单一行的手写字符就变成计算机可以通过各类分类方案进分类学习的特征了。
3)单行文本行的模型训练,这一步骤主要实现手写体字符的统计识别模型训练,目前人工智能发展阶段,已经由传统的单一使用混合高斯模型发展到了深度神经网络模型,例如CNN、RNN、DNN等深度学习模型,目前本期项目已经实现了CRDNN-HMM的模型框架结构。
4)单行文本行的识别解码,这一阶段主要借助深度模型与隐马尔科夫模型的结合,综合使用高效率的基于维特比解码原理的连续识别解码算法,将单行文本内容完成识别转写。
3.1.2英语作文自动评分技术
科大讯飞英文评分引擎包含的技术点如下表所示:
功能点 |
详细说明 |
异常引擎 |
在作文体重异常引擎组要检测抄袭、套作、乱写、卷面乱涂乱画、离题、偏题等异常作文 |
语言水平评价 |
基于学生的作文评价该学生的语言水平 |
内容自动分析 |
分析学生作文要点是否覆盖、内容表述是否充分 |
评分标准机器学习 |
学习人工专家的评分标准并完成对学生作文的合理评价 |
手写识别 |
完成对学生作文图片到文本的自动转写,并反馈学生书写质量 |
如上图所示,英文作文自动评分技术的主要步骤如下:
(1)将考生作文图片转化成文本
手写体字符和印刷体字符在形态上具有较大差别,目前印刷体汉字字符识别的主要方案还是以切分方案为主,而手写体字符识别则以输入整行文本行图像后,经过滑窗特征提取以及后续识别,但需要注意的是,手写体汉字和印刷体汉字目前都已经使用了CNN-HMM模型进行建模。科大讯飞手写识别系统基于千万级实际学生书写资源,进行大规模人工标注,而后进行机器自动学习,在2016年初的某全国性大学英语考试中,识别正确率达到97%,从而保证了后续的评分、批改等相关功能能够顺利实施。
(2)对考生答案进行多维度自动分析,并抽取特征
在收集的超过5000场,千万级实际的考试数据的基础之上,基于深度语义理解技术选出具有代表性的数十万的考生数据进行人工精细标注。而后基于长短时循环神经网络模型(Long Short-Term Memory :LSTM)、受限玻尔兹曼机(Restricted Boltzmann Machine :RBM)、句法分析、句式分析等技术,抽取学生作文的语言水平特征、内容合理度特征,再综合图文转写过程中生成的书写质量特征,从而完成对整篇文章的自动分析。
(3)建立评分标准并实现自动评分
由于不同次考试的评分标准往往会存在偏差,所以需要针对不同次考试的实际情况,优化评分模型。通过收集人工专家在本次考试少量数据的精标基础之上,优化各个维度的权重,从而完成对所有学生答案的自动评分。
3.3.1.3英语作文自动批改技术
英文作文自动批改技术的主要功能模块包含:
模块 |
技术点 |
说明 |
资源抽取 |
语义分析与聚类 |
对大量句子、篇章进行深度语义分析和聚类 |
|
句子质量评价 |
自动评价句子质量 |
|
要点检测 |
检测句子属于哪个要点或者非要点 |
自动批改 |
语法检错 |
检出学生作文中的语法错误 |
|
句子语义相似度 |
计算句子之间的语义相似度,做到定制展示 |
|
自动评语生成 |
结合所有批改结果,给出合理的评语 |
如上图所示,英文作文自动批改的主要功能包含:
(1)资源抽取
在一次考试的所有学生作文上,进行语法错误分析、句子质量检测,自动生成少量的需要人工确认的数据。在人工确认之后进行归档,而后建立索引。主要用于题目定制的资源展示,为学生提供有效的学习资源。
(2)自动批改
自动批改主要包含语法检错、资源定制展示、自动评语等功能。其中语法检错主要是为了发现学生作文中的语法错误,并进行提示。当前语法检错模块,能够检测出动词错误、主谓一致错误、拼写错误、搭配错误、中式英语等16大类错误。语法检错主要分为两个模块:规则检错和模型检错。其中规则检错主要针对的是容易被规则覆盖的错误,比如拼写错误、冠词错误等;而模型检错主要针对的是受上下文语义影响较大的语法错误,比如动词错误、介词错误等。资源展示就是题目定制资源反馈。根据学生作文的实际情况,基于语义比较、要点检测等技术将较为优秀的定制资源(亮点句子、整个要点)直接反馈给学生。自动评语是根据学生作文的整体情况给出合理的评语。
3.3.1.4智能阅卷运算平台技术
智能评测服务主要是将核心技术研究成果能够实现应用化,并且能够实现大数据的分步计算,因此拟采用的技术路线:
通过软件和硬件配合,完成高性能智能阅卷运算平台的研发建设。硬件方面,拟采用高性能的运算服务器,每台服务器都能达到24路以上的并发运算能力,通过加载高性能GPU运算模块,达到顶级的图像识别等计算性能。软件方面,拟通过高性能的开源关系数据库MySQL和可支持扩展的非关系数据库MongoDB搭建数据存储,通过专业化自主定制的大数据的分布式计算框架SimR作为核心计算框架,以Java Web开展应用软件平台的研发,具体的软件技术路线如下:
1)以Python脚本式语言作为本服务的开发主要语言,web服务框架采用Django实现。Django是一个基于MVC构造的框架,简便、快速的开发数据库驱动的网站,它强调代码复用,多个组件可以很方便的以“插件”形式服务于整个框架,Django有许多功能强大的第三方插件,具有很强的可扩展性并且强调快速开发和DRY(Do Not Repeat Yourself)原则。对外服务以RESTful规范的开放接口,通过HTTP协议传输数据,在多路并发上采用Nginx+Lua的方式,通过Lua脚本自定义拦截请求内容转至不同的应用处理,Nginx是一个非常好的负载均衡中间件。
2)纸笔考试智能阅卷系统基于B/S架构,应用系统采用java、MySQL等技术实现,能够完全实现跨平台、通过Jetty等嵌入式服务器实现全绿色部署,运算调度通过Quartz框架实现,稳定高效;智能阅卷分布式运算服务采用Python+MongoDB方案,可移植性好,采用自主研发的分布式计算框架,可支持多运算服务器同时运行、动态增减运算端,保证了智能阅卷的性能和效率。
3.3.2智能组卷技术
3.3.2.1知识点预测技术
将知识点预测看做多标签问题,使用TextCNN模型,在三级知识点预测的精度和召回均能达到0.80的效果。具体的模型框架如下:
3.3.2.2试题难度预测技术
试题难度预测是实际教育活动中常见的任务。不论是题库建设还是考试组卷,或是线上教育中为学生进行个性化试题推荐,都需要对所提供的试题进行难度评估,以匹配实际需求。由于试题实测难度均来自考试回灌的实数值,所以当前定义的评价指标为:机器预测的难度与实测难度的相关系数,接近或超过人工专家预测的难度与实测难度的相关系数。
(1)PCC(Pearson Correlation Coefficient)
PCC(皮尔森相关系数)衡量的是试题实际难度与模型预测难度之间的相关性。计算公式如下:
式中为某场考试中的试题数,
为该场考试中试题j的预测难度,
为该场考试中试题的平均预测难度,
为该场考试中试题j的实际难度,
为该场考试中试题的平均实际难度。
,且PCC绝对值越大,预测值与实际值相关性越大。
(2)DOA(Degree of Agreement)
DOA是衡量一场考试中试题对之间难度预测值相对大小的准确性。计算公式如下:
式中为某场考试中的试题数,
和
分别为该场考试中试题a和试题b的预测难度,
和
分别为该场考试中试题a和试题b的实际难度。
,且DOA越大,预测的试题相对难度越准确。
3.3.2.3相似题检索技术
(1)相似题的定义:
两道题的考点(考查重点)相同
所包含主要知识点和涉及本学段的知识点相同
解题思路和解题方法一致;
所涉及公式定理一致;
难度一致(计算的复杂程度,不涉及知识点的变化)。
(2)相似题检索架构:
离线构建索引;
通过solr一次排序,取出topn候选;
对候选进行精细排序;
后处理(包括去重、去超纲等)。