- 相关推荐
“数据分析观念”的内涵及教学建议
“数据分析观念”的内涵及教学建议数学教育热点问题系列访谈录
摘要:统计是数据分析的科学和艺术,统计课程的核心是发展学生的数据分析观念。准确把握数据分析观念的内涵是进行统计课程设计、教科书编写和教学实施的必要前提和重要基础。体会数据中蕴涵着信息、认识到需要根据问题的背景选择合适的方法、通过数据分析体验随机性是数据分析观念的重要方面。义务教育阶段统计教学关键是使学生想到用数据,愿意“亲近”数据,能从数据中提取信息。
关键词:数据分析观念;教学建议
我国在基础教育阶段将统计作为重要的学习内容,随着大家对统计教学的不断探索和实践,人们逐渐认识到对于统计学习而言,重要的不是画统计图、求平均数等技能的学习,而是发展学生的数据分析观念。那么,数据分析观念到底体现在哪些方面呢?如何设计课程和实施教学,才能更好地发展学生的数据分析观念呢?本文访谈了东北师范大学著名统计学家史宁中教授,并辅助于资料查询等形式就这些问题提出了一些思考。
一、发展学生的数据分析观念
问:您在多种场合不断强调,无论哪一部分内容的学习,都应该抓住这部分的核心内容,那么统计学习的核心内容是什么呢?
▲史教授:首先必须明确的是,我们希望在课程中给出一些关键词。关键词是某部分学习的核心内容。核心内容不是指具体的知识点,甚至不是指具体的知识本身,而是概括很多知识的共性所反映出来的思想和思维方式,这个就叫做核心词,或者叫做核心内容。统计最核心的就是数据分析,统计是处理数据的一门科学和艺术。在这部分内容中,我们提出了数据分析观念的核心词,就跟代数学习里的数感、符号意识、模型等都是核心内容。
▲问:统计的核心是数据分析,那么到底是什么是数据呢,数据与数有什么关系呢?
▲史教授:我们在义务教育阶段处理的数据主要是用数来表达的,当然这些数都是有实际背景的。脱离实际问题的单纯地数的研究是数与代数的内容,不是统计的内容。但是,这些年随着信息的迅速增长,我们需要扩大对数据的认识。事实上,现在的数据不仅仅是数,图是数据、语句也是数据。比如,人们在网上经常用GOOGLE来进行检索,GOOGLE是用统计的方法来进行语句检索,此时统计处理的是语句,我们把这些都叫做数据。
▲问:能不能这样理解,只要蕴含着一定信息,无论是什么表现形式,就是数据,统计能帮助人们从这些数据中提取出大量的信息?
▲史教授:是这样的。人们在实际生活和各行各业中面临的数据越来越多,必须树立利用数据的意识,掌握一些分析数据的方法和模型。所以,数据分析观念是非常重要的。数据分析观念主要体现在三个方面:第一,了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中是蕴涵着信息的。第二,了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法。第三,通过数据分析体验随机性。
二、数据随机性的内涵和教学
(一)数学随机性的内涵
问:对于很多人而言,对第三点“通过数据分析体验随机性”都比较陌生。首先遇到的一个困难是,数据随机性的涵义是什么呢?
▲史教授:简单而言,数据的随机主要有两层涵义:一方面对于同样的事情每次收集到的数据可能会是不同的;另一方面只要有足够的数据就可能从中发现规律。举一个例子,袋中装有若干个红球和白球,一方面,每次摸出的球的颜色可能是不一样的,事先无法确定;另一方面,有放回重复摸多次(摸完后将球放回袋中,摇晃均匀后再摸),从摸到的球的颜色的数据中就能发现一些规律,比如红球多还是白球多、红球和白球的比例等。
问:那么,构成数据随机性的原因主要有哪些呢?
▲史教授:一般来说,产生随机有两方面的原因。
一方面,是运用部分来推断总体,我们知道这是统计的一个基本思想。这里首先假设每一次实验取得的数据是来源于一个总体的,这是很重要的一个假设。比如上面提到的摸球例子,第一需要假设摸的是同一个袋子里的球,而且是有放回的摸;第二,摸之前需要晃一晃,摇晃均匀了。为什么要强调这些呢,就是要保证每一次要处理的事情都是一样的,数据是来源于一个总体的。有了这个假设后就去做重复实验,每一次在摸之前,你不可能知道这次摸的是什么结果,但是摸的次数多了,就能估计出来摸到各种结果的可能性是多大,由此推断总体的情况。比如在上面的例子中,可以推断袋子中什么颜色的球多,各种颜色球的比例,如果知道了袋中球的总数,我们还可以推断出各种球的数量。但是,由于是用部分来推断总体,就不能担保推断一定是准确无误的,而是允许结论可能出错。好的统计方法的主要标志就是出错的可能性较小。
另一方面,是重复测量中的误差。对一些数据,特别是连续型数据总是有测量误差的,而产生误差的原因是多方面的。比如多次测量同一人的身高,由于测量工具、观察者的角度、测量时间等各种各样的原因,每次测量的结果可能都是不一样的,测量数据是随机的。但是如果出现随机误差的平均是零,也就是有时候比真实结果大一点,有时候比真实结果小一点,平均下来零,这个时候就能研究了,如何进行研究这里就不细谈了。主要是以上两方面原因构成了我们研究问题的随机性。
(二)数据随机性的教学
问:说到这里,我感觉您非常强调运用统计(数据分析)来帮助学生体会随机。不少老师有这样的一个困惑,概率也是研究随机现象的,在概率中教师也组织学生做了很多摸球、掷硬币等游戏。那么为什么又提出数据的随机性呢?
▲史教授:我听了一些课,老师们经常这样处理:比如对于掷一枚均匀的硬币,先得到出现正面或反面的概率是二分之一,然后让学生通过反复掷硬币去验证这个结果(二分之一)。这里有两个问题。第一,一个硬币,先假定它出现正面和反面的可能性是二分之一,这是数学(或者称为概率)。这个二分之一是通过概率的定义得到的,不是依靠掷硬币验证出来的。实际上,学生做了很多次实验也得不到二分之一,反而更加糊涂了。第二,运用定义的方式教学随机,不能很好的培养学生的随机观念。
需要指出的是,我们赞成做实验,赞成运用统计的思想来做实验。统计是通过数据来获取一些信息,来帮助人们做出一些判断。同样是掷硬币的问题,在统计上就会这样设计实验:先让学生多次掷硬币,计算出现正面的比例(频率),然后用频率来估计一下出现正面的可能性是多大。如果这个可能性接近二分之一的话,就推断这个硬币大概是均匀的,这是统计的思想。
对于先给出定义,教师往往比较习惯,而对于“逆过来”通过数据来进行推断,教师往往比较陌生。为了帮助大家理解,再阐述一下上面的摸球的例子。同样是一个袋子里有5个球,4个白球、1个红球,如果让学生通过摸来验证出现白球的可能性是五分之四、出现红球的可能性是五分之一,这不是统计。统计是这样的,告诉学生们袋子里有很多球,有白颜色的和红颜色的。让孩子们去摸,摸到一定程度的时候,学生发现摸出白球的次数比红球的次数多,由此推断袋子里白球可能比红球多。进一步的话,能推断出白球和红球的比例大概是多少。再告诉球的总数的时候,能够估计出来几个白球和几个红球,这个是统计的过程。
我并不是反对前一种教法本身,而是说如果这么教,蕴含的随机思想并不强,学生也不感兴趣,都知道了概率为什么还要做实验。而后来的这种教法,学生体会到每一次摸的结果事先都不知道,但是摸多了能够帮助我们做一些判断。这样一来,学生既体会了随机,又感受到了数据中蕴含着信息,我想这种类似于“猜谜”的活动学生也会很有兴趣。
问:实际上,并不是简单地赞成或反对做实验,而是做实验的目的。不是通过实验去验证概率是多少,而是通过实验从数据中获取信息,对总体做一些推断。说到做推断,老师们还有一个困惑,因为数据是随机的,用部分的数据进行估计有时可能会估计得准一些,有时会偏差很大。那么这种推断是不是有点“瞎猜”的味道,能不能保证这种估计是合理的。
▲史教授:这里绝不是“瞎猜”。还是上面摸球的例子(袋子里有5个球,4个白球,1个红球),我们知道如果真是随机摸球的话,那么出现白球的概率是五分之四。而实验中,要使摸球的频率刚好是 五分之四(十分之八)的可能性并不大。但是如果取一个范围,比如在十分之七和十分之九之间,此时频率落在这个范围内,用它去进行估计是可以接受的。如果要使摸出白球的频率落在这个范围之间的可能性达到80%的话,通过计算只要做27次左右的实验;如果要使95%的可能性落在这个范围内的话,摸球的次数要增加,大概是60次左右。所以,实际上有相当多的科学依据在后边支撑着我们做类似摸球的试验。也就是虽然不能保证估计得完全一致,但能保证在一定实验次数下,估计值与实际情况相差不大的可能性是很大的。
问:听了您的解释挺有启发的。是不是虽然不能达到100%的精确,但无论实际情况需要多高的精确度,都可以计算出需要做多少次实验来保证达到这个精确度?
▲史教授:是这样的。因此,我们可以提供一些数据,如果想达到95%的可能性,你至少要摸多少次球。再比如社会上通过打电话做民意调查,不可能给所有拥有电话的人都打,如果调查允许在一定的误差范围内,通过计算可以提供至少需要打电话的数量。当然计算中需要概率的知识,从这些例子中我们也能看到统计与概率的联系。
问:通过上面的两种教法和您的分析,我们可以感觉到概率是定义出来的,它的推理方式是主要是演绎;而统计是用数据来进行推断,它的推理方式主要是归纳。两种思维方式是不一样的。
▲史教授:是这样的。统计体现了与传统数学不一样的思路,而这种思路是培养学生归纳能力的最好方法之一。在义务教育阶段,也有一些素材可以让学生经历归纳的过程,比如归纳一些公式和规律,但这些公式和规律往往都是准备好了的。很难找到让学生真正通过归纳自己得到结论的素材,但是通过统计可以让学生做一些,所以说,运用
[“数据分析观念”的内涵及教学建议]相关文章:
【“数据分析观念”的内涵及教学建议】相关文章:
《简单的数据分析》教学反思02-22
简单的数据分析教学设计12-11
销售数据的分析方法07-25
数据分析报告07-28
大数据分析07-20
大数据分析07-25
简单的数据分析教学设计4篇12-11
多维数据分析方法04-07
数据分析简历模板02-17
数据分析工作职责07-28