形成性考核一(项目1-项目2,阶段性测试,权重15%)
1.
以下关于统计含义的描述不正确的是( )。
统计思维与数据思维是有区别的
统计是围绕数据展开研究的
统计研究的是确定性关系
统计的应用场景丰富
一、选择题(17道题,每小题4分,总共68分)
以产品的等级来衡量某种产品质量的好坏,则产品等级作为一种变量属于( )。
时间变量
数值变量
分类变量
连续变量
在下列分组中,按照取值大小分组的是( )。
班级学生按照性别分组
鸢尾花按照叶片形状分组
家庭按照年消费水平分组
人口按照受教育程度分组
按照连续变量的定义,( )一定不属于连续变量。
分类变量
数值变量
实数变量
可积变量
下列变量中,( )属于连续变量。
运动员获得的奖牌数
雇员的年收入
病人的常住地
单位时间内浏览店铺的顾客数
下列变量中,( )属于数值变量且属于离散变量。
资产的类别
产量
销售额
净利润
假设某地区有800家工业企业,要研究这些企业的产品生产情况,个体是( )。
800家工业企业
每个工业企业
全部工业产品
每一件工业产品
下列属于时间序列数据的是( )。
股票的每日收盘价
2021年不同地区的GDP
全国70个城市的新房价格
2010-2021年所有直辖市的GDP数据
假设你是一家公司的数据分析员,下列数据来源中属于一手数据的是( )。
其他公司提供的经营数据
统计年鉴数据
市场调查公司提供的数据
在公司内部通过调查得到的数据
工厂对生产的一批零件进行检查,通常采用( )。
普查
重点调查
典型调查
随机抽样调查
( )描述了变量在不同观测值或不同观测值区间上出现的频数或频率。
分布
分布特征
总体
个体
( )是满足特定目标的所有观测对象或要素的集合。
个体
分布特征
样本
总体
在制作统计分布表时,将各组的频数与个体总数的比值称为( )。
频数
频率
众数
样本数
按照获取数据的途径不同,统计数据分为( )。
观测数据
时间序列数据
实验数据
面板数据
下列调查方法中,属于概率抽样的是( )。
简单随机抽样
分层抽样
方便抽样
等距抽样
下列属于数据分析方法的是( )。
回归分析
时间序列分析
指数分析
对比分析
数据审核关注的主要问题包括( )。
异常值
缺失值
逻辑错误
重复值
二、综合应用题(1道题,包含8小题,每小题4分,总分32分)
一家小微企业共有20位员工,员工的年龄数据如下。
39 | 47 | 31 | 33 | 42 | 36 | 38 | 36 | 44 | 47 |
48 | 42 | 29 | 42 | 39 | 39 | 46 | 40 | 34 | 40 |
请结合数据和所学知识回答下列问题:
员工年龄的变量类型是( )。
A. 数值变量
B. 分类变量
C. 离散变量
D. 属性变量
在制作员工年龄统计分布表时,第一步是( )。
A. 计算频数
B. 根据变量的观测值进行分组
C. 计算频率
D. 整理表格
在根据变量观测值进行分组时,第一步是( )。
A. 计算组距
B. 确定组限
C. 找到最大值和最小值
D. 确定组数
在Excel中,制作统计分布表用到的主要功能是( )。
A. 数据透视表
B. 排序和筛选
C. 分类汇总
D. 数据分析
请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,占比最多的年龄组是( )。
A. 29-32岁
B. 33-36岁
C. 37-40岁
D. 41-44岁
请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,占比最少的年龄组是( )。
A. 29-32岁
B. 33-36岁
C. 37-40岁
D. 41-44岁
请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,年龄小于等于40岁的占比是( )。
A. 0.35
B. 0.6
C. 0.72
D. 0.8
请使用Excel制作员工年龄变量的频率分布表(设置组距是4)。根据结果可知,年龄小于33岁的占比是( )。
A. 0.23
B. 0.1
C. 0.25
D. 0.6
形成性考核二(项目3-项目5,阶段性测试,权重25%)
1.
在柱形图中,使用( )代表每个类别对应的数值(频数、频率或其他数值结果)。
颜色
面积
高度
宽度
一、选择题(16道题,每道题4分,总共64分)
在饼图中,使用圆内扇形( )表示数值大小。
面积
颜色
半径
弧度
散点图是描述( )变量之间关系的图形。
一个
两个
三个
四个
现在有关于两支球队的几项关键数据,为了横向对比两支球队的表现,适合采取的数据可视化方法是( )。
气泡图
直方图
散点图
雷达图
在热力图中,用来反映变量取值变化规律的特征是( )。
颜色
大小
形状
线条类型
当数据中存在异常值时,不适合用于度量变量分布特征的指标是( )。
众数
中位数
均值
四分位数
已知总体容量为N,抽取了一个样本量是n的样本,则在样本方差的计算公式中,分母是( )。
n-1
N
n
N-1
变异系数的计算结果是一个( )。
相对数
绝对数
平均数
正数
对于右偏分布而言,在箱线图中,中位数更靠近( )的位置。
上四分位数
下四分位数
中间
最大值
对于对称分布而言,直方图的形状呈现( )特征。
平缓
右偏
对称
左偏
度量事件发生可能性的测量指标是( )。
随机变量
随机试验
概率
事件
在正态分布中,共有( )参数。
2
1
3
4
假设z服从标准正态分布,请利用Excel或查表方式计算,P(Z<0.3),计算结果是( )。
0.1
0.24
0.38
0.62
假设z服从标准正态分布,请利用Excel或查表方式计算,P(Z<?)=0.38,求解得到?的结果是( )。
-1.3
-0.3
0.3
1.3
点估计方法背后的理论依据是( )。
大数定律
中心极限定理
中值定理
拉格朗日定理
在假设检验中,显著性水平实质上代表的是( )。
置信水平
估计的准确率
犯第一类错误的概率
犯第二类错误的概率
二、综合应用题(1道题,包含12小题,每小题3分,总分36分)
为了解学习者在线学习情况,课题研究组从某校本科生和专科生中分别各随机抽取了 1000人,调查每日在线学习时长(分钟)。根据调查数据计算度量指标,结果如下表所示:
本次搜集数据的抽样方法是( )。
回答错误
A. 简单随机抽样
B. 分层抽样
C. 整群抽样
D. 雪球抽样
描述学习者每日学习时长分布的数据可视化方法是( )。
A. 雷达图
B. 散点图
C. 直方图
D. 饼图
下列数据可视化方法中,适合描述本科生每日平均学习时长与专科生每日平均学习时长对比的是( )。
A. 柱形图
B. 散点图
C. 气泡图
D. 直方图
下列数据可视化方法中,适合用于对比分析本科生与专科生多个相关指标的是( )。
A. 柱形图
B. 直方图
C. 气泡图
D. 雷达图
在Excel中,计算样本方差的函数是( )。
A. AVERAGE函数
B. MEDIAN函数
C. VAR.S函数
D. MODE.SNGL函数
根据偏度的计算结果可知,本科生组与专科生组的分布形状分别属于( )。
C
A. 严重右偏分布;轻微右偏分布
B. 轻微左偏分布;严重左偏分布
C. 轻微右偏分布;严重右偏分布
D. 轻微左偏分布;中等左偏分布
在95%置信水平下,计算专科生组关于总体均值的置信区间,结果是( )。
C
A. B. C. D.
有研究显示,该校本科生的平均在线学习时长等于200分钟。现在需要使用假设检验方法基于样本数据验证这一结论是否正确,假设检验的拒绝域在( )。
A. 抽样分布的左侧
B. 抽样分布的右侧
C. 抽样分布的两侧
D. 抽样分布的中间
有研究显示,该校本科生的平均在线学习时长为200分钟。现在需要使用假设检验方法基于样本数据验证这一结论是否正确,适合的检验统计量是( )。
C
A. Z统计量
B. t统计量
C. F统计量
D. 卡方统计量
在Excel 中进行假设检验的计算时,计算临界值会用到的函数是( )。
A. CONFIDENCE.NORM函数
B. CONFIDENCE.T函数
C. NORM.S.INV函数
D. NORM.S.DIST函数
在Excel 中求解本科生组和专科生组区间估计结果时,用于计算估计误差的函数是( )。
B
A. CONFIDENCE.NORM函数
B. CONFIDENCE.T函数
C. NORM.S.INV函数
D. NORM.S.DIST函数
在Excel 中进行假设检验的计算时,计算P值会用到的函数是( )。
D
A. CONFIDENCE.NORM函数
B. CONFIDENCE.T函数
C. NORM.S.INV函数
D. NORM.S.DIST函数
形成性考核三(项目6-项目8,阶段性测试,权重25%)
一、选择题(8道题,每道题4分,总共32分)
下列属于结构相对数的是( )。
恩格尔系数
人均消费水平
CPI的环比增长量
人口性别比
下列属于比例相对数的是( )。
人均GDP
人口性别比
运输量定基增长率
耐用消费品支出占比
通过将同类现象在同一时间、不同空间的指标数值进行对比,来分析不同空间之间的不平衡性的对比分析方法是( )。
动态对比分析
空间比较分析
强度对比分析
比例对比分析
一家企业2023年计划生产商品1 000件,实际完成 500件,按照计划完成度相对数的计算公式可得,产量的计划完成相对数是( )。
0.33
0.25
0.5
0.75
线性相关系数的取值范围是( )。
[-1,1]
[-1,0]
[0,1]
[-2,2]
如果两个变量的线性相关系数计算结果是0.7,则说明二者之间可能存在( )。
线性负相关
线性正相关
不相关
完全线性正相关
下列属于时点时间序列的是( )。
年末总资产
第一季度营业收入
年净资产收益率
人均GDP
平稳时间序列只包含( )成分。
不规则性
趋势
周期性
季节性
二、综合应用题(3道题,包含17小题,每小题4分,总分68分)
已知某商场三种商品的销售资料,如下表所示,请根据表中信息回答问题。
拉氏销售量指数属于( )。
A. 数量指标指数
B. 质量指标指数
C. 个体指数
D. 平均指数
帕氏价格指数属于( )。
A. 数量指标指数
B. 质量指标指数
C. 个体指数
D. 平均指数
在表格中,计算【1】位置上数值的方式包括( )。
A. 600*12
B. 28700-18000-3500
C. 600*10
D. 18000-3500
根据表格数据计算帕氏销售量指数,计算公式正确的是( )。
A. 40600/34200
B. 34200/28700
C. 32500/28700
D. 40600/32500
根据平均指数与综合指数的关系,与报告期总值加权的销售量调和平均指数结果一致的是( )。
A. 拉氏价格指数
B. 拉氏销售量指数
C. 帕氏价格指数
D. 帕氏销售量指数
表1给出了一组消费性支出和可支配收入的数据。为了探究两个变量之间的联系,基于Excel工具,使用相关分析、回归分析等方法展开研究,结果如图1所示。
表1 原始数据
图1 相关分析与回归分析的Excel结果
从散点图中,可以得到的初步结论是( )。
A. 消费性支出和可支配收入之间的关系几乎呈现线性特征
B. 消费性支出和可支配收入之间的关系呈现二次函数特征
C. 消费性支出和可支配收入之间不存在明确的关系特征
D. 消费性支出和可支配收入之间的关系呈现三次函数特征
相关分析结果的含义是( )。
A. 消费性支出和可支配收入之间存在高度线性负相关关系
B. 消费性支出和可支配收入之间存在低度线性正相关关系
C. 消费性支出和可支配收入之间存在高度线性正相关关系
D. 消费性支出和可支配收入之间存在不存在线性相关关系
从回归分析的Excel输出结果看,模型拟合优度检验中R平方的值是( )。
A. 0.9989
B. 0.9979
C. 0.9977
D. 0.0021
从回归分析的Excel输出结果看,F检验的P值远远小于0,说明模型的显著性检验结论是( )。
A. 两个变量之间的线性关系不显著
B. 两个变量之间的线性关系显著
C. 两个变量之间的非线性关系显著
D. 两个变量之间的无明显关系
根据回归分析结果,可以写出最终估计得到的一元线性回归方程的表达式是( )。
A. y ̂=54+0.53x
B. y ̂=0.53+54x
C. y ̂=-54+0.53x
D. y ̂=54-0.53x
回归系数b的估计值的含义是( )。
A. 每增加2元的可支配收入,消费性支出平均增加0.53元
B. 每增加1元的消费性支出,可支配收入平均增加0.53元
C. 每增加2元的消费性支出,可支配收入平均增加0.53元
D. 每增加1元的可支配收入,消费性支出平均增加0.53元
现有数据如下表所示,
请结合数据回答下列问题:
现在需要使用数据可视化方法描述2015-2020年年末人口数变化情况,请选择适合的数据可视化方法( )。
A. 散点图
B. 折线图
C. 直方图
D. 饼图
现在需要使用数据可视化方法描述年末人口数与最终消费之间的关系,请选择适合的数据可视化方法( )。
A. 散点图
B. 折线图
C. 直方图
D. 饼图
计算2015-2020年最终消费序列平均发展水平的公式是( )。
A. 2015-2020年最终消费数值的加权平均数
B. 2016-2020年最终消费数值的加权平均数
C. 2016-2020年最终消费数值的算术平均数
D. 2015-2020年最终消费数值的算术平均数
以2015年为基期,年末人口数2017年的环比发展速度等于( )。
A. 140011/138326-1
B. 140011/139232
C. 140011/138326
D. 140011/139232-1
2015-2020年最终消费的平均发展速度为( )。
A. B. C. D.
在使用Excel计算定基发展速度时,会用到绝对引用符号,表示正确的是( )。
A. $
B. #
C. %
D. &
形成性考核四(实践任务,权重30%)
考核形式:实践任务(100分,占比30% )
考核内容:
项目具体内容
实训目标 | 能够应用Excel工具实现实际数据分析并解决问题 |
知识准备 | 项目一至项目八理论知识与Excel实践操作技能 |
任务安排 | 1.选择一个感兴趣的实际问题(问题来源列举:实际业务工作、国家经济发展、国际贸易、商业活动、金融、民生、乡村振兴、医疗健康、日常生活等等)并收集相关数据; 2.根据问题及数据开展数据分析,使用Excel完成主要分析过程,撰写数据分析报告; 3.在数据分析部分,应包含描述性统计分析(项目3数据可视化(不少于2种方法)、项目4概括性度量指标)、不少于1种数据分析方法(来自项目5-项目8)。 【数据分析报告模板(建议框架,可略作调整)】 一.背景与目的 (背景介绍,实际业务或实际问题说明,开展数据分析的原因、意义,其他相关信息等等。) 二.分析思路 (概括数据分析流程,包括具体会用到什么分析方法。) 三.分析过程 (这部分是报告的主体,包含所有的数据事实和观点,通过数据图表和文字呈现,一般包括三个部分) (一)数据来源及变量说明 (解释数据来源,说明重要变量的含义。) (二)数据预处理(可选) (审核数据,根据实际情况及需求决定是否进行数据预处理操作。) (三)数据分析 (以图文结合的方式展示分析过程和结果,思路清晰合理,分析结果能够用于解决实际问题。) 四. 结论与建议 (以综述性文字展现数据分析结果,并结合具体实际业务或实际问题给出相关建议。) 五.附录 (提供正文中涉及但未详细阐述的资料,为整个数据分析报告提供补充说明。) ** 网络课程中有Word模板供同学们下载使用** |
完成时间 | 请在本学期第17周前完成本次实践任务 |
提交方式 | 在网络课程中的指定位置,上传两个文件: 1)数据分析报告(Word文件),文件命名:学期+学号+姓名+报告题目 2)原始数据及Excel分析结果(Excel文件),文件命名:学期+学号+姓名+报告题目 |
注意事项 | 1.Excel数据分析及报告撰写需独立完成,抄袭将无法获得成绩; 2.Excel文件中包括原始数据及主要分析结果; 3.分部任课教师安排一次教学辅导活动,对大家的作业进行讲评,并选取优秀作品在课上进行分享交流。 |
评分标准 | 1. 能够较好完成任务,数据分析报告内容完整,分析方法选取恰当,分析过程详实,内容围绕主题,图表清晰、易于理解,能够较好解释分析结果,观点合理并能与实际问题相联系。(80~100分) 2. 基本完成任务,数据分析报告内容完整,分析方法选取基本恰当,分析过程基本全面,内容基本围绕主题,图表较为清晰,基本能够解释分析结果,观点基本合理。(60 ~79分) 3. 只能完成部分任务,任务完成整体质量不高。(0~59分) |

暂无评论内容