国开搜题
想要快速找到正确答案?
立即关注 国开搜题微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
贵州开放大学统计分析与数据挖掘技术作业答案
统计分析与数据挖掘技术
学校: 贵州开放大学
平台: 国家开放大学
题目如下:
1. 以下哪种数据类型不属于数值型数据?( )
A. 整数
B. 浮点数
C. 字符串
D. 双精度数
答案: 字符串
2. 数据的集中趋势测度中,不受极端值影响的是( )
A. 均值
B. 中位数
C. 众数
D. 以上都不对
答案: 众数
3. 一组数据的方差越大,说明( )
A. 数据的波动越大
B. 数据的波动越小
C. 数据的均值越大
D. 数据的均值越小
答案: 数据的波动越大
4. 在抽样调查中,抽样误差( )
A. 不可避免但可控制
B. 可以避免
C. 不受样本量影响
D. 与样本量无关
答案: 不可避免但可控制
5. HDFS存储数据时,默认存储为( )份
A. 1
B. 2
C. 3
D. 4
答案: 3
6. 在SQL 中,创建数据库用的命令是( )
A. CREATE SCHEMA
B. CREATE TABLE
C. CREATE VIEW
D. CREATE DATABASE
答案: CREATE DATABASE
7. 可用作数据挖掘分析中的关联规则算法有( )
A. Apriori算法、FP-Tree算法
B. K均值法、SOM神经网络
C. 决策树、对数回归、关联模式
D. RBF神经网络、K均值法、决策树
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
8. 大数据的特点不包括( )
A. 数据量大
B. 数据类型多样
C. 处理速度慢
D. 价值密度低
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
9. 以下哪种数据挖掘算法用于分类问题?( )
A. 聚类分析
B. 决策树
C. 关联规则挖掘
D. 以上都不是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
10. 数据清洗的目的是( )
A. 提高数据质量
B. 减少数据量
C. 改变数据类型
D. 以上都不是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
11. 数据挖掘的分类方法包括( )
A. 基于距离的分类方法
B. 决策树
C. 贝叶斯分类方法
D. 规则归纳分类方法
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
12. 数据挖掘的挖掘方法包括 ( )
A. 聚类分析
B. 回归分析
C. 神经网络
D. 决策树算法
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
13. Hadoop可以安装在哪些操作系统( )
A. linux
B. centos
C. Ubuntu
D. windows
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
14. 从教师表查询职称为“副教授、教授”的教师信息,正确的SELECT语句是( )
A. SELECT * FROM 教师 WHERE 职称='教授' OR 职称='副教授';
B. SELECT * FROM 教师 WHERE 职称 IN ('副教授','教授');
C. SELECT * FROM 教师 WHERE 职称='教授' AND 职称='副教授';
D. SELECT * FROM 教师 WHERE RIGHT(职称)='教授';
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
15. 啤酒和尿布的故事是聚类分析的典型案例( )
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
16. 属性的测量值与属性的值的意义是完全对等的( )
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
17. 如果两个变量不独立,那这两者的相关系数必然不等于( )
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
18. 服务器可以根据请求报头中的 Accept进行判断,以返回适当的文件格式给浏览器( )
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
19. 当两种产品为互补品时,其交叉弹性小于零( )
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
20. Namenode的作用是( )
A. 存储用户上传的生产数据
B. 完成用户计算任务
C. 存储datanode节点报告的运行数据
D. 将用户的计算工作分配给各个计算节点
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
21. ( ),用于显示树状结构数据。
A. 矩形式树状结构图
B. 平行结构树
C. 垂直结构树
D. 交叉结构树
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
22. 字典的( )方法返回字典的“键”列表
A. keys()
B. key()
C. values()
D. items()
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
23. 表示职称为副教授、性别为男的表达式为( )
A. 职称 ='副教授 ' OR 性别 ='男'
B. 职称 ='副教授 ' AND 性别 ='男'
C. BETWEEN ' 副教授 ' AND ' 男 '
D. IN (' 副教授 ','男')
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
24. 以下哪个聚类算法不是属于基于原型的聚类( )
A. CLIQUE
B. 模糊C均值
C. EM算法
D. SOM
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
25. 若数据量较大 ,下面哪种方式比较适合( )
A. 系统聚类
B. 快速聚类( k-means )
C. A 和 B 都可以
D. A 和 B 都不可以
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
26. 大数据产生的三个发展阶段()
A. 被动式生成数据→主动式生成数据→感知式生成数据
B. 主动式生成数据→感知式生成数据→被动式生成数据
C. 被动式生成数据→感知式生成数据→主动式生成数据
D. 感知式生成数据→被动式生成数据→主动式生成数据
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
27. 大数据处理流程()
A. 数据抽取与集成→大数据分析→数据可视化
B. 大数据分析→数据可视化→数据抽取与集成
C. 数据可视化→数据抽取与集成→大数据分析
D. 数据抽取与集成→数据可视化→大数据分析
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
28. OLTP代表什么含义()
A. 联机事务处理系统
B. 电磁兼容性
C. 互联网数椐中心
D. 新的可扩展/高性能数据库
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
29. 在回归分析中,要求相关的两个变量( )
A. 都是确定型变量
B. 都是随机变量
C. 自变量是确定型变量,因变量是随机变量
D. 因变量是确定型变量,自变量是随机变量
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
30. 以下属于关联分析的是( )
A. CPU性能预测
B. 购物篮分析
C. 自动判断鸢尾花类别
D. 股票趋势建模
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
31. 大数据数据类型包括( )
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 信息数据
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
32. 大数据的来源有哪些( )
A. 信息管理系统
B. 网络信息系统
C. 物联网系统
D. 科学实验系统
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
33. 大数据的堆栈式技术构架有哪些层()
A. 基础层
B. 管理层
C. 分析层
D. 应用层
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
34. 数据库事务正确执行的基本要素包含( )
A. 包含原子性
B. 一致性
C. 隔离性
D. 持久性
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
35. 相关分析的任务有( )
A. 判定现象之间有无关系
B. 判定现象之间关系的方向
C. 判定相关关系的紧密程度
D. 说明现象之间联系的具体形式
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
36. 结构化信息:这种信息可以在关系数据库中找到,多年来一直主导着IT应用,是关键任务OLTP系统业务所依赖的信息。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
37. 半结构化信息:包括电子邮件、文字处理文件及大量保存和发布在网络上的信息。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
38. 互联网数椐中心:就是电信部门利用已有的互联网通倍线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
39. 即数据抽取、转换、装载的过程。它是构建数据仓库的重要环节。ETL是将业务系统的数据经过抽取、清洗、转换之后加载到到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业决策提供分析依据。(对)
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
40. 商业数据是指网络空间交互过程中产生的大最数据,包括通信记录及QQ、微信、微博等社交媒休产生的数据,其数据复杂且难以被利用。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
41. 在大数据的计算模式中,流计算解决的是什么问题()
A. 针对大规模数据的批量处理
B. 针对大规模图结构数据的处理
C. 大规模数据的存储管理和查询分析
D. 针对流数据的实时计算
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
42. 大数据的三大主要来源是智能化设备数据、( )和行为数据。
A. 交易数据
B. 技术数据
C. 智能消费数据
D. 经验数据
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
43. 第一次信息化浪潮主要解决( )问题?
A. 信息传输
B. 信息处理
C. 信息爆炸
D. 信息转换
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
44. 下列哪一项不属于HDFS采用抽象的块概念带来的好处( )
A. 简化系统设计
B. 支持大规模文件存储
C. 强大的跨平台兼容性
D. 适合数据备份
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
45. HDFS采用了( )模型。
A. 分层模型
B. 主从结构模型
C. 管道-过滤器模型
D. 点对点模型
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
46. 在Hadoop项目结构中,HDFS指的是( )
A. 分布式文件系统
B. 流数据读写
C. 资源管理和调度器
D. Hadoop上的数据仓库
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
47. 描述统计分析不包括( )
A. 数据收集
B. 数据描述
C. 数据概括
D. 数据解释
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
48. 方差分析用于( )
A. 比较两个总体均值是否相等
B. 比较多个总体均值是否相等
C. 分析变量之间的关系
D. 以上都不是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
49. 以下哪个不是数据挖掘的任务( )
A. 分类
B. 聚类
C. 数据库设计
D. 关联分析
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
50. 以下哪种算法常用于关联规则挖掘?( )
A. Apriori 算法
B. K-Means 算法
C. C4.5 算法
D. 以上都不是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
51. 大数据处理的流程不包括( )
A. 数据采集
B. 数据存储
C. 数据解释
D. 数据销毁
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
52. 数据挖掘中的预测问题通常使用( )算法。
A. 分类
B. 回归
C. 聚类
D. 关联规则
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
53. 数据挖掘中的关联规则挖掘主要用于发现( )
A. 变量之间的线性关系
B. 数据项之间的频繁模式
C. 数据的分类模式
D. 以上都不是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
54. 以下哪个不是数据仓库的模型( )
A. 星型模型
B. 雪花模型
C. 关系模型
D. 以上都是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
55. 以下哪种方法可以用于处理不平衡数据?( )
A. 过采样
B. 欠采样
C. 合成少数类过采样技术(SMOTE)
D. 以上都是
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
56. 大数据分析可以分为哪几种基本方法( )
A. 预测性分析
B. 可视化分析
C. 大数据挖掘算法
D. 数据质量和数据管理
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
57. 大数据分析的主要技术有( )
A. 深度学习
B. 知识计算
C. 可视化
D. 统计数据
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
58. 大数据可视化的主要手段有( )
A. 数据转换
B. 视觉转换
C. 视频转换
D. 数字转换
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
59. 数据分析包括对哪些数据的分析( )
A. 结构化数据
B. 半结构化数据
C. 非结构化数据
D. 信息数据
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
60. 第三次信息化浪潮的标志是哪些技术的兴起( )
A. 个人计算机
B. 物联网
C. 云计算
D. 大数据
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
61. HDFS是 Hadoop的一个核心模块,负责分布式地存储和管理数据,具有高容错性、高吞吐量等优点,并提供了多种访问模式。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
62. 回归分析通常用于挖掘关联规则。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
63. 大数据分析是指对规模巨大的数据进行分析,其目的是通过多个学科技术的融合,实现数据的采集、管理和分析,从而发现新的知识和规律。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
64. 可视化分析结果是给计算机看的,而数据挖掘算法是给用户看的。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
65. 数据分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行分析。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
66. 若X为频繁项集,则X的所有非空子集都是频繁项集。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
67. 随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成,需要采用集中式计算来完成,这样可以节约整体计算时间,大大提高计算效率。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
68. ZeroMQ:是一个消息处理队列库,可在多个线程、内核和主机盒之间弹性伸缩。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
69. 人工智能:是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
70. 数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点。
A. 正确
B. 错误
答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。
如果觉得文章对您有用,请随意打赏。
您的支持是我们继续创作的动力!
微信扫一扫
支付宝扫一扫