开大题库网

国家开放大学历年真题库|作业答案|复习资料一站式下载平台

贵州开放大学统计分析与数据挖掘技术作业答案

分类: 上海开放大学 时间:2025-06-15 03:51:03 浏览:0次 评论:0
摘要:贵州开放大学统计分析与数据挖掘技术作业答案 统计分析与数据挖掘技术
国家开放大学作业考试答案

想要快速找到正确答案?

立即关注 国开搜题微信公众号,轻松解决学习难题!

国家开放大学
扫码关注

作业辅导
扫码关注
论文指导
轻松解决学习难题!

贵州开放大学统计分析与数据挖掘技术作业答案

统计分析与数据挖掘技术

学校: 贵州开放大学

平台: 国家开放大学

题目如下:

1. 以下哪种数据类型不属于数值型数据?( )

A. 整数

B. 浮点数

C. 字符串

D. 双精度数

答案: 字符串

2. 数据的集中趋势测度中,不受极端值影响的是( )

A. 均值

B. 中位数

C. 众数

D. 以上都不对

答案: 众数

3. 一组数据的方差越大,说明( )

A. 数据的波动越大

B. 数据的波动越小

C. 数据的均值越大

D. 数据的均值越小

答案: 数据的波动越大

4. 在抽样调查中,抽样误差( )

A. 不可避免但可控制

B. 可以避免

C. 不受样本量影响

D. 与样本量无关

答案: 不可避免但可控制

5. HDFS存储数据时,默认存储为( )份

A. 1

B. 2

C. 3

D. 4

答案: 3

6. 在SQL 中,创建数据库用的命令是( )

A. CREATE SCHEMA

B. CREATE TABLE

C. CREATE VIEW

D. CREATE DATABASE

答案: CREATE DATABASE

7. 可用作数据挖掘分析中的关联规则算法有( )

A. Apriori算法、FP-Tree算法

B. K均值法、SOM神经网络

C. 决策树、对数回归、关联模式

D. RBF神经网络、K均值法、决策树

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

8. 大数据的特点不包括( )

A. 数据量大

B. 数据类型多样

C. 处理速度慢

D. 价值密度低

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

9. 以下哪种数据挖掘算法用于分类问题?( )

A. 聚类分析

B. 决策树

C. 关联规则挖掘

D. 以上都不是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

10. 数据清洗的目的是( )

A. 提高数据质量

B. 减少数据量

C. 改变数据类型

D. 以上都不是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

11. 数据挖掘的分类方法包括( )

A. 基于距离的分类方法

B. 决策树

C. 贝叶斯分类方法

D. 规则归纳分类方法

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

12. 数据挖掘的挖掘方法包括 ( )

A. 聚类分析

B. 回归分析

C. 神经网络

D. 决策树算法

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

13. Hadoop可以安装在哪些操作系统( )

A. linux

B. centos

C. Ubuntu

D. windows

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

14. 从教师表查询职称为“副教授、教授”的教师信息,正确的SELECT语句是( )

A. SELECT * FROM 教师 WHERE 职称='教授' OR 职称='副教授';

B. SELECT * FROM 教师 WHERE 职称 IN ('副教授','教授');

C. SELECT * FROM 教师 WHERE 职称='教授' AND 职称='副教授';

D. SELECT * FROM 教师 WHERE RIGHT(职称)='教授';

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

15. 啤酒和尿布的故事是聚类分析的典型案例( )

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

16. 属性的测量值与属性的值的意义是完全对等的( )

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

17. 如果两个变量不独立,那这两者的相关系数必然不等于( )

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

18. 服务器可以根据请求报头中的 Accept进行判断,以返回适当的文件格式给浏览器( )

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

19. 当两种产品为互补品时,其交叉弹性小于零( )

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

20. Namenode的作用是( )

A. 存储用户上传的生产数据

B. 完成用户计算任务

C. 存储datanode节点报告的运行数据

D. 将用户的计算工作分配给各个计算节点

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

21. ( ),用于显示树状结构数据。

A. 矩形式树状结构图

B. 平行结构树

C. 垂直结构树

D. 交叉结构树

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

22. 字典的( )方法返回字典的“键”列表

A. keys()

B. key()

C. values()

D. items()

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

23. 表示职称为副教授、性别为男的表达式为( )

A. 职称 ='副教授 ' OR 性别 ='男'

B. 职称 ='副教授 ' AND 性别 ='男'

C. BETWEEN ' 副教授 ' AND ' 男 '

D. IN (' 副教授 ','男')

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

24. 以下哪个聚类算法不是属于基于原型的聚类( )

A. CLIQUE

B. 模糊C均值

C. EM算法

D. SOM

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

25. 若数据量较大 ,下面哪种方式比较适合( )

A. 系统聚类

B. 快速聚类( k-means )

C. A 和 B 都可以

D. A 和 B 都不可以

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

26. 大数据产生的三个发展阶段()

A. 被动式生成数据→主动式生成数据→感知式生成数据

B. 主动式生成数据→感知式生成数据→被动式生成数据

C. 被动式生成数据→感知式生成数据→主动式生成数据

D. 感知式生成数据→被动式生成数据→主动式生成数据

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

27. 大数据处理流程()

A. 数据抽取与集成→大数据分析→数据可视化

B. 大数据分析→数据可视化→数据抽取与集成

C. 数据可视化→数据抽取与集成→大数据分析

D. 数据抽取与集成→数据可视化→大数据分析

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

28. OLTP代表什么含义()

A. 联机事务处理系统

B. 电磁兼容性

C. 互联网数椐中心

D. 新的可扩展/高性能数据库

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

29. 在回归分析中,要求相关的两个变量( )

A. 都是确定型变量

B. 都是随机变量

C. 自变量是确定型变量,因变量是随机变量

D. 因变量是确定型变量,自变量是随机变量

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

30. 以下属于关联分析的是( )

A. CPU性能预测

B. 购物篮分析

C. 自动判断鸢尾花类别

D. 股票趋势建模

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

31. 大数据数据类型包括( )

A. 结构化数据

B. 半结构化数据

C. 非结构化数据

D. 信息数据

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

32. 大数据的来源有哪些( )

A. 信息管理系统

B. 网络信息系统

C. 物联网系统

D. 科学实验系统

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

33. 大数据的堆栈式技术构架有哪些层()

A. 基础层

B. 管理层

C. 分析层

D. 应用层

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

34. 数据库事务正确执行的基本要素包含( )

A. 包含原子性

B. 一致性

C. 隔离性

D. 持久性

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

35. 相关分析的任务有( )

A. 判定现象之间有无关系

B. 判定现象之间关系的方向

C. 判定相关关系的紧密程度

D. 说明现象之间联系的具体形式

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

36. 结构化信息:这种信息可以在关系数据库中找到,多年来一直主导着IT应用,是关键任务OLTP系统业务所依赖的信息。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

37. 半结构化信息:包括电子邮件、文字处理文件及大量保存和发布在网络上的信息。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

38. 互联网数椐中心:就是电信部门利用已有的互联网通倍线路、带宽资源,建立标准化的电信专业级机房环境,为企业、政府提供服务器托管、租用以及相关增值等方面的全方位服务。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

39. 即数据抽取、转换、装载的过程。它是构建数据仓库的重要环节。ETL是将业务系统的数据经过抽取、清洗、转换之后加载到到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业决策提供分析依据。(对)

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

40. 商业数据是指网络空间交互过程中产生的大最数据,包括通信记录及QQ、微信、微博等社交媒休产生的数据,其数据复杂且难以被利用。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

41. 在大数据的计算模式中,流计算解决的是什么问题()

A. 针对大规模数据的批量处理

B. 针对大规模图结构数据的处理

C. 大规模数据的存储管理和查询分析

D. 针对流数据的实时计算

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

42. 大数据的三大主要来源是智能化设备数据、( )和行为数据。

A. 交易数据

B. 技术数据

C. 智能消费数据

D. 经验数据

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

43. 第一次信息化浪潮主要解决( )问题?

A. 信息传输

B. 信息处理

C. 信息爆炸

D. 信息转换

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

44. 下列哪一项不属于HDFS采用抽象的块概念带来的好处( )

A. 简化系统设计

B. 支持大规模文件存储

C. 强大的跨平台兼容性

D. 适合数据备份

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

45. HDFS采用了( )模型。

A. 分层模型

B. 主从结构模型

C. 管道-过滤器模型

D. 点对点模型

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

46. 在Hadoop项目结构中,HDFS指的是( )

A. 分布式文件系统

B. 流数据读写

C. 资源管理和调度器

D. Hadoop上的数据仓库

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

47. 描述统计分析不包括( )

A. 数据收集

B. 数据描述

C. 数据概括

D. 数据解释

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

48. 方差分析用于( )

A. 比较两个总体均值是否相等

B. 比较多个总体均值是否相等

C. 分析变量之间的关系

D. 以上都不是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

49. 以下哪个不是数据挖掘的任务( )

A. 分类

B. 聚类

C. 数据库设计

D. 关联分析

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

50. 以下哪种算法常用于关联规则挖掘?( )

A. Apriori 算法

B. K-Means 算法

C. C4.5 算法

D. 以上都不是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

51. 大数据处理的流程不包括( )

A. 数据采集

B. 数据存储

C. 数据解释

D. 数据销毁

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

52. 数据挖掘中的预测问题通常使用( )算法。

A. 分类

B. 回归

C. 聚类

D. 关联规则

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

53. 数据挖掘中的关联规则挖掘主要用于发现( )

A. 变量之间的线性关系

B. 数据项之间的频繁模式

C. 数据的分类模式

D. 以上都不是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

54. 以下哪个不是数据仓库的模型( )

A. 星型模型

B. 雪花模型

C. 关系模型

D. 以上都是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

55. 以下哪种方法可以用于处理不平衡数据?( )

A. 过采样

B. 欠采样

C. 合成少数类过采样技术(SMOTE)

D. 以上都是

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

56. 大数据分析可以分为哪几种基本方法( )

A. 预测性分析

B. 可视化分析

C. 大数据挖掘算法

D. 数据质量和数据管理

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

57. 大数据分析的主要技术有( )

A. 深度学习

B. 知识计算

C. 可视化

D. 统计数据

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

58. 大数据可视化的主要手段有( )

A. 数据转换

B. 视觉转换

C. 视频转换

D. 数字转换

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

59. 数据分析包括对哪些数据的分析( )

A. 结构化数据

B. 半结构化数据

C. 非结构化数据

D. 信息数据

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

60. 第三次信息化浪潮的标志是哪些技术的兴起( )

A. 个人计算机

B. 物联网

C. 云计算

D. 大数据

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

61. HDFS是 Hadoop的一个核心模块,负责分布式地存储和管理数据,具有高容错性、高吞吐量等优点,并提供了多种访问模式。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

62. 回归分析通常用于挖掘关联规则。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

63. 大数据分析是指对规模巨大的数据进行分析,其目的是通过多个学科技术的融合,实现数据的采集、管理和分析,从而发现新的知识和规律。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

64. 可视化分析结果是给计算机看的,而数据挖掘算法是给用户看的。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

65. 数据分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行分析。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

66. 若X为频繁项集,则X的所有非空子集都是频繁项集。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

67. 随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成,需要采用集中式计算来完成,这样可以节约整体计算时间,大大提高计算效率。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

68. ZeroMQ:是一个消息处理队列库,可在多个线程、内核和主机盒之间弹性伸缩。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

69. 人工智能:是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。

70. 数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点。

A. 正确

B. 错误

答案:请关注【渝开搜题】微信公众号,发送题目获取正确答案。



    评论留言请发表您的神机妙论……

    昵称

    邮箱

    地址

    私密评论
    评论列表(共有0条评论)