国开搜题
想要快速找到正确答案?
立即关注 国开搜题微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
国家开放大学软件学院电子商务数据分析与应用作业答案
电子商务数据分析与应用
学校: 国家开放大学软件学院
平台: 国家开放大学
题目如下:
1. 二、判断题 1、使用pip命令也可以查看Anconda安装的包。
答案: 正确
2. Pandas是一个基于NumPy的数据分析包,它是为了解决数据分析任务而创建的。
答案: 错误
3. Pandas既可以按照索引排序也可以按照数据排序。
答案: 错误
4. Series和DataFrame都支持切片操作。
答案: 错误
5. 在操作DataFrame对象时,可以通过指定索引名的方式获取数据。
答案: 错误
6. Pandas只有Series和DataFrame两种数据结构。
答案: 正确
7. DataFrame的结构是由索引和数据组成的。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
8. 过拟合是有监督学习的挑战,而不是无监督学习。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
9. 如果一个训练模型在测试集上精度达到100%,那么在另一个测试集上精度也能达到100%。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
10. 如果一个训练模型在测试集上精度达到100%,那么在另一个测试集上精度也能达到100%()
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
11. K-means算法中聚类的个数K是由用户自定义的()
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
12. 集成学习的效果一定把单个分类器的效果更好 ()
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
13. NumPy是高性能科学计算和数据分析的基础包。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
14. 对于Pandas索引操作,索引对象是可修改的。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
15. 下列Pandas方法中,用于求最大值和最小值的是max和min。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
16. 关于读写excel文件,.to_excel()方法表示将结构化数据读取到DataFrame中。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
17. 从训练样本中是否含有标注好的目标变量,可以将机器学习分为:
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
18. Xgboost不属于集成学习算法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
19. 决策树属于机器学习的无监督算法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
20. 线性回归是使用历史数据进行预测。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
21. 下列图形是在相同的训练数据上具有相同回归的三个不同的模型,图3的回归模型拟合得最好,因为它的训练错误最小。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
22. 在一个包含5000个特征及超过一百万个观测值的数据集上建立一个机器学习的模型,从数据集中随机抽取样本来建立模型、使用在线学习算法、使用主成分分析法(PCA)对数据降维都能更高效地训练模型。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
23. 一个回归模型存在多重共线问题。在不损失过多信息的情况下,我们可以计算方差膨胀因子(variance inflation factor)来检查存在的多重共线性并采取相应的措施。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
24. 聚类算法属于机器学习的无监督算法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
25. DBSCAN属于聚类算法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
26. 二、判断题 1、电子商务数据是对电子商务活动中客观事物的逻辑归纳,可以用符号和字母等方式对客观事物进行直观描述。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
27. 评论数据主要以图片形式出现。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
28. 通过大数据进行维度分析展现品牌印象关键词,和产品的运营方式,帮助企业更好的掌握发展趋势。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
29. 通过大数据技术,可以实现企业的客户资源进行精准锁定,在企业在运营过程中,客户资源的挖掘方式、具体情况和分布情况等,企业都可以进行搜集分析,形成基于企业的资源分布可视图,就如同“电子地图”一般。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
30. 数据采集时需要数据采集人员不惜任何手段获取所有需要的数据。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
31. 在分析全店某段时间内的客单价时,需要采集的数据指标有该段时间内店铺成交客户数及成交总额。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
32. 某网店准备分析一段时间内的全店转化率,需要采集的数据指标有该段时间内的店铺访客数及成交访客数。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
33. 在数据采集工具选择过程中需要注意工具的功能及适用范围。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
34. 电子商务数据采集时对于一些无法使用采集工具采集的数据,可以对其进行摘录。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
35. 电子商务数据采集渠道包含权威网站、数据机构、个人网站。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
36. 价格会或价格决策关系到企业的利润、成本补偿、以及是否有利于产品销售、促销等问题,可以说价格在一定程度上影响着产品的生命力。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
37. 把实际完成值与目标值进行对比,属于纵比。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
38. 企业与行业中的标杆企业、竞争对手或行业平均水平进行对比,这属于横比。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
39. AB测试是指设计两个版本(A和B),A为目前的版本,B是猜想更好的版本或者新的版本。然后,通过测试比较这两个版本之间你所关心的数据,最后选择效果最好的版本。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
40. 杜邦分析法利用几种主要的财务比率之间的关系综合地分析企业的财务状况。具体来说,它是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的经典方法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
41. 对比分析法在做淘宝数据分析过程中是常用的,例如竞争对手分析通过把我们的实际数据和竞争对手的数据进行比较,了解之间的差异并分析原因。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
42. 用漏斗图分析法不能直观地看到每个环节的情况,不能看到每个环节的转化情况、流失情况。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
43. 问题树分析法是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展,把一个已知问题当成树干,然后开始考虑这个问题和哪些相关问题或者子任务有关。每想到一点,就给这个问题(也就是树干)加一个“树枝”,并标明这个“树枝”代表什么问题。一个大的“树枝”上还可以有小的“树枝”,以此类推,找出问题的所有相关联项目。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
44. 像账号密码这种私密的信息,网站基本不会使用 GET 请求去处理,而更多会使用 POST 请求去提交这些数据。GET 请求更多用于获取网页内容。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
45. requests 库主要作用是从网站服务器获取请求的数据,requests 库可直接使用,无需进行任何安装
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
46. 是谁来做属于5W2H中why的范畴。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
47. 下列选项中,与目标对比、行业内对比、不同时期对比、活动效果对比属于对比分析法分析维度。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
48. 想要采集某独立商城上行业竟品商品销售价格,可以使用百度指数数据采集工具进行采集。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
49. 数据分析的方法有AB测试法、杜邦分析法、对比分析法、5W2H分析法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
50. 数据分析中市场类指标主要用于描述行业情况和企业在行业中的发展情况,平均购买次数、活跃客户比率属于市场类指标。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
51. 二、判断题 1、数据预处理是数据挖掘中必不可少的关键一步,更是进行数据挖掘前的准备工作。它一方面保证挖掘数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
52. 重复数据会影响数据处理结果的正确性,从而导致数据分析出现偏差,因此需要将其删除。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
53. 具有多层索引的DataFrame对象经过stack()重塑后,返回的是一个Series对象。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
54. 使用merge()函数进行数据合并时,不需要指定合并键。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
55. fillna()方法处理缺失数据时可以使用Series对象填充,但不可以使用DataFrame对象填充。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
56. dropna()方法可以删除数据中所有的缺失值。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
57. drop_duplicated()方法可以删除重复值。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
58. rename()方法可以重命名索引名。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
59. 通过merge()函数合并数据时可以指定多个键。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
60. join()方法可以使用左连接和右连接两种方式连接数据。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
61. 关于Pandas中的数据重塑,stack()方法可以将列索引转换为行索引。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
62. 关于预处理中的数据合并,concat()函数是最常用的主键合并函数,可以通过内连接和外连接的方式堆叠合并数据。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
63. 关于预处理中的数据合并,merge()函数是最常用的主键合并的函数,但不能够通过左连接和右连接的方式合并数据。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
64. 关于预处理中的数据合并,join()方法是最常用的主键合并方法之一,但不能够通过左连接和右连接的方式合并数据。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
65. Pandas中可以使用boxplot()方法绘制箱形图,以实现对数据中的异常值进行检测。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
66. 关于空值和缺失值,NaN和None是完全一样的。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
67. notnull()与isnull()方法都可以判断数据中是否存在空值或缺失值。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
68. dropna()方法可以删除空值和缺失值
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
69. 异常值处理中可以基于不同字段的均值和标准差求出异常数据分布范围,然后再对异常范围外 的数据做处理,例如填充为均值
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
70. 数据处理中,大多数情况下重复值是需要去除的,使用数据框的drop_duplicates方法即可实现。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
71. 随机抽样即随机的抽取样本,可使用数据框的sample实现,并可通过参数n设置指 定抽样数量,或通过frac指定抽样比例。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
72. 字符串和日期的转换,可通过time或datetime库的strptime和strftime实现。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
73. 数据标准化通过将数据按比例缩放,使之落入一个小的特定区间 对象的操作。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
74. MaxMin方法则是根据原始数据的最大值和最小值做数据处理,它将数据缩 放为特定范围[0,1]内。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
75. 丢弃缺失值是直接将含有NA值的记录丢弃,适用于NA值的记录较少,且整体 样本量较大的情况。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
76. 二、判断题 1、数据分析是一个有目的地收集和整合数据的过程。()
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
77. CDA-验证性数据分析,用于找到数据间的模式,相关性。是一种“参考答案”的获取。场景包括典型的“啤酒尿布”这类数据挖掘应用,工具包括SAS,SPSS这类数据挖掘软件以及python语言这类语言工具。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
78. 数据生态系统逐渐丰富并影响企业商业模式。目前国内整个数据分析产业链的布局相对完整,但局部环节的竞争程度差异化明显。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
79. 生意参谋中的“交易”功能版块可以显示店铺的各项交易数据,能够清楚显示店铺的运营情况和出现的问题。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
80. 转化漏斗模型可以在消费者访问店铺到最终成交的各个环节,一层层过滤转化人数,分析各个环节的转化情况。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
81. 商家获取会员数据后,可以充分利用这些数据对会员的情况进行分析,包括会员的分布情况,如年龄分布、性别分布、地区分布,各地区会员的增长、流失情况,以及挖掘每一位会员的价值潜力等。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
82. conda是一个在Windows、Mac OS、和Linux上运行的开 国家开放大学 源软件包管理系统和环境管理系统。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
83. Jupyter Notebook的优 渝粤题库 点是可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
84. 使用requests库为 URL 的查询字符串(query string)传递某种数据时,如果你是手工构建 URL,那么数据会以键/值对的形式置于 URL 中,跟在一个问号的后面。假如传递的参数为payload = {'key1': 'value1', 'key2': 'value2'}。那么应该使用r = requests.get("url", params=payload)语句。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
85. Beautiful Soup自带的解析器为html.parser。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
86. 数据分析隐藏的风险和困境包括用户隐私、管理困难、数据交易、大数据人才缺乏。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
87. 电子商务领域的销售业绩指标主要分为总销售额指标、有效订单指标。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
88. 转化漏斗模型包括有效入店率、咨询转化率、静默转化率、订单支付率。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
89. 商品的流量转化直接影响店铺的最终销量。因此当商品具有合格的引流能力时,商家一定要关注流量的转化情况,并对转化效果不佳的方面进行优化。实际上,影响转化的因素有很多,包括商品主图、首页、详情页、评价。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
90. Jupyter Notebook不可以将文件保存为html格式。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
91. Anconda不支持Python3.x以上的版本。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
92. this属于Python的保留关键字。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
93. 在循环体内使用break语句或continue语句的作用相同。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
94. catch是Python异常处理关键字。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
95. 进程就是一个应用程序在处理机上的一次执行过程,它是一个动态的概念,而线程是进程中的一部分,进程包含多个线程在运行。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
96. Python中,使用socket模块的socket()方法来创建套接字。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
97. 计算机通信时,负责在两台计算机之间建立可靠连接,保证数据包按顺序到达的协议是UDP。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
98. SciPy可用于python爬虫开发。
广东开放大学 ">答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
99. Python中,创建线程的方式有多种,可以使用threading模块的Thread类创建线程。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
100. 计算机通信时,服务器的套接字方法中用于TCP监听的方法是bind()。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
101. 二、多选题 1、电子商务数据具有以下哪些作用?
A. 电子商务数据具有诊断作用
B. 电子商务数据具有预测作用
C. 电子商务数据具有决定作用
D. 电子商务数据具有传播作用
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
102. 下列选项中,关于数据预处理说法错误的是()。
A. 数据清洗包含了数据标准化、数据合并和缺失值处理
B. 数据合并按照合并轴的方向主要分为左连接、右连接、内连接和外连接
C. 数据分析的预处理过程包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系
D. 数据标准化的主要对象是类别型特征
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
103. 检测出异常值之后,通常会采用哪些方式处理它们?()
A. 直接将含有异常值的记录删除
B. 用具体的值来进行替换,可用前后两个观测值的平均值修正该异常值
C. 不处理,直接在具有异常值的数据集上进行统计分析
D. 视为缺失值,利用缺失值的处理方法修正该异常值
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
104. 商务数据包括()
A. 电子商务平台的基础数据
B. 电子商务专业网站的研究数据
C. 电子商务媒体报道
D. 评论数据
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
105. 数据分析中市场类指标主要用于描述行业情况和企业在行业中的发展情况,下列属于市场类指标的是()
A. 行业增长率
B. 平均购买次数
C. 竞争对手销售额
D. 活跃客户比率
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
106. 以下属于产品类数据指标的是()?
A. SKU
B. 商品数
C. 商品访客数
D. 跳失率
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
107. 对淘宝平台某类商品销量数据进行分析,以下数据采集方式可行的是()
A. 使用爬虫类工具对平台上该类商品的销量数据持续进行采集
B. 使用生意参谋
C. 使用1688指数工具
D. 使用百度指数工具
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
108. 数据清洗的主要内容包括( )。
A. 缺失值清洗
B. 格式内容清洗
C. 逻辑错误清洗
D. 重复数据清洗
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
109. 下面的语句的循环是有限的( )
A. for a in range(10): time.sleep(10)
B. while 1<10: time.sleep(10)
C. while True: break
D. a = [3,-1,','] for i in a[:]: if not a: break
答案 成人学历 :请关 渝粤教育 u.cn" title="渝粤文库">渝粤文库 注【渝粤题库】微信公众号,发送题目获取正确答案。
110. 三、判断题 1、Jupyter Notebook的优点是可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
111. CDA-验证性数据分析,用于找到数据间的模式,相关性。是一种“参考答案”的获取。场景包括典型的“啤酒尿布”这类数据挖掘应用,工具包括SAS,SPSS这类数据挖掘软件以及python语言这类语言工具。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
112. 通过大数据进行维度分析展现品牌印象关键词,和产品的运营方式,帮助企业更好的掌握发展趋势。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
113. 商家获取会员数据后,可以充分利用这些数据对会员的情况进行分析,包括会员的分布情况,如年龄分布、性别分布、地区分布,各地区会员的增长、流失情况,以及挖掘每一位会员的价值潜力等。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
114. 数据采集时需要数据采集人员不惜任何手段获取所有需要的数据。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
115. 在分析全店某段时间内的客单价时,需要采集的数据指标有该段时间内店铺成交客户数及成交总额。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
116. 某网店准备分析一段时间内的全店转化率,需要采集的数据指标有该段时间内的店铺访客数及成交访客数。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
117. kettle包含的部份?
A. Chef— — 任务(job)设计工具(GUI方式)
B. Kitchen— — 任务(job)执行器(命令行方式)
C. Spoon— — 转换(transform)设计工具(GUI方式)
D. Span— — 转换(transform)执行器(命令行方式)
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
118. 价格会或价格决策关系到企业的利润、成本补偿、以及是否有利于产品销售、促销等问题,可以说价格在一定程度上影响着产品的生命力。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
119. 把实际完成值与目标值进行对比,属于纵比。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
120. AB测试是指设计两个版本(A和B),A为目前的版本,B是猜想更好的版本或者新的版本。然后,通过测试比较这两个版本之间你所关心的数据,最后选择效果最好的版本。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
121. 杜邦分析法利用几种主要的财务比率之间的关系综合地分析企业的财务状况。具体来说,它是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的经典方法。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
122. 用漏斗图分析法不能直观地看到每个环节的情况,不能看到每个环节的转化情况、流失情况。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
123. 像账号密码这种私密的信息,网站基本不会使用 GET 请求去处理,而更多会使用 POST 请求去提交这些数据。GET 请求更多用于获取网页内容。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
124. 数据预处理是数据挖掘中必不可少的关键一步,更是进行数据挖掘前的准备工作。它一方面保证挖掘数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
125. fillna()方法处理缺失数据时可以使用Series对象填充,但不可以使用DataFrame对象填充。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
126. drop_duplicated()方法可以删除重复值。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
127. 转化漏斗模型可以在消费者访问店铺到最终成交的各个环节,一层层过滤转化人数,分析各个环节的转化情况。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
128. Kettle是一个Java程序,因此,运行此工具,必须安装Sun公司(已被Oracle公司收购)的Java运行环境1.4或者更高版本。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
129. Kettle连接Mysql数据库,需要另外导入相应的jar。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。
130. 在Kettle中,在一个转换中,一个步骤可以有多个连接,一个连接也可以有多个步骤。
答案:请关注【渝粤题库】微信公众号,发送题目获取正确答案。