国开搜题
想要快速找到正确答案?
立即关注 国开搜题微信公众号,轻松解决学习难题!
作业辅导
扫码关注
论文指导
轻松解决学习难题!
数据采集与预处理 广东开放大学 - 实践作业(不计分)
课程名称:数据采集与预处理 发布教师: 渝粤文库 王小军 作业来源:第6学习单元 数据转换 作业满分:100.0分 发布时间:2025-07-10 作业要求:电信 国家开放大学 数据和支付数据整合 一、实验目的 1. 掌握数据合并的方法。 2. 掌握数据分组统计的方法。 二、实验内容 有两个数据集文件( 见附件 成人学历 >渝粤题库 )payment.csv和communication.csv,分别是用户的支付记录和电信相关记录。payment数据集的属性有28个,communication数据集的属性有49个,具体请查看文件内容。要求: 1. 读取两个数据集,并使用head函数查看数据集。 2. 统计数据集的基本信息。 3. 根据属性用户号的取值,进行连表操作。 4. 查看名义型属性的取值是否含有数据,如:产品类型,缴费方式,信控方式,商品名称,客户群,促销名称。 5. 对“商品名称”和“客户群”两个属性取零值的重合数据记录,求出行索引的并集,确定存在零值的所有行。 6. 查看商品生效时间属性,将其分拆为两个属性,商品生效年份和商品生效月份。 7. 使用groupby函数进行分组统计,分别统计商品名称和客户群的单笔消费最大金额,以及产品类型和商品名称的话费充值总额。 三、作业提交要求 完成实验报告( 见附件模板 ),将源代码和实验报告一起压缩打包提交至学习平台。
题目1
1. 实践作业(不计 渝粤教育 分) (分值:100.0分)
