spark-SQL实验
实验内容:统计有效数据条数及用户数量最多的前二十个地址。
原数据:
注意事项:
将json格式数据利用get_json_object函数转换格式之后在进行后续分析处理。
有效数据:指uid、phone、addr三个字段均无空值的数据。
代码实操:
结果展示:
注意事项:
1:数据库,已有数据库就选择合适的,没有数据库就需提前创建
2:文件路径问题,不要复制,容易出错
3:运行一遍之后,再次运行会报错,因为数据库已经存在创建的表
实验内容:统计有效数据条数及用户数量最多的前二十个地址。
原数据:
注意事项:
将json格式数据利用get_json_object函数转换格式之后在进行后续分析处理。
有效数据:指uid、phone、addr三个字段均无空值的数据。
代码实操:
结果展示:
注意事项:
1:数据库,已有数据库就选择合适的,没有数据库就需提前创建
2:文件路径问题,不要复制,容易出错
3:运行一遍之后,再次运行会报错,因为数据库已经存在创建的表