当前位置: 首页 > news >正文

pyspark测试样例

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, lit, concat

创建 SparkSession

spark = SparkSession.builder.appName(“SparkSQLExample”).getOrCreate()

创建 DataFrame(可以是从 CSV、JSON 等文件读取)

data = [(“Alice”, 586240, 177)] # 注意这里逗号使用的是英文逗号
columns = [“name”, “lac”, “ci”]

df = spark.createDataFrame(data, columns)

创建 CGI 列

df = df.withColumn(
“cgi”,
concat(
lit(“3-”),
(col(“lac”).cast(“integer”) * 256 + col(“ci”).cast(“integer”)).cast(“string”)
)
)

显示结果

df.show()

df = df.withColumn(
“cgi”,
concat(
lit(“3-”),
(col(“lac”).cast(“int”) * 256 + col(“ci”).cast(“int”)).cast(“string”)
)
)

显示结果

df.show()

停止 SparkSession

spark.stop()

样例2:

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, lit, concatspark = SparkSession.builder.appName("SparkSQLExample").getOrCreate()data = [("Alice", 586240, 177)]
columns = ["name", "lac", "ci"]
df = spark.createDataFrame(data, columns)
df = df.withColumn("cgi", concat(lit("3-"), (col("lac").cast("integer") * 256 + col("ci").cast("integer")).cast("string")))
df.show()df = df.withColumn("cgi", concat(lit("3-"), (col("lac").cast("int") * 256 + col("ci").cast("int")).cast("string"))
)# 显示结果
df.show()# 停止 SparkSession
spark.stop()
http://www.xdnf.cn/news/525637.html

相关文章:

  • OpenCv(7.0)——银行卡号识别
  • 芯驰科技与安波福联合举办技术研讨会,深化智能汽车领域合作交流
  • Java知识点-Stream流
  • Maven配置安装
  • Unity入门学习(三)3D数学(3)之Vector3类的介绍
  • 15、Python布尔逻辑全解析:运算符优先级、短路特性与实战避坑指南
  • 使用 NGINX 的 `ngx_http_secure_link_module` 模块保护资源链接
  • 编译Qt5.15.16并启用pdf模块
  • 紫光同创FPGA实现AD9238数据采集转UDP网络传输,分享PDS工程源码和技术支持和QT上位机
  • PDF 合并测试:性能与内容完整性
  • 2025-5-19Vue3快速上手
  • 双指针算法:原理与应用详解
  • 大数据实时分析:ClickHouse、Doris、TiDB 对比分析
  • [低代码] 明道云调用本地部署 Dify 的进阶方法
  • 存储系统03——数据缓冲evBuffer
  • 不同类型桥梁的无人机检测内容及技术难度
  • 智能体应用如何重塑未来生活?全面解析技术场景与实在Agent突破
  • Oracle 的 PGA_AGGREGATE_LIMIT 参数
  • 2024年ASOC SCI2区TOP,多机制群优化算法+多风场输电线路巡检中多无人机任务分配与路径规划,深度解析+性能实测
  • 使用PowerShell备份和还原Windows环境变量
  • 第三十八节:视频处理-视频保存
  • Vue百日学习计划Day36-42天详细计划-Gemini版
  • 树莓派(Raspberry Pi)中切换为国内的软件源
  • easy-live2d v0.2.1 发布啦! 增加了语音 以及 口型同步功能,现在你的Live2D角色 可以在web里说话了!Ciallo~(∠・ω< )
  • OpenMV IDE 的图像接收缓冲区原理
  • 2025年AI与网络安全的终极博弈:冲击、重构与生存法则
  • 谷歌前CEO TED演讲解析:AI 红利的三年窗口期与行业重构
  • Python类方法解析:从字节序列重构Vector2d实例
  • 用 CodeBuddy 搭建「MiniGoal 小目标打卡器」:一次流畅的 UniApp 开发体验
  • WPF Data Binding 及经典应用示例