当前位置: 首页 > ds >正文

SQL实战:06交叉日期打折问题求解

文章目录

  • 概述
  • 题目:交叉打折问题求解
  • 题解
    • 第一步:使用滑动窗口统计当前活动前的最大结束日期
    • 步骤二:拆分出交叉部分
    • 步骤三:计算每次活动的持续天数
    • 步骤四:分组统计最终结果
    • 完整SQL

概述

最近刷题时遇到一些比较有意思的题目,就决定记录下来,并将解题过程一一拆解。此文中要记录的是交叉打折日期问题的求解。

题目:交叉打折问题求解

如下为平台商品促销数据:字段为品牌,打折开始日期,打折结束日期

表logs

字段名数据类型
brandstring
sttdate
edtdate

示例数据如下:

brandsttedt
oppo2021-06-052021-06-09
oppo2021-06-112021-06-21
vivo2021-06-052021-06-15
vivo2021-06-092021-06-21
redmi2021-06-052021-06-21
redmi2021-06-092021-06-15
redmi2021-06-172021-06-26
huawei2021-06-052021-06-26
huawei2021-06-092021-06-15
huawei2021-06-172021-06-21

计算每个品牌总的打折销售天数,注意其中的交叉日期:
比如 vivo 品牌,第一次活动时间为 2021-06-05 到 2021-06-15,第二次活动时间为 2021-06-09 到 2021-06-21 其中 9 号到 15号为重复天数,只统计一次,即 vivo 总打折天数为 2021-06-05 到 2021-06-21 共计 17 天。

题解

碰到这类问题,我们第一反应就是需要使用窗口处理函数,解题思路如下所示:

  • 第一步统计出当前活动前的最大结束日期,按照品牌brand进行分区,然后按照stt、edt字段升序进行处理,并使用滑动窗口统计出窗口中到当前行之前的最大的结束日期,使用MAX(edt) OVER(PARTITION BY brand ORDER BY stt ASC, edt ASC ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING )

  • 第二步:拆分出交叉部分,通过比较当前行的开始日期stt和上一步骤中统计出来的当前行之前的最大结束日期prev_max_edt的大小:

    • 如果当前活动的开始日期比之前的最大的结束日期大,则说明两次活动之间没有交叉;

    • 如果当前活动的开始日期比之前活动最大结束日期小,则说明二者具有交叉,那么这次活动的开始日期要重置为上一次最大日期的后一天,这样在计算活动时长时才不会有交叉

  • 第三步:计算每次活动的持续天数,在第二步将每次活动都处理成了没有交叉日期的数据之后,就可以利用结束日期减去开始日期,统计出每次活动的持续时长。在这一步的处理结果中可能会得到负数,这表示这次活动的结束日期比“开始日期”小,这说明当前活动被包含在了上一次活动期间。

  • 第四步:分组统计最后结果,第三步中已经得出了每次活动的持续时长,最后就只需要按照分组统计,将每个品牌的活动时长相加即可。需要注意的是,如果活动的时长为负数(第三步已解释),则不参与计算

第一步:使用滑动窗口统计当前活动前的最大结束日期

WITH temp_001 AS (SELECT brand,stt,edt,MAX(edt) OVER(PARTITION BY brand ORDER BY stt,edt ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING ) AS prev_max_edtFROM logs
)

输出如下:

brandsttedtprev_max_edt
oppo2021-06-052021-06-09NULL
oppo2021-06-112021-06-212021-06-09
vivo2021-06-052021-06-15NULL
vivo2021-06-092021-06-212021-06-15
redmi2021-06-052021-06-21NULL
redmi2021-06-092021-06-152021-06-21
redmi2021-06-172021-06-262021-06-21
huawei2021-06-052021-06-26NULL
huawei2021-06-092021-06-152021-06-26
huawei2021-06-172021-06-212021-06-26

步骤二:拆分出交叉部分

通过比较当前行的开始日期stt和上一步骤中统计出来的当前行之前的最大结束日期prev_max_edt的大小:

  • 如果当前活动的开始日期比之前的最大的结束日期大,则说明两次活动之间没有交叉;

  • 如果当前活动的开始日期比之前活动最大结束日期小,则说明二者具有交叉,那么这次活动的开始日期要重置为上一次最大日期的后一天,这样在计算活动时长时才不会有交叉

SQL实现:

temp_002 AS (SELECT brand, IF(prev_max_dt IS NULL, stt, IF(stt>prev_max_dt, stt, DATE_ADD(max_edt, INTERVAL 1 DAY ))) AS stt, edtFROM temp_001
)

输出结果:

brandsttedt
oppo2021-06-052021-06-09
oppo2021-06-112021-06-21
vivo2021-06-052021-06-15
vivo2021-06-162021-06-21
redmi2021-06-052021-06-21
redmi2021-06-222021-06-15
redmi2021-06-222021-06-26
huawei2021-06-052021-06-26
huawei2021-06-272021-06-15
huawei2021-06-272021-06-21

步骤三:计算每次活动的持续天数

temp_003 AS (SELECT brand,stt,edt,DATE_DIFF(edt,stt) AS daysFROM temp_002
)

输出结果

brandsttedtdays
oppo2021-06-052021-06-094
oppo2021-06-112021-06-2110
vivo2021-06-052021-06-1510
vivo2021-06-162021-06-215
redmi2021-06-052021-06-2116
redmi2021-06-222021-06-15-7
redmi2021-06-222021-06-264
huawei2021-06-052021-06-2621
huawei2021-06-272021-06-15-12
huawei2021-06-272021-06-21-6

步骤四:分组统计最终结果

SELECT brand,SUM(IF(days>0, days, 0 )) AS ttl_days
FROM temp_003
GROUP BY brand
;

输出结果

brandttl_days
huawei21
oppo14
redmi20
vivo15

完整SQL

WITH temp_001 AS (SELECT brand,stt,edt,MAX(edt) OVER(PARTITION BY brand ORDER BY stt,edt ROWS BETWEEN UNBOUNDED PRECEDING AND 1 PRECEDING ) AS prev_max_edtFROM logs
)
,temp_002 AS (SELECT brand, IF(prev_max_dt IS NULL, stt, IF(stt>prev_max_dt, stt, DATE_ADD(max_edt, INTERVAL 1 DAY ))) AS stt, edtFROM temp_001
)
,temp_003 AS (SELECT brand,stt,edt,DATE_DIFF(edt,stt) AS daysFROM temp_002
)
SELECT brand,SUM(IF(days>0, days, 0 )) AS ttl_days
FROM temp_003
GROUP BY brand
;
http://www.xdnf.cn/news/6488.html

相关文章:

  • 论文学习_Precise and Accurate Patch Presence Test for Binaries
  • 浅析 Spring 启动过程:从源码到核心方法
  • 【Redis】双向链表结构
  • ARM A64 LDR指令
  • constexpr 关键字的意义(入门)
  • 关于在深度聚类中Representation Collapse现象
  • RM算法的地下宫殿
  • 解决 Conda 安装 PyTorch 1.1.0 报错:excluded by strict repo priority(附三种解决方案)
  • 射击游戏demo11
  • 微服务如何实现服务的高并发
  • idea整合maven环境配置
  • 幼儿学前教育答辩词答辩技巧问题答辩自述稿
  • IPLOOK | 2025 MVNOs 世界大会:从Wi-Fi通话到卫星覆盖
  • MapReduce架构-打包运行
  • gitlab+portainer 实现Ruoyi Vue后端CI/CD
  • Trae 插件 Builder 模式:从 0 到 1 开发天气查询小程序,解锁 AI 编程新体验
  • 全面掌握JSR303校验:从入门到实战
  • 安全牛报告解读《低空经济发展白皮书(3.0)安全体系》
  • React事件机制
  • antd mobile 点击 TabBar 切换页面
  • 工业4.0神经嫁接术:ethernet ip转profinet协议通信步骤图解
  • 【数据挖掘笔记】兴趣度度量Interest of an association rule
  • AI大模型学习二十四、实践QEMU-KVM 虚拟化:ubuntu server 25.04 下云镜像创建Ubuntu 虚拟机
  • [6-8] 编码器接口测速 江协科技学习笔记(7个知识点)
  • ES常识8:ES8.X如何实现热词统计
  • 微服务概述
  • 量子隧穿:PROFINET到Ethernet ip的无损耗协议转换方案转
  • 【寻找Linux的奥秘】第五章:认识进程
  • salesforce如何导出所有字段
  • SQL注入---05--跨站注入