当前位置: 首页 > ai >正文

L38.【LeetCode题解】四数之和(双指针思想) 从汇编角度分析报错原因

目录

1.题目

2.分析

去重的代码

错误代码

3.完整代码

提交结果


1.题目

四数之和

给你一个由 n 个整数组成的数组 nums ,和一个目标值 target 。请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] (若两个四元组元素一一对应,则认为两个四元组重复):

  • 0 <= a, b, c, d < n
  • abcd 互不相同
  • nums[a] + nums[b] + nums[c] + nums[d] == target

你可以按 任意顺序 返回答案 。

示例 1:

输入:nums = [1,0,-1,0,-2,2], target = 0
输出:[[-2,-1,1,2],[-2,0,0,2],[-1,0,0,1]]

示例 2:

输入:nums = [2,2,2,2,2], target = 8
输出:[[2,2,2,2]]

提示:

  • 1 <= nums.length <= 200
  • -10^9 <= nums[i] <= 10^9
  • -10^9 <= target <= 10^9

2.分析

本题和L37.【LeetCode题解】三数之和(双指针思想)题非常像,解法也是类似的,将原暴力解法的四重循环(循环变量为i,j,k,l)的最里面的两重循环换成双指针(left和right)即可

但题目条件限制"不重复的四元组",因此需要做去重操作,这个实现的思路在L37.【LeetCode题解】三数之和(双指针思想)文章中讲过了

去重的代码

i,j,left和right都要跳过相同的元素,一定要注意i,j,left,right不能超过各自的循环范围

left++;
while (nums[left]==nums[left-1]&&left<right)left++;right--;
while (nums[right]==nums[right+1]&&left<right)right--;j++;
while (nums[j]==nums[j-1]&&j<=nums.size()-3)j++;i++;
while (nums[i]==nums[i-1]&&i<=nums.size()-4)i++;

错误代码

class Solution {
public:vector<vector<int>> fourSum(vector<int>& nums, int target) {if (nums.size()<4)return {};        sort(nums.begin(),nums.end());vector<vector<int>> ret;for (int i=0;i<=nums.size()-4;){for (int j=i+1;j<=nums.size()-3;){int left=j+1;int right=nums.size()-1;while (left<right){int sum=nums[i]+nums[j]+nums[left]+nums[right];if (sum>target)right--;else if (sum<target)left++;else//sum==target{ret.push_back({nums[i],nums[j],nums[left],nums[right]});left++;while (nums[left]==nums[left-1]&&left<right)left++;right--;while (nums[right]==nums[right+1]&&left<right)right--;}}j++;while (nums[j]==nums[j-1]&&j<=nums.size()-3)j++;}i++;while (nums[i]==nums[i-1]&&i<=nums.size()-4)i++;}return ret;}
};

报错信息:

sum超出int的存储范围,因为-10^9 <= nums[i] <= 10^9,sum最大可为4\cdot 10^9

如果将int改成long long写成long long sum=nums[i]+nums[j]+nums[left]+nums[right];仍然会出错

明明已经用long long来扩大存储范围了却仍然会出错,想要找到具体原因需要看底层汇编代码的实现,查看Leetcode在线测试使用的编译器:

在What-are-the-environments-for-the-programming-languages找到了信息:

由于Leetcode的编译器为clang,可手动在Linux平台上测试,

先安装clang:

sudo apt update
sudo apt install clang

编译以下代码:

//保存为test.cpp
int  main()
{int i=1000000000;int j=1000000000;int left=1000000000;int right=1000000000;long long sum=i+j+left+right;return 0;
}

要看底层,需要看汇编代码,指令为:

clang -S test.cpp

 汇编代码为:

        .text.file   "test.cpp".globl  main                    # -- Begin function main.p2align        4, 0x90.type   main,@function
main:                                   # @main.cfi_startproc
# %bb.0:pushq   %rbp.cfi_def_cfa_offset 16.cfi_offset %rbp, -16movq    %rsp, %rbp.cfi_def_cfa_register %rbpxorl    %eax, %eaxmovl    $0, -4(%rbp)movl    $1000000000, -8(%rbp)   # imm = 0x3B9ACA00movl    $1000000000, -12(%rbp)  # imm = 0x3B9ACA00movl    $1000000000, -16(%rbp)  # imm = 0x3B9ACA00movl    $1000000000, -20(%rbp)  # imm = 0x3B9ACA00movl    -8(%rbp), %ecxaddl    -12(%rbp), %ecxaddl    -16(%rbp), %ecxaddl    -20(%rbp), %ecxmovslq  %ecx, %rdxmovq    %rdx, -32(%rbp)popq    %rbp.cfi_def_cfa %rsp, 8retq
.Lfunc_end0:.size   main, .Lfunc_end0-main.cfi_endproc# -- End function.ident  "clang version 10.0.0-4ubuntu1 ".section        ".note.GNU-stack","",@progbits.addrsig

只看重点部分:按照Intel汇编代码的风格来说,四个1000000000分别存到了[rbp-8],[rbp-12],[rbp-16],[rbp-20]的位置,之后使用3次addl指令,都做了相同的事,都是+10^9,而且都是由ecx寄存器来接收,ecx寄存器是4字节,由于int类型的最大值约为2.1\cdot 10^9,因此在相加时会超过int类型的最大值,导致溢出,最后的movslq,作用为以符号扩展传送方式,将参数从4字节扩展为8字节,4字节是int类型,8字节是long long类型,会发生类型转换

注:movslq全称moves a 32-bit quantity (longword) into a 64-bit register (quadword) with sign extension 

因此可以理解为:long long sum=i+j+left+right;的i+j+left+right先按int类型相加,最后将结果的类型转换为long long

为了解决按int类型相加时产生的溢出,可以加两次:

long long sum=nums[i]+nums[j];
sum+=nums[left]+nums[right];

(原因:nums数组的元素不会超过1\cdot 10^9,两个元素的和不会超过2\cdot 10^9,比int类型的最大值要小)

或者只加一次,强制类型转换:

long long sum=nums[i]+nums[j]+(long long)(nums[left]+nums[right]);

注意:不能使用unsigned long long,数组元素值可为负

3.完整代码

class Solution {
public:vector<vector<int>> fourSum(vector<int>& nums, int target) {if (nums.size()<4)return {};        sort(nums.begin(),nums.end());vector<vector<int>> ret;for (int i=0;i<=nums.size()-4;){for (int j=i+1;j<=nums.size()-3;){int left=j+1;int right=nums.size()-1;while (left<right){long long sum=nums[i]+nums[j];sum+=nums[left]+nums[right];if (sum>target)right--;else if (sum<target)left++;else//sum==target{ret.push_back({nums[i],nums[j],nums[left],nums[right]});left++;while (nums[left]==nums[left-1]&&left<right)left++;right--;while (nums[right]==nums[right+1]&&left<right)right--;}}j++;while (nums[j]==nums[j-1]&&j<=nums.size()-3)j++;}i++;while (nums[i]==nums[i-1]&&i<=nums.size()-4)i++;}return ret;}
};

提交结果

http://www.xdnf.cn/news/236.html

相关文章:

  • C++11中的std::condition_variable
  • 深度学习中的概念——元素积(哈达玛积)
  • Skipped breakpoint at ... because of stepping in another thread问题分析
  • 制造企业PLM深度应用:2025年基于PDCA循环的7项持续改进指标
  • 2025年Q2(桥式)起重机司机题库考试精选题
  • 高级java每日一道面试题-2025年4月13日-微服务篇[Nacos篇]-Nacos如何处理网络分区情况下的服务可用性问题?
  • AI的出现,是否能替代IT从业者?
  • 电子电器架构 --- OEM企标中规定ECU启动时间的目的
  • 第七篇:系统分析师第三遍——1、2章
  • 【Spring Boot】把jar包导入本地系统
  • C#获取当前方法的命名空间、类名称、方法名称以及方法的参数信息
  • 【前端HTML生成条形码——MQ】
  • DeepSeek深度观察:白宫“炒人“威胁的语义强度与市场应激量化分析
  • 【Unity】使用Cinemachine+CharacterController实现第三人称视角下的角色视角、移动和跳跃控制
  • Maven与Springboot创建
  • Qt QThread 两种线程管理方法
  • 通信算法之269 : OFDM信号的循环自相关特性用于无人机图传信号识别
  • Ethernet/IP转ProfiNet边缘计算网关在能源管理中的应用:跨系统数据聚合与智能分析
  • (7)VTK C++开发示例 --- 使用交互器
  • 英伟达A100、H100、H800性能详细对比
  • 4.18日学习--引用
  • 记一次bat脚本的坑:中文注释导致脚本不能运行
  • 【无标题】作业
  • 不确定与非单调推理的基本概念
  • 新书速览|DeepSeek移动端AI应用开发:基于Android与iOS
  • win11系统截图的几种方式
  • SQL通用语法和注释,SQL语句分类(DDL,DML,DQL,DCL)及案例
  • 深入简出:KL散度、交叉熵、熵、信息量简介、交叉熵损失
  • Spring Boot自动配置原理深度解析:从条件注解到spring.factories
  • FFmpeg 硬核指南:从底层架构到播放器全链路开发实战 基础