杜教筛原理,实现与时间复杂度分析
引例
洛谷 P4213 【模板】杜教筛
题目描述
给定一个正整数,求
a n s 1 = ∑ i = 1 n φ ( i ) ans_1=\sum_{i=1}^n\varphi(i) ans1=i=1∑nφ(i)
a n s 2 = ∑ i = 1 n μ ( i ) ans_2=\sum_{i=1}^n \mu(i) ans2=i=1∑nμ(i)
输入格式
本题单测试点内有多组数据。
输入的第一行为一个整数,表示数据组数 T T T。
接下来 T T T 行,每行一个整数 n n n,表示一组询问。
输出格式
对于每组询问,输出一行两个整数,分别代表 a n s 1 ans_1 ans1 和 a n s 2 ans_2 ans2。
输入输出样例 #1
输入 #1
6 1 2 8 13 30 2333
输出 #1
1 1 2 0 22 -2 58 -3 278 -3 1655470 2
说明/提示
数据规模与约定
对于全部的测试点,保证 1 ≤ T ≤ 10 1 \leq T \leq 10 1≤T≤10, 1 ≤ n < 2 31 1 \leq n \lt 2^{31} 1≤n<231。对于全部的测试点,保证 1 ≤ T ≤ 10 1 \leq T \leq 10 1≤T≤10, 1 ≤ n < 2 31 1 \leq n \lt 2^{31} 1≤n<231。
题中要求以低于线性的时间复杂度对数论函数求和。
原理
将例写为更一般的形式:
求 S ( n ) = ∑ i = 1 n f ( i ) S(n)=\sum_{i=1}^{n}f(i) S(n)=i=1∑nf(i) ,其中, f f f 是数论函数。
构造函数 g g g 并令 h = f ∗ g = g ∗ f h=f*g=g*f h=f∗g=g∗f ,
故,
∑ i = 1 n h ( i ) = ∑ i = 1 n ∑ d ∣ i g ( d ) f ( i d ) = ∑ d = 1 n ∑ d ∣ i n g ( d ) f ( i d ) = ∑ d = 1 n g ( d ) ∑ d ∣ i n f ( i d ) = ∑ d = 1 n g ( d ) ∑ i = 1 ⌊ n d ⌋ f ( i ) = ∑ d = 1 n g ( d ) S ( ⌊ n d ⌋ ) = g ( 1 ) S ( n ) + ∑ i = 2 n g ( i ) S ( ⌊ n i ⌋ ) \begin{aligned} \sum_{i=1}^nh(i) &= \sum_{i=1}^n\sum_{d|i}g(d)f\left(\frac{i}{d}\right) \\ &= \sum_{d=1}^n\sum_{d|i}^ng(d)f\left(\frac{i}{d}\right) \\ &= \sum_{d=1}^ng(d)\sum_{d|i}^nf\left(\frac{i}{d}\right) \\ &= \sum_{d=1}^ng(d)\sum_{i=1}^{\left\lfloor \frac{n}{d}\right\rfloor}f(i) \\ &= \sum_{d=1}^ng(d)S\left(\left\lfloor \frac{n}{d}\right\rfloor\right) \\ &= g(1)S(n)+\sum_{i=2}^ng(i)S\left(\left\lfloor \frac{n}{i}\right\rfloor\right) \end{aligned} i=1∑nh(i)=i=1∑nd∣i∑g(d)f(di)=d=1∑nd∣i∑ng(d)f(di)=d=1∑ng(d)d∣i∑nf(di)=d=1∑ng(d)i=1∑⌊dn⌋f(i)=d=1∑ng(d)S(⌊dn⌋)=g(1)S(n)+i=2∑ng(i)S(⌊in⌋)
因此,
g ( 1 ) S ( n ) = ∑ i = 1 n h ( i ) − ∑ i = 2 n g ( i ) S ( ⌊ n / i ⌋ ) g(1)S(n)=\sum_{i=1}^nh(i)-\sum_{i=2}^ng(i)S(\lfloor n/i\rfloor) g(1)S(n)=i=1∑nh(i)−i=2∑ng(i)S(⌊n/i⌋)
采用数论分快加速第二个求和运算,这要求:
- 可以快速计算 ∑ i = 1 n h ( i ) \sum_{i=1}^nh(i) ∑i=1nh(i) ;
- 可以快速计算 ∑ i = l r g ( i ) \sum_{i=l}^rg(i) ∑i=lrg(i) ;
实现
实现时构造出来的 h , g h,g h,g 已经满足了上述要求,采用记忆化搜索计算 S ( n ) S(n) S(n) ,数论分块加速求和。
考虑进一步优化,对于前 k k k 项使用线性筛直接计算。
以下为C++参考实现。
时间复杂度分析
此处伪证极多,点名《算法竞赛》中的“高阶小量”伪证。
先考虑有哪些 S ( i ) S(i) S(i) 会被计算。
设记搜时 S ( i ) S(i) S(i) 会使用 R ( i ) = { j ∣ j = ⌊ i k ⌋ , k ∈ N + , k > 1 } R(i)=\{j|j=\lfloor \frac ik \rfloor,k∈\mathbb{N^+},k>1\} R(i)={j∣j=⌊ki⌋,k∈N+,k>1} 中的元素的 S S S 。
下证若 m ∈ R ( n ) m∈R(n) m∈R(n) ,则 R ( m ) ⊆ R ( n ) R(m)\subseteq R(n) R(m)⊆R(n) 。
对于任意 i ∈ R ( m ) i∈R(m) i∈R(m) , i = ⌊ m x ⌋ i=\lfloor \frac mx \rfloor i=⌊xm⌋ ,
又 m = ⌊ n y ⌋ m=\lfloor \frac ny \rfloor m=⌊yn⌋ ,
故 i = ⌊ ⌊ n y ⌋ x ⌋ = ⌊ n x y ⌋ ∈ R ( n ) i=\lfloor \frac {\lfloor \frac ny \rfloor}x \rfloor =\lfloor \frac n{xy} \rfloor ∈R(n) i=⌊x⌊yn⌋⌋=⌊xyn⌋∈R(n) 。
由上知只有 i ∈ R ( n ) i∈R(n) i∈R(n) 才会被计算。
下令 T ( n ) T(n) T(n) 为计算 S ( n ) S(n) S(n) 的时间复杂度,并忽略计算 h , g h,g h,g 相关的消耗。则由数论分块相关可知 T ( n ) = n T(n)=\sqrt n T(n)=n 。
类似数论分块,若 i = ⌊ n x ⌋ ∈ R ( n ) i=\lfloor \frac nx \rfloor∈R(n) i=⌊xn⌋∈R(n),
则 i ≤ n i≤\sqrt n i≤n 或 $ i=\lfloor \frac nj \rfloor,j<\sqrt n$ 。
对于朴素的杜教筛(不使用线性筛优化),其时间复杂度为,
∑ i ∈ R ( n ) T ( i ) = ∑ i ∈ R ( n ) i = ∑ i = 1 ⌊ n ⌋ i + ∑ j = 2 ⌊ n ⌋ n j < ∑ i = 1 ⌊ n ⌋ i + n i ≈ ∫ 0 n ( x + n x ) d x = n 3 / 4 \begin{align} \sum_{i∈R(n)}T(i)&=\sum_{i∈R(n)}\sqrt i \\ &=\sum_{i=1}^{\left\lfloor \sqrt n \right\rfloor}\sqrt i + \sum_{j=2}^{\left\lfloor \sqrt n \right\rfloor}\sqrt{\frac nj} \\ &<\sum_{i=1}^{\left\lfloor \sqrt n \right\rfloor}\sqrt i +\sqrt{\frac ni} \\ &≈\int_0^{\sqrt n}(\sqrt x +\sqrt{\frac nx})dx \\ &=n^{3/4} \end{align} i∈R(n)∑T(i)=i∈R(n)∑i=i=1∑⌊n⌋i+j=2∑⌊n⌋jn<i=1∑⌊n⌋i+in≈∫0n(x+xn)dx=n3/4
即为 O ( n 3 / 4 ) O(n^{3/4}) O(n3/4) 。
若使用线性筛预处理前 k k k 项,预处理部分时间复杂度为 O ( k ) O(k) O(k) 。当 k > n k>\sqrt n k>n 时时间复杂度变为,
k + ∑ i ∈ R ( n ) , i > k T ( i ) = k + ∑ i ∈ R ( n ) , i > k i = k + ∑ j = 2 ⌊ n / k ⌋ n j < k + ∑ i = 1 ⌊ n / k ⌋ n i ≈ k + ∫ 0 n / k n x d x = k + n k \begin{aligned} k+\sum_{i\in R(n),i>k}T(i)&=k+\sum_{i\in R(n),i>k}\sqrt{i} \\ &=k+ \sum_{j=2}^{\lfloor n/k \rfloor}\sqrt{\frac{n}{j}} \\ &<k+\sum_{i=1}^{\lfloor n/k \rfloor}\sqrt{\frac{n}{i}} \\ &\approx k+\int_0^{n/k}\sqrt{\frac{n}{x}}dx \\ &=k+\frac{n}{\sqrt{k}} \end{aligned} k+i∈R(n),i>k∑T(i)=k+i∈R(n),i>k∑i=k+j=2∑⌊n/k⌋jn<k+i=1∑⌊n/k⌋in≈k+∫0n/kxndx=k+kn
为求上式极值,以 k k k 为自变量求导,令 d O d k = 1 − 1 2 n k − 3 2 = 0 \frac {dO}{dk}=1-\frac 12 nk^{-\frac 32}=0 dkdO=1−21nk−23=0 ,
得到 k = O ( n 2 / 3 ) k=O(n^{2/3}) k=O(n2/3) ,此时总时间复杂度为 O ( n 2 / 3 ) O(n^{2/3}) O(n2/3) 。