跳至主要內容

树状数组

Mr.Heaboy大约 37 分钟

author: HeRaNO, Zhoier, Ir1d, Xeonacid, wangdehu, ouuan, ranwen, ananbaobeichicun, Ycrpro, dbxxx-oi

树状数组

引入

树状数组是一种支持 单点修改区间查询 的,代码量小的数据结构。

"什么是「单点修改」和「区间查询」?" 假设有这样一道题:

已知一个数列 aa,你需要进行下面两种操作:

  • 给定 x,yx, y,将 a[x]a[x] 自增 yy
  • 给定 l,rl, r,求解 a[lr]a[l \ldots r] 的和。

其中第一种操作就是「单点修改」,第二种操作就是「区间查询」。

类似地,还有:「区间修改」、「单点查询」。它们分别的一个例子如下:

  • 区间修改:给定 l,r,xl, r, x,将 a[lr]a[l \ldots r] 中的每个数都分别自增 xx
  • 单点查询:给定 xx,求解 a[x]a[x] 的值。

注意到,区间问题一般严格强于单点问题,因为对单点的操作相当于对一个长度为 11 的区间操作。

普通树状数组维护的信息及运算要满足 结合律可差分,如加法(和)、乘法(积)、异或等。

  • 结合律:(xy)z=x(yz)(x \circ y) \circ z = x \circ (y \circ z),其中 \circ 是一个二元运算符。
  • 可差分:具有逆运算的运算,即已知 xyx \circ yxx 可以求出 yy

需要注意的是:

  • 模意义下的乘法若要可差分,需保证每个数都存在逆元(模数为质数时一定存在);
  • 例如 gcd\gcdmax\max 这些信息不可差分,所以不能用普通树状数组处理,但是:

事实上,树状数组能解决的问题是线段树能解决的问题的子集:树状数组能做的,线段树一定能做;线段树能做的,树状数组不一定可以。然而,树状数组的代码要远比线段树短,时间效率常数也更小,因此仍有学习价值。

有时,在差分数组和辅助数组的帮助下,树状数组还可解决更强的 区间加单点值区间加区间和 问题。

树状数组

初步感受

先来举个例子:我们想知道 a[17]a[1 \ldots 7] 的前缀和,怎么做?

一种做法是:a1+a2+a3+a4+a5+a6+a7a_1 + a_2 + a_3 + a_4 + a_5 + a_6 + a_7,需要求 77 个数的和。

但是如果已知三个数 AABBCCA=a[14]A = a[1 \ldots 4] 的和,B=a[56]B = a[5 \ldots 6] 的总和,C=a[77]C = a[7 \ldots 7] 的总和(其实就是 a[7]a[7] 自己)。你会怎么算?你一定会回答:A+B+CA + B + C,只需要求 33 个数的和。

这就是树状数组能快速求解信息的原因:我们总能将一段前缀 [1,n][1, n] 拆成 不多于 logn\boldsymbol{\log n} 段区间,使得这 logn\log n 段区间的信息是 已知的

于是,我们只需合并这 logn\log n 段区间的信息,就可以得到答案。相比于原来直接合并 nn 个信息,效率有了很大的提高。

不难发现信息必须满足结合律,否则就不能像上面这样合并了。

下面这张图展示了树状数组的工作原理:

最下面的八个方块代表原始数据数组 aa。上面参差不齐的方块(与最上面的八个方块是同一个数组)代表数组 aa 的上级——cc 数组。

cc 数组就是用来储存原始数组 aa 某段区间的和的,也就是说,这些区间的信息是已知的,我们的目标就是把查询前缀拆成这些小区间。

例如,从图中可以看出:

  • c2c_2 管辖的是 a[12]a[1 \ldots 2]
  • c4c_4 管辖的是 a[14]a[1 \ldots 4]
  • c6c_6 管辖的是 a[56]a[5 \ldots 6]
  • c8c_8 管辖的是 a[18]a[1 \ldots 8]
  • 剩下的 c[x]c[x] 管辖的都是 a[x]a[x] 自己(可以看做 a[xx]a[x \ldots x] 的长度为 11 的小区间)。

不难发现,c[x]c[x] 管辖的一定是一段右边界是 xx 的区间总信息。我们先不关心左边界,先来感受一下树状数组是如何查询的。

举例:计算 a[17]a[1 \ldots 7] 的和。

过程:从 c7c_{7} 开始往前跳,发现 c7c_{7} 只管辖 a7a_{7} 这个元素;然后找 c6c_{6},发现 c6c_{6} 管辖的是 a[56]a[5 \ldots 6],然后跳到 c4c_{4},发现 c4c_{4} 管辖的是 a[14]a[1 \ldots 4] 这些元素,然后再试图跳到 c0c_0,但事实上 c0c_0 不存在,不跳了。

我们刚刚找到的 ccc7,c6,c4c_7, c_6, c_4,事实上这就是 a[17]a[1 \ldots 7] 拆分出的三个小区间,合并得到答案是 c7+c6+c4c_7 + c_6 + c_4

举例:计算 a[47]a[4 \ldots 7] 的和。

我们还是从 c7c_7 开始跳,跳到 c6c_6 再跳到 c4c_4。此时我们发现它管理了 a[14]a[1 \ldots 4] 的和,但是我们不想要 a[13]a[1 \ldots 3] 这一部分,怎么办呢?很简单,减去 a[13]a[1 \ldots 3] 的和就行了。

那不妨考虑最开始,就将查询 a[47]a[4 \ldots 7] 的和转化为查询 a[17]a[1 \ldots 7] 的和,以及查询 a[13]a[1 \ldots 3] 的和,最终将两个结果作差。

管辖区间

那么问题来了,c[x](x1)c[x](x \ge 1) 管辖的区间到底往左延伸多少?也就是说,区间长度是多少?

树状数组中,规定 c[x]c[x] 管辖的区间长度为 2k2^{k},其中:

  • 设二进制最低位为第 00 位,则 kk 恰好为 xx 二进制表示中,最低位的 1 所在的二进制位数;
  • 2k2^kc[x]c[x] 的管辖区间长度)恰好为 xx 二进制表示中,最低位的 1 以及后面所有 0 组成的数。

举个例子,c88c_{88} 管辖的是哪个区间?

因为 88(10)=01011000(2)88_{(10)}=01011000_{(2)},其二进制最低位的 1 以及后面的 0 组成的二进制是 1000,即 88,所以 c88c_{88} 管辖 88aa 数组中的元素。

因此,c88c_{88} 代表 a[8188]a[81 \ldots 88] 的区间信息。

我们记 xx 二进制最低位 1 以及后面的 0 组成的数为 lowbit(x)\operatorname{lowbit}(x),那么 c[x]c[x] 管辖的区间就是 [xlowbit(x)+1,x][x-\operatorname{lowbit}(x)+1, x]

这里注意:lowbit\boldsymbol{\operatorname{lowbit}} 指的不是最低位 1 所在的位数 k\boldsymbol{k},而是这个 1 和后面所有 0 组成的 2k\boldsymbol{2^k}

怎么计算 lowbit?根据位运算知识,可以得到 lowbit(x) = x & -x

"lowbit 的原理" 将 x 的二进制所有位全部取反,再加 1,就可以得到 -x 的二进制编码。例如,66 的二进制编码是 110,全部取反后得到 001,加 1 得到 010

设原先 x 的二进制编码是 (...)10...00,全部取反后得到 [...]01...11,加 1 后得到 [...]10...00,也就是 -x 的二进制编码了。这里 x 二进制表示中第一个 1x 最低位的 1

(...)[...] 中省略号的每一位分别相反,所以 x & -x = (...)10...00 & [...]10...00 = 10...00,得到的结果就是 lowbit

"实现" C++

        int lowbit(int x) {
          // x 的二进制中,最低位的 1 以及后面所有 0 组成的数。
          // lowbit(0b01011000) == 0b00001000
          //          ~~~~^~~~
          // lowbit(0b01110010) == 0b00000010
          //          ~~~~~~^~
          return x & -x;
        }
Python
        def lowbit(x):
            """
            x 的二进制中,最低位的 1 以及后面所有 0 组成的数。
            lowbit(0b01011000) == 0b00001000
                    ~~~~~^~~
            lowbit(0b01110010) == 0b00000010
                    ~~~~~~~^~
            """
            return x & -x

区间查询

接下来我们来看树状数组具体的操作实现,先来看区间查询。

回顾查询 a[47]a[4 \ldots 7] 的过程,我们是将它转化为两个子过程:查询 a[17]a[1 \ldots 7] 和查询 a[13]a[1 \ldots 3] 的和,最终作差。

其实任何一个区间查询都可以这么做:查询 a[lr]a[l \ldots r] 的和,就是 a[1r]a[1 \ldots r] 的和减去 a[1l1]a[1 \ldots l - 1] 的和,从而把区间问题转化为前缀问题,更方便处理。

事实上,将有关 lrl \ldots r 的区间询问转化为 1r1 \ldots r1l11 \ldots l - 1 的前缀询问再差分,在竞赛中是一个非常常用的技巧。

那前缀查询怎么做呢?回顾下查询 a[17]a[1 \ldots 7] 的过程:

c7c_{7} 往前跳,发现 c7c_{7} 只管辖 a7a_{7} 这个元素;然后找 c6c_{6},发现 c6c_{6} 管辖的是 a[56]a[5 \ldots 6],然后跳到 c4c_{4},发现 c4c_{4} 管辖的是 a[14]a[1 \ldots 4] 这些元素,然后再试图跳到 c0c_0,但事实上 c0c_0 不存在,不跳了。

我们刚刚找到的 ccc7,c6,c4c_7, c_6, c_4,事实上这就是 a[17]a[1 \ldots 7] 拆分出的三个小区间,合并一下,答案是 c7+c6+c4c_7 + c_6 + c_4

观察上面的过程,每次往前跳,一定是跳到现区间的左端点的左一位,作为新区间的右端点,这样才能将前缀不重不漏地拆分。比如现在 c6c_6 管的是 a[56]a[5 \ldots 6],下一次就跳到 51=45 - 1 = 4,即访问 c4c_4

我们可以写出查询 a[1x]a[1 \ldots x] 的过程:

  • c[x]c[x] 开始往前跳,有 c[x]c[x] 管辖 a[xlowbit(x)+1x]a[x-\operatorname{lowbit}(x)+1 \ldots x]
  • xxlowbit(x)x \gets x - \operatorname{lowbit}(x),如果 x=0x = 0 说明已经跳到尽头了,终止循环;否则回到第一步。
  • 将跳到的 cc 合并。

实现时,我们不一定要先把 cc 都跳出来然后一起合并,可以边跳边合并。

比如我们要维护的信息是和,直接令初始 ans=0\mathrm{ans} = 0,然后每跳到一个 c[x]c[x]ansans+c[x]\mathrm{ans} \gets \mathrm{ans} + c[x],最终 ans\mathrm{ans} 就是所有合并的结果。

"实现" C++

        int getsum(int x) {  // a[1]..a[x]的和
          int ans = 0;
          while (x > 0) {
            ans = ans + c[x];
            x = x - lowbit(x);
          }
          return ans;
        }
Python
        def getsum(x):  # a[1]..a[x]的和
            ans = 0
            while x > 0:
                ans = ans + c[x]
                x = x - lowbit(x)
            return ans

树状数组与其树形态的性质

在讲解单点修改之前,先讲解树状数组的一些基本性质,以及其树形态来源,这有助于更好理解树状数组的单点修改。

我们约定:

  • l(x)=xlowbit(x)+1l(x) = x - \operatorname{lowbit}(x) + 1。即,l(x)l(x)c[x]c[x] 管辖范围的左端点。
  • 对于任意正整数 xx,总能将 xx 表示成 s×2k+1+2ks \times 2^{k + 1} + 2^k 的形式,其中 lowbit(x)=2k\operatorname{lowbit}(x) = 2^k
  • 下面「c[x]c[x]c[y]c[y] 不交」指 c[x]c[x] 的管辖范围和 c[y]c[y] 的管辖范围不相交,即 [l(x),x][l(x), x][l(y),y][l(y), y] 不相交。「c[x]c[x] 包含于 c[y]c[y]」等表述同理。

性质 1\boldsymbol{1}:对于 xy\boldsymbol{x \le y},要么有 c[x]\boldsymbol{c[x]}c[y]\boldsymbol{c[y]} 不交,要么有 c[x]\boldsymbol{c[x]} 包含于 c[y]\boldsymbol{c[y]}

"证明" 证明:假设 c[x]c[x]c[y]c[y] 相交,即 [l(x),x][l(x), x][l(y),y][l(y), y] 相交,则一定有 l(y)xyl(y) \le x \le y

yy 表示为 s×2k+1+2ks \times 2^{k +1} + 2^k,则 l(y)=s×2k+1+1l(y) = s \times 2^{k + 1} + 1。所以,xx 可以表示为 s×2k+1+bs \times 2^{k +1} + b,其中 1b2k1 \le b \le 2^k

不难发现 lowbit(x)=lowbit(b)\operatorname{lowbit}(x) = \operatorname{lowbit}(b)。又因为 blowbit(b)0b - \operatorname{lowbit}(b) \ge 0

所以 l(x)=xlowbit(x)+1=s×2k+1+blowbit(b)+1s×2k+1+1=l(y)l(x) = x - \operatorname{lowbit}(x) + 1 = s \times 2^{k +1} + b - \operatorname{lowbit}(b) +1 \ge s \times 2^{k +1} + 1 = l(y),即 l(y)l(x)xyl(y) \le l(x) \le x \le y

所以,如果 c[x]c[x]c[y]c[y] 相交,那么 c[x]c[x] 的管辖范围一定完全包含于 c[y]c[y]

性质 2\boldsymbol{2}:在 c[x]\boldsymbol{c[x]} 真包含于 c[x+lowbit(x)]\boldsymbol{c[x + \operatorname{lowbit}(x)]}

"证明" 证明:设 y=x+lowbit(x)y = x + \operatorname{lowbit}(x)x=s×2k+1+2kx = s \times 2^{k + 1} + 2^k,则 y=(s+1)×2k+1y = (s + 1) \times 2^{k +1}l(x)=s×2k+1+1l(x) = s \times 2^{k + 1} + 1

不难发现 lowbit(y)2k+1\operatorname{lowbit}(y) \ge 2^{k + 1},所以 l(y)=(s+1)×2k+1lowbit(y)+1s×2k+1+1=l(x)l(y) = (s + 1) \times 2^{k + 1} - \operatorname{lowbit}(y) + 1 \le s \times 2^{k +1} + 1= l(x),即 l(y)l(x)x<yl(y) \le l(x) \le x < y

所以,c[x]c[x] 真包含于 c[x+lowbit(x)]c[x + \operatorname{lowbit}(x)]

性质 33:对于任意 x<y<x+lowbit(x)\boldsymbol{x < y < x + \operatorname{lowbit}(x)},有 c[x]\boldsymbol{c[x]}c[y]\boldsymbol{c[y]} 不交。

"证明" 证明:设 x=s×2k+1+2kx = s \times 2^{k + 1} + 2^k,则 y=x+b=s×2k+1+2k+by = x + b = s \times 2^{k + 1} + 2^k + b,其中 1b<2k1 \le b < 2^k

不难发现 lowbit(y)=lowbit(b)\operatorname{lowbit}(y) = \operatorname{lowbit}(b)。又因为 blowbit(b)0b - \operatorname{lowbit}(b) \ge 0

因此 l(y)=ylowbit(y)+1=x+blowbit(b)+1>xl(y) = y - \operatorname{lowbit}(y) + 1 = x + b - \operatorname{lowbit}(b) + 1 > x,即 l(x)x<l(y)yl(x) \le x < l(y) \le y

所以,c[x]c[x]c[y]c[y] 不交。

有了这三条性质的铺垫,我们接下来看树状数组的树形态(请忽略 aacc 的连边)。

事实上,树状数组的树形态是 xxx+lowbit(x)x + \operatorname{lowbit}(x) 连边得到的图,其中 x+lowbit(x)x + \operatorname{lowbit}(x)xx 的父亲。

注意,在考虑树状数组的树形态时,我们不考虑树状数组大小的影响,即我们认为这是一棵无限大的树,方便分析。实际实现时,我们只需用到 xnx \le nc[x]c[x],其中 nn 是原数组长度。

这棵树天然满足了很多美好性质,下面列举若干(设 fa[u]fa[u] 表示 uu 的直系父亲):

  • u<fa[u]u < fa[u]
  • uu 大于任何一个 uu 的后代,小于任何一个 uu 的祖先。
  • uulowbit\operatorname{lowbit} 严格小于 fa[u]fa[u]lowbit\operatorname{lowbit}

"证明" 设 y=x+lowbit(x)y = x + \operatorname{lowbit}(x)x=s×2k+1+2kx = s \times 2^{k + 1} + 2^k,则 y=(s+1)×2k+1y = (s + 1) \times 2^{k +1},不难发现 lowbit(y)2k+1>lowbit(x)\operatorname{lowbit}(y) \ge 2^{k + 1} > \operatorname{lowbit}(x),证毕。

  • xx 的高度是 log2lowbit(x)\log_2\operatorname{lowbit}(x),即 xx 二进制最低位 1 的位数。

"高度的定义" 点 xx 的高度 h(x)h(x) 满足:如果 xmod2=1x \bmod 2 = 1,则 h(x)=0h(x) = 0,否则 h(x)=max(h(y))+1h(x) = \max(h(y)) + 1,其中 yy 代表 xx 的所有儿子(此时 xx 至少存在一个儿子 x1x - 1)。

也就是说,一个点的高度恰好比它最高的那个儿子再高 11。如果一个点没有儿子,它的高度是 00

这里引出高度这一概念,是为后面解释复杂度更方便。

  • c[u]c[u] 真包含于 c[fa[u]]c[fa[u]](性质 22)。
  • c[u]c[u] 真包含于 c[v]c[v],其中 vvuu 的任一祖先(在上一条性质上归纳)。
  • c[u]c[u] 真包含 c[v]c[v],其中 vvuu 的任一后代(上面那条性质 uuvv 颠倒)。
  • 对于任意 v>uv' > u,若 vv' 不是 uu 的祖先,则 c[u]c[u]c[v]c[v'] 不交。

"证明" uuuu 的祖先中,一定存在一个点 vv 使得 v<v<fa[v]v < v' < fa[v],根据性质 33c[v]c[v'] 不相交于 c[v]c[v],而 c[v]c[v] 包含 c[u]c[u],因此 c[v]c[v'] 不交于 c[u]c[u]

  • 对于任意 v<uv < u,如果 vv 不在 uu 的子树上,则 c[u]c[u]c[v]c[v] 不交(上面那条性质 uuvv' 颠倒)。
  • 对于任意 v>uv > u,当且仅当 vvuu 的祖先,c[u]c[u] 真包含于 c[v]c[v](上面几条性质的总结)。这就是树状数组单点修改的核心原理。
  • u=s×2k+1+2ku = s \times 2^{k + 1} + 2^k,则其儿子数量为 k=log2lowbit(u)k = \log_2\operatorname{lowbit}(u),编号分别为 u2t(0t<k)u - 2^t(0 \le t < k)
    • 举例:假设 k=3k = 3uu 的二进制编号为 ...1000,则 uu 有三个儿子,二进制编号分别为 ...0111...0110...0100

"证明" 在一个数 xx 的基础上减去 2t2^txx 二进制第 tt 位会反转,而更低的位保持不变。

考虑 uu 的儿子 vv,有 v+lowbit(v)=uv + \operatorname{lowbit}(v) = u,即 v=u2tv = u - 2^tlowbit(v)=2t\operatorname{lowbit}(v) = 2^t。设 u=s×2k+1+2ku = s \times 2^{k + 1} + 2^k

考虑 0t<k\boldsymbol{0 \le t < k}uu 的第 tt 位及后方均为 00,所以 v=u2tv = u - 2^t 的第 tt 位变为 11,后面仍为 00满足 lowbit(v)=2t\operatorname{lowbit}(v) = 2^t

考虑 t=k\boldsymbol{t = k},则 v=u2kv = u - 2^kvv 的第 kk 位变为 00不满足 lowbit(v)=2t\operatorname{lowbit}(v) = 2^t

考虑 t>k\boldsymbol{t > k},则 v=u2tv = u - 2^tvv 的第 kk 位是 11,所以 lowbit(v)=2k\operatorname{lowbit}(v) = 2^k不满足 lowbit(v)=2t\operatorname{lowbit}(v) = 2^t

  • uu 的所有儿子对应 cc 的管辖区间恰好拼接成 [l(u),u1][l(u), u - 1]
    • 举例:假设 k=3k = 3uu 的二进制编号为 ...1000,则 uu 有三个儿子,二进制编号分别为 ...0111...0110...0100
    • c[...0100] 表示 a[...0001 ~ ...0100]
    • c[...0110] 表示 a[...0101 ~ ...0110]
    • c[...0111] 表示 a[...0111 ~ ...0111]
    • 不难发现上面是三个管辖区间的并集恰好是 a[...0001 ~ ...0111],即 [l(u),u1][l(u), u - 1]

"证明" uu 的儿子总能表示成 u2t(0t<k)u - 2^t(0 \le t < k),不难发现,tt 越小,u2tu - 2^t 越大,代表的区间越靠右。我们设 f(t)=u2tf(t) = u - 2^t,则 f(k1),f(k2),,f(0)f(k - 1), f(k - 2), \ldots, f(0) 分别构成 uu 从左到右的儿子。

不难发现 lowbit(f(t))=2t\operatorname{lowbit}(f(t)) = 2^t,所以 l(f(t))=u2t2t+1=u2t+1+1l(f(t)) = u - 2^t - 2^t + 1 = u - 2^{t + 1} + 1

考虑相邻的两个儿子 f(t+1)f(t + 1)f(t)f(t)。前者管辖区间的右端点是 f(t+1)=u2t+1f(t + 1) = u - 2^{t + 1},后者管辖区间的左端点是 l(f(t))=u2t+1+1l(f(t)) = u - 2^{t + 1} + 1,恰好相接。

考虑最左面的儿子 f(k1)f(k - 1),其管辖左边界 l(f(k1))=u2k+1l(f(k - 1)) = u - 2^k + 1 恰为 l(u)l(u)

考虑最右面的儿子 f(0)f(0),其管辖右边界就是 u1u - 1

因此,这些儿子的管辖区间可以恰好拼成 [l(u),u1][l(u), u - 1]

单点修改

现在来考虑如何单点修改 a[x]a[x]

我们的目标是快速正确地维护 cc 数组。为保证效率,我们只需遍历并修改管辖了 a[x]a[x] 的所有 c[y]c[y],因为其他的 cc 显然没有发生变化。

管辖 a[x]a[x]c[y]c[y] 一定包含 c[x]c[x](根据性质 11),所以 yy 在树状数组树形态上是 xx 的祖先。因此我们从 xx 开始不断跳父亲,直到跳得超过了原数组长度为止。

nn 表示 aa 的大小,不难写出单点修改 a[x]a[x] 的过程:

  • 初始令 x=xx' = x
  • 修改 c[x]c[x']
  • xx+lowbit(x)x' \gets x' + \operatorname{lowbit}(x'),如果 x>nx' > n 说明已经跳到尽头了,终止循环;否则回到第二步。

区间信息和单点修改的种类,共同决定 c[x]c[x'] 的修改方式。下面给几个例子:

  • c[x]c[x'] 维护区间和,修改种类是将 a[x]a[x] 加上 pp,则修改方式则是将所有 c[x]c[x'] 也加上 pp
  • c[x]c[x'] 维护区间积,修改种类是将 a[x]a[x] 乘上 pp,则修改方式则是将所有 c[x]c[x'] 也乘上 pp

然而,单点修改的自由性使得修改的种类和维护的信息不一定是同种运算,比如,若 c[x]c[x'] 维护区间和,修改种类是将 a[x]a[x] 赋值为 pp,可以考虑转化为将 a[x]a[x] 加上 pa[x]p - a[x]。如果是将 a[x]a[x] 乘上 pp,就考虑转化为 a[x]a[x] 加上 a[x]×pa[x]a[x] \times p - a[x]

下面以维护区间和,单点加为例给出实现。

"实现" C++

        void add(int x, int k) {
          while (x <= n) {  // 不能越界
            c[x] = c[x] + k;
            x = x + lowbit(x);
          }
        }
Python
        def add(x, k):
            while x <= n:  # 不能越界
                c[x] = c[x] + k
                x = x + lowbit(x)

建树

也就是根据最开始给出的序列,将树状数组建出来(cc 全部预处理好)。

一般可以直接转化为 nn 次单点修改,时间复杂度 Θ(nlogn)\Theta(n \log n)(复杂度分析在后面)。

比如给定序列 a=(5,1,4)a = (5, 1, 4) 要求建树,直接看作对 a[1]a[1] 单点加 55,对 a[2]a[2] 单点加 11,对 a[3]a[3] 单点加 44 即可。

也有 Θ(n)\Theta(n) 的建树方法,见本页面 Θ(n)\Theta(n) 建树 一节。

复杂度分析

空间复杂度显然 Θ(n)\Theta(n)

时间复杂度:

  • 对于区间查询操作:整个 xxlowbit(x)x \gets x - \operatorname{lowbit}(x) 的迭代过程,可看做将 xx 二进制中的所有 11,从低位到高位逐渐改成 00 的过程,拆分出的区间数等于 xx 二进制中 11 的数量(即 popcount(x)\operatorname{popcount}(x))。因此,单次查询时间复杂度是 Θ(logn)\Theta(\log n)
  • 对于单点修改操作:跳父亲时,访问到的高度一直严格增加,且始终有 xnx \le n。由于点 xx 的高度是 log2lowbit(x)\log_2\operatorname{lowbit}(x),所以跳到的高度不会超过 log2n\log_2n,所以访问到的 cc 的数量是 logn\log n 级别。因此,单次单点修改复杂度是 Θ(logn)\Theta(\log n)

区间加区间和

前置知识:前缀和 & 差分

该问题可以使用两个树状数组维护差分数组解决。

考虑序列 aa 的差分数组 dd,其中 d[i]=a[i]a[i1]d[i] = a[i] - a[i - 1]。由于差分数组的前缀和就是原数组,所以 ai=j=1idja_i=\sum_{j=1}^i d_j

一样地,我们考虑将查询区间和通过差分转化为查询前缀和。那么考虑查询 a[1r]a[1 \ldots r] 的和,即 i=1rai\sum_{i=1}^{r} a_i,进行推导:

i=1rai=i=1rj=1idj \begin{aligned} &\sum_{i=1}^{r} a_i\\=&\sum_{i=1}^r\sum_{j=1}^i d_j \end{aligned}

观察这个式子,不难发现每个 djd_j 总共被加了 rj+1r - j + 1 次。接着推导:

i=1rj=1idj=i=1rdi×(ri+1)=i=1rdi×(r+1)i=1rdi×i \begin{aligned} &\sum_{i=1}^r\sum_{j=1}^i d_j\\=&\sum_{i=1}^r d_i\times(r-i+1) \\=&\sum_{i=1}^r d_i\times (r+1)-\sum_{i=1}^r d_i\times i \end{aligned}

i=1rdi\sum_{i=1}^r d_i 并不能推出 i=1rdi×i\sum_{i=1}^r d_i \times i 的值,所以要用两个树状数组分别维护 did_idi×id_i \times i 的和信息。

那么怎么做区间加呢?考虑给原数组 a[lr]a[l \ldots r] 区间加 xxdd 带来的影响。

因为差分是 d[i]=a[i]a[i1]d[i] = a[i] - a[i - 1]

  • a[l]a[l] 多了 vva[l1]a[l - 1] 不变,所以 d[l]d[l] 的值多了 vv
  • a[r+1]a[r + 1] 不变而 a[r]a[r] 多了 vv,所以 d[r+1]d[r + 1] 的值少了 vv
  • 对于不等于 ll 且不等于 r+1r+1 的任意 iia[i]a[i]a[i1]a[i - 1] 要么都没发生变化,要么都加了 vva[i]+v(a[i1]+v)a[i] + v - (a[i - 1] + v) 还是 a[i]a[i1]a[i] - a[i - 1],所以其它的 d[i]d[i] 均不变。

那就不难想到维护方式了:对于维护 did_i 的树状数组,对 ll 单点加 vvr+1r + 1 单点加 v-v;对于维护 di×id_i \times i 的树状数组,对 ll 单点加 v×lv \times lr+1r + 1 单点加 v×(r+1)-v \times (r + 1)

而更弱的问题,「区间加求单点值」,只需用树状数组维护一个差分数组 did_i。询问 a[x]a[x] 的单点值,直接求 d[1x]d[1 \ldots x] 的和即可。

这里直接给出「区间加区间和」的代码:

"实现" C++

        int t1[MAXN], t2[MAXN], n;
        
        int lowbit(int x) { return x & (-x); }
        
        void add(int k, int v) {
          int v1 = k * v;
          while (k <= n) {
            t1[k] += v, t2[k] += v1;
            // 注意不能写成 t2[k] += k * v,因为 k 的值已经不是原数组的下标了
            k += lowbit(k);
          }
        }
        
        int getsum(int *t, int k) {
          int ret = 0;
          while (k) {
            ret += t[k];
            k -= lowbit(k);
          }
          return ret;
        }
        
        void add1(int l, int r, int v) {
          add(l, v), add(r + 1, -v);  // 将区间加差分为两个前缀加
        }
        
        long long getsum1(int l, int r) {
          return (r + 1ll) * getsum(t1, r) - 1ll * l * getsum(t1, l - 1) -
                 (getsum(t2, r) - getsum(t2, l - 1));
        }
Python
        t1 = [0] * MAXN, t2 = [0] * MAXN; n = 0
        
        def lowbit(x):
            return x & (-x)
        
        def add(k, v):
            v1 = k * v
            while k <= n:
                t1[k] = t1[k] + v; t2[k] = t2[k] + v1
                k = k + lowbit(k)
        
        def getsum(t, k):
            ret = 0
            while k:
                ret = ret + t[k]
                k = k - lowbit(k)
            return ret
        
        def add1(l, r, v):
            add(l, v)
            add(r + 1, -v)
        
        def getsum1(l, r):
            return (r) * getsum(t1, r) - l * getsum(t1, l - 1) - \
                  (getsum(t2, r) - getsum(t2, l - 1))

根据这个原理,应该可以实现「区间乘区间积」,「区间异或一个数,求区间异或值」等,只要满足维护的信息和区间操作是同种运算即可,感兴趣的读者可以自己尝试。

二维树状数组

单点修改,子矩阵查询

二维树状数组,也被称作树状数组套树状数组,用来维护二维数组上的单点修改和前缀信息问题。

与一维树状数组类似,我们用 c(x,y)c(x, y) 表示 a(xlowbit(x)+1,ylowbit(y)+1)a(x,y)a(x - \operatorname{lowbit}(x) + 1, y - \operatorname{lowbit}(y) + 1) \ldots a(x, y) 的矩阵总信息,即一个以 a(x,y)a(x, y) 为右下角,高 lowbit(x)\operatorname{lowbit}(x),宽 lowbit(y)\operatorname{lowbit}(y) 的矩阵的总信息。

对于单点修改,设:

f(x,i)={xi=0f(x,i1)+lowbit(f(x,i1))i>0 f(x, i) = \begin{cases}x &i = 0\\f(x, i - 1) + \operatorname{lowbit}(f(x, i - 1)) & i > 0\\\end{cases}

f(x,i)f(x, i)xx 在树状数组树形态上的第 ii 级祖先(第 00 级祖先是自己)。

则只有 c(f(x,i),f(y,j))c(f(x, i), f(y, j)) 中的元素管辖 a(x,y)a(x, y),修改 a(x,y)a(x, y) 时只需修改所有 c(f(x,i),f(y,j))c(f(x, i), f(y, j)),其中 f(x,i)nf(x, i) \le nf(y,j)mf(y, j) \le m

"正确性证明" c(p,q)c(p, q) 管辖 a(x,y)a(x, y),求 ppqq 的取值范围。

考虑一个大小为 nn 的一维树状数组 c1c_1(对应原数组 a1a_1)和一个大小为 mm 的一维树状数组 c2c_2(对应原数组 a2a_2)。

则命题等价为:c1(p)c_1(p) 管辖 a1[x]a_1[x]c2(q)c_2(q) 管辖 a2[y]a_2[y] 的条件。

也就是说,在树状数组树形态上,ppxx 及其祖先中的一个点,qqyy 及其祖先中的一个点。

所以 p=f(x,i)p = f(x, i)q=f(y,j)q = f(y, j)

对于查询,我们设:

g(x,i)={xi=0g(x,i1)lowbit(g(x,i1))i,g(x,i1)>00otherwise. g(x, i) = \begin{cases}x &i = 0\\g(x, i - 1) - \operatorname{lowbit}(g(x, i - 1)) & i, g(x, i - 1) > 0\\0&\text{otherwise.}\end{cases}

则合并所有 c(g(x,i),g(y,j))c(g(x, i), g(y, j)),其中 g(x,i),g(y,j)>0g(x, i), g(y, j) > 0

"正确性证明" 设 \circ 表示合并两个信息的运算符(比如,如果信息是区间和,则 =+\circ = +)。

考虑一个一维树状数组 c1c_1c1[g(x,0)]c1[g(x,1)]c1[g(x,2)]c_1[g(x, 0)] \circ c_1[g(x, 1)] \circ c_1[g(x, 2)] \circ \cdots 恰好表示原数组上 [1x][1 \ldots x] 这段区间信息。

类似地,设 t(x)=c(x,g(y,0))c(x,g(y,1))c(x,g(y,2))t(x) = c(x, g(y, 0)) \circ c(x, g(y, 1)) \circ c(x, g(y, 2)) \circ \cdots,则 t(x)t(x) 恰好表示 a(xlowbit(x)+1,1)a(x,y)a(x - \operatorname{lowbit}(x) + 1, 1) \ldots a(x, y) 这个矩阵信息。

又类似地,就有 t(g(x,0))t(g(x,1))t(g(x,2))t(g(x, 0)) \circ t(g(x, 1)) \circ t(g(x, 2)) \circ \cdots 表示 a(1,1)a(x,y)a(1, 1) \ldots a(x, y) 这个矩阵信息。

其实这里 t(x)t(x) 这个函数如果看成一个树状数组,相当于一个树状数组套了一个树状数组,这也就是「树状数组套树状数组」这个名字的来源。

下面给出单点加、查询子矩阵和的代码。

"实现"

"单点加"

        void add(int x, int y, int v) {
          for (int i = x; i <= n; i += lowbit(i)) {
            for (int j = y; j <= m; j += lowbit(j)) {
              // 注意这里必须得建循环变量,不能像一维数组一样直接 while (x <= n) 了
              c[i][j] += v;
            }
          }
        }

"查询子矩阵和"

        int sum(int x, int y) {
          int res = 0;
          for (int i = x; i > 0; i -= lowbit(i)) {
            for (int j = y; j > 0; j -= lowbit(j)) {
              res += c[i][j];
            }
          }
          return res;
        }
        
        int ask(int x1, int y1, int x2, int y2) {
          // 查询子矩阵和
          return sum(x2, y2) - sum(x2, y1 - 1) - sum(x1 - 1, y2) + sum(x1 - 1, y1 - 1);
        }

子矩阵加,求子矩阵和

前置知识:前缀和 & 差分 和本页面 区间加区间和 一节。

和一维树状数组的「区间加区间和」问题类似,考虑维护差分数组。

二维数组上的差分数组是这样的:

d(i,j)=a(i,j)a(i1,j)a(i,j1)+a(i1,j1) d(i, j) = a(i, j) - a(i - 1, j) - a(i, j - 1) + a(i - 1, j - 1)。

"为什么这么定义?" 这是因为,理想规定状态下,在差分矩阵上做二维前缀和应该得到原矩阵,因为这是一对逆运算。

二维前缀和的公式是这样的:

s(i,j)=s(i1,j)+s(i,j1)s(i1,j1)+a(i,j)s(i, j) = s(i - 1, j) + s(i, j - 1) - s(i - 1, j - 1) + a(i, j)

所以,设 aa 是原数组,dd 是差分数组,有:

a(i,j)=a(i1,j)+a(i,j1)a(i1,j1)+d(i,j)a(i, j) = a(i - 1, j) + a(i, j - 1) - a(i - 1, j - 1) + d(i, j)

移项就得到二维差分的公式了。

d(i,j)=a(i,j)a(i1,j)a(i,j1)+a(i1,j1)d(i, j) = a(i, j) - a(i - 1, j) - a(i, j - 1) + a(i - 1, j - 1)

这样以来,对左上角 (x1,y1)(x_1, y_1),右下角 (x2,y2)(x_2, y_2) 的子矩阵区间加 vv,相当于在差分数组上,对 d(x1,y1)d(x_1, y_1)d(x2+1,y2+1)d(x_2 + 1, y_2 + 1) 分别单点加 vv,对 d(x2+1,y1)d(x_2 + 1, y_1)d(x1,y2+1)d(x_1, y_2 + 1) 分别单点加 v-v

至于原因,把这四个 dd 分别用定义式表示出来,分析一下每项的变化即可。

举个例子吧,初始差分数组为 00,给 a(2,2)a(3,4)a(2, 2) \ldots a(3, 4) 子矩阵加 vv 后差分数组会变为:

(000000v00v000000v00v) \begin{pmatrix}0&0&0&0&0\\0&v&0&0&-v\\0&0&0&0&0\\0&-v&0&0&v\end{pmatrix}

(其中 a(2,2)a(3,4)a(2, 2) \ldots a(3, 4) 这个子矩阵恰好是上面位于中心的 2×32 \times 3 大小的矩阵。)

因此,子矩阵加的做法是:转化为差分数组上的四个单点加操作。

现在考虑查询子矩阵和:

对于点 (x,y)(x, y),它的二维前缀和可以表示为:

i=1xj=1yh=1ik=1jd(h,k) \sum_{i = 1}^x\sum_{j = 1}^y\sum_{h = 1}^i\sum_{k = 1}^j d(h, k)

原因就是差分的前缀和的前缀和就是原本的前缀和。

和一维树状数组的「区间加区间和」问题类似,统计 d(h,k)d(h, k) 的出现次数,为 (xh+1)×(yk+1)(x - h + 1) \times (y - k + 1)

然后接着推导:

i=1xj=1yh=1ik=1jd(h,k)=i=1xj=1yd(i,j)×(xi+1)×(yj+1)=i=1xj=1yd(i,j)×(xy+x+y+1)d(i,j)×i×(y+1)d(i,j)×j×(x+1)+d(i,j)×i×j \begin{aligned} &\sum_{i = 1}^x\sum_{j = 1}^y\sum_{h = 1}^i\sum_{k = 1}^j d(h, k) \\=&\sum_{i = 1}^x\sum_{j = 1}^y d(i, j) \times (x - i + 1) \times (y - j + 1) \\=&\sum_{i = 1}^x\sum_{j = 1}^y d(i, j) \times (xy + x + y + 1) - d(i, j) \times i \times (y + 1) - d(i, j) \times j \times (x + 1) + d(i, j) \times i \times j \end{aligned}

所以我们需维护四个树状数组,分别维护 d(i,j)d(i, j)d(i,j)×id(i, j) \times id(i,j)×jd(i, j) \times jd(i,j)×i×jd(i, j) \times i \times j 的和信息。

当然了,和一维同理,如果只需要子矩阵加求单点值,维护一个差分数组然后询问前缀和就足够了。

下面给出代码:

"实现"

    typedef long long ll;
    ll t1[N][N], t2[N][N], t3[N][N], t4[N][N];
    
    void add(ll x, ll y, ll z) {
      for (int X = x; X <= n; X += lowbit(X))
        for (int Y = y; Y <= m; Y += lowbit(Y)) {
          t1[X][Y] += z;
          t2[X][Y] += z * x;  // 注意是 z * x 而不是 z * X,后面同理
          t3[X][Y] += z * y;
          t4[X][Y] += z * x * y;
        }
    }
    
    void range_add(ll xa, ll ya, ll xb, ll yb,
                   ll z) {  //(xa, ya) 到 (xb, yb) 子矩阵
      add(xa, ya, z);
      add(xa, yb + 1, -z);
      add(xb + 1, ya, -z);
      add(xb + 1, yb + 1, z);
    }
    
    ll ask(ll x, ll y) {
      ll res = 0;
      for (int i = x; i; i -= lowbit(i))
        for (int j = y; j; j -= lowbit(j))
          res += (x + 1) * (y + 1) * t1[i][j] - (y + 1) * t2[i][j] -
                 (x + 1) * t3[i][j] + t4[i][j];
      return res;
    }
    
    ll range_ask(ll xa, ll ya, ll xb, ll yb) {
      return ask(xb, yb) - ask(xb, ya - 1) - ask(xa - 1, yb) + ask(xa - 1, ya - 1);
    }

权值树状数组及应用

我们知道,普通树状数组直接在原序列的基础上构建,c6c_6 表示的就是 a[56]a[5 \ldots 6] 的区间信息。

然而事实上,我们还可以在原序列的权值数组上构建树状数组,这就是权值树状数组。

"什么是权值数组?" 一个序列 aa 的权值数组 bb,满足 b[x]b[x] 的值为 xxaa 中的出现次数。

例如:a=(1,3,4,3,4)a = (1, 3, 4, 3, 4) 的权值数组为 b=(1,0,2,2)b = (1, 0, 2, 2)

很明显,bb 的大小和 aa 的值域有关。

若原数列值域过大,且重要的不是具体值而是值与值之间的相对大小关系,常 离散化 原数组后再建立权值数组。

另外,权值数组是原数组无序性的一种表示:它重点描述数组的元素内容,忽略了数组的顺序,若两数组只是顺序不同,所含内容一致,则它们的权值数组相同。

因此,对于给定数组的顺序不影响答案的问题,在权值数组的基础上思考一般更直观,比如 [NOIP2021] 数列open in new window

运用权值树状数组,我们可以解决一些经典问题。

单点修改,查询全局第 kk

在此处只讨论第 kk 小,第 kk 大问题可以通过简单计算转化为第 kk 小问题。

该问题可离散化,如果原序列 aa 值域过大,离散化后再建立权值数组 bb。注意,还要把单点修改中的涉及到的值也一起离散化,不能只离散化原数组 aa 中的元素。

对于单点修改,只需将对原数列的单点修改转化为对权值数组的单点修改即可。具体来说,原数组 a[x]a[x]yy 修改为 zz,转化为对权值数组 bb 的单点修改就是 b[y]b[y] 单点减 11b[z]b[z] 单点加 11

对于查询第 kk 小,考虑二分 xx,查询权值数组中 [1,x][1, x] 的前缀和,找到 x0x_0 使得 [1,x0][1, x_0] 的前缀和 <k< k[1,x0+1][1, x_0 + 1] 的前缀和 k\ge k,则第 kk 大的数是 x0+1x_0 + 1(注:这里认为 [1,0][1, 0] 的前缀和是 00)。

这样做时间复杂度是 Θ(log2n)\Theta(\log^2n) 的。

考虑用倍增替代二分。

x=0x = 0sum=0\mathrm{sum} = 0,枚举 iilog2n\log_2n 降为 00

  • 查询权值数组中 [x+1x+2i][x + 1 \ldots x + 2^i] 的区间和 tt
  • 如果 sum+t<k\mathrm{sum} + t < k,扩展成功,xx+2ix \gets x + 2^isumsum+t\mathrm{sum} \gets \mathrm{sum} + t;否则扩展失败,不操作。

这样得到的 xx 是满足 [1x][1 \ldots x] 前缀和 <k< k 的最大值,所以最终 x+1x + 1 就是答案。

看起来这种方法时间效率没有任何改善,但事实上,查询 [x+1x+2i][x + 1 \ldots x + 2^i] 的区间和只需访问 c[x+2i]c[x + 2^i] 的值即可。

原因很简单,考虑 lowbit(x+2i)\operatorname{lowbit}(x + 2^i),它一定是 2i2^i,因为 xx 之前只累加过 2j2^j 满足 j>ij > i。因此 c[x+2i]c[x + 2^i] 表示的区间就是 [x+1x+2i][x + 1 \ldots x + 2^i]

如此一来,时间复杂度降低为 Θ(logn)\Theta(\log n)

"实现" C++

        // 权值树状数组查询第 k 小
        int kth(int k) {
          int sum = 0, x = 0;
          for (int i = log2(n); ~i; --i) {
            x += 1 << i;                    // 尝试扩展
            if (x >= n || sum + t[x] >= k)  // 如果扩展失败
              x -= 1 << i;
            else
              sum += t[x];
          }
          return x + 1;
        }
Python
        # 权值树状数组查询第 k 小
        def kth(k):
            sum = 0
            x = 0
            i = int(log2(n))
            while ~i:
                x = x + (1 << i)  # 尝试扩展
                if x >= n or sum + t[x] >= k:  # 如果扩展失败
                    x = x - (1 << i)
                else:
                    sum = sum + t[x]
                i = i - 1
            return x + 1

全局逆序对(全局二维偏序)

全局逆序对也可以用权值树状数组巧妙解决。问题是这样的:给定长度为 nn 的序列 aa,求 aa 中满足 i<ji < ja[i]>a[j]a[i] > a[j] 的数对 (i,j)(i, j) 的数量。

该问题可离散化,如果原序列 aa 值域过大,离散化后再建立权值数组 bb

我们考虑从 nn11 倒序枚举 ii,作为逆序对中第一个元素的索引,然后计算有多少个 j>ij > i 满足 a[j]<a[i]a[j] < a[i],最后累计答案即可。

事实上,我们只需要这样做(设当前 a[i]=xa[i] = x):

  • 查询 b[1x1]b[1 \ldots x - 1] 的前缀和,即为左端点为 a[i]a[i] 的逆序对数量。
  • b[x]b[x] 自增 11

原因十分自然:出现在 b[1x1]b[1 \ldots x-1] 中的元素一定比当前的 x=a[i]x = a[i] 小,而 ii 的倒序枚举,自然使得这些已在权值数组中的元素,在原数组上的索引 jj 大于当前遍历到的索引 ii

用例子说明,a=(4,3,1,2,1)a = (4, 3, 1, 2, 1)

ii 按照 515 \to 1 扫:

  • a[5]=1a[5] = 1,查询 b[10]b[1 \ldots 0] 前缀和,为 00b[1]b[1] 自增 11b=(1,0,0,0)b = (1, 0, 0, 0)
  • a[4]=2a[4] = 2,查询 b[11]b[1 \ldots 1] 前缀和,为 11b[2]b[2] 自增 11b=(1,1,0,0)b = (1, 1, 0, 0)
  • a[3]=1a[3] = 1,查询 b[10]b[1 \ldots 0] 前缀和,为 00b[1]b[1] 自增 11b=(2,1,0,0)b = (2, 1, 0, 0)
  • a[2]=3a[2] = 3,查询 b[12]b[1 \ldots 2] 前缀和,为 33b[3]b[3] 自增 11b=(2,1,1,0)b = (2, 1, 1, 0)
  • a[1]=4a[1] = 4,查询 b[13]b[1 \ldots 3] 前缀和,为 44b[4]b[4] 自增 11b=(2,1,1,1)b = (2, 1, 1, 1)

所以最终答案为 0+1+0+3+4=80 + 1 + 0 + 3 + 4 = 8

注意到,遍历 ii 后的查询 b[1x1]b[1 \ldots x - 1] 和自增 b[x]b[x] 的两个步骤可以颠倒,变成先自增 b[x]b[x] 再查询 b[1x1]b[1 \ldots x - 1],不影响答案。两个角度来解释:

  • b[x]b[x] 的修改不影响对 b[1x1]b[1 \ldots x - 1] 的查询。
  • 颠倒后,实质是在查询 iji \le ja[i]>a[j]a[i] > a[j] 的数对数量,而 i=ji = j 时不存在 a[i]>a[j]a[i] > a[j],所以 iji \le j 相当于 i<ji < j,所以这与原来的逆序对问题是等价的。

如果查询非严格逆序对(i<ji < ja[i]a[j]a[i] \ge a[j])的数量,那就要改为查询 b[1x]b[1 \ldots x] 的和,这时就不能颠倒两步了,还是两个角度来解释:

  • b[x]b[x] 的修改 影响b[1x]b[1 \ldots x] 的查询。
  • 颠倒后,实质是在查询 iji \le ja[i]a[j]a[i] \ge a[j] 的数对数量,而 i=ji = j 时恒有 a[i]a[j]a[i] \ge a[j],所以 iji \le j 不相当于 i<ji < j,与原问题 不等价

如果查询 iji \le ja[i]a[j]a[i] \ge a[j] 的数对数量,那这两步就需要颠倒了。

另外,对于原逆序对问题,还有一种做法是正着枚举 jj,查询有多少 i<ji < j 满足 a[i]>a[j]a[i] > a[j]。做法如下(设 x=a[j]x = a[j]):

  • 查询 b[x+1V]b[x + 1 \ldots V]VVbb 的大小,即 aa 的值域(或离散化后的值域))的区间和。
  • b[x]b[x] 自增 11

原因:出现在 b[x+1V]b[x + 1 \ldots V] 中的元素一定比当前的 x=a[j]x = a[j] 大,而 jj 的正序枚举,自然使得这些已在权值数组中的元素,在原数组上的索引 ii 小于当前遍历到的索引 jj

树状数组维护不可差分信息

比如维护区间最值等。

注意,这种方法虽然码量小,但单点修改和区间查询的时间复杂度均为 Θ(log2n)\Theta(\log^2n),比使用线段树的时间复杂度 Θ(logn)\Theta(\log n) 劣。

区间查询

我们还是基于之前的思路,从 rr 沿着 lowbit\operatorname{lowbit} 一直向前跳,但是我们不能跳到 ll 的左边。

因此,如果我们跳到了 c[x]c[x],先判断下一次要跳到的 xlowbit(x)x - \operatorname{lowbit}(x) 是否小于 ll

  • 如果小于 ll,我们直接把 a[x]\boldsymbol{a[x]} 单点 合并到总信息里,然后跳到 c[x1]c[x - 1]
  • 如果大于等于 ll,说明没越界,正常合并 c[x]c[x],然后跳到 c[xlowbit(x)]c[x - \operatorname{lowbit}(x)] 即可。

下面以查询区间最大值为例,给出代码:

"实现"

    int getmax(int l, int r) {
      int ans = 0;
      while (r >= l) {
        ans = max(ans, a[r]);
        --r;
        for (; r - lowbit(r) >= l; r -= lowbit(r)) {
          // 注意,循环条件不要写成 r - lowbit(r) + 1 >= l
          // 否则 l = 1 时,r 跳到 0 会死循环
          ans = max(ans, C[r]);
        }
      }
      return ans;
    }

可以证明,上述算法的时间复杂度是 Θ(log2n)\Theta(\log^2n)

"时间复杂度证明" 考虑 rrll 不同的最高位,一定有 rr 在这一位上为 11ll 在这一位上为 00(因为 rlr \ge l)。

如果 rr 在这一位的后面仍然有 11,一定有 rlowbit(r)lr - \operatorname{lowbit}(r) \ge l,所以下一步一定是把 rr 的最低位 11 填为 00

如果 rr 的这一位 11 就是 rr 的最低位 11,无论是 rrlowbit(r)r \gets r - \operatorname{lowbit}(r) 还是 rr1r \gets r - 1rr 的这一位 11 一定会变为 00

因此,rr 经过至多 logn\log n 次变换后,rrll 不同的最高位一定可以下降一位。所以,总时间复杂度是 Θ(log2n)\Theta(\log^2n)

单点更新

"注" 请先理解树状数组树形态的以下两条性质,再学习本节。

  • u=s×2k+1+2ku = s \times 2^{k + 1} + 2^k,则其儿子数量为 k=log2lowbit(u)k = \log_2\operatorname{lowbit}(u),编号分别为 u2t(0t<k)u - 2^t(0 \le t < k)
  • uu 的所有儿子对应 cc 的管辖区间恰好拼接成 [l(u),u1][l(u), u - 1]

关于这两条性质的含义及证明,都可以在本页面的 树状数组与其树形态的性质 一节找到。

更新 a[x]a[x] 后,我们只需要更新满足在树状数组树形态上,满足 yyxx 的祖先的 c[y]c[y]

对于最值(以最大值为例),一种常见的错误想法是,如果 a[x]a[x] 修改成 pp,则将所有 c[y]c[y] 更新为 max(c[y],p)\max(c[y], p)。下面是一个反例:(1,2,3,4,5)(1, 2, 3, 4, 5) 中将 55 修改成 44,最大值是 44,但按照上面的修改这样会得到 55。将 c[y]c[y] 直接修改为 pp 也是错误的,一个反例是,将上面例子中的 33 修改为 44

事实上,对于不可差分信息,不存在通过 pp 直接修改 c[y]c[y] 的方式。这是因为修改本身就相当于是把旧数从原区间「移除」,然后加入一个新数。「移除」时对区间信息的影响,相当于做「逆运算」,而不可差分信息不存在「逆运算」,所以无法直接修改 c[y]c[y]

换句话说,对每个受影响的 c[y]c[y],这个区间的信息我们必定要重构了。

考虑 c[y]c[y] 的儿子们,它们的信息一定是正确的(因为我们先更新儿子再更新父亲),而这些儿子又恰好组成了 [l(y),y1][l(y), y - 1] 这一段管辖区间,那再合并一个单点 a[y]a[y] 就可以合并出 [l(y),y][l(y), y],也就是 c[y]c[y] 了。这样,我们能用至多 logn\log n 个区间重构合并出每个需要修改的 cc

"实现"

    void update(int x, int v) {
      a[x] = v;
      for (int i = x; i <= n; i += lowbit(i)) {
        // 枚举受影响的区间
        C[i] = a[i];
        for (int j = 1; j < lowbit(i); j *= 2) {
          C[i] = max(C[i], C[i - j]);
        }
      }
    }

容易看出上述算法时间复杂度为 Θ(log2n)\Theta(\log^2n)

建树

可以考虑拆成 nn 个单点修改,Θ(nlog2n)\Theta(n\log^2n) 建树。

也有 Θ(n)\Theta(n) 的建树方法,见本页面 Θ(n)\Theta(n) 建树 一节的方法一。

Tricks

Θ(n)\Theta(n) 建树

以维护区间和为例。

方法一:

每一个节点的值是由所有与自己直接相连的儿子的值求和得到的。因此可以倒着考虑贡献,即每次确定完儿子的值后,用自己的值更新自己的直接父亲。

"实现" C++

        // Θ(n) 建树
        void init() {
          for (int i = 1; i <= n; ++i) {
            t[i] += a[i];
            int j = i + lowbit(i);
            if (j <= n) t[j] += t[i];
          }
        }
Python
        # Θ(n) 建树
        def init():
            for i in range(1, n + 1):
                t[i] = t[i] + a[i]
                j = i + lowbit(i)
                if j <= n:
                    t[j] = t[j] + t[i]

方法二:

前面讲到 c[i]c[i] 表示的区间是 [ilowbit(i)+1,i][i-\operatorname{lowbit}(i)+1, i],那么我们可以先预处理一个 sum\mathrm{sum} 前缀和数组,再计算 cc 数组。

"实现" C++

        // Θ(n) 建树
        void init() {
          for (int i = 1; i <= n; ++i) {
            t[i] = sum[i] - sum[i - lowbit(i)];
          }
        }
Python
        # Θ(n) 建树
        def init():
            for i in range(1, n + 1):
                t[i] = sum[i] - sum[i - lowbit(i)]

时间戳优化

对付多组数据很常见的技巧。若每次输入新数据都暴力清空树状数组,就可能会造成超时。因此使用 tag\mathrm{tag} 标记,存储当前节点上次使用时间(即最近一次是被第几组数据使用)。每次操作时判断这个位置 tag\mathrm{tag} 中的时间和当前时间是否相同,就可以判断这个位置应该是 00 还是数组内的值。

"实现" C++

        // 时间戳优化
        int tag[MAXN], t[MAXN], Tag;
        
        void reset() { ++Tag; }
        
        void add(int k, int v) {
          while (k <= n) {
            if (tag[k] != Tag) t[k] = 0;
            t[k] += v, tag[k] = Tag;
            k += lowbit(k);
          }
        }
        
        int getsum(int k) {
          int ret = 0;
          while (k) {
            if (tag[k] == Tag) ret += t[k];
            k -= lowbit(k);
          }
          return ret;
        }
Python
        # 时间戳优化
        tag = [0] * MAXN
        t = [0] * MAXN
        Tag = 0
        
        
        def reset():
            Tag = Tag + 1
        
        
        def add(k, v):
            while k <= n:
                if tag[k] != Tag:
                    t[k] = 0
                t[k] = t[k] + v
                tag[k] = Tag
                k = k + lowbit(k)
        
        
        def getsum(k):
            ret = 0
            while k:
                if tag[k] == Tag:
                    ret = ret + t[k]
                k = k - lowbit(k)
            return ret

例题