巧用“离散化”处理

离散化的本质就是映射，专门用于处理数据的值域比较大，个数比较少的情况，这时候我们的做法就是离散化：将这些间隔很大的点，映射到相邻的数组元素中，减少对空间的需求，也减少计算量。

离散化

值的范围比较大
值的个数比较少

这里可能会疑惑这和哈希有什么区别？

哈希表不能像离散化那样缩小数组的空间

核心问题

$A[]$ 可能存在重复，需要去重

vector<int> A;
sort(A.begin(), A.end());	// 排序
A.erase(unique(A.begin(), A.end()), A.end());	// 去除重复元素

如何计算离散化后的值？ ==> 二分

// 二分求出x对应离散化的值
int find(int x) {
    int l = 0, r = A.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (A[mid] >= x)
            r = mid;
       	l = mid + 1;
    }
    // 目的为了映射到 1 ~ n
    return r + 1;
}

区间和

假定有一个无限长的数轴，数轴上每个坐标上的数都是0。现在，我们首先进行 n 次操作，每次操作将某一位置x上的数加c。接下来，进行 m 次询问，每个询问包含两个整数l和r，你需要求出在区间[l, r]之间的所有数的和。

输入格式

第一行包含两个整数n和m。接下来 n 行，每行包含两个整数x和c。再接下里 m 行，每行包含两个整数l和r。

输出格式

共m行，每行输出一个询问中所求的区间内数字和。

数据范围

$−10^9≤x≤10^9, 1≤n,m≤10^5, −10^9≤l≤r≤10^9, −10000≤c≤10000$

输入样例：

输出样例：

8
0
5

分析：

数据分布在 $−10^9≤x≤10^9$ ，加数据的次数和查询的次数所涉及的数据不超过 $3 × 10^5$ ，离散化处理
开辟额外数组 $alls$ 存放所以要访问的数组下标，然后进行离散化
要访问该下标的时候，根据映射关系 $find(int\ x)$ 函数去访问离散化后的数组对应的值

#include <iostream>
#include <algorithm>
#include <vector>

using namespace std;

typedef pair<int, int> PII;

const int N = 300010;

int n, m;
int a[N], s[N];
vector<PII> add, query;
// 存放需要进行离散化的数据
vector<int> alls;

int find(int x) {
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (alls[mid] >= x) 
            r = mid;
        else 
            l = mid + 1;
    }
    // 映射到 1 ~ n
    return r + 1;
} 

int main() {
    cin >> n >> m;
    for (int i = 0; i < n; i++) {
        int x, c;
        cin >> x >> c;
        // 表示要在x的位置加上c
        add.push_back({x, c});
        // 存下要进行离散化处理的元素
        alls.push_back(x);
    }
    for (int i = 0; i < m; i++) {
        int l, r;
        cin >> l >> r;
        query.push_back({l, r});
        alls.push_back(l);
        alls.push_back(r);
    }
    // 去重
    sort(alls.begin(), alls.end());
    alls.erase(unique(alls.begin(), alls.end()), alls.end());
    for (auto item : add) {
        // 找到离散化的位置
        int x = find(item.first);
        a[x] += item.second;
    }
    // 预处理前缀和
    for (int i = 1; i <= alls.size(); i++) 
        s[i] = s[i - 1] + a[i];
    for (auto item : query) {
        int l = find(item.first);
        int r = find(item.second);
        cout << s[r] - s[l - 1] << endl;
    }
    return 0;
}

巧用“离散化”处理

离散化

区间和

感谢您的支持，我会继续努力的!