Всем привет! Хочу рассказать о достаточно простом приеме (не знаю как называется) для оптимизации динамики. Очень часто бывает так, что при пересчете нам надо искать минимум в какой-нибудь уже посчитанной таблице, но при этом игнорируя некоторое конечное количество строк и столбцов; как оптимизировать такое и подобное, описано в блоге.

Постановка задачи

Итак, у нас есть таблица, предположим, что большая — $$$N \times N$$$, и мы хотим сделать какое-то большое количество запросов вида «Найди максимальное значение в таблице, которое не лежит в столбцах из множества $$$C$$$ и строках из множества $$$R$$$», при этом для каждого запроса гарантируется, что $$$max ( |C|, |R| ) \leq K$$$, где $$$K$$$ -- какая-то очень маленькая константа. Эту задачу мы бы могли решать, например, с помощью двумерного ДО -- но это работает долго и занимает гораздо больше памяти.

Решается задача просто, давайте для начала, найдем $$$x_1$$$ — глобальный максимум в таблице и запомним его позицию $$$(i_1, j_1)$$$. Далее, при дальнейших запросах, возможен вариант, что либо $$$i_1 \in C$$$, либо $$$j_1 \in R$$$, поэтому давайте запустим два рекурсивных вызова, с поиском максимума в таблице, в одном из них запретив строку $$$i_1$$$, а в другом -- столбец $$$j_1$$$. Таким образом каждая рекурсивная функция считает максимум, в случае, если мы запрещаем столбцы $$$C'$$$ и строки $$$R'$$$. Заметим, что при $$$C' > k$$$ и $$$R' > k$$$ значения нам считать не надо, так что можно смело обрывать рекурсию.

реализация

struct Candidate {
    int value;
    int x, y;

    bool operator < (const Candidate& c) const {
        return value < c.value;
    }
};

Candidate get_neutral_candidate() {
    return Candidate { numeric_limits<int>::min(), -1, -1 };
}

struct CandidateSet {
    vector<Candidate> v;
    vector<pair<int, int>> go;

    // data -- исходный массив
    // kx -- максимальное количество запретов по строкам
    // ky -- максимальное количество запретов по столбцам
    CandidateSet(const vector<vector<int>>& data, int kx, int ky) {
        set<int> x, y;
        build(data, x, y, kx, ky);
    }

    int build(const vector<vector<int>>& data, set<int>& x, set<int>& y, int kx, int ky) {
        int res = v.size();

        v.push_back(get_neutral_candidate());
        go.emplace_back(-1, -1);

        for (int i = 0; i < data.size(); ++i) {
            if (x.count(i)) continue;
            for (int j = 0; j < data[i].size(); ++j) {
                if (y.count(j)) continue;
                v.back() = max(v.back(), Candidate { data[i][j], i, j });
            }
        }

        if (v[res].x == -1) {
            v.pop_back();
            go.pop_back();
            return -1;
        }

        if (kx != 0) {
            x.insert(v[res].x);
            go[res].first = build(data, x, y, kx - 1, ky);
            x.erase(v[res].x);
        }

        if (ky != 0) {
            y.insert(v[res].y);
            go[res].second = build(data, x, y, kx, ky - 1);
            y.erase(v[res].y);
        }

        return res;
    }

    Candidate get_max(int x, int y) {
        auto ans = get_neutral_candidate();
        for (auto& s : v) if (s.x != x && s.y != y) ans = max(ans, s);
        return ans;
    }

    Candidate get_max(const set<int>& x, const set<int>& y) {
        auto ans = get_neutral_candidate();
        for (auto& s : v) if (!x.count(s.x) && !y.count(s.y)) ans = max(ans, s);
        return ans;
    }
};

Чтобы в таком случае искать максимум можно просто пройтись по кандидатам $$$O(C_{2K}^K)$$$ или используя дерево рекурсивных вызовов пройтись по нему и найти максимум за $$$O(K)$$$, во всяком случае, вы понимаете, что это работает быстро. Да, кстати, по очевидным причинам алгоритм построения этой таблицы работает за $$$O(N^2 \cdot C_{2K}^K)$$$, и алгоритм является корректным. Почему? Ну потому что если вдруг глобальный максимум не будет запрещен по обоим кандидатам, то очевидно, это будет ответ на запрос, а в ином случае, если запрещена строка, в которой он находится, то в одном из рекурсивных вызовов мы посчитали другого кандидата и так далее.

Почему это бывает полезно?

Приведу пример задачи на эту тему. У нас есть дерево размером $$$N$$$, в каждой вершине которого записана буква от $$$a$$$ до $$$z$$$, назовем строку хорошей, если ни одна его подстрока длиной больше $$$1$$$ не является палиндромом. Требуется найти максимальную подпоследовательность, какого-то простого пути в дереве, такую, что если записать символы в вершинах этой последовательности, то получится хорошая строка.

Докинем в афлавит фиктивный символ $$$\epsilon$$$. За $$$\Sigma$$$ обозначим размер алфавита, в данном случае $$$\Sigma = 26 + 1$$$. Заведем трехмерную динамику $$$dp$$$ с размерностью $$$N \times \Sigma \times \Sigma$$$, в $$$dp[v][i][j]$$$ будем хранить максимальную подпоследовательность, пути идущего сверху-вниз до вершины $$$v$$$, два последних символа которой равны $$$i$$$ и $$$j$$$, $$$i=j=\epsilon$$$ значит, что строка пустая, $$$i=\epsilon$$$ значит, что строка содержит ровно один символ. Динамика очень легко пересчитывается и это суммарно отработает за $$$O(N \cdot \Sigma ^ 2)$$$. Чтобы посчитать ответ на задачу требуется перебрать LCA двух конечных вершин пути и с помощью посчитанных значений динамики найти максимальное значение $$$dp'[u][x][y] + dp[v][z][w]$$$, где $$$dp'[u]$$$ обозначает динамику $$$dp$$$, посчитанную для путей исходящих из поддерева вершины $$$u$$$ и заканчивающих свой путь в предке $$$u$$$, при этом $$$u$$$ и $$$v$$$ -- братья и при этом $$$y \neq z$$$, $$$y \neq w$$$, $$$x \neq z$$$. При этом такой максимум уже можно найти за $$$O(N{\Sigma}^4)$$$, это медленно.. Можно постараться и найти его за $$$O(N{\Sigma}^3)$$$. Но с помощью структуры данных, описанных выше это можно сделать тривиальным образом за $$$O(N{\Sigma}^2)$$$.

Кстати, с помощью нашей структуры данных можно пойти гораздо дальше. Можно сказать, что все состояния динамики нам совершенно не нужны. Давайте вместо трехмерной динамики $$$dp$$$ построим динамику $$$dc$$$ размера $$$N$$$, основанную на CandidateSet, в котором есть не более одного запрета $$$x$$$ и не более двух запретов на $$$y$$$, для каждого состояния исходной динамики. Пересчитывать ее очень просто и приятно -- это работает за $$$O(N)$$$, единственная вещь, которую я не описал -- это объединение множества кандидатов и его обрезание, но я верю в то, что вы и сами справитесь :D. Утверждается, что глобальный максимум по $$$dp'[u][x][y] + dp[v][z][w]$$$ достигается и среди сумм $$$dc'[u][x][y] + dc[v][x][y]$$$, определенных по такому же принципу. Доказать это очень просто, пусть это останется как упражнение читателю, но с помощью этого простого трюка наше решение превращается в гордый $$$O(N)$$$ с большой константой. Ура!

пруф

Комментарии (4)

Написать комментарий?

golikovnik

3 года назад, # |

+20

Да, кстати, по очевидным причинам алгоритм построения этой таблицы работает за $$$O((NK)^2)$$$

А можно поподробнее про очевидные причины? Мне вот очевидно, что построение работает за $$$O(N^2 4^K)$$$, и я не вижу причин, по которым оно должно работать быстрее.

→ Ответить

teraqqq

3 года назад, # ^ |

+10

Признаю, облажался, безусловно оценка кол-ва вершин $$$C_{2K}^K$$$, сейчас поправлю

Nybik

Эту задачу можно решать за $$$O(2^k \cdot k + N \cdot k + N^2)$$$ предпосчета и $$$O(k)$$$ на запрос, а также с использованием $$$O(2^k \cdot k)$$$ памяти.

Воспользуемся обычным сохранением состояния $$$dp[mask]$$$ — будет список максимальных кандидатов из $$$O(k)$$$ элементов, таких, что у них разные столбцы, а также строчка не совпадает с выбранными из $$$mask$$$.

Для пересчета — посчитаем максимум по всем элементам массива, такие что они не попадают ни в R, ни в C. Добавим его в каждый из $$$dp[mask]$$$. Чтобы пересчитать $$$dp[mask]$$$ — давайте пробежимся по всем $$$R \backslash mask$$$, и добавим максимум, которого нет в $$$C$$$. Аналогично пробежимся по всем $$$C$$$ и добавим максимум, которого нет в $$$mask$$$. После этого, в $$$dp[mask]$$$ у нас будет не более $$$2k + 1$$$ элементов.

Тут казалось бы логичный вопрос, как сделать вторую часть решения, когда мы хотели бы взять максимум, которого нет в $$$mask$$$, по всем столбцам. Для этого достаточно написать ещё одну динамику по каждому $$$C$$$. Её нужно пересчитывать рекурсивным перебором $$$mask$$$, таким образом, что мы добавляем элементы в том порядке, в котором они идут в отсортированном массиве. (если написать наивный проход, будет $$$O(2^k \cdot k^2))$$$

Чтобы спросить текущий запрос, обращаемся к $$$dp[R]$$$ и смотрим все элементы. По построению, мы нашли максимальный ответ.

← Rev. 2 →

Более того, из этого решения выводится то, что кол-во кандидатов $$$O(k^2)$$$.

Они выглядят достаточно тривиально — это пересечения $$$R$$$ с $$$C$$$, максимумы в каждом $$$R$$$ и $$$C$$$, которые не затрагивают столбцы и строки соотвественно, а также максимум во всем массиве, кроме данных строк и столбцов.

№	Пользователь	Рейтинг
1	tourist	3690
2	jiangly	3647
3	Benq	3581
4	orzdevinwang	3570
5	Geothermal	3569
5	cnnfls_csy	3569
7	Radewoosh	3509
8	ecnerwala	3486
9	jqdai0815	3474
10	gyh20	3447

№	Пользователь	Вклад
1	maomao90	174
2	awoo	164
3	adamant	163
4	TheScrasse	159
5	nor	157
6	maroonrk	155
7	-is-this-fft-	152
8	Petr	146
8	orz	146
10	BledDest	145

Блог пользователя teraqqq

Постановка задачи

Почему это бывает полезно?