Facebook Hacker Cup 2012 - Разбор задачи Auction

Есть N ≤ 10¹⁸ пар (P_i, W_i) сгенерированных по следующему алгоритму:

P_i = ((A*P_i-1 + B) mod M) + 1
W_i = ((C*W_i-1 + D) mod K) + 1
Где M, K ≤ 10⁷, P₁, W₁, A, B, C, D заданы.
Требуется найти:

Количество пар (P_i, W_i) таких что не существует пары (P_j, W_j) такой что P_j ≤ P_i и W_j < W_i либо P_j < P_i и W_j ≤ W_i
Количество пар (P_i, W_i) таких что не существует пары (P_j, W_j) такой что P_j ≥ P_i и W_j > W_i либо P_j > P_i и W_j ≥ W_i

Разберемся с первой частью, вторая делается аналогично.

Заметим, что если все P_i одинаковы, то ответ это количество минимумов.

Переходим к двумерной задаче: для каждого P < M будем хранить текущий минимум min_p и количество найденных пар вида (P, min_p).

Если посчитать эти величины, то ответ ищется просто: для каждого p надо проверить что нет такого p₀ < p что min_p₀ ≤ min_p , и в этом случае прибавить к ответу количество пар вида (P, min_p). Это делается за один проход.

Как же искать этот min_p ?

Понятно, что через max(M, K) элементов обе последовательности зациклятся. Обработаем этот кусок, выкинем его и рассмотрим циклы, осталось обработать N₁ = N - max(M, K) пар.

Получившиеся циклы:

p₀, p₁, p₂, p₃, ... p_A - 1

w₀, w₁, w₂, w₃, ... w_B - 1

Для фиксированного p_i важно знать минимум и количеством минимумов тех w, что попадают в пару вместе с фиксированным p_i:

Для p₀ они имеют индексы 0, A%B, (2 * A)%B, ...

Для p₁ это 1, (A + 1)%B, (2 * A + 1)%B, ...

Для p₂ это 2, (A + 2)%B, (2 * A + 2)%B, ...

Для p(A - 1) это (A - 1)%B, (2 * A - 1)%B, ...

Все индексы меньше N₁

Вот тут можно поступить по-разному

Разбить цикл из w на орбиты элементов которые идут через A и на каждой использовать RMQ. Это O(max(M, K) * logN) по времени. Можно улучшить до O( max(M, K) ) используя RMQ за O(1) два раза, ведь последовательности могут иметь длины ⌈ N₁ / A⌉ и ⌊ N₁ / A⌋.
Cчитать минимум и количество минимумов среди элементов w проиндексированных (i + j * A)%B , 0 ≤ j < 2^k для каждого k, и использовать на этом двоичный подъём, "перемножая" массив как при быстром возведении в степень. Это O(max(M, K) * logN) по времени

В обоих случаях получается и и O(max(M, K)) по памяти.

Лично я выбрал второе, макстест на Java работал за 17 секунд, но на их 20 тестах программа уложилась в 2 минуты. К тому же можно было запускать это сразу на нескольких компах/ядрах.

Если вы считаете что можете объяснить это лучше и проще, пожалуйста, оставьте свои объяснения в комментариях.

Комментарии (16)

Написать комментарий?

jaric

12 лет назад, # |

Извините, но не могли бы вы объяснить следующее: "Понятно, что через max(M, K) элементов обе последовательности зациклятся.". Я интуитивно догадываюсь, а доказать не могу.

→ Ответить

ivan.popelyshev

12 лет назад, # ^ |

← Rev. 4 →

А, это просто.

Если W_i = W_j то W_i + 1 = W_j + 1, а значит W_i + 2 = W_j + 2 и так далее. При этом различных W не более K. Одно повторение и она зацикливается.

Ещё раз напишу: надо, чтобы когда зациклились обе по отдельности.

ewgra

А можно еще вас помучать на эту тему?

Судя по теории все это близко к Линейному конгруентному методу формирования случайных чисел, там действительно период лежит в пределах M. Но в задаче формула другая, и когда я ее пытался решить, то даже в тестовом примере там существовал случай когда периодичность устанавливалась не с первого элемента, а надо было отмотать какое-то количество значений, прежде чем находился элемент который являлся началом периода. Это мне приснилось?

Всё так, поэтому я и предлагаю отмотать max(M, K) , так как за этот промежуток гарантированно начнутся повторы.

Jughead

Не понятно почему во втором случае с двоичным подъемом O(max(M, K)) памяти, а не O(max(M, K) log max(M,K)). И, кстати, у тебя на Java не получалось OutOfMemory на каких-нибудь своих тестах? Мне вот пришлось извернуться, чтобы такого не возникало

← Rev. 2 →

-xmx2048M помог.

Если делать аналогично быстрому возведению в степень, логарифма по памяти нету.

UPD.

То есть надо возвести в степень весь массив, а не посчитать таблицу для всех 2^k и потом для каждого элемента идти.

хм... ну у меня только -xmx1G :)

Так ведь возводить в степень весь массив это долго (за его длину на логарифм), а минимум нужно O(M) раз посчитать. Или я тебя не правильно понимаю?

Ок, конкретизирую:

В массиве U_k в элементе U_k[i] хранятся минимум и кол-во минимумов среди элементов проиндексированных (i + j * A)%B , 0 ≤ j < 2^k .

U_k вычисляется по U_k - 1, следующей операцией:

пусть X и Y это U_k - 1, Z это U_k

Z[i] = min (X[i], Y[(i + 2^k)%B])

Тут есть небольшой подкол со сдвигом, он каждый раз разный. Тем не менее, применив эту ассоциативную операцию ко всем U_i где бит i включён в показателе степени, мы получим что надо.

Я прошу кого-нибудь помочь с объяснением.

Это понятно все. Я имею ввиду вот что:

можно хранить log max(M, K) массивов и за логарифм узнавать минимум на отрезке. Ты предлагаешь не хранить логарифм массивов, тогда ты будешь находить минимум не за логарифм, потому что возводишь ты весь массив.

Да, всё так.

Возводить надо лишь один раз, после этого у нас все нужные данные оказываются на руках, т.е. минимум по конкретному p берется за O(1).

Весь массив возводится в степень ⌊ N₁ / A⌋ , а потом еще возможно что надо домножить на начальный, чтобы получить степень ⌈ N₁ / A⌉.

А круто, действительно, всего две степени будут: $\text{[math]}$ и $\text{[math]}$ .

Monyura

Спасибо за разбор! Но я немного не понял как считать ответ для оставшихся N₁ пар...
Если бы у нас N₁делилось на НОК(A,B), то в W было бы НОД(A,B) орбит элементов через А, и в P было бы НОД(A,B) орбит элементов через В. При этом если пронумеровать орбиты по их первому элементу, то все элементы из орбиты i в P встречались бы в паре со всеми элементами из орбиты i в W.
Тогда берём минимум в первой, минимум во второй - и это пара кандидат на минимальную. Т.е. всего будет НОД(A,B) кандидатов. А что делать если N₁ не делится на НОК ? Я написал какой-то изврат: поочередно то в одном то в другом массиве выбираю минимальный не вычеркнутый элемент, просматриваю всех кто с ним в паре во втором массиве, запоминаю минимум и вычеркиваю все просмотренные. Потом с помощью Фенвика проверяю является ли эта пара кандидатом на ответ (Пока писал это предложение понял, ночью голова не варила... Зачем было ещё Фенвика прикручивать, если потом я всё равно буду проверять можно ли посчитать эту пару как хорошую). В общем в итоге я разбил всё на три части - найти пары для хвоста, для нока, и для N₁% НОК. Но после этого я как последний баран их пихал в массив на 30 лимонов из пар интов и сортил его)) В итоге оно сумело пройти всего 4 теста, примерно по минуте с лишним на тест. Можно поподробней как посчитать для N₁ответ не разбивая на НОК и остаток от НОКа за O(max(M, K) * logN)?

Да, берём две соответствующие орбиты: пусть одна P (берутся элементы из первого цикла идущие через B и соотв. ей из W (берутся элементы из второго цикла через A).

Возьмём циклический RMQ над W, и ещё массив частичных сумм последовательности из нулей и единиц, где единицы соответствуют элементам минимальным на орбите.

Возьмём какой-нибудь элемент $\text{[math]}$ , с ним в парах встречаются либо ⌊ N₁ / A⌋ либо ⌈N₁ / A⌉ элементов подряд из W. Если кол-во маленькое то используем RMQ, а если $\text{[math]}$ оказался больше орбиты, то минимум берётся по всей орбите, а это значит что для вычисления можно использовать частичные суммы - считаем сколько раз орбита полностью влезла, и сколько минимумов в остатке.

Вот поэтому я писал двоичный подъём.

>Возьмём какой-нибудь элемент $\text{[math]}$ , с ним в парах встречаются либо ⌊ N₁ / A⌋ >либо ⌈N₁ / A⌉ элементов подряд из W
Вы имеете ввиду элементы подряд из соответствующей орбиты? И под подряд понимается циклически подряд?

Теперь всё ясно, спасибо. Я этот факт как-то не заметил)

№	Пользователь	Рейтинг
1	tourist	3690
2	jiangly	3647
3	Benq	3581
4	orzdevinwang	3570
5	Geothermal	3569
5	cnnfls_csy	3569
7	Radewoosh	3509
8	ecnerwala	3486
9	jqdai0815	3474
10	gyh20	3447

№	Пользователь	Вклад
1	maomao90	171
2	adamant	164
3	awoo	163
4	TheScrasse	160
5	nor	157
6	maroonrk	155
7	-is-this-fft-	152
8	Petr	146
9	orz	145
9	pajenegod	145

Блог пользователя ivan.popelyshev