Количество инверсий дерево отрезков

Содержание

Подсчет инверсий — Разделяй и властвуй
Анализ алгоритма
Реализация алгоритма
Количество инверсий дерево отрезков

Подсчет инверсий — Разделяй и властвуй

Глава началась с обсуждения методов разрешения некоторых распространенных рекуррентностей. В оставшейся части главы будет продемонстрировано применение принципа “разделяй и властвуй” к задачам из разных областей; информация, представленная в предыдущих разделах, будет использоваться для ограничения времени выполнения этих алгоритмов. Сначала мы увидим, как разновидность метода сортировки слиянием используется для решения задачи, не связанной напрямую с сортировкой чисел.

Следующая задача встречается при анализе ранжирования, которое начинает играть важную роль во многих современных областях. Например, некоторые сайты применяют метод, называемый совместной фильтрацией, чтобы сопоставить ваши предпочтения (книги, кино, рестораны) с предпочтениями других людей в Интернете. Обнаружив других людей с “похожими” вкусами (которые определяются сравнением оценок, присвоенных ими и вами разным вещам), сайт рекомендует новые ресурсы, которые понравились вашим “единомышленникам”. Другое практическое применение встречается в инструментах метапоиска, которые выполняют один запрос в разных поисковых системах, а потом пытаются синтезировать результаты на основании сходств и различий между рангами, полученными от разных поисковых систем.

Центральное место в таких приложениях занимает задача сравнения двух ранжировок. Вы оцениваете множество из n фильмов, а система совместной фильтрации по своим базам данных ищет других людей с “похожими” оценками. Но как измерить сходство оценок двух людей на числовом уровне? Очевидно, идентичные оценки очень похожи, а полностью противоположные сильно различаются; нужна некая метрика, способная выполнять интерполяцию на середине шкалы.

Рассмотрим задачу сравнения двух ранжировок набора фильмов: вашей и чьей- то еще. Естественный метод — пометить фильмы от 1 до n в соответствии с вашей ранжировкой, затем упорядочить эти метки в соответствии с ранжировкой другого человека и посмотреть, сколько пар “нарушает порядок”. Более конкретная формулировка задачи выглядит так: имеется последовательность из n чисел a₁, . a_n; предполагается, что все числа различны. Требуется определить метрику, которая сообщает, насколько список отклоняется от упорядочения по возрастанию; значение метрики должно быть равно 0, если a₁ < a₂ < . < a_n, и должно быть тем выше, чем сильнее нарушен порядок чисел.

Естественное количественное выражение этого понятия основано на подсчете инверсий. Мы будем говорить, что два индекса i i > а_j, то есть если два элемента а_i и а_j идут “не по порядку”. Нужно определить количество инверсий в последовательности a₁, . а_n.

Чтобы вы лучше поняли смысл определения, рассмотрим пример с последовательностью 2, 4, 1, 3, 5. В нем присутствуют три инверсии: (2, 1), (4, 1) и (4, 3). Также существует элегантный геометрический способ наглядного представления инверсий, изображенный на рис. 5.4: сверху записывается последовательность входных чисел в порядке, в котором они заданы, а ниже — эти же числа, упорядоченные по возрастанию. Затем каждое число соединяется отрезком со своей копией в нижнем списке. Каждая пересекающаяся пара отрезков соответствует одной паре, находящейся в обратном порядке в двух списках, — иначе говоря, инверсии.

Рис. 5.4. Подсчет инверсий в последовательности 2, 4, 1, 3, 5. Каждая пересекающаяся пара отрезков соответствует паре, находящейся в обратном порядке во входном и упорядоченном списках, — иначе говоря, инверсии

Обратите внимание, как количество инверсий плавно интерполируется между полным совпадением (когда последовательность упорядочена по возрастанию, инверсий нет) и полным несовпадением (если последовательность упорядочена по убыванию, каждая пара образует инверсию и общее количество инверсий равно ).

Разработка и анализ алгоритма

Как проще всего посчитать инверсии? Разумеется, можно проверить каждую пару чисел (а_i, а_j) и определить, образуют ли они инверсию; проверка займет время O(n 2 ).

Сейчас мы покажем, как подсчитать инверсии намного быстрее, за время O(n log n). Так как возможно квадратичное количество инверсий, такой алгоритм должен быть способен подсчитать инверсии без проверки отдельных инверсий. Общая идея состоит в применении стратегии (√) из раздела 5.1. Мы назначаем m = [п/2| и делим список на две части: а₁, . а_m и а_m+1, . а_n. Сначала количество инверсий подсчитывается в каждой половине по отдельности, а затем считаются инверсии (а_i, а_j) для двух чисел, принадлежащих разным половинам; хитрость в том, что это нужно сделать за время O(n), если мы хотим применить (5.2). Обратите внимание: инверсии “первая половина/вторая половина” имеют очень удобную форму: они представляют собой пары (а_i, а_j), в которых а_i находится в первой половине, а_j находится во второй половине и а_i > а_j.

Чтобы упростить подсчет инверсий между половинами, мы заставим алгоритм также рекурсивно сортировать числа в двух половинах. Некоторое возрастание объема работы на шаге рекурсии (сортировка и подсчет инверсий) упростит “объединяющую” часть алгоритма.

Итак, главной частью процесса станет процедура “слияния с подсчетом”. Предположим, мы рекурсивно отсортировали первую и вторую половины списка и подсчитали инверсии в каждой половине. Теперь имеются два отсортированных списка A и B, содержащих первую и вторую половины соответственно. Мы хотим объединить их с построением одного отсортированного списка C, одновременно подсчитав пары (a, b), у которых a ∈ A, b ∈ B, и a > b. По приведенному выше определению это именно то, что необходимо для “объединяющего” шага, вычисляющего количество инверсий между половинами.

Эта задача тесно связана с более простой задачей из главы 2, в которой был сформирован соответствующий “объединяющий” шаг для сортировки слиянием: тогда у нас были два отсортированных списка A и B, которые нужно было объединить в один отсортированный список за время O(n). На этот раз нужно сделать кое- что еще: не только построить один отсортированный список из A и B, но и подсчитать количество “инвертированных пар” (a, b), для которых a ∈ A, b ∈ B, и a > b.

Как выясняется, это делается практически так же, как для слияния. Процедура “слияния с подсчетом” проходит по отсортированным спискам A и B, удаляя элементы от начала и присоединяя их к отсортированному списку C. На каждом конкретном шаге для каждого списка доступен указатель Current, обозначающий текущую позицию. Предположим, эти указатели в настоящее время указывают на элементы a_i и b_j. За один шаг мы сравниваем элементы a_i и b_j, удаляем меньший элемент из списка и присоединяем его в конец списка C.

Со слиянием понятно, но как подсчитать количество инверсий? Так как списки A и B отсортированы, отслеживать количество обнаруженных инверсий на самом деле очень просто. Каждый раз, когда элемент a_. добавляется к C, новые инверсии не возникают, так как a_i меньше всех элементов, оставшихся в списке B, и должен предшествовать им всем. С другой стороны, если элемент b_j присоединяется к списку C, значит, он меньше всех оставшихся элементов A и должен следовать после них всех, поэтому счетчик инверсий увеличивается на количество элементов, оставшихся в A. Это центральная идея алгоритма: за постоянное время учитывается потенциально высокое количество инверсий. Процесс проиллюстрирован на рис. 5.5.

Рис. 5.5. Слияние двух отсортированных списков с одновременным подсчетом инверсий между ними

Ниже приведено описание алгоритма на псевдокоде.

Время выполнения алгоритма слияния с подсчетом может быть ограничено аргументом, аналогичным тому, который использовался для исходного алгоритма слияния в сортировке слиянием: каждая итерация цикла выполняется за постоянное время, и при каждой итерации в выходной список добавляется элемент, который исключается из рассмотрения. Следовательно, количество итераций не может превышать сумму исходных длин A и B, а значит, общее время выполнения составляет O(n).

Процедура используется в рекурсивном алгоритме, который одновременно сортирует и подсчитывает количество инверсий в списке L.

Так как слияние с подсчетом выполняется за время O(n), время выполнения T(n) полной процедуры сортировки с подсчетом удовлетворяет рекуррентному отношению (5.1). Из (5.2) следует (5.7).

(5.7) Алгоритм сортировки с подсчетом i правильно сортирует входной список и подсчитывает количество инверсий; для списка с n элементами он выполняется за время O(n log n).

Библиотека образовательных материалов для студентов, учителей, учеников и их родителей.

Наш сайт не претендует на авторство размещенных материалов. Мы только конвертируем в удобный формат материалы из сети Интернет, которые находятся в открытом доступе и присланные нашими посетителями.

Если вы являетесь обладателем авторского права на любой размещенный у нас материал и намерены удалить его или получить ссылки на место коммерческого размещения материалов, обратитесь для согласования к администратору сайта.

Разрешается копировать материалы с обязательной гипертекстовой ссылкой на сайт, будьте благодарными мы затратили много усилий чтобы привести информацию в удобный вид.

Источник

Анализ алгоритма

Входная последовательность содержит разные числа – от больших до малых. В общем случае она могла бы содержать и отрицательные числа. Совершим отображение n входных чисел во множество [0, …, n – 1] таким образом, чтобы результирующий массив содержал такое же число инверсий, как и исходный. Заменим каждое число a_i его индексом в отсортированном массиве (индексы начинаются с нуля). Например можно отобразить в . Действительно, пусть а = , b = – отсортированный массив. Тогда число 99 в массиве b имеет позицию 2, число 3 в массиве b имеет позицию 0, число 10 6 в массиве b имеет позицию 3, а число 16 в массиве b имеет позицию 1.

Задача свелась к подсчету количества инверсий в массиве, являющемся перестановкой чисел от 0 до n – 1 (отметим, что по условию задачи все числа входного массива разные). Будем двигаться по массиву из конца в начало, поддерживая дерево Фенвика по массиву b, которое изначально пусто (то есть заполнено нулями). Для каждого значения a_i сумма b₀ + b₁ + … + b_i равна количеству элементов справа от него в массиве а, с которыми a_i образует инверсию. После подсчета указанного числа инверсий увеличим b[a[ i]] на 1. Таким образом, при поступлении числа a_i в массиве b единицы будут находиться лишь в тех в ячейках, индексы которых равны уже обработанным числам из массива а (индексы и числа в обновленном массиве а принимают значения от 0 до n – 1).

Входная последовательность а имеет вид:

Пять чисел отобразим во множество [0, …, 4]. Новое состояние массива а:

Количество инверсий в первой и второй последовательности одинаково. Количество инверсий, которое образует a_i с числами правее его, равно b₀ + b₁ + … + b_i. После подсчета указанного числа инверсий увеличиваем b[ a[i]] на единицу.

Из массива а обработаны числа 2, 3 и 0. В ячейках с этими индексами в массиве b стоят единицы.

Общее количество инверсий равно 1 + 1 + 4 = 6.

Реализация алгоритма

Объявим рабочие массивы a и b. Работу дерева Фенвика моделируем в массиве Fenwick.

Основная часть программы. Для каждого теста читаем входную последовательность чисел a. В переменной swaps подсчитываем количество инверсий.

memset(Fenwick,0, sizeof (Fenwick));

Скопируем входной массив a в b и отсортируем его.

Совершим отображение чисел входного массива а во множество [0, …, n – 1]. Заменяем каждое a_i его индексом в отсортированном массиве.

Для каждого значения a_i подсчитываем количество инверсий, которое оно образует со стоящими справа от него элементами в массиве a . У величиваем b[a[i]] на единицу.

Выводим количество инверсий.

Источник

Количество инверсий дерево отрезков

pakhomovee → Codeforces Round #893 (Div. 2) Editorial

Byakko → Invitation to 2023 USP Try-outs

Error_Yuan → About #893 C

Ibrahim-Elsayed → How to solve this problem?

JanBobi → How to block users in Codeforces

K evin114514 → I’m Kevin114514, AMA!

Rezwan.Arefin01 → Checklist for OI Problems (WebApp)

MikeMirzayanov → Codeforces Beta Round #9

T heQueenOfHatred → 2023 KSAAC Summer · solved.ac Arena #4 Announcement

awoo → Educational Codeforces Round 56 [рейтинговый для Div. 2]

lumibons → CEOI 2023

mohit_jx64 → [Invitation] Coding Events — Esya’23 IIIT-Delhi

MikeMirzayanov → Codeforces Beta Round #7

removed1 → Разбор задач Codeforces Beta Round #1

RAD → Codeforces Beta Round #22 (Див. 2)

e-maxx → Codeforces Beta Round #30. Разбор A

PinkieRabbit → AI language models and cheating in online contests

induk_v_tsiane → Codeforces Round #892 (Div. 2) Editorial

abcsumits → Help me to find number of solution of this equation efficiently

steveonalex → [Tutorial] Divide and Conquer Offline Query — A Niche Way to solve Static Range Query

RAD → Codeforces Round #113 (Div. 2) Разбор задач

MikeMirzayanov → Filter for Past Contests

ashwanth106121023 → Good Observations:

Vladosiya → Codeforces Round #874 (Div. 3) Разбор

R.A.N.K.A. → Help in Permutation P[i]=P[P[i]]

Источник