Дерево как структура данных
Какую выгоду можно извлечь из такой структуры данных, как дерево? В этой статье мы расскажем о данных в виде дерева, рассмотрим основные определения, которые следует знать, а также узнаем, как и зачем используется дерево в программировании. Спойлер: бинарные деревья часто применяют для поиска информации в базах данных, для сортировки данных, для проведения вычислений, для кодирования и в других случаях. Но давайте обо всем по порядку.
Основные термины
Дерево — это, по сути, один из частных случаев графа. Древовидная модель может быть весьма эффективна в случае представления динамических данных, особенно тогда, когда у разработчика стоит цель быстрого поиска информации, в тех же базах данных, к примеру. Еще древом называют структуру данных, которая представляет собой совокупность элементов, а также отношений между этими элементами, что вместе образует иерархическую древовидную структуру.
Каждый элемент — это вершина или узел дерева. Узлы, соединенные направленными дугами, называются ветвями. Начальный узел — это корень дерева (корневой узел). Листья — это узлы, в которые входит 1 ветвь, причем не выходит ни одной.
Общую терминологию можно посмотреть на левой и правой части картинки ниже:
Какие свойства есть у каждого древа:
— существует узел, в который не входит ни одна ветвь;
— в каждый узел, кроме корневого узла, входит 1 ветвь.
На практике деревья нередко применяют, изображая различные иерархии. Очень популярны, к примеру, генеалогические древа — они хорошо известны. Все узлы с ветвями, исходящими из единой общей вершины, являются потомками, а сама вершина называется предком (родительским узлом). Корневой узел не имеет предков, а листья не имеют потомков.
Также у дерева есть высота (глубина). Она определяется числом уровней, на которых располагаются узлы дерева. Глубина пустого древа равняется нулю, а если речь идет о дереве из одного корня, тогда единице. В данном случае на нулевом уровне может быть лишь одна вершина – корень, на 1-м – потомки корня, на 2-м – потомки потомков корня и т. д.
Ниже изображен графический вывод древа с 4-мя уровнями (дерево имеет глубину, равную четырем):
Следующий термин, который стоит рассмотреть, — это поддерево. Поддеревом называют часть древообразной структуры, которую можно представить в виде отдельного дерева.
Идем дальше. Древо может быть упорядоченным — в данном случае ветви, которые исходят из каждого узла, упорядочены по некоторому критерию.
Степень вершины в древе — это число ветвей (дуг), выходящих из этой вершины. Степень равняется максимальной степени вершины, которая входит в дерево. В этом случае листьями будут узлы, имеющие нулевую степень. По величине степени деревья бывают:
— двоичные (степень не больше двух);
— сильноветвящиеся (степень больше двух).
Деревья — это рекурсивные структуры, ведь каждое поддерево тоже является деревом. Каждый элемент такой рекурсивной структуры является или пустой структурой, или компонентом, с которым связано конечное количество поддеревьев.
Когда мы говорим о рекурсивных структурах, то действия с ними удобнее описывать посредством рекурсивных алгоритмов.
Обход древа
Чтобы выполнить конкретную операцию над всеми вершинами, надо все эти узлы просмотреть. Данную задачу называют обходом дерева. То есть обход представляет собой упорядоченную последовательность узлов, в которой каждый узел встречается лишь один раз.
В процессе обхода все узлы должны посещаться в некотором, заранее определенном порядке. Есть ряд способов обхода, вот три основные:
— прямой (префиксный, preorder);
— симметричный (инфиксный, inorder);
— обратный (постфиксный, postorder).
Существует много древовидных структур данных: двоичные (бинарные), красно-черные, В-деревья, матричные, смешанные и пр. Поговорим о бинарных.
Бинарные (двоичные) деревья
Бинарные имеют степень не более двух. То есть двоичным древом можно назвать динамическую структуру данных, где каждый узел имеет не большое 2-х потомков. В результате двоичное дерево состоит из элементов, где каждый из элементов содержит информационное поле, а также не больше 2-х ссылок на различные поддеревья. На каждый элемент древа есть только одна ссылка.
У бинарного древа каждый текущий узел — это структура, которая состоит из 4-х видов полей. Какие это поля:
— информационное (ключ вершины);
— служебное (включена вспомогательная информация, однако таких полей может быть несколько, а может и не быть вовсе);
— указатель на правое поддерево;
— указатель на левое поддерево.
Самый удобный вид бинарного древа — бинарное дерево поиска.
Что значит древо в контексте программирования?
Мы можем долго рассуждать о математическом определении древа, но это вряд ли поможет понять, какие именно выгоды можно извлечь из древовидной структуры данных. Тут важно отметить, что древо является способом организации данных в форме иерархической структуры.
В каких случаях древовидные структуры могут быть полезны при программировании:
- Когда данная иерархия существует в предметной области разрабатываемой программы. К примеру, программа должна обрабатывать генеалогическое древо либо работать со структурой каталогов. В таких ситуациях иногда есть смысл сохранять между объектами программы существующие иерархические отношения. В качестве примера можно вывести древо каталогов операционной системы UNIX:
- Когда между объектами, которые обрабатывает программа, отношения иерархии не заданы явно, но их можно задать, что сделает обработку данных удобнее. Как тут не вспомнить разработку парсеров либо трансляторов, где весьма полезным может быть древо синтаксического разбора?
- А сейчас очевидная вещь: поиск объектов более эффективен, когда объекты упорядочены, будь то те же базы данных. К примеру, поиск значения в неструктурированном наборе из тысячи элементов потребует до тысячи операций, тогда как в упорядоченном наборе может хватить всего дюжины. Вывод прост: раз иерархия — эффективный способ упорядочивания объектов, почему же не использовать древовидную иерархию для ускорения поиска узлов со значениями? Так и происходит: если вспомнить бинарные деревья, то на практике их можно применять в следующих целях:
— поиск данных в базах данных (специально построенных деревьях);
— сортировка и вывод данных;
— вычисления арифметических выражений;
— кодирование по методу Хаффмана и пр.
Источник
8. Остовы и деревья
Понятие дерева широко используется во многих областях математики и информатики. Например, как инструмент при вычислениях, как удобный способ хранения данных, способ сортировки или поиска данных.
Достаточно развитое генеалогическое дерево образует дерево.
Типичное частичное организационное дерево для университета.
Если дерево имеет хотя бы одно ребро, оно имеет две вершины со степенью 1. Вершины со степенью 1 называются листьями. Другие вершины называются внутренними вершинами.
Предположим, что дерево представляет физический объект, подвижный в вершинах, и подвесим дерево за одну из его вершин:
Если подвесить за вершину V3 или V4
Вершина в верхней части называется корнем дерева, если корень определен, то дерево называется корневым. При необходимости корневое дерево Т можно заменить на ориентированное корневое дерево Т’, порожденное корневым деревом Т.
Если корень выбран, уровень вершины V определяется длиной единственного пути из корня в вершину V. Высотой дерева называется длина самого длинного пути от корня дерева до листа.
Если рассматривается корневое ориентированное дерево Т’, порожденное данным корневым деревом Т, тогда вершина u называется родителем вершины v; a v называется сыном вершины u, если существует ориентированное ребро из u в v.
Если u — родитель v и v1, тогда v и v1 называются братьями.
Если существует ориентированный путь из вершины u в вершину v, тогда u называется предком вершины v, a v называется потомком вершины u.
Если наибольшая из степеней выхода для вершин дерева равна m, тогда дерево называется m — арным деревом.
В частном случае, когда m = 2, дерево называется бинарным деревом.
В каждом бинарном дереве каждый сын родителя обозначается либо как левый сын, либо как правый сын (но не то и другое одновременно).
Связный граф G(V,E), не имеющий циклов, называется деревом.
ТЕОРЕМА (основные свойства деревьев):
Пусть граф G(V,E) имеет n вершин. Тогда следующие утверждения эквивалентны:
- G является деревом;
- G не содержит циклов и имеет n-1 рёбер;
- G связен и имеет n-1 рёбер;
- G связен, но удаление » ребра нарушает связность;
- » две вершины графа G соединены ровно одним путём;
- G не имеет циклов, но добавление » ребра порождает ровно один цикл.
Ориентированное дерево представляет собой ориентированный граф без циклов, в котором полустепень захода каждой вершины (за исключением одной, например v1) не больше 1, а полустепень захода вершины v1 (называемой также корнем) равна нулю. Вершину v ордерева называют потомком вершины u, если $ путь из u в v. В этом же случае вершину u называют предком вершины v. Вершину, не имеющую потомков, называют листом. Высота ордерева – это наибольшая длина пути из корня в лист. Уровень вершины ордерева – длина пути из корня в эту вершину. Ордерево называют бинарным, если полустепень исхода любой его вершины не превосходит 2. Пусть задан неориентированный граф. Остовным деревом (остовом) связного графа называется любой его остовный подграф, являющийся деревом.
Граф и два его остовных дерева (удаленные ребра показаны пунктиром).
Задачи о кратчайших расстояниях на графах.
- Построение минимального остовного дерева (кратчайшей связывающей сети) – соединение всех узлов сети с помощью путей наименьшей длины.
- Задача о нахождении дерева кратчайших расстояний – нахождение кратчайшего пути из одной вершины в любую другую.
- Построение матрицы кратчайших расстояний – нахождение кратчайших путей для любой пары вершин.
Необходимо проложить линии коммуникаций (дороги, линии связи, электропередач и т.п.) между n заданными «точечными» объектами, при условии: во-первых, известны «расстояния» между каждой парой объектов (это может быть геометрическое расстояние или стоимость прокладки коммуникаций между ними), во-вторых, объекты могут быть связаны как непосредственно, так и с участием произвольного количества промежуточных объектов. При допущении, что разветвления возможны только в этих же n объектах, задача сводится к нахождению кратчайшего остовного дерева (SST — shortest spanning tree, или MST — minimal spanning tree) во взвешенном графе, вершины которого соответствуют заданным объектам, а веса ребер равны «расстояниям» между ними. Определение.Весостовного дерева взвешенного графа G равен сумме весов, приписанных ребрам остовного дерева. Будем обозначать (T). Минимальным остовным деревом (МОД) называется такое остовное дерево графа G, что вес T меньше или равен весу любого другого остовного дерева графа G. Вес минимального остовного дерева будем обозначать min(T). Задача 1:найти кратчайшее остовное дерево (минимальный покрывающий остов) взвешенного графа. Пусть дан неориентированный связный граф со взвешенными ребрами. Вес ребра (xi,xj) обозначим cij. Из всех остовов графа необходимо найти один, у которого сумма весов на ребрах наименьшая. Стоимость остовного дерева вычисляется как сумма стоимостей всех рёбер, входящих в это дерево. Построение остова графа G, имеющего наименьший вес, имеет широкое применение при решении некоторого класса задач прикладного характера. Например: Пусть, например, G=(V, E, ) служит моделью железнодорожной сети, соединяющей пункты v1, v2, …, vnV, а (vi, vj) – расстояние между пунктами vi и vj. Требуется проложить сеть телеграфных линий вдоль железнодорожной сети так, чтобы все пункты v1, v2, …, vn были связаны между собой телеграфной сетью, протяженность которой была бы наименьшей. Рассмотрим два способа построения минимального остовного дерева взвешенного графа: алгоритм Крускала и алгоритм Прима. Алгоритм Крускала: 1) Выбрать в графе G ребро e минимального веса, не принадлежащее множеству E и такое, что его добавление в E не создает цикл в дереве T. 2) Добавить это ребро во множество ребер E. 3) Продолжить, пока имеются ребра, обладающие указанными свойствами. Пример. Для данного взвешенного графа найти минимальное корневое остовное дерево, используя алгоритм Крускала. Определить высоту построенного дерева.
Алгоритм Крускала. Выбираем ребро с минимальным весом. Это ребро, (
,
) с весом, равным 4. Пусть вершина
будет корнем дерева. Далее выбираем ребра, инцидентные вершинам
,
и имеющие минимальный вес. Это ребро (
,
) с весом 5. Затем к вершине
присоединяем ребро (
,
) с весом 7. Далее, добавляем ребро (
,
) с весом 7 и ребро (
,
) с весом 6. Минимальный вес построенного дерева равен: min(T)=4+5+7+7+6=29.
Источник