基本使用映射和集合 -3. 树状结构的关联容器

最编程 2024-04-21 18:34:48

...

根据应用场景的不同，STL总共实现了两种不同结构的管理式容器：树型结构与哈希结构。树型结构的关联式容器主要有四种：map、set、multimap、multiset。这四种容器的共同点是：使用平衡搜索树(即红黑树)作为其底层结果，容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

3.1 set的介绍和使用

// set的类域
std::set

    
// set的类模板如下：  
template < class T,                        // set::key_type/value_type
           class Compare = less<T>,        // set::key_compare/value_compare
           class Alloc = allocator<T>      // set::allocator_type
           > 
class set{}

在set中，元素的value也标识它(value就是key，类型为T)，并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const)，但是可以从容器中插入或删除它们。与map/multimap不同，map/multimap中存储的是真正的键值对<key, value>，set中只放value，但在底层实际存放的是由<value, value>构成的键值对。
set中插入元素时，只需要插入value即可，不需要构造键值对。
set中的元素不可以重复(因此可以使用set进行去重)。
使用set的迭代器遍历set中的元素，可以得到有序序列
set中的元素默认按照小于来比较
set中查找某个元素，时间复杂度为：log_2 n
set中的元素不允许修改(为什么?)
set中的底层使用二叉搜索树(红黑树)来实现。

std::set

#include<iostream>
#include<set>
using namespace std;

void test_set1()
{
	set<int> s;
	s.insert(3);
	s.insert(1);
	s.insert(4);
	s.insert(7);
	s.insert(2);
	s.insert(1);

	// set的底层是一个搜索二叉树因此会进行 ==> 排序+去重
	// set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
    // 打印结果为：1 2 3 4 7
	cout << endl;
    
    // 算法库中的find函数的时间复杂度为 O(N)
    // set内置的find函数的时间复杂度为(logN)
    // auto pos = s.find(3);       
	auto pos = find(s.begin(), s.end(), 3);  // 这里使用的是算法库的find函数
	if (pos != s.end())
	{
		s.erase(pos);
	}
    
	cout << s.erase(1) << endl;
	cout << s.erase(3) << endl;  // 已经删除，则直接返回，不会进行任何操作
    
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}


int main()
{
	test_set1();

	return 0;
}

std::multiset

multiset是按照特定顺序存储元素的容器，其中元素是可以重复的。
在multiset中，元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对，因此value本身就是key，key就是value，类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的)，但可以从容器中插入或删除。

 // 演示：
#include<iostream>
#include<set>
using namespace std;

void test_set2()
{
    // multiset不会进行去重
	multiset<int> s;
	s.insert(3);
	s.insert(1);
	s.insert(4);
	s.insert(7);
	s.insert(2);
	s.insert(1);
	s.insert(1);
	s.insert(3);
	s.insert(1);
	s.insert(3);
	s.insert(2);
	s.insert(1);
	s.insert(1);


	// 排序
	// multiset<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
    

	// 支持范围for
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;

	// 找到的是中序遍历的第一个3，并返回它的iterator
	auto pos = s.find(3);                    // 时间复杂度为O(logN)
	while (pos != s.end())
	{
		cout << *pos << " ";
		++pos;
	}
	cout << endl;
}
// 打印结果如下：
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 3 3 3 4 7

int main()
{
	test_set2();

	return 0;
}

3.2 map的介绍和使用

std::map
    // 类模板
template < class Key,                                     // map::key_type
           class T,                                       // map::mapped_type
           class Compare = less<Key>,                     // map::key_compare
           class Alloc = allocator<pair<const Key,T> >    // map::allocator_type
           > 
 class map{}

map是关联容器，它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
在map中，键值key通常用于排序和惟一地标识元素，而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，为其取别名称为pair:

typedef pair<const key, T> value_type;
在内部，map中的元素总是按照键值key进行比较排序的。
map中通过键值访问单个元素的速度通常比unordered_map容器慢，但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时，可以得到一个有序的序列)。
map支持下标访问符，即在[]中放入key，就可以找到与key对应的value。
map通常被实现为二叉搜索树(更准确的说：平衡二叉搜索树(红黑树))。

make::pair

The behavior of this function template is the same as if defined as:
// 这个函数模板的行为与定义的一样:

// make_pair的函数模板
// 返回值类型为pair<T1,T2>
// 需要两个参数T1 x, T2 y 分别是键值key，和值value
template <class T1,class T2>
pair<T1,T2>   make_pair (T1 x, T2 y)
{
	return  ( pair<T1,T2>(x,y) ); 
}
// 注：pair<T1,T2>(x,y)  是一个匿名对象

map

演示1：

int main()
{
	map<string, string> dict;
    // 注：pair<string, string>("排序", "sort")是一个匿名对象
	dict.insert(pair<string, string>("排序", "sort"));
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边", "right"));
	dict.insert(make_pair("字符串", "string"));

	// map<string, string>::iterator it = dict.begin();
	auto it = dict.begin();
	while (it != dict.end())
	{
        // 下面这两种打印方式都可以
		// cout << (*it).first<<":"<<(*it).second << endl;
		cout << it->first << ":" << it->second << endl;
		++it;
	}
	cout << endl;

    // for循环
	for (const auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}

演示2：统计水果出现的次数

#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;


int main()
{
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };

/*  // 方法1：
	map<string, int> countmap;
	for (auto& e : arr)
	{
		// map<string, int>::iterator it = countmap;
		auto it = countmap.find(e);
		if (it == countmap.end())
		{
			// 代码运行到这里说明没有相对应的水果，那么我们就进行插入
			countmap.insert(make_pair(e, 1));
		}
		else
		{
			// 运行到这里说明，存在相对应的结果，则对水果的个数进行++
			it->second++;
		}
	}
*/
    
    // 方法二：
    map<string, int> countmap;
    // 使用for循环将数组arr中的数据拿出，传引用给e
	for (auto& e : arr)
	{
        // countmap[e] 
        // 1.将e插入到map对象中
        // 2.返回值是value的传引用返回
		countmap[e]++;
	}
    
    for (const auto& kv : countmap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}

// 打印结果为：
// 草莓:1
// 苹果:6
// 西瓜:3
// 香蕉:3

注：
std::map::operator[]
A call to this function is equivalent to:
// 对该函数的调用相当于:
(*((this->insert(make_pair(k, mapped_type()))).first)).second
    // 1.this->insert(make_pair(k, mapped_type())    使用A代替
    // 2.(*(A.first)).secend
    // 3.详细解释如下所示

std::map::insert
pair<iterator,bool>  insert (const value_type& val);
    
// insert函数的返回值：Return value
The single element versions (1) return a pair, with its member pair::first set to an iterator pointing to either the newly inserted element or to the element with an equivalent key in the map. The pair::second element in the pair is set to true if a new element was inserted or false if an equivalent key already existed.
	单元素版本（1）返回一个 pair 对象，其中 pair::first 成员设置为指向新插入元素或具有等效键的元素的迭代器。如果插入了一个新元素，pair 对象中的 pair::second 元素设置为 true，如果已经存在一个等效键,则设置为 false。

// map<string, int> countmap;
// countmap[e];
// e就是将要插入的key也就是键值

// 重载[]的内部我们可以理解为：
V& operator[](const K& K)
{
    // 如果K已经存在，则pair::first 指向k，pair::second 为false
    // V() 是V类型的匿名对象
    pair<iteraor, bool> ret = insert( make_pair(k, V())); 

    // ret的类型为pair<iteraor, bool>，
    // ret.first 就是迭代器
    // 迭代器内指向对应的节点，节点存储的键值对的类型为pair<T1,T2>(k, V())
    // 所以ret.first->second 就是这个V()匿名对象
    // 注：因为是传引用返回，所以对返回值进行修改，就可以将相应节点的value值修改
    return ret.first->second;

    // 也可以写为
    // return (*(ret.first)).second
}

演示3：

// 明白了opertaor[]的用法之后，还有如下的应用：
int main()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("左边", "left"));
    
	// pair<iteraor, bool> ret = insert( make_pair(k, V())); 
	// operator[] 的返回值为Value的引用返回，Value的值原本为默认构造的值,也就是V()
	// 如果Value为指针，则默认构造为nullptr
	// 如果Value为字符串，则默认构造为\0
	// 如果Value为整型，则默认构造为0
	// 下面这行代码修改了key对应的value值
	dict["迭代器"] = "iterator"; // 插入+修改

	// 根据二叉树的原理，key值不可以重复，因此如果key已经存在，那么就不会进行插入
	dict["insert"]; 

    // 插入失败，此时key值已经存在了(在二叉树中已经有"左边"这个key值了
	dict.insert(pair<string, string>("左边", "xxx")); 
	
    // 修改  
    // pair<iteraor, bool> ret = insert( make_pair(k, V())); 
    // dict["insert"] 的返回值是value的引用，对其进行赋值，就可以修改对应节点的value值
	dict["insert"] = "插入"; 

    // dict["左边"]的返回值是value的引用
	cout << dict["左边"] << endl; 

	// map<string, string>::iterator it = dict.begin();
	auto it = dict.begin();
	while (it != dict.end())
	{
        // 下面两种打印方式都是可以的
		// cout << (*it).first<<":"<<(*it).second << endl;
		cout << it->first << ":" << it->second << endl;
		++it;
	}
	cout << endl;


	return 0;
}

multimap

注：
1. multimap中的key是可以重复的。
2. multimap中的元素默认将key按照小于来比较
3. multimap中没有重载operator[]操作(同学们可思考下为什么?)。
4. 使用时与map包含的头文件相同：

#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;

int main()
{
	multimap<string, string> dict;
    // 向multimap插入键值对
	dict.insert(make_pair("left", "左边"));
	dict.insert(make_pair("left", "剩余"));
	dict.insert(make_pair("string", "字符串"));
	dict.insert(make_pair("left", "xxx"));

    // 使用for循环进行打印
	for (const auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

    // 初始化存放水果的数组
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };

    // 创建一个multimap对象
	multimap<string, int> countMap;
    
	for (auto& e : arr)
	{
        // iterator find (const key_type& k);
		// map<string, int>::iterator it = countMap
		auto it = countMap.find(e); 
		if (it == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}

	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}

在OJ中得应用

前k个高频单词

解题思路：

首先我们要统计出每个单词的个数
按照单词出现的频率，也就是单词个数的大小来对单词进行排序
- 我们考虑使用算法库中的sort函数或者stable_sort函数来对单词个数进行排序
- 最终选择用stable_sort,这是因为stable_sort是一个稳定排序
- sort是不稳定排序，即经过排序之后，相同值的元素在序列中的相对位置可能发生改变。
- stable_sort是稳定排序，即经过排序之后，相同值的元素在序列中的相对位置不会发生改变。
  
  比如：原始数组 1 2 3 2
  用sort和stable_sort虽然都可以将其排序为 1 2 2 3
  但是sort可能会打乱两个相同的数的相对位置，例如原始数组中的2
将排序好的前k个单词放入一个vector容器中，并返回

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        // 1.首先我们要统计出每个单词的个数
        map<string, int> Countmap;
        for(string& e : words)
        {
            Countmap[e]++;
        }

        // 2.按照单词出现的频率，也就是单词个数的大小来对单词进行排序
        // 将map中的数据放入vector方便我们后续的遍历
        vector<pair<string, int>> v;
        for(const pair<string, int>& KV : Countmap)
        {
            v.push_back(KV);
        }

        // compare() 是一个仿函数的匿名对象
        // pair的比较规则并不适合，因此需要我们自己来写仿函数
        stable_sort(v.begin(), v.end(), compare());

        // 3.将排序好的前k个单词放入一个vector容器中，并返回
        vector<string> ret;
        for(size_t i = 0; i < k; ++i)
        {
            ret.push_back(v[i].first);
        }

        return ret;
    }
    
private:
    struct compare{
        // 仿函数
        bool operator()(const pair<string, int>& l, const pair<string, int>& r)
        {
            // 我们比较的是单词出现的个数，也就是pair类中的 second
            return l.second > r.second;
        }
	};
};

// 如果想使用sort来进行排序，我们只需要改变仿函数即可
class Solution {
public:
struct compare{
    // 仿函数
    bool operator()(const pair<string, int>& l, const pair<string, int>& r)
    {
        // 我们比较的是单词出现的个数，也就是pair类中的 second
        // 如果出现的次数相等，还需要比较单词的大小(也就是比较字符串的大小)
        return l.second > r.second || (l.first < r.first && l.second == r.second);
    }
};
    vector<string> topKFrequent(vector<string>& words, int k) {
        // 1.首先我们要统计出每个单词的个数
        map<string, int> Countmap;
        for(string& e : words)
        {
            Countmap[e]++;
        }

        // 2.按照单词出现的频率，也就是单词个数的大小来对单词进行排序
        // 将map中的数据放入vector方便我们后续的遍历
        vector<pair<string, int>> v;
        for(const pair<string, int>& KV : Countmap)
        {
            v.push_back(KV);
        }

        // compare() 是一个仿函数的匿名对象
        // pair的比较规则并不适合，因此需要我们自己来写仿函数
        sort(v.begin(), v.end(), compare());

        // 3.将排序好的前k个单词放入一个vector容器中，并返回
        vector<string> ret;
        for(size_t i = 0; i < k; ++i)
        {
            ret.push_back(v[i].first);
        }

        return ret;
    }
};

两个数组的交集

解题思路：

将两个数组都放入set中，这样两个数组会有序
再创建一个容器vector，
- 当 *it1 等于*it2时，插入vector中,且两个迭代器同时++
- 如果不相等，数组元素小的这一方迭代器++

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        // 1.将两个数组都放入set中，这样两个数组会有序（set底层是搜索二叉树，会进行排序）
        // template <class InputIterator> set (InputIterator first, InputIterator last, const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type());
        set<int> s1(nums1.begin(), nums1.end());
        set<int> s2(nums2.begin(), nums2.end());

        // 2.再创建一个容器vector，
	    // 当 *it1 等于 *it2 时，插入vector中,且两个迭代器同时++
	    // 如果不相等，数组元素小的这一方迭代器++
        vector<int> v;
        set<int>::iterator it1 = s1.begin();
        set<int>::iterator it2 = s2.begin();
        while(it1 != s1.end() && it2 != s2.end())
        {
            if(*it1 == *it2)
            {
                v.push_back(*it1);
                it1++;
                it2++;
            }
            else if(*it1 < *it2)
            {
                it1++;
            }
            else
            {
                it2++;
            }
        }

        return v;
        
    }
};

上一篇：测试用例设计--边界值法

下一篇： OpenSSL 3.0.0 设计（III）｜FIPS 模块