欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

基本使用映射和集合 -3. 树状结构的关联容器

最编程 2024-04-21 18:34:48
...

根据应用场景的不同,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:mapsetmultimapmultiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

3.1 set的介绍和使用

// set的类域
std::set

    
// set的类模板如下:  
template < class T,                        // set::key_type/value_type
           class Compare = less<T>,        // set::key_compare/value_compare
           class Alloc = allocator<T>      // set::allocator_type
           > 
class set{}
  1. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。

  2. set中插入元素时,只需要插入value即可,不需要构造键值对。

  3. set中的元素不可以重复(因此可以使用set进行去重)。

  4. 使用set的迭代器遍历set中的元素,可以得到有序序列

  5. set中的元素默认按照小于来比较

  6. set中查找某个元素,时间复杂度为:log_2 n

  7. set中的元素不允许修改(为什么?)

  8. set中的底层使用二叉搜索树(红黑树)来实现。

std::set

#include<iostream>
#include<set>
using namespace std;

void test_set1()
{
	set<int> s;
	s.insert(3);
	s.insert(1);
	s.insert(4);
	s.insert(7);
	s.insert(2);
	s.insert(1);

	// set的底层是一个搜索二叉树因此会进行 ==> 排序+去重
	// set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
    // 打印结果为:1 2 3 4 7
	cout << endl;
    
    // 算法库中的find函数的时间复杂度为 O(N)
    // set内置的find函数的时间复杂度为(logN)
    // auto pos = s.find(3);       
	auto pos = find(s.begin(), s.end(), 3);  // 这里使用的是算法库的find函数
	if (pos != s.end())
	{
		s.erase(pos);
	}
    
	cout << s.erase(1) << endl;
	cout << s.erase(3) << endl;  // 已经删除,则直接返回,不会进行任何操作
    
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}


int main()
{
	test_set1();

	return 0;
}

std::multiset

  1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
  2. multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是keykey就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
 // 演示:
#include<iostream>
#include<set>
using namespace std;

void test_set2()
{
    // multiset不会进行去重
	multiset<int> s;
	s.insert(3);
	s.insert(1);
	s.insert(4);
	s.insert(7);
	s.insert(2);
	s.insert(1);
	s.insert(1);
	s.insert(3);
	s.insert(1);
	s.insert(3);
	s.insert(2);
	s.insert(1);
	s.insert(1);


	// 排序
	// multiset<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
    

	// 支持范围for
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;

	// 找到的是中序遍历的第一个3,并返回它的iterator
	auto pos = s.find(3);                    // 时间复杂度为O(logN)
	while (pos != s.end())
	{
		cout << *pos << " ";
		++pos;
	}
	cout << endl;
}
// 打印结果如下:
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 3 3 3 4 7

int main()
{
	test_set2();

	return 0;
}

3.2 map的介绍和使用

std::map
    // 类模板
template < class Key,                                     // map::key_type
           class T,                                       // map::mapped_type
           class Compare = less<Key>,                     // map::key_compare
           class Alloc = allocator<pair<const Key,T> >    // map::allocator_type
           > 
 class map{}
  1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。

  2. map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,keyvalue通过成员类型value_type绑定在一起,为其取别名称为pair:

    typedef pair<const key, T> value_type;

  3. 在内部,map中的元素总是按照键值key进行比较排序的。

  4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。

  5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。

  6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

make::pair

The behavior of this function template is the same as if defined as:
// 这个函数模板的行为与定义的一样:

// make_pair的函数模板
// 返回值类型为pair<T1,T2>
// 需要两个参数T1 x, T2 y 分别是键值key,和值value
template <class T1,class T2>
pair<T1,T2>   make_pair (T1 x, T2 y)
{
	return  ( pair<T1,T2>(x,y) ); 
}
// 注:pair<T1,T2>(x,y)  是一个匿名对象

map

  • 演示1:
int main()
{
	map<string, string> dict;
    // 注:pair<string, string>("排序", "sort")是一个匿名对象
	dict.insert(pair<string, string>("排序", "sort"));
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边", "right"));
	dict.insert(make_pair("字符串", "string"));

	// map<string, string>::iterator it = dict.begin();
	auto it = dict.begin();
	while (it != dict.end())
	{
        // 下面这两种打印方式都可以
		// cout << (*it).first<<":"<<(*it).second << endl;
		cout << it->first << ":" << it->second << endl;
		++it;
	}
	cout << endl;

    // for循环
	for (const auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}
  • 演示2:统计水果出现的次数
#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;


int main()
{
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };

/*  // 方法1:
	map<string, int> countmap;
	for (auto& e : arr)
	{
		// map<string, int>::iterator it = countmap;
		auto it = countmap.find(e);
		if (it == countmap.end())
		{
			// 代码运行到这里说明没有相对应的水果,那么我们就进行插入
			countmap.insert(make_pair(e, 1));
		}
		else
		{
			// 运行到这里说明,存在相对应的结果,则对水果的个数进行++
			it->second++;
		}
	}
*/
    
    // 方法二:
    map<string, int> countmap;
    // 使用for循环将数组arr中的数据拿出,传引用给e
	for (auto& e : arr)
	{
        // countmap[e] 
        // 1.将e插入到map对象中
        // 2.返回值是value的传引用返回
		countmap[e]++;
	}
    
    for (const auto& kv : countmap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}

// 打印结果为:
// 草莓:1
// 苹果:6
// 西瓜:3
// 香蕉:3
注:
std::map::operator[]
A call to this function is equivalent to:
// 对该函数的调用相当于:
(*((this->insert(make_pair(k, mapped_type()))).first)).second
    // 1.this->insert(make_pair(k, mapped_type())    使用A代替
    // 2.(*(A.first)).secend
    // 3.详细解释如下所示
std::map::insert
pair<iterator,bool>  insert (const value_type& val);
    
// insert函数的返回值:Return value
The single element versions (1) return a pair, with its member pair::first set to an iterator pointing to either the newly inserted element or to the element with an equivalent key in the map. The pair::second element in the pair is set to true if a new element was inserted or false if an equivalent key already existed.
	单元素版本(1)返回一个 pair 对象,其中 pair::first 成员设置为指向新插入元素或具有等效键的元素的迭代器。如果插入了一个新元素,pair 对象中的 pair::second 元素设置为 true,如果已经存在一个等效键,则设置为 false。
// map<string, int> countmap;
// countmap[e];
// e就是将要插入的key也就是键值

// 重载[]的内部我们可以理解为:
V& operator[](const K& K)
{
    // 如果K已经存在,则pair::first 指向k,pair::second 为false
    // V() 是V类型的匿名对象
    pair<iteraor, bool> ret = insert( make_pair(k, V())); 

    // ret的类型为pair<iteraor, bool>,
    // ret.first 就是迭代器
    // 迭代器内指向对应的节点,节点存储的键值对的类型为pair<T1,T2>(k, V())
    // 所以ret.first->second 就是这个V()匿名对象
    // 注:因为是传引用返回,所以对返回值进行修改,就可以将相应节点的value值修改
    return ret.first->second;

    // 也可以写为
    // return (*(ret.first)).second
}  

演示3:

// 明白了opertaor[]的用法之后,还有如下的应用:
int main()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("左边", "left"));
    
	// pair<iteraor, bool> ret = insert( make_pair(k, V())); 
	// operator[] 的返回值为Value的引用返回,Value的值原本为默认构造的值,也就是V()
	// 如果Value为指针,则默认构造为nullptr
	// 如果Value为字符串,则默认构造为\0
	// 如果Value为整型,则默认构造为0
	// 下面这行代码修改了key对应的value值
	dict["迭代器"] = "iterator"; // 插入+修改

	// 根据二叉树的原理,key值不可以重复,因此如果key已经存在,那么就不会进行插入
	dict["insert"]; 

    // 插入失败,此时key值已经存在了(在二叉树中已经有"左边"这个key值了
	dict.insert(pair<string, string>("左边", "xxx")); 
	
    // 修改  
    // pair<iteraor, bool> ret = insert( make_pair(k, V())); 
    // dict["insert"] 的返回值是value的引用,对其进行赋值,就可以修改对应节点的value值
	dict["insert"] = "插入"; 

    // dict["左边"]的返回值是value的引用
	cout << dict["左边"] << endl; 

	// map<string, string>::iterator it = dict.begin();
	auto it = dict.begin();
	while (it != dict.end())
	{
        // 下面两种打印方式都是可以的
		// cout << (*it).first<<":"<<(*it).second << endl;
		cout << it->first << ":" << it->second << endl;
		++it;
	}
	cout << endl;


	return 0;
}

multimap

  • 注:

    1. multimap中的key是可以重复的。

    2. multimap中的元素默认将key按照小于来比较

    3. multimap中没有重载operator[]操作(同学们可思考下为什么?)。

    4. 使用时与map包含的头文件相同:

#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;

int main()
{
	multimap<string, string> dict;
    // 向multimap插入键值对
	dict.insert(make_pair("left", "左边"));
	dict.insert(make_pair("left", "剩余"));
	dict.insert(make_pair("string", "字符串"));
	dict.insert(make_pair("left", "xxx"));

    // 使用for循环进行打印
	for (const auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

    // 初始化存放水果的数组
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };

    // 创建一个multimap对象
	multimap<string, int> countMap;
    
	for (auto& e : arr)
	{
        // iterator find (const key_type& k);
		// map<string, int>::iterator it = countMap
		auto it = countMap.find(e); 
		if (it == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}

	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}

在OJ中得应用

前k个高频单词

image-20240421172614000

解题思路:

  1. 首先我们要统计出每个单词的个数

  2. 按照单词出现的频率,也就是单词个数的大小来对单词进行排序

    • 我们考虑使用算法库中的sort函数或者stable_sort函数来对单词个数进行排序

    • 最终选择用stable_sort,这是因为stable_sort是一个稳定排序

    • sort是不稳定排序,即经过排序之后,相同值的元素在序列中的相对位置可能发生改变。

    • stable_sort是稳定排序,即经过排序之后,相同值的元素在序列中的相对位置不会发生改变。

      比如:原始数组 1 2 3 2
      用sort和stable_sort虽然都可以将其排序为 1 2 2 3
      但是sort可能会打乱两个相同的数的相对位置,例如原始数组中的2

  3. 将排序好的前k个单词放入一个vector容器中,并返回

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        // 1.首先我们要统计出每个单词的个数
        map<string, int> Countmap;
        for(string& e : words)
        {
            Countmap[e]++;
        }

        // 2.按照单词出现的频率,也就是单词个数的大小来对单词进行排序
        // 将map中的数据放入vector方便我们后续的遍历
        vector<pair<string, int>> v;
        for(const pair<string, int>& KV : Countmap)
        {
            v.push_back(KV);
        }

        // compare() 是一个仿函数的匿名对象
        // pair的比较规则并不适合,因此需要我们自己来写仿函数
        stable_sort(v.begin(), v.end(), compare());

        // 3.将排序好的前k个单词放入一个vector容器中,并返回
        vector<string> ret;
        for(size_t i = 0; i < k; ++i)
        {
            ret.push_back(v[i].first);
        }

        return ret;
    }
    
private:
    struct compare{
        // 仿函数
        bool operator()(const pair<string, int>& l, const pair<string, int>& r)
        {
            // 我们比较的是单词出现的个数,也就是pair类中的 second
            return l.second > r.second;
        }
	};
};

// 如果想使用sort来进行排序,我们只需要改变仿函数即可
class Solution {
public:
struct compare{
    // 仿函数
    bool operator()(const pair<string, int>& l, const pair<string, int>& r)
    {
        // 我们比较的是单词出现的个数,也就是pair类中的 second
        // 如果出现的次数相等,还需要比较单词的大小(也就是比较字符串的大小)
        return l.second > r.second || (l.first < r.first && l.second == r.second);
    }
};
    vector<string> topKFrequent(vector<string>& words, int k) {
        // 1.首先我们要统计出每个单词的个数
        map<string, int> Countmap;
        for(string& e : words)
        {
            Countmap[e]++;
        }

        // 2.按照单词出现的频率,也就是单词个数的大小来对单词进行排序
        // 将map中的数据放入vector方便我们后续的遍历
        vector<pair<string, int>> v;
        for(const pair<string, int>& KV : Countmap)
        {
            v.push_back(KV);
        }

        // compare() 是一个仿函数的匿名对象
        // pair的比较规则并不适合,因此需要我们自己来写仿函数
        sort(v.begin(), v.end(), compare());

        // 3.将排序好的前k个单词放入一个vector容器中,并返回
        vector<string> ret;
        for(size_t i = 0; i < k; ++i)
        {
            ret.push_back(v[i].first);
        }

        return ret;
    }
};

两个数组的交集

image-20240421174046802

image-20230320190918870

解题思路:

  1. 将两个数组都放入set中,这样两个数组会有序
  2. 再创建一个容器vector
    • *it1 等于*it2时,插入vector中,且两个迭代器同时++
    • 如果不相等,数组元素小的这一方迭代器++
class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        // 1.将两个数组都放入set中,这样两个数组会有序(set底层是搜索二叉树,会进行排序)
        // template <class InputIterator> set (InputIterator first, InputIterator last, const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type());
        set<int> s1(nums1.begin(), nums1.end());
        set<int> s2(nums2.begin(), nums2.end());

        // 2.再创建一个容器vector,
	    // 当 *it1 等于 *it2 时,插入vector中,且两个迭代器同时++
	    // 如果不相等,数组元素小的这一方迭代器++
        vector<int> v;
        set<int>::iterator it1 = s1.begin();
        set<int>::iterator it2 = s2.begin();
        while(it1 != s1.end() && it2 != s2.end())
        {
            if(*it1 == *it2)
            {
                v.push_back(*it1);
                it1++;
                it2++;
            }
            else if(*it1 < *it2)
            {
                it1++;
            }
            else
            {
                it2++;
            }
        }

        return v;
        
    }
};

推荐阅读