C++ 多线程线程安全关联性map设计_编程开发

C++ 多线程线程安全关联性map设计

创始人

2024-02-02 10:11:34

0次

我们知道关联性map有多种实现方式，一般有顺序表和二叉树以及哈希表；

如果我们要设计一个线程安全的map，且要求并发性要高，那么我们可以对上面的实现方法做一个评价；

1：二叉树，稍微想一下就会不合适，拿AVL树来讲

：效率底下，每次访问树都需要经过根节点，这说明我们要拿一个互斥量来保护根节点，这很不好，因为访问根节点的次数太多了；

：容易死锁，当有多个线程进行着向下遍历树和向上遍历数，因为每次遍历可能需要获取邻近节点的锁，所以遍历方向的不同会导致死锁的发声

【这些毛病是树结构通有的，因为树型数据结构每个数据的之间的依赖性太强了，这说明树型结构可能不适合多线程并发】

2：顺序表，这个数据结构有着比二叉树更操蛋的问题

：会导致死锁，和二叉树一样的理由

：效率底下，不是因为互斥量的原因，而是因为数据结构本身的原因，一次查询就需要o(n)的时间，因为这个，即使在单线程中，也几乎没有人会拿顺序表作为map的实现

3：哈希表，这个数据结构就非常适合并发了，而且是高并发！

：对于每一个桶之间都是一个独立的个体，之间没有依赖关系，这说明我们可以同时访问两个桶，更普遍地说，如果情况是理想的，我们可以同时访问所有桶！只需要给每个桶一个互斥量，以保证对单独的一个桶的访问是串行的【我们也可以用boost::shared_lock来做到对一个桶多并发读访问，但是修改访问是串行的】

综上所述，我选择哈希表作为map的实现：

看下列代码：

#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;//类拷贝方案错误
class class_construct_error :public exception {};template>
class hash_map {
private:class bucket {private:typedef pair date;typedef typename std::list::iterator date_iterator;typedef std::list date_store;//拷贝策略接口：struct strategy_construct {virtual void operator()(date_iterator it, const value& val) = 0;};//两种策略拷贝策略//移动拷贝策略struct move_construct :public strategy_construct {void operator()(date_iterator it, const value& val) {it->second = std::move(val);}};//赋值拷贝策略struct copy_construct :public strategy_construct {void operator()(date_iterator it, const value& val) {it->second = val;}};date_store dates;std::mutex mtx;//寻找迭代器date_iterator find_for_iterator(const key& k) {return find_if(dates.begin(), dates.end(),[&](const date& it){return  k == it.first; });}public:strategy_construct *strategy;bucket() {if (std::is_move_constructible::value) {strategy = new move_construct();return;}else if (std::is_copy_constructible::value) {strategy = new copy_construct();return;}//如果类没有合适的拷贝构造函数，那么就直接中止程序}//修改、添加值//如果添加，返回true，否则返回falsebool add_or_update(const key& k, const value& val) {lock_guard lock_g(mtx);date_iterator it = find_for_iterator(k);if (it == dates.end()) {//没找到，则添加值dates.push_back(date(k, val));return true;}else {(*strategy)(it, val);//要求value类要有拷贝构造函数return false;}}/* 删除值* return 如果值存在并删除，那么return true 否则 return false*/bool remove(const key& k) {lock_guard lock_g(mtx);date_iterator it = find_for_iterator(k);if (it != dates.end()) {dates.erase(it);return true;}return false;}/*寻找k对应的值return 如果找到，则return对应的value，否则return 默认val*/value find_value(const key& k, const value& default_val) {lock_guard lock_g(mtx);date_iterator it = find_for_iterator(k);if (it != dates.end()) {return it->second;}return default_val;}size_t size() { return dates.size(); }//这三个操作是为扩充哈希表而实现的，在这段时间内任何对哈希表的请求都会被阻塞，所以不需要锁保护void push(date& new_date) {this->dates.push_back(std::move(new_date));}date_iterator begin() { return dates.begin();}date_iterator end() { return dates.end(); }};std::vector> buckets;//桶管理器hash hasher;//哈希器size_t cnt;//元素个数atomic flag{ 1 };//是否将刚调用哈希表的线程阻塞atomic consumer;//当前时刻访问的哈希表的线程量condition_variable cond_check;//让check函数等待condition_variable cond_enter;//让正在扩充哈希表的这段时间内访问哈希表的线程等待std::mutex mtx_check, mtx_enter;bucket& find_bucket(const key& k) {std::size_t const bucket_index = hasher(k) % buckets.size();return *buckets[bucket_index];}void reorder() {size_t old_size = buckets.size();size_t index;std::vector> new_bucket(old_size * 10);for (auto& t : new_bucket) {t = std::make_unique();}for (auto& t : buckets) {for (auto it = t.get()->begin(); it != t.get()->end(); it++) {index = hasher(it->first) % new_bucket.size();new_bucket[index].get()->push(*it);}}buckets = std::move(new_bucket);//哈希表扩充完毕，唤醒等待的线程；flag = 1;cond_enter.notify_all();}void check() {if (double(cnt) / buckets.size() > 16) {if (consumer > 0) {flag=false;//开始扩充哈希表，阻止线程访问unique_lock lock_u(mtx_check);cond_check.wait(lock_u);//等待所有线程从哈希表中退出}flag = false;reorder();}}void enter() {if (flag == false) {unique_lock lock_u(mtx_enter);cond_enter.wait(lock_u);lock_u.unlock();//记得要unlock，要不然这些线程会串行}consumer++;}void exit() {consumer--;if (flag == 0 && consumer == 0) {//此刻哈希表的访问线程为0，哈希表正在等待扩充cond_check.notify_all();//开始扩充}}public:hash_map(unsigned int size = 19):buckets(size) {for (unsigned int i = 0; i < size; i++) {buckets[i].reset(new bucket());}}hash_map(const hash_map&) = delete;value find(const key& k, const value& default_val = value()) {enter();return this->exit(),find_bucket(k).find_value(k, default_val);}//如果添加，返回true，否则返回falsebool modify_or_add(const key& k,const value& val) {enter();if (find_bucket(k).add_or_update(k, val)) {this->exit();cnt++; check();return true;}else {this->exit();return false;}}bool remove(const key& k) {enter();if (find_bucket(k).remove(k)) {cnt--;this->exit();return true;}else {this->exit();return false;}}size_t size() { return cnt; }size_t bucket_size() { return buckets.size(); }
};

这边的思路是用一个互斥量来保护一个桶，这里没什么好说的；

但是要注意，当我们的哈希表扩张时，要保证此刻哈希表没有线程进行访问，且要保证在进行扩展的这段时间，线程能够进行访问的，为此我利用了两个环境变量和两个原子对象来控制这个流程，下面简单描述一下逻辑；

atmoic consumer;此刻访问哈希表的线程数

atomic flag;是否允许线程对哈希表进行访问，当开始扩充时，将其设置为false

1：当一个线程开始访问哈希表时，先进入enter函数，判断是否能进行访问，如果不能则线程进入阻塞状态；

2：当一个线程结束访问哈希表是，进入exit函数，判断是否能哈希表是否能进行访问，如果不能，则说明哈希表正在等待扩张，这再判断此刻是否已经没有线程对哈希表进行访问，如果是的话，则唤醒哈希表，进行扩张；

3：当要开始扩张哈希表的时候，见flag置为false，并进入阻塞状态，等待线程将其唤醒；

4：当扩张完毕时，将flag设置为true，以开放哈希表，然后唤醒在扩展时进入阻塞状态的线程；

上一篇：企业认证两化融合管理体系贯标的益处

下一篇：kube-apiserver鉴权源码简析

C++ 多线程线程安全关联性map设计

相关内容

热门资讯

C++ 多线程 线程安全关联性map设计

相关内容

热门资讯

C++ 多线程线程安全关联性map设计