Linux环境多线程编程基础设施

lileifrog
4 ℃
2020-01-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

本文介绍多线程环境下并行编程的基础设施。主要包括：Volatile__threadMemoryBarrier__sync_synchronizevolatile编译器有时候为了优化性能，会将一些变量的值缓存到寄存器中，因此如果编译器发现该变量的值没有改变的话，将从寄存器里读出该值，这样可以避免内存访问。但是这种做法有时候会有问题。如果该变量确实（以某种很难检测的方式）被修改呢？那岂不是读到错的值？是的。在多线程情况下，问题更为突出：当某个线程对一个内存单元进行修改后，其他线程如果从寄存器里读取该变量可能读到老值，未更新的值，错误的值，不新鲜的值。如何防止这样错误的“优化”？方法就是给变量加上volatile修饰。volatileinti=10;//用volatile修饰变量i......//somethinghappenedintb=i;//强制从内存中读取实时的i的值OK，毕竟volatile不是完美的，它也在某种程度上限制了优化。有时候是不是有这样的需求：我要你立即实时读取数据的时候，你就访问内存，别优化；否则，你该优化还是优化你的。能做到吗？不加volatile修饰，那么就做不到前面一点。加了volatile，后面这一方面就无从谈起，怎么办？伤脑筋。其实我们可以这样：inti=2;//变量i还是不用加volatile修饰#defineACCESS_ONCE(x)(*(volatiletypeof(x)*)&(x))需要实时读取i的值时候，就调用ACCESS_ONCE(i)，否则直接使用i即可。这个技巧，我是从《Isparallelprogramminghard？》上学到的。听起来都很好？然而险象环生：volatile常被误用，很多人往往不知道或者忽略它的两个特点：在C/C++语言里，volatile不保证原子性；使用volatile不应该对它有任何MemoryBarrier的期待。第一点比较好理解，对于第二点，我们来看一个很经典的例子：volatileintis_ready=0;charmessage[123];voidthread_A{while(is_ready==0){}//usemessage;}voidthread_B{strcpy(message,);is_ready=1;}线程B中，虽然is_ready有volatile修饰，但是这里的volatile不提供任何MemoryBarrier，因此12行和13行可能被乱序执行，is_ready=1被执行，而message还未被正确设置，导致线程A读到错误的值。这意味着，在多线程中使用volatile需要非常谨慎、小心。__thread__thread是gcc内置的用于多线程编程的基础设施。用__thread修饰的变量，每个线程都拥有一份实体，相互独立，互不干扰。举个例子：#includeiostream#includepthread.h#includeunistd.husingnamespacestd;__threadinti=1;void*thread1(void*arg);void*thread2(void*arg);intmain(){pthread_tpthread1;pthread_tpthread2;pthread_create(&pthread1,NULL,);pthread_create(&pthread2,NULL,thread2,NULL);pthread_join(pthread1,NULL);pthread_join(pthread2,NULL);return0;}void*thread1(void*arg){cout++iendl;//输出2returnNULL;}void*thread2(void*arg){sleep(1);//等待thread1完成更新cout++iendl;//输出2，而不是3returnNULL;}需要注意的是：1，__thread可以修饰全局变量、函数的静态变量，但是无法修饰函数的局部变量。2，被__thread修饰的变量只能在编译期初始化，且只能通过常量表达式来初始化。MemoryBarrier为了优化，现代编译器和CPU可能会乱序执行指令。例如：inta=1;intb=2;a=b+3;b=10;CPU乱序执行后，第4行语句和第5行语句的执行顺序可能变为先b=10然后再a=b+3有些人可能会说，那结果不就不对了吗？b为10，a为13？可是正确结果应该是a为5啊。哦，这里说的是语句的执行，对应的汇编指令不是简单的movb,10和movb,a+3。生成的汇编代码可能是：movlb(%rip),%eax;将b的值暂存入%eaxmovl$10,b(%rip);b=10addl$3,%eax;%eax加3movl%eax,a(%rip);将%eax也就是b+3的值写入a,即a=b+3这并不奇怪，为了优化性能，有时候确实可以这么做。但是在多线程并行编程中，有时候乱序就会出问题。一个最典型的例子是用锁保护临界区。如果临界区的代码被拉到加锁前或者释放锁之后执行，那么将导致不明确的结果，往往让人不开心的结果。还有，比如随意将读数据和写数据乱序，那么本来是先读后写，变成先写后读就导致后面读到了脏的数据。因此，MemoryBarrier就是用来防止乱序执行的。具体说来，MemoryBarrier包括三种：1，acquirebarrier。acquirebarrier之后的指令不能也不会被拉到该acquirebarrier之前执行。2，releasebarrier。releasebarrier之前的指令不能也不会被拉到该releasebarrier之后执行。3，fullbarrier。以上两种的合集。所以，很容易知道，加锁，也就是lock对应acquirebarrier；释放锁，也就是unlock对应releasebarrier。哦，那么fullbarrier呢？__sync_synchronize__sync_synchronize就是一种fullbarrier。