`
haierboos
  • 浏览: 439028 次
文章分类
社区版块
存档分类
最新评论

Java多线程初学者指南(9):为什么要进行数据同步

 
阅读更多

本文为原创,如需转载,请注明作者和出处,谢谢!

Java中的变量分为两类:局部变量和类变量。局部变量是指在方法内定义的变量,如在run方法中定义的变量。对于这些变量来说,并不存在线程之间共享的问题。因此,它们不需要进行数据同步。类变量是在类中定义的变量,作用域是整个类。这类变量可以被多个线程共享。因此,我们需要对这类变量进行数据同步。

数据同步就是指在同一时间,只能由一个线程来访问被同步的类变量,当前线程访问完这些变量后,其他线程才能继续访问。这里说的访问是指有写操作的访问,如果所有访问类变量的线程都是读操作,一般是不需要数据同步的。

那么如果不对共享的类变量进行数据同步,会发生什么情况呢?让我们先看看下面的代码会发生什么样的事情:

<!--<br /> <br /> Code highlighting produced by Actipro CodeHighlighter (freeware)<br /> http://www.CodeHighlighter.com/<br /> <br /> -->packagetest;

publicclassMyThreadextendsThread
{
publicstaticintn=0;

publicvoidrun()
{
intm=n;
yield();
m
++;
n
=m;
}
publicstaticvoidmain(String[]args)throwsException
{
MyThreadmyThread
=newMyThread();
Threadthreads[]
=newThread[100];
for(inti=0;i<threads.length;i++)
threads[i]
=newThread(myThread);
for(inti=0;i<threads.length;i++)
threads[i].start();
for(inti=0;i<threads.length;i++)
threads[i].join();
System.out.println(
"n="+MyThread.n);
}
}

在执行上面代码的可能结果如下:


<!--<br /> <br /> Code highlighting produced by Actipro CodeHighlighter (freeware)<br /> http://www.CodeHighlighter.com/<br /> <br /> --> n=59

看到这个结果,可能很多读者会感到奇怪。这个程序明明是启动了100个线程,然后每个线程将静态变量n1。最后使用join方法使这100个线程都运行完后,再输出这个n值。按正常来讲,结果应该是n = 100。可偏偏结果小于100

其实产生这种结果的罪魁祸首就是我们经常提到的“脏数据”。而run方法中的yield()语句就是产生“脏数据”的始作俑者(不加yield语句也可能会产生“脏数据”,但不会这么明显,只有将100改成更大的数,才会经常产生“脏数据”,在本例中调用yield就是为了放大“脏数据”的效果)。yield方法的作用是使线程暂停,也就是使调用yield方法的线程暂时放弃CPU资源,使CPU有机会来执行其他的线程。为了说明这个程序如何产生“脏数据”,我们假设只创建了两个线程:thread1thread2。由于先调用了thread1start方法,因此,thread1run方法一般会先运行。当thread1run方法运行到第一行(int m = n;)时,将n的值赋给m。当执行到第二行的yield方法后,thread1就会暂时停止执行,而当thread1暂停时,thread2获得了CPU资源后开始运行(之前thread2一直处于就绪状态),当thread2执行到第一行(int m = n;)时,由于thread1在执行到yieldn仍然是0,因此,thread2中的m获得的值也是0。这样就造成了thread1thread2m获得的都是0。在它们执行完yield方法后,都是从0开始加1,因此,无论谁先执行完,最后n的值都是1,只是这个nthread1thread2各赋了一遍值。这个过程如下图如示:

也许有人会问,如果只有n++,会产生“脏数据”吗?答案是肯定的。那么n++只是一条语句,又如何在执行过程中将CPU交给其他的线程呢?其实这只是表面现象,n++在被Java编译器编译成中间语言(也叫做字节码)后,并不是一条语言。让我们看看下面的Java代码将会被编译成什么样的Java中间语言。

Java源代码

<!--<br /> <br /> Code highlighting produced by Actipro CodeHighlighter (freeware)<br /> http://www.CodeHighlighter.com/<br /> <br /> -->publicvoidrun()
{
n
++;
}

被编译后的中间语言代码

<!--<br /> <br /> Code highlighting produced by Actipro CodeHighlighter (freeware)<br /> http://www.CodeHighlighter.com/<br /> <br /> -->001publicvoidrun()
002{
003aload_0
004dup
005getfield
006iconst_1
007iadd
008putfield
009return
010}

大家可以看到在run方法中只有n++一条语句,而在编译后,却有7条中间语言语句。我们并不需要知道这些语句的功能是什么,只看一下第005007008行语句。在005行是getfield,根据它的英文含义可知是要得到某个值,因为这里只有一个n,所以毫无疑问,是要得到n的值。而在007行的iadd也不难猜测是将这个得到的n值加1。在008行的putfield的含义我想大家可能已经猜出来了,它负责将这个加1后的n再更新回类变量n。说到这,可能大家还有一个疑惑,执行n++时直接将n1不就行了,为什么要如此费周折。其实这里涉及到一个Java内存模型的问题。

Java的内存模型分为主存储区和工作存储区。主存储区保存了Java中所有的实例。也就是说,在我们使用new来建立一个对象后,这个对象及它内部的方法、变量等都保存在这一区域,在MyThread类中n就保存在这个区域。主存储区可以被所有线程共享。而工作存储区就是我们前面所讲的线程栈,在这个区域里保存了在run方法以及run方法所调用的方法中定义的变量,也就是方法变量。在线程要修改主存储区中的变量时,并不是直接修改这些变量,而是将它们先复制到当前线程的工作存储区,在修改完后,再将这个变量值覆盖主存储区的相应的变量值。

在了解了

Java

的内存模型后,就不难理解为什么

n++

也不是原子操作了。它必须经过一个拷贝、加

1

和覆盖的过程。这个过程和在MyThread类中模拟的过程类似。大家可以想象,如果在执行到

getfield

时,

thread1

由于某种原因被中断,那么就会发生和MyThread类的执行结果类似的情况。要想彻底解决这个问题,就必须使用某种方法对n进行同步,也就是在同一时间只能有一个线程操作n,这也称为对n的原子操作。
分享到:
评论

相关推荐

    Java多线程初学者指南

    Java多线程初学者指南,共12篇文档,由浅入深,举例说明,包括一些疑点都解释得很清楚,类,方法,属性同步的区别等细节也都介绍得很全面,是个很好的学习资料。

    【并发编程】CAS到底是什么.pdf

    中级开发者:已经具备一定的编程经验,希望提高程序性能或学习多线程开发的人员。 高级开发者:需要深入理解并发编程原理,解决复杂并发问题的资深开发者。 计算机科学学生:正在学习计算机科学,对并发和分布式系统...

    【并发编程】volatile的原理我好像又懂了.pdf

    中级开发者:已经具备一定的编程经验,希望提高程序性能或学习多线程开发的人员。 高级开发者:需要深入理解并发编程原理,解决复杂并发问题的资深开发者。 计算机科学学生:正在学习计算机科学,对并发和分布式系统...

    【并发编程】自定义简单线程池.pdf

    中级开发者:已经具备一定的编程经验,希望提高程序性能或学习多线程开发的人员。 高级开发者:需要深入理解并发编程原理,解决复杂并发问题的资深开发者。 计算机科学学生:正在学习计算机科学,对并发和分布式系统...

    【并发编程】简单化理解AQS和ReentrantLock.pdf

    中级开发者:已经具备一定的编程经验,希望提高程序性能或学习多线程开发的人员。 高级开发者:需要深入理解并发编程原理,解决复杂并发问题的资深开发者。 计算机科学学生:正在学习计算机科学,对并发和分布式系统...

    【并发编程】如何优雅使用线程池.pdf

    中级开发者:已经具备一定的编程经验,希望提高程序性能或学习多线程开发的人员。 高级开发者:需要深入理解并发编程原理,解决复杂并发问题的资深开发者。 计算机科学学生:正在学习计算机科学,对并发和分布式系统...

    【并发编程】深入理解JMM.pdf

    中级开发者:已经具备一定的编程经验,希望提高程序性能或学习多线程开发的人员。 高级开发者:需要深入理解并发编程原理,解决复杂并发问题的资深开发者。 计算机科学学生:正在学习计算机科学,对并发和分布式系统...

    Eclipse权威开发指南2.pdf

    5.3 为初学者准备的CVS概述...... 133 5.3.1 CVS的一些重要设计原则..... 133 5.3.2 修订版:任何东西都不会被丢失..... 134 5.3.3 更新:跟上小组的进度..... 134 5.3.4 提交:共享您的资源..... 134 5.3.5 版本...

    Eclipse权威开发指南3.pdf

    5.3 为初学者准备的CVS概述...... 133 5.3.1 CVS的一些重要设计原则..... 133 5.3.2 修订版:任何东西都不会被丢失..... 134 5.3.3 更新:跟上小组的进度..... 134 5.3.4 提交:共享您的资源..... 134 ...

    Eclipse权威开发指南1.pdf

    5.3 为初学者准备的CVS概述...... 133 5.3.1 CVS的一些重要设计原则..... 133 5.3.2 修订版:任何东西都不会被丢失..... 134 5.3.3 更新:跟上小组的进度..... 134 5.3.4 提交:共享您的资源..... 134 ...

    asp.net知识库

    ADO.NET 2.0 大批量数据操作和多个动态的结果集 ADO.NET 2.0 异步处理 在ASP.NET中使用WINDOWS验证方式连接SQL SERVER数据库 改进ADO.Net数据库访问方式 ASP.NET 2.0 绑定高级技巧 简单实用的DataSet更新数据库的类+...

Global site tag (gtag.js) - Google Analytics