1.背景
上周在生产环境应用启动时,发生应用频频发生死锁的现象。原因是因为 spring IOC 容器还未初始化完成,就有工作线程调用 context.getBean() 来获取容器里的对象。具体产生死锁的原因条件有:
1. 应用启动的时候 Main 线程进行 spring 容器初始化。
2. 容器初始化的过程中有工作线程也起来了并开始工作。
3. 工作线程代码里显式调用 spring ioc 容器的 context.getBean(String beanName) 。
4. 工作线程显式获取的 bean 未实例化,且里存在直接或者间接的注解注入方式的情况。
以上情况都符合,那工作线程和 main 线程可能发生死锁。
2.具体原因分析
Spring ioc 容器组合里有两个重要的 map :
/** Map of bean definition objects, keyed by bean name */
private final Map beanDefinitionMap = CollectionFactory.createConcurrentMapIfPossible (16);
//bean definition 是 spring 容器里描述 bean 对象的元数据( bean 的创建等就是基于此来创建)。 Spring 容器初始化实例之前需要先把配置文件的 bean 定义都转化成内部的统一描述对象 BeanDefinition 。该beanDefinitionMap 用于保存这些数据。
/** Cache of singleton objects: bean name --> bean instance */
private final Map singletonObjects = CollectionFactory.createConcurrentMapIfPossible (16);
//spring 容器用于 cache 住 spring 容器初始化的单例对象
以上两个对象为了保证数据的一致性,在操作的时候很多时候会进行加锁。如以下两个过程。
过程一: spring 容器初始化
Spring 容器初始化的时候会实例化所有单例对象( preInstantiateSingletons ),这个过程中会对上面两个对象加锁,以防止并发。先对 beanDefinitionMap 加锁,防止元数据被修改,然后在每次实例化单例对象的时候对singletonObjects 加锁,防止并发修改。
过程二:根据 spring 容器获取一个单例对象。
调用 spring 容器的 context.getBean ( beanName ),如果该 bean 是单例且还未实例化,这个时候就需要进行实例化,如果该 bean 直接或间接存在注解方式的 bean 注入的时候,过程中也会对以上两个对象进行加锁防止并发。先对 singleObjects 加锁,从改 map 里找是否有存在 beanName 的对象,没有的话在创建该 bean 的过程中会对 beanDefinitionMap 加锁。
可以看出以上过程一和过程二对两个对象的锁顺序是不一致的,所以并发执行就可能会发生死锁。
在本机写了一个简单的实验,死锁的线程栈信息可以证明这一点,具体如下:
代码十分简单,如下:
其中mybean定义如下(一定要用注解的注入方式,才会有可能发生死锁!):
myBean.xml:
以上代码经过调试控制,即会发生思索,控制如下:
1.main线程在DefaultListableBeanFactory.preInstantiateSingletons 方法的
synchronized (this.beanDefinitionMap) {
...
}里加个断点
2.getBean工作线程在DefaultSingletonBeanRegistry.getSingleton(String beanName, ObjectFactory singletonFactory)方法的
synchronized (this.singletonObjects) {
...
}里加个断点。
3.等1,2断点都进去之后,再触发继续运行,就会发生死锁。
结论也许可以算是 spring 的 bug ,也许可以算我们使用不当。
总之,有两点需要注意:
1. 尽量避免显式调用 ioc 容器,注入工作由容器自己来完成。
2. 尽量在容器初始化完,开始对外服务。