hibernate复习(1)性能优化之抓取策略

标签: hibernate 性能优化 策略 | 发表时间:2013-03-17 23:29 | 作者:allenzhangfan
出处:http://blog.csdn.net

抓取策略(fetching strategy) 是指:当应用程序需要在(Hibernate实体对象图的)关联关系间进行导航的时候, Hibernate如何获取关联对象的策略。抓取策略可以在O/R映射的元数据中声明,也可以在特定的HQL 或条件查询(Criteria Query)中重载声明。 

通过配置抓取策略可以直接影响Session的get()和load()方法的查询效率
Hibernate3 定义了如下几种抓取策略:
    * 连接抓取(Join fetching) - Hibernate通过 在SELECT语句使用OUTER JOIN(外连接)来 获得对象的关联实例或者关联集合。
    *查询抓取(Select fetching) - 另外发送一条 SELECT 语句抓取当前对象的关联实体或集合。除非你显式的指定lazy="false"禁止 延迟抓取(lazy fetching),否则只有当你真正访问关联关系的时候,才会执行第二条select语句。
    *子查询抓取(Subselect fetching) - 另外发送一条SELECT 语句抓取在前面查询到(或者抓取到)的所有实体对象的关联集合。除非你显式的指定lazy="false" 禁止延迟抓取(lazy fetching),否则只有当你真正访问关联关系的时候,才会执行第二条select语句。
    *批量抓取(Batch fetching) - 对查询抓取的优化方案, 通过指定一个主键或外键列表,Hibernate使用单条SELECT语句获取一批对象实例或集合。

Hibernate抓取策略会区分下列各种情况:

1.Immediate fetching,立即抓取 - 当宿主被加载时,关联、集合或属性被立即抓取。

2.Lazy collection fetching,延迟集合抓取- 直到应用程序对集合进行了一次操作时,集合才被抓取。(对集合而言这是默认行为。) 

3."Extra-lazy" collection fetching,"Extra-lazy"集合抓取 -对集合类中的每个元素而言,都是直到需要时才去访问数据库。除非绝对必要,Hibernate不会试图去把整个集合都抓取到内存里来(适用于非常大的集合)。 

4.Proxy fetching,代理抓取 - 对返回单值的关联而言,当其某个方法被调用,而非对其关键字进行get操作时才抓取。

5."No-proxy" fetching,非代理抓取 - 对返回单值的关联而言,当实例变量被访问的时候进行抓取。与上面的代理抓取相比,这种方法没有那么“延迟”得厉害(就算只访问标识符,也会导致关联抓取)但是更加透明,因为对应用程序来说,不再看到proxy。这种方法需要在编译期间进行字节码增强操作,因此很少需要用到。

6.Lazy attribute fetching,属性延迟加载 - 对属性或返回单值的关联而言,当其实例变量被访问的时候进行抓取。需要编译期字节码强化,因此这一方法很少是必要的。 

这里有两个正交的概念:关联何时被抓取,以及被如何抓取(会采用什么样的SQL语句)。不要混淆它们!我们使用抓取来改善性能。我们使用延迟来定义一些契约,对某特定类的某个脱管的实例,知道有哪些数据是可以使用的。 

1.操作延迟加载的关联

默认情况下,Hibernate 3对集合使用延迟select抓取,对返回单值的关联使用延迟代理抓取。对几乎是所有的应用而言,其绝大多数的关联,这种策略都是有效的。 

注意:假若你设置了hibernate.default_batch_fetch_size,Hibernate会对延迟加载采取批量抓取优化措施(这种优化也可能会在更细化的级别打开)。 

然而,你必须了解延迟抓取带来的一个问题。在一个打开的Hibernate session上下文之外调用延迟集合会导致一次意外。比如: 
Java代码   收藏代码
  1. <span style="font-size: large;">s = sessions.openSession();    
  2. Transaction tx = s.beginTransaction();                  
  3. User u = (User) s.createQuery("from User u where u.name=:userName")      .setString("userName", userName).uniqueResult();    
  4. Map permissions = u.getPermissions();    
  5. tx.commit();   
  6. s.close();    
  7. Integer accessLevel = (Integer) permissions.get("accounts");  // Error!</span>  
 在Session关闭后,permessions集合将是未实例化的、不再可用,因此无法正常载入其状态。 Hibernate对脱管对象不支持延迟实例化. 这里的修改方法是:将permissions读取数据的代码 移到tx.commit()之前。

除此之外,通过对关联映射指定lazy="false",我们也可以使用非延迟的集合或关联。但是, 对绝大部分集合来说,更推荐使用延迟方式抓取数据。如果在你的对象模型中定义了太多的非延迟关联,Hibernate最终几乎需要在每个事务中载入整个数据库到内存中!

但是,另一方面,在一些特殊的事务中,我们也经常需要使用到连接抓取(它本身上就是非延迟的),以代替查询抓取。 下面我们将会很快明白如何具体的定制Hibernate中的抓取策略。在Hibernate3中,具体选择哪种抓取策略的机制是和选择 单值关联或集合关联相一致的。


 

2.  调整抓取策略(Tuning fetch strategies)

查询抓取(默认的)在 N+1查询的情况下是极其脆弱的,因此我们可能会要求在映射文档中定义使用连接抓取:  

 

 

Java代码   收藏代码
  1. <span style="font-size: large;"><set name="permissions"     fetch="join">   
  2. <key column="userId"/>       
  3. <one-to-many class="Permission"/>   
  4. </set>   
  5. <many-to-one name="mother" class="Cat" fetch="join"/> </span>  
 在映射文档中定义的抓取策略将会对以下列表条目产生影响:通过get()或load()方法取得数据。只有在关联之间进行导航时,才会隐式的取得数据。

 

条件查询,使用了subselect抓取的HQL查询

不管你使用哪种抓取策略,定义为非延迟的类图会被保证一定装载入内存。注意这可能意味着在一条HQL查询后紧跟着一系列的查询。

通常情况下,我们并不使用映射文档进行抓取策略的定制。更多的是,保持其默认值,然后在特定的事务中, 使用HQL的左连接抓取(left join fetch) 对其进行重载。这将通知 Hibernate在第一次查询中使用外部关联(outer join),直接得到其关联数据。 在条件查询 API中,应该调用 setFetchMode(FetchMode.JOIN)语句。

也许你喜欢仅仅通过条件查询,就可以改变get() 或 load()语句中的数据抓取策略。例如:

Java代码   收藏代码
  1. <span style="font-size: large;">User user = (User) session.createCriteria(User.class) .  
  2.                    setFetchMode("permissions", FetchMode.JOIN).  
  3.                    add( Restrictions.idEq(userId) ).uniqueResult(); </span>  

 

  (这就是其他ORM解决方案的“抓取计划(fetch plan)”在Hibernate中的等价物。)截然不同的一种避免 N+1次查询的方法是,使用二级缓存。


示例配置(主要有两种情况):
  1)单端关联(<many-to-one>、<one-to-many>)上的抓取
可以给单端关联的映射元素添加fetch属性。fetch属性有两个可选值。
a).select:作为默认值,它的策略是党需要使用到关联关系对象的数据时,另外单独发送一条select语句抓取当前对象的关联对象的数据。即延时加载。
b).join:它的策略是在同一条select语句使用连接李艾获得对象的数据和它关联的对象的数据,此时关联对象的延迟加载失效.
以下是单端关联上fetch=join的一个配置示例
Java代码   收藏代码
  1. <span style="font-size: large;"><?xml version="1.0" encoding="UTF-8"?>  
  2. <!DOCTYPE hibernate-mapping PUBLIC  
  3.         "-//Hibernate/Hibernate Mapping DTD 3.0//EN"  
  4.         "http://hibernate.sourceforge.net/hibernate-mapping-3.0.dtd">  
  5.   
  6. <hibernate-mapping>  
  7.     <class name="com.javacrazyer.domain.Product" table="product">  
  8.         <id name="id">  
  9.             <generator class="native"/>  
  10.         </id>  
  11.         <version name="version"/>  
  12.           
  13.         <property name="name"/>  
  14.         <property name="unitCost" column="unit_cost"/>  
  15.         <property name="pubTime" column="pub_time"/>  
  16.           
  17.         <!-- 映射多对一 -->  
  18.         <many-to-one name="cate" column="cate_id" fetch="join"/>  
  19.           
  20.     </class>  
  21. </hibernate-mapping></span>  
 
在应用程序中加载某个实体product的数据时,会使用内连接把它关联的Category实体也加载上来,即类似下面的SQL语句:

Sql代码   收藏代码
  1. <span style="font-size: large;">select tab1.xx,tab1.yy,tab2.aa,tab2.cc   
  2.                    from product tab1   
  3.                    inner join category tab2   
  4.                    on tab1.cate_id=tab2.id   
  5.                    where product_id=?</span>  
 2)集合属性上抓取策略
 在集合属性的映射元素上可以添加fetch属性,他有三个可选值
a).select:作为默认值,它的策略是党需要使用所关联集合的数据时,另外单独发送一条select语句抓取当前对象的关联集合,即延时加载
b).join:在同一条select语句使用连接来获得对象的关联集合,此时关联集合上的lazy会失效
c).subselect:另外发送一体哦啊查询语句(或者子查询语句)抓取在前面查询到的所有实体对象的关联集合.这个策略对HQL的查询也起作用.
以下是集合属性上fetch=subselect的示例
Java代码   收藏代码
  1. <span style="font-size: large;"><?xml version="1.0" encoding="UTF-8"?>  
  2. <!DOCTYPE hibernate-mapping PUBLIC  
  3.         "-//Hibernate/Hibernate Mapping DTD 3.0//EN"  
  4.         "http://hibernate.sourceforge.net/hibernate-mapping-3.0.dtd">  
  5.   
  6. <hibernate-mapping>  
  7.     <class name="com.javacrazyer.domain.Category" table="category" batch-size="10">  
  8.         <id name="id">  
  9.             <generator class="native"/>  
  10.         </id>  
  11.         <version name="version"/>  
  12.         <property name="name"/>  
  13.         <property name="description"/>  
  14.           
  15.         <!-- 映射集合属性 -->  
  16.         <bag name="productList" inverse="true" fetch="subselect">  
  17.             <key column="cate_id"/>  
  18.             <!-- 映射一对多 -->  
  19.             <one-to-many class="com.javacrazyer.domain.Product"/>  
  20.         </bag>  
  21.     </class>  
  22. </hibernate-mapping></span>  
当使用get()或load()方法加载一个Category实体数据时,它对关联的Product集合属性先延迟加载,当真正需要使用 Product集合属性中的数据时,才再发送一条SQL语句来抓取数据; 当使用HQL语句加载多个CategoryShiite数据时,对它们关联的Product集合属性先延迟加载,当真正需要使用Product集合属性的数据时,才会再发送一条子查询语句来抓取相应的数据


批量抓取:
(1)在Hibernate中,对于关联抓取,可以定义每次抓取数据的数量,批量地将数据载入内存,减少与数据库交互的次数。在应用程序中可以定义车间默认的关联抓取数量。在
<hibernate-configuration>
    <session-factory>
         <property name-"default_batch_fetch_size">2</property>
    </session-factory>
</hibernate-configuration>

(2)在映射定义文件中,可能在元素class中使用属性batch-size为持久化类指定批量抓取的数量。同样,如果要在集合中使用指定的批量,可以在集合元素set(list、bag等)中使用属性batch-size指定。如果同进采用了默认的批量抓取配置,又为持久化类或集合配置了特定的抓取数量,则类或集合的特定配置将覆盖配置文件中的默认批量抓取属性。
<hibernate-mapping package="com">
    <class name="Classes">
        <id name="id">
            <generator class="native"></generator>
        </id>
        <property name="name"/>
        <set name="students" inverse="true" batch-size="3">
            <key column="classesid"/>
            <one-to-many class="Student"/>
        </set>
    </class>
</hibernate-mapping> 

作者:allenzhangfan 发表于2013-3-17 23:29:07 原文链接
阅读:119 评论:0 查看评论

相关 [hibernate 性能优化 策略] 推荐:

hibernate复习(1)性能优化之抓取策略

- - CSDN博客互联网推荐文章
抓取策略(fetching strategy) 是指:当应用程序需要在(Hibernate实体对象图的)关联关系间进行导航的时候, Hibernate如何获取关联对象的策略. 抓取策略可以在O/R映射的元数据中声明,也可以在特定的HQL 或条件查询(Criteria Query)中重载声明. 通过配置抓取策略可以直接影响Session的get()和load()方法的查询效率.

Hibernate性能优化技巧

- - SQL - 编程语言 - ITeye博客
文章分为十三个小块儿对Hibernate性能优化技巧进行总结性分析,分析如下:. 一、在处理大数据量时,会有大量的数据缓冲保存在Session的一级缓存中,这缓存大太时会严重显示性能,所以在使用Hibernate处理大数据量的,可以使用session. clear()或者session. evict(Object) 在处理过程中,清除全部的缓存或者清除某个对象.

ElasticSearch性能优化策略

- - 数据库 - ITeye博客
ElasticSearch性能优化主要分为4个方面的优化. 1、增加1-2台服务器,用于负载均衡节点. elasticSearch的配置文件中有2个参数:node.master和node.data. 数搭配使用时,能够帮助提供服务器性能.         该node服务器只作为一个数据节点,只用于存储索引数据.

性能优化之Hibernate缓存讲解、应用和调优

- - CSDN博客系统运维推荐文章
    近来坤哥推荐我我们一款性能监控、调优工具——JavaMelody,通过它让我觉得项目优化是看得见摸得着的,优化有了针对性. 而无论是对于分布式,还是非分布,缓存是提示性能的有效工具.     数据层是EJB3.0实现的,而EJB3.0内部也是通过Hibernate实现的,而Hibernate本身提供了很好的缓存机制,我们只需要学会使用它驾驭它就够了.

Spring/Hibernate 应用性能优化的7种方法

- - IT瘾-geek
【编者按】对于大多数典型的 Spring/Hibernate 企业应用而言,其性能表现几乎完全依赖于持久层的性能. 此篇文章中将介绍如何确认应用是否受数据库约束,同时介绍七种常用的提高应用性能的速成法:. 如何确认应用是否受限于数据库. 确认应用是否受限于数据库的第一步,是在开发环境中进行测试,并使用 VisualVM 进行监控.

hibernate annotation 之 主键生成策略

- - BlogJava_首页
Hibernate 默认总共支持 13 种生成策略 :. 下面介绍几个较为常用的策略 :. ① identity [ 自然递增 ].          支持 DB2,MySQL,SQL Server,Sybase 和HypersonicSQL 数据库, 用于为 long 或 short 或 int 类型生成唯一标识.

HBase最佳实践-写性能优化策略 – 有态度的HBase/Spark/BigData

- -
上一篇文章主要介绍了HBase读性能优化的基本套路,本篇文章来说道说道如何诊断HBase写数据的异常问题以及优化写性能. 和读相比,HBase写数据流程倒是显得很简单:数据先顺序写入HLog,再写入对应的缓存Memstore,当Memstore中数据大小达到一定阈值(128M)之后,系统会异步将Memstore中数据flush到HDFS形成小文件.

HBase最佳实践-读性能优化策略 – 有态度的HBase/Spark/BigData

- -
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题. HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少. 总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大.

Hibernate面试题

- - ITeye博客
什么是Hibernate的并发机制. Hibernate并发机制:. a、Hibernate的Session对象是非线程安全的,对于单个请求,单个会话,单个的工作单元(即单个事务,单个线程),它通常只使用一次,. 如果一个Session 实例允许共享的话,那些支持并发运行的,例如Http request,session beans将会导致出现资源争用.

Hibernate Lazy属性

- - 博客园_首页
  Hibernate 的延迟加载(lazy load)是一个被广泛使用的技术. 这种延迟加载保证了应用只有在需要时才去数据库中抓取相应的记录. 通过延迟加载技术可以避免过多、过早地加载数据表里的数据,从而降低应用的内存开销. Hibernate 的延迟加载本质上就是代理模式的应用,当程序通过 Hibernate 装载一个实体时,默认情况下,Hibernate 并不会立即抓取它的集合属性、关联实体所以对应的记录,而是通过生成一个代理来表示这些集合属性、关联实体,这就是代理模式应用带来的优势.