hibernate复习（1）性能优化之抓取策略

标签： hibernate 性能优化 策略 | 发表时间：2013-03-17 23:29 | 作者：allenzhangfan

出处：http://blog.csdn.net

抓取策略（fetching strategy）是指：当应用程序需要在（Hibernate实体对象图的）关联关系间进行导航的时候， Hibernate如何获取关联对象的策略。抓取策略可以在O/R映射的元数据中声明，也可以在特定的HQL 或条件查询（Criteria Query）中重载声明。

通过配置抓取策略可以直接影响Session的get()和load()方法的查询效率

Hibernate3 定义了如下几种抓取策略：

* 连接抓取（Join fetching） - Hibernate通过在SELECT语句使用OUTER JOIN（外连接）来获得对象的关联实例或者关联集合。

*查询抓取（Select fetching） - 另外发送一条 SELECT 语句抓取当前对象的关联实体或集合。除非你显式的指定lazy="false"禁止延迟抓取（lazy fetching），否则只有当你真正访问关联关系的时候，才会执行第二条select语句。

*子查询抓取（Subselect fetching） - 另外发送一条SELECT 语句抓取在前面查询到（或者抓取到）的所有实体对象的关联集合。除非你显式的指定lazy="false" 禁止延迟抓取（lazy fetching），否则只有当你真正访问关联关系的时候，才会执行第二条select语句。

*批量抓取（Batch fetching） - 对查询抓取的优化方案，通过指定一个主键或外键列表，Hibernate使用单条SELECT语句获取一批对象实例或集合。

Hibernate抓取策略会区分下列各种情况：

1.Immediate fetching，立即抓取 - 当宿主被加载时，关联、集合或属性被立即抓取。

2.Lazy collection fetching，延迟集合抓取- 直到应用程序对集合进行了一次操作时，集合才被抓取。（对集合而言这是默认行为。）

3."Extra-lazy" collection fetching,"Extra-lazy"集合抓取 -对集合类中的每个元素而言，都是直到需要时才去访问数据库。除非绝对必要，Hibernate不会试图去把整个集合都抓取到内存里来（适用于非常大的集合）。

4.Proxy fetching，代理抓取 - 对返回单值的关联而言，当其某个方法被调用，而非对其关键字进行get操作时才抓取。

5."No-proxy" fetching,非代理抓取 - 对返回单值的关联而言，当实例变量被访问的时候进行抓取。与上面的代理抓取相比，这种方法没有那么“延迟”得厉害(就算只访问标识符，也会导致关联抓取)但是更加透明，因为对应用程序来说，不再看到proxy。这种方法需要在编译期间进行字节码增强操作，因此很少需要用到。

6.Lazy attribute fetching，属性延迟加载 - 对属性或返回单值的关联而言，当其实例变量被访问的时候进行抓取。需要编译期字节码强化，因此这一方法很少是必要的。

这里有两个正交的概念：关联何时被抓取，以及被如何抓取（会采用什么样的SQL语句）。不要混淆它们！我们使用抓取来改善性能。我们使用延迟来定义一些契约，对某特定类的某个脱管的实例，知道有哪些数据是可以使用的。

1.操作延迟加载的关联

默认情况下，Hibernate 3对集合使用延迟select抓取，对返回单值的关联使用延迟代理抓取。对几乎是所有的应用而言，其绝大多数的关联，这种策略都是有效的。

注意:假若你设置了hibernate.default_batch_fetch_size,Hibernate会对延迟加载采取批量抓取优化措施（这种优化也可能会在更细化的级别打开）。

然而，你必须了解延迟抓取带来的一个问题。在一个打开的Hibernate session上下文之外调用延迟集合会导致一次意外。比如：

Java代码

s = sessions.openSession();
Transaction tx = s.beginTransaction();
User u = (User) s.createQuery("from User u where u.name=:userName") .setString("userName", userName).uniqueResult();
Map permissions = u.getPermissions();
tx.commit();
s.close();
Integer accessLevel = (Integer) permissions.get("accounts"); // Error!

在Session关闭后，permessions集合将是未实例化的、不再可用，因此无法正常载入其状态。 Hibernate对脱管对象不支持延迟实例化. 这里的修改方法是：将permissions读取数据的代码移到tx.commit()之前。

除此之外，通过对关联映射指定lazy="false",我们也可以使用非延迟的集合或关联。但是，对绝大部分集合来说，更推荐使用延迟方式抓取数据。如果在你的对象模型中定义了太多的非延迟关联，Hibernate最终几乎需要在每个事务中载入整个数据库到内存中！

但是，另一方面，在一些特殊的事务中，我们也经常需要使用到连接抓取（它本身上就是非延迟的），以代替查询抓取。下面我们将会很快明白如何具体的定制Hibernate中的抓取策略。在Hibernate3中，具体选择哪种抓取策略的机制是和选择单值关联或集合关联相一致的。

2. 调整抓取策略（Tuning fetch strategies）

查询抓取（默认的）在 N+1查询的情况下是极其脆弱的，因此我们可能会要求在映射文档中定义使用连接抓取：

Java代码

<set name="permissions" fetch="join">
<key column="userId"/>
<one-to-many class="Permission"/>
</set>
<many-to-one name="mother" class="Cat" fetch="join"/>

在映射文档中定义的抓取策略将会对以下列表条目产生影响：通过get()或load()方法取得数据。只有在关联之间进行导航时，才会隐式的取得数据。

条件查询，使用了subselect抓取的HQL查询

不管你使用哪种抓取策略，定义为非延迟的类图会被保证一定装载入内存。注意这可能意味着在一条HQL查询后紧跟着一系列的查询。

通常情况下，我们并不使用映射文档进行抓取策略的定制。更多的是，保持其默认值，然后在特定的事务中，使用HQL的左连接抓取（left join fetch）对其进行重载。这将通知 Hibernate在第一次查询中使用外部关联（outer join），直接得到其关联数据。在条件查询 API中，应该调用 setFetchMode(FetchMode.JOIN)语句。

也许你喜欢仅仅通过条件查询，就可以改变get() 或 load()语句中的数据抓取策略。例如：

Java代码

User user = (User) session.createCriteria(User.class) .
setFetchMode("permissions", FetchMode.JOIN).
add( Restrictions.idEq(userId) ).uniqueResult();

（这就是其他ORM解决方案的“抓取计划(fetch plan)”在Hibernate中的等价物。）截然不同的一种避免 N+1次查询的方法是，使用二级缓存。

示例配置（主要有两种情况）：

1）单端关联(<many-to-one>、<one-to-many>)上的抓取

可以给单端关联的映射元素添加fetch属性。fetch属性有两个可选值。

a）.select:作为默认值，它的策略是党需要使用到关联关系对象的数据时，另外单独发送一条select语句抓取当前对象的关联对象的数据。即延时加载。

b）.join:它的策略是在同一条select语句使用连接李艾获得对象的数据和它关联的对象的数据，此时关联对象的延迟加载失效.

以下是单端关联上fetch=join的一个配置示例

Java代码

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE hibernate-mapping PUBLIC
"-//Hibernate/Hibernate Mapping DTD 3.0//EN"
"http://hibernate.sourceforge.net/hibernate-mapping-3.0.dtd">
<hibernate-mapping>
<class name="com.javacrazyer.domain.Product" table="product">
<id name="id">
<generator class="native"/>
</id>
<version name="version"/>
<property name="name"/>
<property name="unitCost" column="unit_cost"/>
<property name="pubTime" column="pub_time"/>
<many-to-one name="cate" column="cate_id" fetch="join"/>
</class>
</hibernate-mapping>

在应用程序中加载某个实体product的数据时，会使用内连接把它关联的Category实体也加载上来，即类似下面的SQL语句：

Sql代码

select tab1.xx,tab1.yy,tab2.aa,tab2.cc
from product tab1
inner join category tab2
on tab1.cate_id=tab2.id
where product_id=?

2)集合属性上抓取策略

在集合属性的映射元素上可以添加fetch属性，他有三个可选值

a）.select:作为默认值，它的策略是党需要使用所关联集合的数据时，另外单独发送一条select语句抓取当前对象的关联集合，即延时加载

b）.join:在同一条select语句使用连接来获得对象的关联集合，此时关联集合上的lazy会失效

c）.subselect:另外发送一体哦啊查询语句(或者子查询语句)抓取在前面查询到的所有实体对象的关联集合.这个策略对HQL的查询也起作用.

以下是集合属性上fetch=subselect的示例

Java代码

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE hibernate-mapping PUBLIC
"-//Hibernate/Hibernate Mapping DTD 3.0//EN"
"http://hibernate.sourceforge.net/hibernate-mapping-3.0.dtd">
<hibernate-mapping>
<class name="com.javacrazyer.domain.Category" table="category" batch-size="10">
<id name="id">
<generator class="native"/>
</id>
<version name="version"/>
<property name="name"/>
<property name="description"/>
<bag name="productList" inverse="true" fetch="subselect">
<key column="cate_id"/>
<one-to-many class="com.javacrazyer.domain.Product"/>
</bag>
</class>
</hibernate-mapping>

当使用get()或load()方法加载一个Category实体数据时，它对关联的Product集合属性先延迟加载，当真正需要使用 Product集合属性中的数据时，才再发送一条SQL语句来抓取数据；当使用HQL语句加载多个CategoryShiite数据时，对它们关联的Product集合属性先延迟加载，当真正需要使用Product集合属性的数据时，才会再发送一条子查询语句来抓取相应的数据

批量抓取：

(1)在Hibernate中，对于关联抓取，可以定义每次抓取数据的数量，批量地将数据载入内存，减少与数据库交互的次数。在应用程序中可以定义车间默认的关联抓取数量。在

<hibernate-configuration>

<session-factory>

</session-factory>

</hibernate-configuration>

(2)在映射定义文件中，可能在元素class中使用属性batch-size为持久化类指定批量抓取的数量。同样，如果要在集合中使用指定的批量，可以在集合元素set(list、bag等)中使用属性batch-size指定。如果同进采用了默认的批量抓取配置，又为持久化类或集合配置了特定的抓取数量，则类或集合的特定配置将覆盖配置文件中的默认批量抓取属性。

<hibernate-mapping package="com">

</id>

<one-to-many class="Student"/>

</set>

</class>

</hibernate-mapping>

作者：allenzhangfan 发表于2013-3-17 23:29:07 原文链接

阅读：119 评论：0 查看评论

hibernate复习（1）性能优化之抓取策略

相关 [hibernate 性能优化策略] 推荐：