文章: Spring Data —— 完全统一的API?

标签: 文章 spring data | 发表时间:2012-09-05 16:00 | 作者:
出处:http://pipes.yahoo.com/pipes/pipe.info?_id=10560380f804c7341f042a2b8a03e117

Spring Data 作为SpringSource的其中一个父项目, 旨在统一和简化对各类型持久化存储, 而不拘泥于是关系型数据库还是NoSQL 数据存储。

无论是哪种持久化存储, 数据访问对象(或称作为DAO,即Data Access Objects)通常都会提供对单一域对象的CRUD (创建、读取、更新、删除)操作、查询方法、排序和分页方法等。Spring Data则提供了基于这些层面的统一接口(CrudRepository,PagingAndSortingRepository)以及对持久化存储的实现。

你可能接触过某一种Spring 模型对象——比如 JdbcTemplate——来编写访问对象的实现。基于Spring Data的数据访问对象, 我们只需定义和编写一些查询方法的接口(基于不同的持续化存储, 定义有可能稍有不同)。Spring Data会在运行时间生成正确的实现。 请看下面的例子:

public interface UserRepository extends MongoRepository<User, String> { 
        @Query("{ fullName: ?0 }")
        List<User> findByTheUsersFullName(String fullName);

        List<User> findByFullNameLike(String fullName, Sort sort);
}
...

Autowired UserRepository repo;

本文将比较两个JPA的子项目, MongoDB和Neo4j。JPA是J2EE的一部分, 它定义了一系列用于操作关系型数据库和O/R映射的API。 MongoDB是一种可扩展的、高性能的、开源的、面向文档的数据库。Neo4j则是一种图形数据库,一种完整的用于存储图形数据的事务性数据库。

所有这些Spring Data的子项目都支持:

  • 模板
  • 对象、数据存储映射
  • 对数据访问对象的支持

其他一些Spring Data 子项目,如Spring Data Redis和Spring Data Riak都只是提供模板, 这是由于其相应的数据存储都只支持非结构化的数据,而不适用于对象的映射和查询。

下面,我们来深入了解一下模板、对象数据映射和数据访问对象。

模板

Spring Data 模板的主要目的, 同时也是所有其他Spring 模板的目的, 就是资源分配和异常处理。

这里所说的资源就是数据存储资源, 通常来说会通过远程TCP/IP连接访问。下面的实例展示了如果配置MongoDB的模板:

<!-- Connection to MongoDB server -->
<mongo:db-factory host="localhost" port="27017" dbname="test" /> 

<!-- MongoDB Template -->
<bean id="mongoTemplate"
class="org.springframework.data.mongodb.core.MongoTemplate">
  <constructor-arg name="mongoDbFactory" ref="mongoDbFactory"/> 
</bean>

首先我们需要定义连接工厂,MongoTemplate会引用这个连接工厂。这个例子中, Spring Data采用了较底层的数据库驱动, MongoDB Java driver

一般来说, 这类较底层的数据库驱动会有自己的一套异常处理策略。 Spring的异常处理采用的是未检查异常(unchecked exception),因此开发人员可以自己决定是否须要捕获异常。MongoDB的模板的实现方式是把捕获到的底层的异常封装成未检查异常, 这些异常都是Spring里DataAccessException的子类。

模板提供了基于数据存储的操作, 诸如保存、更新、删除单一记录或执行查询的方法。但所有这些方法只能用于相应的底层数据存储。

由于JPA的实现本身已经是位于JDBC API上层的抽象层,Spring Data JPA 并没有提供模板。和模板概念相对应的是JPA的EntityManager, 而异常处理则是由数据访问对象来负责的。

对象、数据映射

JPA引入了O/R映射的标准(如关系型数据库中表和对象的映射)。Hibernate很有可能是被最为广泛使用的JPA标准的实现。

Spring Data采用类对象的方式将O/R映射的支持延伸到了NoSQL数据库。但在各种NoSQL数据库中, 数据结构差异较大, 所以很难形成一种通用的API。 每一种数据存储都有各自一套注释用以标注映射所需要的元信息。下面我们来看一个简单的例子,如何映射一个简单领域对象:

JPA MongoDB Neo4j
@Entity
@Table(name="TUSR")
public class User {
    @Id
    private String id;
    @Column(name="fn")
    private String name;
    private Date lastLogin;
...
}
@Document(collection="usr")
public class User {
    @Id
    private String id;
    @Field("fn")
    private String name;
    private Date lastLogin;
    ..
}
@NodeEntity
public class User {
    @GraphId
    Long id;
    private String name;
    private Date lastLogin;
...
}

如果你已经熟悉JPA实体,不难看出这里用了标准的JPA注释。Spring Data复用了这些标准的注释, 而且没有引入其他新的内容。对象的映射正是由这些JPA的实现完成的。 MangoDB和Neo4j各种需要一套类似的注释。在上面的例子中, 我们使用了类级别的注释collection和nodetype. MangoDB中, collection就相当于关系型数据库的表, 而node和edge则是图形数据库(如Neo4j)的主要数据类型。

每个JPA实体都需要有唯一标识符,即便是MongoDB的文档和Neo4j的节点也是如此。

MongoDB使用@Id这个注释作为唯一标识符(这@Id是在org.springframework.data.annotation包中, 和JPA的@Id并不相同)。Neo4j则使用了@GraphId这个注释。这些属性的值是在域对象成功存储后被设置的。 当类属性的名称和MongoDB的文档中的属性名称不同时, 可以使用@Field注释标注。

同样这两种映射也支持对其他对象的引用,请看下面的例子:

JPA MongoDB Neo4j
@OneToMany
private List<Role> roles;
private List<Role> roles; @RelatedTo( type = "has", direction = Direction.OUTGOING)
private List<Role> roles;

在JPA中, 我们使用@OneToMany来标识一对多的关系, 通常多的一端的数据存放在子表中, 通过联合查询获得。MongoDB并不支持文档间的联合查询,默认情况下, 被引用的对象和主对象存储在同一个文档中。当然, 我们也可以通过客户端的虚拟联合查询引用其他文档的数据。在Neo4j中, 关系被称作edges, 而edge也是一个基本的数据类型。

总结来说, MongoDB和Neo4j所使用的对象映射和我们大家所熟悉的JPA O/R映射非常类似, 但由于不同的数据结构,两者存在着显著的区别。但不管怎么说, 基本概念都是实现对象和数据结构的映射。

数据访问对象

你一定写过这样的DAO对象,针对单一记录的CRUD操作、针对多记录的CRUD操作, 基于各种查询条件的查询方法。

随着JPA的引入, 虽然EntityManager接口已经包含了CRUD操作,但 编写查询方法仍然是一件麻烦事, 为此, 完成一次查询需要创建命名查询, 设置参数, 执行查询。请看下面的例子:

@Entity
@NamedQuery( name="myQuery", query = "SELECT u FROM User u where u.name = :name" )
public class User { 
...
} 

@Repository 
public class ClassicUserRepository { 

   @PersistenceContext EntityManager em; 

   public List<User> findByName(String Name) { 
      TypedQuery<User> q = getEntityManger().createNamedQuery("myQuery", User.class); 

      q.setParameter("name", fullName);

      return q.getResultList();
   } 
   ...

TypedQuery可以略微简化这个过程,如:

@Repository
public class ClassicUserRepository { 

   @PersistenceContext EntityManager em; 

   public List<User> findByName(String name) {
      return getEntityManger().createNamedQuery("myQuery", User.class)
         .setParameter("name", fullName)
         .getResultList(); 
   } 
   ...

我们仍然须要编写类似这样的查询方法,为查询赋值, 执行查询。如果可以引入Spring Data JPA,要实现这类的查询, 编码就可以大大简化, 如下:

package repositories; 

public interface UserRepository extends JpaRepository<User, String> {

   List<User> findByName(String name); 
}

在Spring Data JPA中, 我们将不再需要在JPA实体类中定义@NamedQuerys, 来实现JPQL的查询。 相反, 我们可以为数据访问对象的各方法加上@Query这样的注释。如:

@Transactional(timeout = 2, propagation = Propagation.REQUIRED)
@Query("SELECT u FROM User u WHERE u.name = 'User 3'")
List<User> findByGivenQuery();

Spring Data MongoDB和Spring Data Neo4j可以使上述方法同样适用于MangoDB和Neo4j数据库。下面的例子的是通过 Cipher查询语言来实现对Neo4j数据库的查询。

public interface UserRepository extends GraphRepository<User> {

  User findByLogin(String login); 

  @Query("START root=node:User(login = 'root') MATCH root-[:knows]->friends RETURN friends")
  List<User> findFriendsOfRoot(); 
}

当然,各个持久化层的方的命名规则稍有差异。比如说, MongoDB支持一种叫 geospatial queries的查询语言, 通常我们可以这样写查询:

public interface LocationRepository extends MongoRepository<Location, String> {

        List<Location> findByPositionWithin(Circle c);

        List<Location> findByPositionWithin(Box b);

        List<Location> findByPositionNear(Point p, Distance d);
}

Spring Data也提供对分页和排序的通用方法,这需要在查询方法中加入特殊的参数。

支持数据访问对象的优势在于:

  • 减少相似代码的编写
  • 定义方法的同时, 可以定义查询语句,这也使文档变得更清晰
  • 另外一个优点是, 查询语句将和Spring上下文同时编译并组装,而不是在初次使用的时候编译, 这样可以大大减少代码编写中的语法错误。

总结

本文只是简单介绍了Spring Data 的这些新内容, 意在阐明和普通JPA的相似点和不同之处。下面这些链接可以帮助大家对Spring Data的相关项目做更输入的了解。

对标题中问题的回答显然是否定的, 不可能存在支持所有持久存储的通用API, 其原因也是不言而喻的。Spring Data 项目旨在为大家提供一种通用的编码模式。

数据访问对象实现了对物理数据层的抽象, 为编写查询方法提供了方便。通过对象映射, 实现域对象和持续化存储之间的转换, 而模板提供的是对底层存储实体的访问实现。

关于作者

Tobias Trelle 是codecentric AG的高级IT顾问,有15年的IT从业经验。致力于对软件系统架构、EAI以及云计算的研究。作者会在博客中发布一些培训材料和公开演讲内容。

Twitter
Blog
Linked In
G+

原文地址: http://www.infoq.com/articles/spring-data-intro


感谢 侯伯薇对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至 [email protected]。也欢迎大家通过新浪微博( @InfoQ)或者腾讯微博( @InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

相关 [文章 spring data] 推荐:

文章: Spring Data —— 完全统一的API?

- - InfoQ cn
Spring Data 作为SpringSource的其中一个父项目, 旨在统一和简化对各类型持久化存储, 而不拘泥于是关系型数据库还是NoSQL 数据存储. 白皮书下载:JBoss Enterprise Application Platform 6迁移指南. 白皮书下载:从虚拟化到云:在云中优化和自动化IT.

Spring Data JPA 简单介绍

- tangfl - BlogJava-首页技术区
考虑到公司应用中数据库访问的多样性和复杂性,目前正在开发UDSL(统一数据访问层),开发到一半的时候,偶遇SpringData工程. 于是就花了点时间了解SpringData,可能UDSL II期会基于SpringData做扩展. 介绍:针对关系型数据库,KV数据库,Document数据库,Graph数据库,Map-Reduce等一些主流数据库,采用统一技术进行访问,并且尽可能简化访问手段.

SpringSource发布Spring Data Redis 1.0.0

- - InfoQ cn
近日, SpringSource 发布了用于将Redis轻松集成到Java应用中的开源 库的首个稳定版. Redis是个由VMWare/SpringSource资助的键值存储,为一些高性能网站如GitHub与StackOverflow等所用. Redis是新近涌现的NoSQL数据存储之一,它关注于简单性与性能(整个数据集放在内存中).

spring data jpa简单实例

- - 编程语言 - ITeye博客
我们都知道Spring是一个非常优秀的JavaEE整合框架,它尽可能的减少我们开发的工作量和难度.   在持久层的业务逻辑方面,Spring开源组织又给我们带来了同样优秀的Spring Data JPA.   通常我们写持久层,都是先写一个接口,再写接口对应的实现类,在实现类中进行持久层的业务逻辑处理.

了解 Spring Data JPA - hungerW

- - 博客园_首页
自 JPA 伴随 Java EE 5 发布以来,受到了各大厂商及开源社区的追捧,各种商用的和开源的 JPA 框架如雨后春笋般出现,为开发者提供了丰富的选择. 它一改之前 EJB 2.x 中实体 Bean 笨重且难以使用的形象,充分吸收了在开源社区已经相对成熟的 ORM 思想. 另外,它并不依赖于 EJB 容器,可以作为一个独立的持久层技术而存在.

Spring Data JPA,基础学习笔记.

- - ITeye博客
最好先学习 JPA 方面的知识....在这里使用的是 Hibernate. 也已经使用了一段时间,看什么都不如看官方文档,我这里也只是写个笔记记录一下,如果能帮助到其他人,很开心 .算是个 demoshow 吧.这里也只写了一些我觉得比较有用的地方.其他一些使用知识,请参见官方文档:http://static.springsource.org/spring-data/data-jpa/docs/current/reference/html/.

使用 Spring Data JPA 简化 JPA 开发

- -
Spring Data JPA 让一切近乎完美. 通过前面的分析可以看出,Spring 对 JPA 的支持已经非常强大,开发者只需关心核心业务逻辑的实现代码,无需过多关注 EntityManager 的创建、事务处理等 JPA 相关的处理,这基本上也是作为一个开发框架而言所能做到的极限了. 然而,Spring 开发小组并没有止步,他们再接再厉,于最近推出了 Spring Data JPA 框架,主要针对的就是 Spring 唯一没有简化到的业务逻辑代码,至此,开发者连仅剩的实现持久层业务逻辑的工作都省了,唯一要做的,就只是声明持久层的接口,其他都交给 Spring Data JPA 来帮你完成.

使用Java 8 Streams和Spring Data JPA流式传输MySQL结果

- -
2015年10月19日|  KrešimirNesek. 从1.8版开始,Spring数据项目包含一个有趣的功能 - 通过一个简单的API调用,开发人员可以请求将数据库查询结果作为Java 8流返回. 在技​​术上可行并且由底层数据库技术支持的情况下,结果将逐个流式传输,并且可以使用流操作进行处理.

在Spring Data JPA中使用Update query更新实体

- -
使用诸如Hibernate之类的对象关系映射(ORM)工具,通常通过首先从数据库中获取实体,修改某些字段,然后再次持久化实体来修改实体. 在许多情况下,这是一种很好的方法,但在某些情况下,这可能并不理想. 例如,如果要更新实体集合(即数据库中的行),或者需要大量数据来构造实体对象. 在后一种情况下,例如,可能需要太多资源来组装实体对象以仅改变单个字段的值.

文章: 数据集成的演化:从EII到Big Data

- - InfoQ cn
 “企业信息集成(EII):实用方式”于2005年发布,描述了一套集成不同数据源的方法论,它利用了当时的先进技术,如面向服务架构(SOA)、Web Services、XML、资源描述架构(RDF)、基于XML的元数据格式、数据提取、转换和加载(ETL)等. EII基本能够为关系型数据元素提供统一视角,但在性能效率上还无法替代数据仓库和多维数据库.