文章: MongoDB、Java及ORM

标签: 文章 mongodb java | 发表时间:2012-05-22 13:00 | 作者:
出处:http://pipes.yahoo.com/pipes/pipe.info?_id=10560380f804c7341f042a2b8a03e117

MongoDB简介

目前有很多互相竞争的NoSQL产品,它们使用的方式不尽相同,但都能很好地解决大数据问题。 MongoDB就是其中一款非常不错的产品。MongoDB是面向文档、无Schema的存储解决方案,它用JSON风格的文档展现、查询、修改数据。

MongoDB有很丰富的文档,安装和设置都很简单,而且易于扩展。它支持大家熟知的复制、分片、索引和Map/Reduce等概念。MongoDB开源社区的规模很大,也很活跃。让MongoDB引以为豪的是,包括Disney、Craigslist、Foursquare、Github和SourceForge在内的大型、高流量生产环境都已经部署了MongoDB。MongoDB是个开源项目,由DoubleClick前高管们创办的 10gen.com公司创建和维护。除了很积极地参与社区支持外,10gen也提供商业支持。

MongoDB和NoSQL的优劣势

作为NoSQL解决方案,MongoDB的优势是很容易上手。在我第一次深入研究NoSQL数据库的时候,尝试了很多基于Java的解决方案,我发现要搞清楚什么是列族(column family)、Hadoop和HBase之间是什么关系、ZooKeeper到底是什么非常费时间。我最终想明白这些问题的时候,才明白Cassandra、HBase等产品都是非常完善的NoSQL解决方案。和其他解决方案相比,MongoDB则更容易掌握一些,开始写代码之前不需要理解太多的概念。

很显然,MongoDB和任何软件一样都存在缺陷。在学习、使用MongoDB的过程中,我遇到过几件可算是“陷阱”的事情:

  • 不要把它用成RDBMS。这一点看起来显而易见,但在MongoDB里创建、执行复杂查询都很容易,以至于到了想用它做实时查询的时候,你可能才会发现自己已经做过头了,而且可能会碰到性能问题。 (我以前就犯过这样的错)
  • MongoDB的索引是Binary Tree。如果你不太熟悉B-Tree,应该 研究一下。查询条件的顺序要和创建索引的顺序相匹配。
  • 精心设计索引。这和前面提到的B-Tree有关系。我刚开始创建的几个索引都包含文档里的很多字段,因为总是想着以后可能会查询它们,这种想法你应该能够理解。不要犯这样的错误。我曾给一个很小的集合(大约一千万条记录)创建了一个索引,这个索引后来增长到17GB,比集合本身还要大。如果某个数组字段可能会包含成百上千的条目,你可能不会给它创建索引。
  • MongoDB支持NoSQL的方法非常有趣,它用BSON存储、用JSON表示,管理和Map/Reduce则用了JavaScript。这样一来,等MongoDB发展的时间足够久、和更流行的大数据解决方案一样长的时候,MongoDB必然会出现一些奇怪的小问题, 比如在NumberLong上使用等于运算符会判断失败

MongoDB、控制台、驱动程序

MongoDB的管理通常可以在一个JavaScript客户端控制台应用上进行,控制台应用能简化数据迁移和操作等复杂任务;你也完全可以用JavaScript语言编程实现MongoDB的管理。在这篇文章里,我们会示范控制台的使用。现在的MongoDB客户端产品非常多,它们都具备能投入生产环境的品质,MongoDB社区也称它们为驱动程序。一般来说,每种编程语言都有各自的驱动程序,这些驱动程序能覆盖所有流行的编程语言,还有一些并不是很流行的编程语言。本文将展示MongoDB的Java驱动程序该如何使用,也会和使用ORM库(MJORM)的方式进行比较。

MJORM简介:MongoDB的ORM解决方案

NoSQL数据存储还有很多有趣的问题需要解决,最近让应用程序员比较关心的是对象关系映射(ORM)。ORM是指持久化数据和应用所用对象之间的映射,持久化数据过去都存储在关系型数据库里。ORM能让处理数据的过程更加流畅、更加贴近编写应用的语言。

MongoDB面向文档的架构让它很容易进行ORM,因为它存储的文档本身就是对象。不过可惜的是,可用于MongoDB的Java ORM库还不是很多,目前只有 morphia(针对MongoDB的Java库,是类型安全的)和 spring-data(Spring Data综合项目的MongoDB实现)。

这些ORM库使用了大量注解,出于很多原因,我并不倾向于使用注解,其中最重要的是被注解的对象在多个项目之间的可移植性问题。所以我创建了mongo-Java-orm项目(MJORM,发音为me-yorm),它是针对MongoDB的Java ORM。MJORM使用MIT许可,放在了 Google Code上。项目用Maven构建,Maven的工件库目前托管在Google Code的Subversion服务器上。写这篇文章的时候,MJORM最新的稳定发布版本是0.15,个别项目已经在生产环境里使用了。

MJORM入门

将MJORM库添加到项目里

Maven用户首先要将MJORM的Maven仓库添加到pom.xml文件里,以便自己的项目能使用MJORM工件:

<repository> 	
    <id>mjorm-webdav-maven-repo</id>
    <name>mjorm maven repository</name>
    <url>http://mongo-Java-orm.googlecode.com/svn/maven/repo/</url>
    <layout>default</layout> 
</repository> 

然后添加依赖本身:

<dependency>
    <groupid>com.googlecode</groupid>
    <artifactid>mongo-Java-orm</artifactid>
    <version>0.15</version>
</dependency>

这样你就能把MJORM类导入到自己的应用里并使用它们。如果你没用Maven,那你需要手动下载MJORM库,还有MJORM pom.xml里列出的所有依赖。

创建POJO

依赖关系处理好之后,就开始编写代码吧。我们先编写Java POJO:

class Author {
    private String firstName;
    private String lastName;
    // ... setters and getters ...
}

class Book {
    private String id;
    private String isbn;
    private String title;
    private String description;
    private Author author;
    // ... setters and getters ...
}

上面的对象模型描述了作者和书,作者有一个ID、还有姓氏和名字,书的描述信息则包含ID、ISBN号、标题、描述信息和作者。

可以看到书的ID属性是一个String,它会适应成MongoDB的 ObjectId类型,ObjectId类型是个十二字节的二进制值,用十六进制的字符串来表示。虽然MongoDB要求所有集合里的每个文档都要有一个唯一的ID,但并没有要求ID必须是ObjectId类型。目前MJORM支持的ID类型只有ObjectId,而且会把它们表示成String。

你可能已经注意到,Author对象没有ID。这是因为Author是Book文档的子文档,所以就没必要非得有一个ID了。请记住,MongoDB的ID只需要放在一个集合的根级别文档中。

创建XML映射文件

下一步是创建XML映射文件,MJORM会用这些映射文件把MongoDB文档映射成对象。在本文的演示里,我们会给两个对象各创建一个文档,但真正合理的做法是把所有的映射都放在一个XML文件里,或者根据实际需要进行分割。

下面是Author.mjorm.xml:

<?xml version="1.0"?>
<descriptors>
    <object class="Author">
        <property name="firstName" />
        <property name="lastName" />
    </object>
</descriptors>

Book.mjorm.xml是:

<?xml version="1.0"?>
<descriptors>
    <object class="Book">
        <property name="id" id="true" auto="true" />
        <property name="isbn" />
        <property name="title" />
        <property name="description" />
        <property name="author" />
    </object>
</descriptors>

映射文件完全能自解释。descriptors元素是根元素,所有的映射文件都要有。根元素下面是object元素,用来定义要被映射到MongoDB文档的类。object会包含property元素,用来描述POJO的所有属性,以及它们怎样映射到MongoDB文档的属性。property元素至少要有一个name属性,这是POJO属性的名称,也是MongoDB文档属性的名称。property元素还可以添加一个column属性,指定MongoDB文档里备用的属性名称。

包含id属性的property元素会被看作是对象的唯一标识符。一个object元素可以只包含一个带有id属性的property元素。auto属性是让MJORM在持久化这个属性时给它自动生成一个值。

要想了解有关XML映射文件更详细的说明,请移步至Google Code上的MJORM项目。

整合

我们现在已经创建好了数据模型,还有告诉MJORM在数据写入MongoDB时如何解析POJO、从MongoDB读取数据时如何封装POJO的映射文件,那我们就可以开始一段有趣的学习之旅了。首先我们必须打开到MongoDB的连接:

Mongo mongo = new Mongo(
    new MongoURI("mongodb://localhost/mjormIsFun")); // 10gen驱动程序

Mongo对象来自10gen员工编写的Java驱动程序。这个例子打开了一个到本地MongoDB实例的连接,使用mjormIsFun数据库。接下来我们创建MJORM里的ObjectMapper。目前MJORM里可用的ObjectMapper接口实现只有XmlDescriptorObjectMapper,它使用前面的XML Schema,MJORM以后的实现可能会支持注解或其他配置机制。

XmlDescriptorObjectMapper objectMapper = new XmlDescriptorObjectMapper();
mapper.addXmlObjectDescriptor(new File("Book.mjorm.xml"));
mapper.addXmlObjectDescriptor(new File("Author.mjorm.xml"));

我们创建了XmlDescriptorObjectMapper对象,并添加了映射文件。下一步我们会创建一个MJORM提供的MongoDao对象实例:

DB db = mongo.getDB("mjormIsFun"); // 10gen驱动程序
MongoDao dao = new MongoDaoImpl(db, objectMapper);

我们先获取了一个10gen驱动程序里的DB对象实例。然后用DB对象和先前创建的ObjectMapper来创建MongoDao。现在已经做好了持久化数据的准备,那让我们创建一个Book对象,并把它保存到MongoDB里去。

Book book = new Book();
book.setIsbn("1594743061");
book.setTitle("MongoDB is fun");
book.setDescription("...");

book = dao.createObject("books", book);
System.out.println(book.getId()); // 4f96309f762dd76ece5a9595

我们先创建了Book对象,赋值之后调用了MongoDao的createObject方法,两个参数分别是集合名称“books”和Book对象。MJORM接着会用先前创建的XML映射文件把Book转换成DBObject(10gen的Java驱动程序所使用的基本对象类型),并把新的文档持久化到“books”集合中。然后MJORM会返回Book对象的实例,返回的Book对象实例带有生成的id属性。重点要注意的是,MongoDB在默认情况下并不会要求创建好数据库或集合后才能使用;MongoDB在需要的时候才会创建它们,这有时候会引起混乱。从MongoDB控制台上看到的新Book如下所示:

> db.books.find({_id:ObjectId("4f96309f762dd76ece5a9595")}).pretty()
{
    "_id":          ObjectId("4f96309f762dd76ece5a9595"),
    "isbn":         "1594743061",
    "title":        "MongoDB is fun",
    "description":  "..."
}

让我们来看看如果不使用MJORM,而是直接用10gen的Java驱动程序,createObject的过程是怎样的:

Book book = new Book();
book.setIsbn("1594743061");
book.setTitle("MongoDB is fun");
book.setDescription("...");

DBObject bookObj = BasicDBObjectBuilder.start()
    .add("isbn", 		book.getIsbn())
    .add("title",		book.getTitle())
    .add("description",	book.getDescription())
    .get();

// ‘db’是我们先前创建的DB对象
DBCollection col = db.getCollection("books");
col.insert(bookObj);

ObjectId id = ObjectId.class.cast(bookObj.get("_id"));
System.out.println(id.toStringMongod()); // 4f96309f762dd76ece5a9595

现在我们来查询一下对象:

Book book = dao.readObject("books", "4f96309f762dd76ece5a9595", Book.class);
System.out.println(book.getTitle()); // "MongoDB is fun"

readObject方法用指定的id从特定集合中读取文件,然后将文件转换成相应的类(会再次使用先前的映射文件)并返回。

敏锐的你可能已经察觉到我们的Book还没Author,但Book仍然被持久化了。这正是MongoDB的无Schema特性。除了id之外,我们不能要求集合里的文档包含任何属性,所以在MongoDB里创建没有Author的Book是完全没有问题的。让我们给Book添加一位Author并更新:

Author author = new Author();
author.setFirstName("Brian");
author.setLastName("Dilley");

book.setAuthor(author);

dao.updateObject("books", "4f96309f762dd76ece5a9595", book);

现在的Book包含了Author,也持久化到了MongoDB。让我们从MongoDB控制台上看看新的Book:

> db.books.find({_id:ObjectId("4f96309f762dd76ece5a9595")}).pretty()
{
    "_id":          ObjectId("4f96309f762dd76ece5a9595"),
    "isbn":         "1594743061",
    "title":        "MongoDB is fun",
    "description":  "..."
    "author": {
        "firstName": "Brian",
        "lastName": "Dilley"
    }
}

正如你所看到的,持久化的Book现在包含一个作者。接着再看看不使用MJORM的情况:

Author author = new Author();
author.setFirstName("Brian");
author.setLastName("Dilley");

book.setAuthor(author);

DBObject bookObj = BasicDBObjectBuilder.start()
    .add("isbn", 		book.getIsbn())
    .add("title",		book.getTitle())
    .add("description",	book.getDescription())
    .push("author")
        .add("firstName", 	author.getFirstName())
        .add("lastName", 	author.getLastName())
        .pop()
    .get();

DBCollection col = db.getCollection("books");
col.update(new BasicDBObject("_id", bookObj.get("_id")), bookObj);

在这篇文章里我们就不深入介绍MongoDao的所有方法了。如果你想在项目里使用MJORM,推荐你看看MJORM项目的文档,或者是MJORM项目提供的MongoDao接口。

结论

希望这篇文章能让大家对MongoDB和MJORM开始感兴趣。方兴未艾的MongoDB是个很优秀的NoSQL数据存储产品,有很多很不错的特性。如果你要在Java项目里使用MongoDB,那你可以考虑用MJORM库来满足ORM需求。要是能提出功能需求、Bug报告、文档,或给源码打补丁,我们将不胜感激!

作者介绍

Brian Dilley是一位经验丰富的高级工程师,带过十三年的团队,他的技术专长有Java、Java EE、Spring Framework、Linux内部原理和管理。Brian曾单枪匹马创立了好几家互联网公司,并维护着它们的产品。他还擅长IaaS、云、PHP、Linux管理,以及生产环境和公司里软硬件基础设施的安装、配置,比如负载均衡、数据库、Web等。你可以在Twitter上Follow Brian

 

 

查看英文原文: MongoDB, Java and Object Relational Mapping

译者后记:

MongoDB并不是一款关系型数据库,针对文中的ORM这个词语,读者Roopesh Shenoy提出:

用ORM描述MJORM框架似乎并不合适——毕竟没有关系型数据库!

也许我们可以使用其他名称?Database Mapper?

Jean-Baptiste DUSSEAUT回复到:

在我创建的项目里,我管它叫对象文件映射(Object Document Mapper)

读者朋友们,你们对此有什么看法呢?


给InfoQ中文站投稿或者参与内容翻译工作,请邮件至 [email protected]。也欢迎大家通过新浪微博( @InfoQ)或者腾讯微博( @InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

相关 [文章 mongodb java] 推荐:

文章: MongoDB、Java及ORM

- - InfoQ cn
目前有很多互相竞争的NoSQL产品,它们使用的方式不尽相同,但都能很好地解决大数据问题. MongoDB就是其中一款非常不错的产品. MongoDB是面向文档、无Schema的存储解决方案,它用JSON风格的文档展现、查询、修改数据. MongoDB有很丰富的文档,安装和设置都很简单,而且易于扩展.

[mongodb] java操作mongodb

- - 数据库 - ITeye博客
           //实例化Mongo对象,连接27017端口.                               //连接名为yourdb的数据库,假如数据库不存在的话,mongodb会自动建立. //从Mongodb中获得名为yourColleection的数据集合,如果该数据集合不存在,Mongodb会为其新建立.

Java和MongoDB之Hello World

- - BlogJava-首页技术区
新建Java Project,并把mongo-java-driver驱动加入到项目bulid path中,如果你使用的是maven增加依赖. 2.连接上MongoDB. //>2.10版本. 如果需要验证,需要输入用户名和密码. 3.MongoDB数据库 得到MongoDB中的数据库,如果数据库名不存在,MongoDB会自动创建.

Java MongoDB : Save image example(译)

- - 数据库 - ITeye博客
原文出自:http://www.mkyong.com/mongodb/java-mongodb-save-image-example/. 返回目录: http://ysj5125094.iteye.com/blog/2192754  . 译:在本教程中,我们将向你展示如何通过  GridFS API 保存一个图片到MongoDB.

MongoDB对图片进行CRUD操作——与JAVA结合

- - CSDN博客推荐文章
        上几篇博客简单对MongoDB进行了简单介绍和如何安装,以及在dos下是如何操作MongoDB和在安装MongoDB中,出现了什么错误,是如何解决的. 当然这些都还不够,我们还要用到实际当中去. 我用MyEclipse+JDK1.7做了一个简单的demo,来展示下MongoDB怎么运用到实际中去.

文章: Java SE1.6中的Synchronized

- - InfoQ cn
在多线程并发编程中Synchronized一直是元老级角色,很多人都会称呼它为重量级锁,但是随着Java SE1.6对Synchronized进行了各种优化之后,有些情况下它并不那么重了,本文详细介绍了Java SE1.6中为了减少获得锁和释放锁带来的性能消耗,而引入的偏向锁和轻量级锁,以及锁的存储结构和升级过程.

文章: Java虚拟机家族考

- Haides - InfoQ中文站
说起Java虚拟机,许多Java程序员都会潜意识地把它与Sun HotSpot虚拟机等同看待,也许还有一些程序员会注意到BEA JRockit和IBM J9,但大多数人对JVM的认识都仅限于此了. 从1996年初Sun发布的JDK 1.0中所包含的Sun Classic VM算起,Java虚拟机已经发展了15个年头,沧海桑田一瞬间,15年转眼而过,这期间曾经涌现、湮灭过许多或经典或优秀或有特色的虚拟机实现,在《Java虚拟机专栏》的第1篇中,我们先暂且把代码与技术放下,一起来回顾一下Java虚拟机家族的发展轨迹和历史变迁.

文章: Java Remoting远程服务(下)

- - InfoQ cn
上篇分别介绍了Java Remoting远程服务中的RMI、EJB、Web Service等技术,下篇继续分享其他的内容. 百度技术沙龙第二十三期:一站式的前端开发框架(2月18日 周六). QCon北京2012:语言代码之美. 盛大云计算创意&开发大赛火热报名中. Hessian(http://hessian.caucho.com)是一种轻量级的Web Service, 采用的是二进制的RPC协议.

【MongoDB】MongoDB之优化器Profiler

- - CSDN博客数据库推荐文章
在mysql数据库中,慢查询日志经常作为优化数据库的依据, mongodb中依然有类似的功能. Mongodb自带的profiler,可以方便地记录所有耗时的操作,以便于调优;. 一、开始profiler功能. 开启profier功能有两种:. 第一种就是直接在启动参数里面进行设置,就在茄冬mongodb时候添加-profile=级别.

夜说mongodb

- Lianhui Wang - NoSQLFan
前两天本站刚刚分享了wordnik使用MongoDB经验的文章:《Wordnik 的 MongoDB 使用经历》,今天又看到一位朋友对这方面做的总结,分享在这里,供大家参考. 赋闲以后很长没有更新博客了,说忙完全是借口,多半因为没有兴致所致. 今天凌晨比赛多多,趁着比赛的前奏和间隙,遂浏览些技术文章.