基于电影知识图谱的智能问答系统(八) -- 终极完结篇 - Appleyk的专栏 - CSDN博客
基于电影知识图谱的智能问答系统系列章节传送门:
基于电影知识图谱的智能问答系统(一) -- Mysql数据准备
基于电影知识图谱的智能问答系统(二) -- Neo4j导入CSV文件
基于电影知识图谱的智能问答系统(三) -- Spark环境搭建
基于电影知识图谱的智能问答系统(四) -- HanLP分词器
基于电影知识图谱的智能问答系统(五) -- Spark朴素贝叶斯分类器
基于电影知识图谱的智能问答系统(六) -- 问题训练样本集敲定
基于电影知识图谱的智能问答系统(七) -- Neo4j语句那点事
博主注:本篇不再过多的讲解demo了,集成也很简单,前面几章也已经给本篇做足了铺垫,项目demo中的注释也是非常的详细,最后会附上整个项目的下载地址,如有问题,另留言吧。
一、效果预览
(1)电影简介
前端展示:
后台效果:
(2)电影评分
前端展示:
后台效果:
(3)电影演员列表
前端展示:
后台效果:
(4)演员A和演员B合作过哪些电影
前端展示:
后端效果:
由于章子怡本来是一个完整的人名,但是HanLP分词的时候,却意外的“失手”了,因此导致最后查询无果
我们再换个问题试验一把
后台效果:
(5)某演员出演过那种类型的电影或演过某种类型的电影有哪些
......etc,其余不在做演示,下面直接来看如何利用Spring-Boot搭建我们的智能问答系统
二、项目目录结构图
三、Movie节点类
这里只拿电影信息的节点类来进行演示,比如,movie对应的节点在Java中定义类如下:
package com.appleyk.node;
import java.util.List;
import org.neo4j.ogm.annotation.NodeEntity;
import org.neo4j.ogm.annotation.Relationship;
import com.fasterxml.jackson.annotation.JsonProperty;
@NodeEntity
public class Movie extends BaseEntity{
private Long mid;
private Double rating;
private String releasedate;
private String title;
private String introduction;
@Relationship(type = "is")
@JsonProperty("电影类型")
private List<Genre> genres;
public Movie() {
}
public Long getMid() {
return mid;
}
public void setMid(Long mid) {
this.mid = mid;
}
public Double getRating() {
return rating;
}
public void setRating(Double rating) {
this.rating = rating;
}
public String getReleasedate() {
return releasedate;
}
public void setReleasedate(String releasedate) {
this.releasedate = releasedate;
}
public String getTitle() {
return title;
}
public void setTitle(String title) {
this.title = title;
}
public String getIntroduction() {
return introduction;
}
public void setIntroduction(String introduction) {
this.introduction = introduction;
}
public List<Genre> getGenres() {
return genres;
}
public void setGenres(List<Genre> genres) {
this.genres = genres;
}
}
其中属性和neo4j中的movie节点的属性一一对应
电影信息节点里面带有关系is,对应neo4j中该电影的类型
通过Controller对外提供的查询接口如下:
外部调用效果如下:
四、加载自定义带词性的字典数据
注:不要使用HanLP提供的自定义词典路径,因为这个除了不能随心所欲的定义分词的词性以外,还极容易出现分词紊乱,词性对不上的bug,为了满足我们对专有电影名、电影分数及电影类型词性的定义,我们使用额外加载的方式设置HanLP的自定义分词,application.properties中设置自定义词典的路径如下:
这三个文件的下载地址: https://pan.baidu.com/s/13PYsF2X3v7BzkPFG37kKuw
注:也可以根据自己的需求进行设置
五、项目完整地址
GitHub下载地址: Spring-Boot集成Neo4j并利用Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统
完结!!!
番外篇:如何将项目导入到IDEA并运行测试效果?
(1)IDEA项目结构图(导入pom文件,配置好Maven后如下)
(2)项目配置文件
(3)内嵌html测试前端访问页面
(4)启动项目
(5)浏览器访问主页Index.html