首发于图数据库

Titan/JanusGraph图数据库实战总结与深入分析

TitanDB/JanusGraph图数据库入门简介|实战总结|选型对比|存储结构深入分析

历史背景

JanusGraph图数据库，源自于TitanDB开源图数据库。TitanDB在2012年发布第一个版本，2015年被Datastax公司收购，后续不再维护导致项目停滞。

图数据库有2个最具代表性的查询语言：Cypher 及 Gremlin。Cypher是商业公司Neo4j出品，Neo4j图数据库在2007年发布了第一个版本，是商用图数据库领域的开拓者。Gremlin是Apache TinkerPop框架下规范的语言，TinkerPop属于当前图数据库领域最流行的框架规范，具备开源开放、功能丰富、生态完善等特点，拥有大量厂商支持（超过20家），Titan当属TinkerPop框架下最成功的开源图数据库实现，后续的不少图数据库或多或少借鉴了Titan的思想，Titan的几位核心作者包括：Dan、Matthias、Marko(okram)、Stephen(spmallette)等，其中的两位--Marko和Stephen同时也是TinkerPop的核心作者。个人在此致敬Titan和TinkerPop。

非常令人遗憾的是，Titan在2015年被收购后，其开源社区无人维护，否则以其前三年的势头来看，大有一统图江湖的趋势，不过没有如果。而Janus稍许弥补了这个遗憾，也算是后继之人，但是Janus绝大部分功能沿袭自Titan，没有更上一个台阶发扬光大，只是做了一些小修补。下面是对Titan/Janus的一些总结和分析。

2016年由其他人基于Titan源码Fork出了Janus，到目前（2020年）Janus已经合入了700多个Pull Request，主要包括：

总结来说，在大方向上Janus对Titan改进并不多，主要包括2方面：

整体架构

Janus整体架构分为3层，中间层是图引擎，最底层是存储层，最上层是应用程序层：

数据模型/存储结构（整体）

图概念简介：图的核心是顶点和边，顶点代表现实世界中的实体，边代表现实世界中的关系，“我喜欢你”就可以抽象为两个顶点和一条边，同时顶点和边还可以有属性。

图是如何被存储的？在Titan/Janus中，使用的是邻接表存储结构（见上图，另一种流行的结构是Neo4j的邻接链表）。比对着上图来详细看：Janus把每个顶点的数据存为一行，当插入图数据时，会为每个顶点分配一个递增的Long类型ID（vertex id），查询的时候使用这个ID来进行索引查找。顶点的数据包括两方面内容：顶点属性（property）和邻接边（edge），每个顶点属性存为一列，每条邻接边也存为一列，列内部的详细结构见下一部分。

数据模型/存储结构（边及属性）

一个顶点的各顶点属性和边数据是按照顺序排列的，内部规则如下：

Janus这种存储结构的优点是：

针对上述第2个场景，邻接链表的存储结构是难于进行类似性能优化的。因此当一个顶点的邻接边超多时，即使用户只需要查询其部分邻接边，也还是需要从磁盘先读取所有邻接边，从而导致性能低下。

Janus大功能总结

Janus官方公布的技术限制：

Janus实战问题总结：

面对这些问题，我们是如何解决的？请听下回分解。

原文链接：

Janus参考资料：

配置项文档：

https://docs.janusgraph.org/basics/configuration-reference/

技术限制：

https://docs.janusgraph.org/basics/technical-limitations/

https://docs.janusgraph.org/basics/common-questions/

数据类型支持：

https://docs.janusgraph.org/index-backend/search-predicates/#data-type-support

https://docs.janusgraph.org/basics/schema/

索引介绍：

https://docs.janusgraph.org/index-management/index-performance/

https://docs.janusgraph.org/index-backend/search-predicates/

数据模型：

https://docs.janusgraph.org/advanced-topics/data-model/

高级特性：

https://docs.janusgraph.org/advanced-topics/advschema/

第三方可视化界面集成：

Arcade Analytics, Cytoscape, Gephi plugin for Apache TinkerPop, Graphexp, Key Lines by Cambridge Intelligence, Linkurious and Tom Sawyer Perspectives.

Janus版本增强：

https://github.com/JanusGraph/janusgraph/blob/master/docs/changelog.md

https://github.com/JanusGraph/janusgraph/milestone/1?closed=1

编辑于 2020-03-13 22:03

数据库技术

图数据库

数据库

文章被以下专栏收录

图数据库

专注于图数据库、智能知识图谱的技术交流

数据库内核

解码数据库实现

数据库内核技术专栏

探讨MySQL/PostgreSQL等数据库系统的用法和内核技术