Doris 是一款高性能、实时的分析型数据库,能够在海量数据中快速返回精确的查询结果。它易于使用,支持多种数据源和分析场景,广泛应用于报表分析、广告投放、用户行为分析等领域。Doris 的MPP架构和向量化执行引擎使其成为构建大数据分析平台的理想选择。
特性
- 实时数据摄取和存储: 支持秒级内推送式微批处理和拉取式流数据摄取。存储引擎支持实时更新、追加和预聚合。
- 闪电般的查询速度,优化查询性能: 通过列式存储引擎、MPP架构、基于成本的查询优化器和向量化执行引擎,优化高并发和高吞吐量查询。
- 联合数据湖和数据库: 支持联邦查询数据湖如Hive、Iceberg和Hudi,以及数据库如MySQL和PostgreSQL。
- 复合数据类型: 支持数组、映射和JSON等复合数据类型。
- 变体数据类型: 支持JSON数据的自动数据类型推断。
- 文本搜索: 使用NGram布隆过滤器和倒排索引进行文本搜索。
- 分布式设计: 支持线性扩展。
- 工作负载隔离和分层存储: 有效地管理资源。支持无共享集群以及存储和计算分离。
- 兼容性: 与MySQL协议和ANSI SQL兼容,易于与BI工具集成。
- 开放数据API: 提供开放数据API,可供外部计算引擎如Spark、Flink和ML/AI访问。
安装
从 doris.apache.org 下载 Apache Doris 安装包,然后按照以下步骤进行操作。
# 下载 Apache Doris
server1:~ doris$ wget https://apache-doris-releases.oss-accelerate.aliyuncs.com/apache-doris-2.0.3-bin-x64.tar.gz
# 解压安装包
server1:~ doris$ tar zxf apache-doris-2.0.3-bin-x64.tar.gz
# 重命名目录
server1:~ doris$ mv apache-doris-2.0.3-bin-x64 apache-doris
# 添加JAVA_HOME并将其指向JDK8运行时环境
JAVA_HOME=/home/doris/jdk8
# 启动 FE
server1:apache-doris/fe doris$ ./bin/start_fe.sh --daemon
下载 便携式 MySQL 客户端,连接 Doris FE。
解压客户端,在 bin/
目录下找到 mysql
命令行工具。然后执行以下命令,连接 Apache Doris。
mysql -uroot -P9030 -h127.0.0.1