txtai 将向量索引、图网络和关系数据库有机结合,实现了对文本数据的深度理解和灵活检索。它不仅支持传统的 SQL 查询,还能进行语义搜索、主题建模,并为生成式 AI 提供高质量的提示。
特性
- 向量搜索: 使用 SQL、对象存储、主题建模、图分析和多模态索引进行向量搜索。
- 创建嵌入: 为文本、文档、音频、图像和视频创建嵌入。
- 管道: 由语言模型驱动的管道,运行 LLM 提示、问答、标记、转录、翻译、摘要等功能。
- 工作流: 将管道组合在一起并聚合业务逻辑。txtai 进程可以是简单的微服务或多模型工作流。
- 构建: 使用 Python 或 YAML 构建。提供 JavaScript、Java、Rust 和 Go 的 API 绑定。
- 部署: 本地运行或使用容器编排进行扩展。
txtai 使用 Python 3.8+、Hugging Face Transformers、Sentence Transformers 和 FastAPI 构建。txtai 是一个根据 Apache 2.0 许可证发布的开源项目。
安装
pip install txtai