Label Studio 是一个开源的数据标注工具,它允许你标注各种类型的数据,包括图像、文本、音频、视频和时间序列数据。它旨在简化和加速机器学习模型的数据标注过程,并提供了一个灵活的界面,可以根据你的特定需求进行定制。
特性
灵活且可配置
可配置的布局和模板可根据你的数据集和工作流程进行适配。
集成到你的 ML/AI 管道
通过 Webhooks、Python SDK 和 API 实现认证、创建项目、导入任务、管理模型预测等功能。
机器学习辅助标注
通过与机器学习后端的集成,利用预测结果辅助标注,从而节省时间。
连接云存储
连接到云对象存储(如 S3 和 GCP),直接标注其中的数据。
探索并理解你的数据
使用高级筛选功能,在数据管理器中准备和管理你的数据集。
支持多个项目和用户
在一个平台上支持多个项目、使用场景和数据类型。
安装
建议使用虚拟环境(venv 或 conda)来降低包冲突或缺少包的可能性。
使用 pip 安装
要使用 pip 和虚拟环境安装 Label Studio,需要 Python 版本 3.8 或更高。运行以下命令:
python3 -m venv env
source env/bin/activate
python -m pip install label-studio
如果仅使用 pip 安装 Label Studio,同样需要 Python 版本 3.8 或更高。运行以下命令:
pip install label-studio
安装完成后,使用以下命令启动 Label Studio 服务:
label-studio
默认情况下,系统会自动在浏览器中打开 http://localhost:8080 并加载 Label Studio。有关启动 Label Studio 的更多选项,请参考相关文档。
使用 Homebrew 安装
要通过 Homebrew 安装 Label Studio,需要在系统中安装 Brew 包管理器。如果尚未安装 Brew,请访问 brew.sh 查看安装说明。
执行以下命令添加 Heartexlabs 的软件源:
brew tap humansignal/tap
然后执行以下命令安装 Label Studio:
brew install humansignal/tap/label-studio
安装完成后,使用以下命令启动 Label Studio 服务:
label-studio
默认情况下,系统会自动在浏览器中打开 http://localhost:8080 并加载 Label Studio。有关启动 Label Studio 的更多选项,请参考相关文档。
注意
如果您之前从已弃用的组织名称 heartexlabs/tap
安装了 Brew 的软件源,不必立即迁移。过时的软件源已设置为 humansignal/tap
的镜像,以确保现有用户的使用不会中断。
使用 Docker 安装
Label Studio 也可以作为 Docker 容器运行。确保您的计算机已安装 Docker。
在 *nix 系统上使用 Docker 安装
要在 http://localhost:8080
启动 Label Studio,并将所有标注数据存储在 ./mydata
目录中,请运行以下命令:
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest
重要提示
由于这是一个非 root 容器,挂载的文件和目录必须为 UID 1001 配置正确的权限。