label-studio – 一个开源的简化和加速机器学习模型数据标注工具

Label Studio 是一个开源的数据标注工具,它允许你标注各种类型的数据,包括图像、文本、音频、视频和时间序列数据。它旨在简化和加速机器学习模型的数据标注过程,并提供了一个灵活的界面,可以根据你的特定需求进行定制。

特性

灵活且可配置
可配置的布局和模板可根据你的数据集和工作流程进行适配。

集成到你的 ML/AI 管道
通过 Webhooks、Python SDK 和 API 实现认证、创建项目、导入任务、管理模型预测等功能。

机器学习辅助标注
通过与机器学习后端的集成,利用预测结果辅助标注,从而节省时间。

连接云存储
连接到云对象存储(如 S3 和 GCP),直接标注其中的数据。

探索并理解你的数据
使用高级筛选功能,在数据管理器中准备和管理你的数据集。

支持多个项目和用户
在一个平台上支持多个项目、使用场景和数据类型。

安装

建议使用虚拟环境(venv 或 conda)来降低包冲突或缺少包的可能性。

使用 pip 安装

要使用 pip 和虚拟环境安装 Label Studio,需要 Python 版本 3.8 或更高。运行以下命令:

python3 -m venv env
source env/bin/activate
python -m pip install label-studio

如果仅使用 pip 安装 Label Studio,同样需要 Python 版本 3.8 或更高。运行以下命令:

pip install label-studio

安装完成后,使用以下命令启动 Label Studio 服务:

label-studio

默认情况下,系统会自动在浏览器中打开 http://localhost:8080 并加载 Label Studio。有关启动 Label Studio 的更多选项,请参考相关文档。

使用 Homebrew 安装

要通过 Homebrew 安装 Label Studio,需要在系统中安装 Brew 包管理器。如果尚未安装 Brew,请访问 brew.sh 查看安装说明。

执行以下命令添加 Heartexlabs 的软件源:

brew tap humansignal/tap

然后执行以下命令安装 Label Studio:

brew install humansignal/tap/label-studio

安装完成后,使用以下命令启动 Label Studio 服务:

label-studio

默认情况下,系统会自动在浏览器中打开 http://localhost:8080 并加载 Label Studio。有关启动 Label Studio 的更多选项,请参考相关文档。

注意
如果您之前从已弃用的组织名称 heartexlabs/tap 安装了 Brew 的软件源,不必立即迁移。过时的软件源已设置为 humansignal/tap 的镜像,以确保现有用户的使用不会中断。

使用 Docker 安装
Label Studio 也可以作为 Docker 容器运行。确保您的计算机已安装 Docker。

在 *nix 系统上使用 Docker 安装

要在 http://localhost:8080 启动 Label Studio,并将所有标注数据存储在 ./mydata 目录中,请运行以下命令:

docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest

重要提示
由于这是一个非 root 容器,挂载的文件和目录必须为 UID 1001 配置正确的权限。

参考链接

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注