Label Studio 入门
概述
Label Studio是一個獨立的Web應(yīng)用程序,用于多類型數(shù)據(jù)標(biāo)記和探索。
后端是用純Python編寫的,由Django提供支持。
前端部分是一個與后端無關(guān)的React+MST應(yīng)用程序,包括在一個預(yù)編譯腳本中。
以下是Label Studio工作流背后的主要概念:
- Tasks表示單個數(shù)據(jù)集項。
Label Studio是一個多類型的標(biāo)簽工具-您可以導(dǎo)入文本、圖像、音頻URL、HTML文本或這些數(shù)據(jù)資源的任意數(shù)量和組合。 - Completions是JSON格式的標(biāo)記結(jié)果。
它們可以以各種通用格式導(dǎo)出,隨時可以在機器學(xué)習(xí)管道中使用。 - Predictions是具有相同格式的可選標(biāo)記結(jié)果,但與完成不同,它們用于在注釋過程中生成預(yù)標(biāo)記,或驗證模型預(yù)測。
- Machine learning backend將流行的機器學(xué)習(xí)框架連接到Label Studio,以便動態(tài)學(xué)習(xí)和生成模型預(yù)測。
- Labeling-config是一個簡單的XML樹,帶有標(biāo)記,用于配置UI元素,連接輸入數(shù)據(jù)和輸出標(biāo)簽方案。
- Project包含任務(wù)、配置、預(yù)測和完成在一個獨立的目錄中。
- Frontend Labeling UI可以從任何瀏覽器訪問,以預(yù)編譯的js/css腳本的形式發(fā)布,并且可以通過新的標(biāo)簽標(biāo)簽輕松擴展。
您還可以將Label Studio用戶界面嵌入到應(yīng)用程序中。
快速啟動
先決條件
在Linux、Windows和MacOSX上運行的Python 3.5或更高版本支持Label Studio。
注意:對于Windows用戶,默認安裝可能無法構(gòu)建lxml包。
考慮從非官方的Windows二進制文件中手動安裝它。
如果您在x64上運行python3.8,請運行pip install lxml?4.5.0?cp38?cp38?win_amd64.whl。
使用 pip 運行
要通過pip安裝Label Studio,需要Python>=3.5并運行:
pip install label-studio然后啟動一個新項目,該項目將所有標(biāo)簽數(shù)據(jù)存儲在本地目錄my_labeling_項目中:
label-studio start my_labeling_project --init默認瀏覽器在自動打開http://localhost:8080/。
通過 Docker 運行
Label Studio也作為docker容器分發(fā)。
確保您的本地計算機上安裝了Docker。
安裝并啟動Label Studio在http://localhost:8080,將所有標(biāo)簽數(shù)據(jù)存儲在./my_labeling_項目目錄中:
docker run --rm -p 8080:8080 -v `pwd`/my_labeling_project:/label-studio/my_labeling_project --name label-studio heartexlabs/label-studio:latest注意:如果./my_labeling_project文件夾存在,將引發(fā)異常。
請刪除此文件夾或使用–force選項。
注意:對于Windows,您必須修改由-v選項設(shè)置的卷路徑
您可以通過附加任何可用的命令行參數(shù)來重寫默認啟動命令:
docker run -p 8080:8080 -v `pwd`/my_project:/label-studio/my_project --name label-studio heartexlabs/label-studio:latest label-studio start my_project --init --force --template image_mixedlabel如果要生成本地映像,請運行:
docker build -t heartexlabs/label-studio:latest .通過源碼運行
如果要使用夜間構(gòu)建或擴展功能,請考慮使用Git下載源代碼并在本地運行Label Studio:
git clone https://github.com/heartexlabs/label-studio.git cd label-studio python setup.py develop然后創(chuàng)建一個新的項目,它將所有標(biāo)簽數(shù)據(jù)存儲在本地目錄my_labeling_project中:
label-studio start my_labeling_project --init默認瀏覽器將在自動打開http://localhost:8080。
多會話模式
您可以在多會話模式下啟動Label Studio-每個瀏覽器 session 都創(chuàng)建自己的項目,并將關(guān)聯(lián)的 session ID作為名稱。
要以多會話模式啟動Label Studio并將所有項目保留在單獨的目錄會話項目中,請運行
label-studio start-multi-session --root-dir ./session_projects命令行參數(shù)
您可以通過命令行界面指定輸入任務(wù)、項目配置、機器學(xué)習(xí)后端和其他選項。
運行l(wèi)abel-studio start --help查看所有可用選項。
使用登錄名和密碼進行身份驗證
您可以使用基本HTTP身份驗證來限制對LS實例的訪問。
label-studio start my_labeling_project --username user --password pwd或者在項目的config.json中輸入用戶名和密碼。
{ ..."username": "user", "password": "pwd",... }所有用戶的用戶名和密碼都是相同的。
總結(jié)
以上是生活随笔為你收集整理的Label Studio 入门的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Flask-RESTful 快速入门
- 下一篇: 104. Maximum Depth o