人工智能會取代你的工作嗎?
站在2022年的當下,大部分人給出的回答是——不會。事實上,AI產(chǎn)業(yè)的蓬勃發(fā)展,正在創(chuàng)造更多工作崗位。
AI產(chǎn)業(yè)的工作機會不僅僅局限于工程師崗位。如今,從城市到鄉(xiāng)村,從學生到上班族,越來越多人開始將AI數(shù)據(jù)標注員作為一項兼職工作,為AI模型添磚加瓦。
但在AI數(shù)據(jù)標注領域,服務于數(shù)據(jù)標注的平臺、工具卻一直不夠豐富。特別是可供中小企業(yè)、個人開發(fā)者使用的開源、免費的標注工具,更是少之又少。
如今,越來越多的AI開發(fā)者注意到了這一問題,并開始改變這一現(xiàn)狀。為了滿足以上需求,LabelFree數(shù)據(jù)標注平臺目前發(fā)布了最新版本,提供高效的標注能力,并原生對接YMIR開源AI模型生產(chǎn)平臺,提供了一站式的AI解決方案。這些低門檻的AI數(shù)據(jù)標注解決方案,或將在未來進一步加速AI的普及。
數(shù)據(jù)標注平臺,能做到既便宜又好用嗎?
在AI產(chǎn)業(yè),數(shù)據(jù),意味著什么?
數(shù)據(jù),是AI生產(chǎn)的基座。一個AI模型從誕生到完善,直至應用于產(chǎn)品,實現(xiàn)商業(yè)化落地,需要大量數(shù)據(jù)的喂養(yǎng)。而在這一過程中,數(shù)據(jù)標注給AI模型提供了學習數(shù)據(jù)的重要基礎,是AI從“人工”到“智能”的第一步。
在AI產(chǎn)業(yè)鏈條中,數(shù)據(jù)標注平臺基本可劃分為四類:
其一,是大型企業(yè)開發(fā)的數(shù)據(jù)標注平臺,大多服務于企業(yè)內部的AI項目,不會對外開放。
其二,是SaaS類的數(shù)據(jù)標注解決方案,企業(yè)及個人開發(fā)者可付費使用。這類服務的優(yōu)勢是無需部署,可以直接使用;而劣勢則是不支持本地化部署,可能存在數(shù)據(jù)合規(guī)風險,且大多不支持定制及二次開發(fā)。
其三,是直接將數(shù)據(jù)標注服務交給外包服務商,通過服務商的團隊完成數(shù)據(jù)標注工作。其優(yōu)勢在于省心省力,而劣勢也十分明顯:數(shù)據(jù)安全、交付速度、標注質量均不可控。特別是一些具有一定專業(yè)性的標注工作,如醫(yī)學影像類標注,更是考驗數(shù)據(jù)標注服務商的專業(yè)能力。
最后,是開源的數(shù)據(jù)標注平臺。與前幾者相比,開源方案的使用門檻更低,且支持二次開發(fā),并支持本地化部署。但與此同時,市面上的開源數(shù)據(jù)標注平臺數(shù)量有限,且許多產(chǎn)品在標注員使用、項目管理方面均存在流程復雜、效率低的問題。因此,開源解決方案始終未能成為行業(yè)主流。
綜上所述,在數(shù)據(jù)標注的工具選擇上,AI開發(fā)者度的需求其實十分清晰:低成本使用,最好是開源項目,或支持免費授權;支持定制或二次開發(fā);可以本地化部署,滿足數(shù)據(jù)可控需求;標注、項目管理流程簡便;最后,最好可以與MLOps平臺緊密結合,更快、更好地開發(fā)、測試及部署模型。
為了滿足以上需求,開源AI模型生產(chǎn)平臺項目YMIR在日前上線了數(shù)據(jù)標注平臺——LabelFree,希望通過免費、可定制、支持本地部署的解決方案,提升數(shù)據(jù)標注平臺的易用性。
YMIR的定位是“一站式AI模型生產(chǎn)和部署平臺”,其簡化了AI模型的訓練流程,支持以無代碼開發(fā)的模式,實現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)挖掘、模型訓練、模型驗證等功能。而LabelFree支持與YMIR平臺無縫銜接,用戶可以在YMIR平臺選擇數(shù)據(jù)集后直接跳轉至LabelFree進行標注,圖片的標注信息會同步至YMIR,標注完成后的數(shù)據(jù)集可以直接用來在YMIR平臺進行模型訓練。在后續(xù)模型迭代的過程中,用戶也可以在YMIR和LabelFree之間快速切換,通過挖掘、標注和重訓練的多次循環(huán),獲得滿意的模型。
YMIR GitHub頁面
今年5月,YMIR在GitHub上線。公開資料顯示,其核心發(fā)起人包括云天勵飛首席科學家,IEEEFellow王孝宇;美國硅谷NEC實驗室媒體分析部主管,印裔科學家ManmohanChandraker;前谷歌、亞馬遜、Snap機器學習研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官,法裔科學家WilliamBrendel等。
事實上,YMIR的許多特性,如一站式服務、開放式設計、免費使用等等,都在LabelFree上得以體現(xiàn)。LabelFree提供的低門檻、優(yōu)體驗的數(shù)據(jù)標注服務,也契合了YMIR的開發(fā)理念——通過開源AI系統(tǒng)能力,讓每一家企業(yè)都能擁抱AI,加速AI產(chǎn)業(yè)化、平民化。
專注視覺信息標注,LabelFree有何不一樣?
與市面上的大部分數(shù)據(jù)標注平臺相比,LabelFree的優(yōu)勢是什么?
在產(chǎn)品定位方面,大部分AI數(shù)據(jù)標注平臺都會同時支持視覺、語音、文本類數(shù)據(jù)標注,而LabelFree則不追求大而全,而是聚焦于計算機視覺領域。事實上,這也是AI數(shù)據(jù)領域最大的數(shù)據(jù)板塊。根據(jù)艾瑞咨詢發(fā)布的《中國AI基礎數(shù)據(jù)服務行業(yè)發(fā)展報告》,中國AI基礎數(shù)據(jù)服務行業(yè)市場中,圖像類數(shù)據(jù)需求占比為49.7%,遠高于其他類型數(shù)據(jù)。
對于專精于計算機視覺領域的原因,LabelFree工程師給出的答案是——LabelFree專注于計算機視覺數(shù)據(jù)的標注,希望依托于頂尖的AI算法團隊、成熟的數(shù)據(jù)標注體系、大規(guī)模算法落地經(jīng)驗提供最低成本、最高效率的數(shù)據(jù)標注能力,讓LabelFree的數(shù)據(jù)標注能力躋身行業(yè)第一梯隊。
在圖像分割技術上,LabelFree集成了輔助分割算法。在傳統(tǒng)的標注模式下,標注員需要手動點擊錨點,將被標注物從圖片中分割出來;引入輔助分割算法后,標注員只需點擊標注物,系統(tǒng)會自動將標注物分割,標注員只需要對錨點進行微調,即可完成標注。圖像分割等技術的加入,提升了標注員在LabelFree平臺的標注效率,從而降低AI開發(fā)成本。
事實上,目前市面上的大部分數(shù)據(jù)標注平臺,在產(chǎn)品設計上更傾向于管理者視角,鮮少關注數(shù)據(jù)標注員的使用體驗。在英文世界中,AI數(shù)據(jù)標注員常常被媒體稱為“幽靈工人”(ghostworker),他們大多以兼職或遠程辦公的身份進行工作,是AI時代中常常被忽視的“看不見的人”。
因此,在AI時代,數(shù)據(jù)標注員的話語權是缺失的。此外,計件而非計時的計薪模式,也讓許多數(shù)據(jù)標注平臺沒有動力在產(chǎn)品層面優(yōu)化標注員的標注效率。
而LabelFree開發(fā)團隊針對數(shù)據(jù)標注員群體開展了大量調研工作,以優(yōu)化標注員的使用體驗,幫助他們減輕工作壓力,提升工作效率。例如,在圖像復雜、目標眾多的目標檢測場景中,標注員對目標的標簽設置存在大量重復操作,為此,LabelFree特別設計了“無限模式“,讓標注員可以快捷地對某一類型連續(xù)操作,達到最高的生成效率。
與此同時,針對數(shù)據(jù)標注效率,LabelFree也完善了多人標注協(xié)作體驗,并原生支持分布式對象存儲,以解決海量標注數(shù)據(jù)的存儲問題,降低存儲成本,提升數(shù)據(jù)安全。
在提升數(shù)據(jù)標注效率的同時,LabelFree與YMIR的無縫銜接也簡化了AI模型的訓練流程。在LabelFree平臺上完成標注后,AI工程師可以直接在YMIR上進行模型訓練,檢驗模型訓練成果,并將新的模型在LabelFree上進行預標注,同時提升數(shù)據(jù)標注與模型訓練的工作流效率。
Label Free使用文檔
此外,最重要的是,LabelFree支持本地化、私有化部署,用戶可以在以私有化的形式安裝LabelFree,將數(shù)據(jù)留存在可控范圍內,在保證數(shù)據(jù)安全的前提下完成數(shù)據(jù)標注流程。而這一特性,對于醫(yī)院、學校等信息敏感類客戶而言至關重要。
在商業(yè)化方面,LabelFree提供數(shù)據(jù)標注解決方案、定制化開發(fā)、技術支持,以滿足專業(yè)商業(yè)客戶的需求。此外,有AI需求的客戶可以在算法商城模塊上試用現(xiàn)有的算法方案,結合自身數(shù)據(jù)完善自己的AI模型。
提煉「數(shù)據(jù)石油」——AI數(shù)據(jù)服務市場迅速成長
未來,AI數(shù)據(jù)服務行業(yè)將駛向何方?
早在2017年,《經(jīng)濟學人》雜志就曾發(fā)表封面文章,提出了“數(shù)據(jù)石油”的概念——“世界上最有價值的資源不再是石油,而是數(shù)據(jù)”。與石油類似,數(shù)據(jù)本身價值有限,只有經(jīng)過“提煉”之后,才能爆發(fā)出巨大的價值。
而數(shù)據(jù)標注平臺則成為了“提煉數(shù)據(jù)石油”的關鍵。一方面,越來越好用的數(shù)據(jù)標注平臺,完善了AI產(chǎn)業(yè)的基礎設施,從而帶動更多開發(fā)者及企業(yè)加入到AI產(chǎn)業(yè),也可以做大AI數(shù)據(jù)標注員的就業(yè)市場,創(chuàng)造更多就業(yè)崗位。
2020年2月,人力資源社會保障部聯(lián)合多部門發(fā)布通知,正式將“人工智能訓練師”列為新職業(yè),并納入國家職業(yè)分類目錄。這意味著AI數(shù)據(jù)標注員這一職業(yè)獲得了國家層面的認可。
而另一方面,以數(shù)據(jù)標注、處理為代表的AI基礎數(shù)據(jù)服務市場,仍處于高速增長之中。這意味著,數(shù)據(jù)標注平臺、數(shù)據(jù)采集服務等AI基礎數(shù)據(jù)服務,在未來存在著巨大的增長空間。
艾瑞咨詢的數(shù)據(jù)顯示,包括數(shù)據(jù)采集、數(shù)據(jù)處理(標注)、數(shù)據(jù)存儲、數(shù)據(jù)挖掘等模塊在內的AI基礎數(shù)據(jù)服務市場,將在未來數(shù)年內持續(xù)增長,到2025年,國內AI基礎數(shù)據(jù)服務市場的整體規(guī)模預計將達到101.1億元,整體市場增速將達到31.8%(2024-2025年)。
AI數(shù)據(jù)基礎設施的不斷完善,將會推動更多數(shù)據(jù)流動起來,投入到AI模型訓練的應用之中,并緩解困擾行業(yè)已久的“數(shù)據(jù)煙囪”問題。在大數(shù)據(jù)時代,挖掘數(shù)據(jù)價值比以往任何時刻都更重要,正如“大數(shù)據(jù)之父”、牛津大學舍恩伯格在《大數(shù)據(jù)時代》一書所言:“在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己‘發(fā)聲’?!?/p>
免責聲明:以上內容為本網(wǎng)站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點,亦不代表本網(wǎng)站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。
互聯(lián)網(wǎng)新聞信息服務許可證10120230012 信息網(wǎng)絡傳播視聽節(jié)目許可證0121673 增值電信業(yè)務經(jīng)營許可證京B2-20171219 廣播電視節(jié)目制作經(jīng)營許可證(京)字第10250號
關于我們 中宏網(wǎng)動態(tài) 廣告服務 中宏網(wǎng)版權所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.uokii.com. all rights reserved 運營管理:國家發(fā)展和改革委員會宏觀經(jīng)濟雜志社