數(shù)據(jù)是人工智能的基礎(chǔ)。小到智能手機人臉解鎖,大到智慧城市的智能安防;從車輛自動駕駛到AI聊天機器人,從醫(yī)學成像與診斷到農(nóng)作物監(jiān)測。AI需要依據(jù)大量有效數(shù)據(jù)總結(jié)規(guī)律形成“智能”,進而在不同場景下落地應(yīng)用。
“其實AI數(shù)據(jù)作為生產(chǎn)資料,是推動整個AI行業(yè)發(fā)展的必要一環(huán),也是人工智能商業(yè)化的主要驅(qū)動力之一,說高質(zhì)量的數(shù)據(jù)決定了AI的落地程度也不為過?!痹茰y數(shù)據(jù)總經(jīng)理賈宇航表示。
目前,場景化AI數(shù)據(jù)是人工智能現(xiàn)階段發(fā)展和商業(yè)化落地的關(guān)鍵點。但機器并不能理解人類所能識別的原始數(shù)據(jù),這些原始數(shù)據(jù)需要人為的“標簽化”以后,才可以被用于模型訓(xùn)練。這些“標簽化”的數(shù)據(jù)越多越精準,其獲得的結(jié)果就越準確。例如,自動駕駛的算法模型經(jīng)過大量場景AI數(shù)據(jù)的訓(xùn)練,不斷的學習和優(yōu)化,進而讓系統(tǒng)的智能化程度逐漸提高。
如何“標簽化”就涉及“數(shù)據(jù)標注”這一環(huán)節(jié),即針對語音、圖像、文本等數(shù)據(jù),通過貼標簽、做記號、標顏色或劃重點的方式,來標注出其中目標數(shù)據(jù)的不同點、相似點或類別。
數(shù)據(jù)標注,是將數(shù)據(jù)轉(zhuǎn)化為AI商業(yè)價值的重要一環(huán)。數(shù)據(jù)標注的精準度越高,AI學習和產(chǎn)出的結(jié)果越精確,AI也就越智能。
在場景化落地中,意味數(shù)據(jù)標注行業(yè)要滿足多樣化應(yīng)用場景標注需求。例如,金融行業(yè),早期對AI客服機器人的要求只停留在“用戶提問后,對其中的關(guān)鍵詞進行提取,并按照既定話術(shù)回答”。但在互聯(lián)網(wǎng)金融業(yè)務(wù)競爭異常激烈的今天,越來越多的用戶習慣在網(wǎng)上辦理業(yè)務(wù),AI客服機器人正在大規(guī)模地取代人工客服,AI問答的準確性將直接決定業(yè)務(wù)的效率和成本,并影響用戶體驗,很大程度上決定了金融機構(gòu)的競爭力。(王雨陽)
相關(guān)資訊