行業(yè)資訊
中國經濟導報
中國戰(zhàn)略新興產業(yè)雜志記者|杜壯
目前人工智能市場發(fā)展依然火熱,各行各業(yè)對數據的需求也呈現井噴態(tài)勢。然而現在很多企業(yè)的大部分非結構化數據無法用于AI(人工智能)模型訓練,需要大量的人工進行標簽化處理。人工智能企業(yè)要想在數據標注上降本增效,必須選擇更加高效、體驗更好的標注工具,從而提升標注團隊的工作效率。
在二零二一年中國國際服務貿易交易會期間,云測數據發(fā)布了“云測數據標注平臺-AI數據集管理系統(tǒng)”,專注于AI數據集的上傳、管理、存儲、分享,數據類型標簽化管理,同時支持標注結果的存儲、標注結果可視化等功能,從而助力企業(yè)進行數據管理,提升數據訓練的匹配度。作為AI訓練數據頭部服務商,云測數據總經理賈宇航接受中國經濟導報記者專訪時表示,只有把海量的訓練數據進行有效管理,才能減少冗余數據、最大化地發(fā)揮訓練數據的價值,從而推動數據要素有序發(fā)展及高效利用。
在人工智能產業(yè)鏈中,算法、算力和數據共同構成技術發(fā)展的三大核心要素。從人工智能產業(yè)鏈的發(fā)展情況和未來發(fā)展趨勢來看,中國人工智能數據服務行業(yè)的市場規(guī)模正在逐步擴大。據IDC預測,中國的數據量增速最快,平均每年的增長速度比全球快3%。2018年,中國的數據量為7.6ZB,占全球總量的23.4%,預計到2025年將增至48.6ZB,占全球總量的27.8%,年復合增長率達30.35%。在這樣的數據增長背景下,數據資產管理的重要性不言而喻。
如今,各行各業(yè)紛紛搭乘數字化轉型的快車,以取得市場競爭力。值得注意的是,在企業(yè)爭先擁抱數字化轉型的同時,部分中小企業(yè)也面臨著“不會轉、不能轉、不敢轉”的現狀。相關數據顯示,目前我國僅有25%的企業(yè)開啟了數字化轉型,中小企業(yè)比例則更小。
賈宇航認為,數字化轉型的本質,是利用軟件技術、互聯(lián)網、人工智能等數字手段,降低企業(yè)運營成本,提升生產運營效率,為對外開源拓客創(chuàng)造更多價值的過程。也正因為如此,企業(yè)的數字化轉型必然離不開應用、軟件、系統(tǒng)等信息基礎設施的建設與運用,這背后必然產生大量的數據。
“人工智能落地商業(yè)化時代,企業(yè)面臨著自身AI數據量大、對某個特殊問題場景很難找到有價值AI數據的普遍困境。同時在人工智能數據訓練過程中,AI數據管理更是面臨著數據資產不能充分利用、管理方式不完善等新的挑戰(zhàn)?!辟Z宇航說。
“企業(yè)在使用系統(tǒng)的過程中會有一個‘拎包入住’的體驗?!辟Z宇航告訴記者,這次推出的平臺將AI數據服務的流程具象化,變成了一個產品。原來用于管理云測數據內部的服務流程,如今可以擴展到AI相關企業(yè)中應用。再結合云測數據標注平臺,客戶可以一站式、流程化進行數據采集、數據標注、數據管理。
據了解,自主研發(fā)的云測數據標注平臺為AI相關企業(yè)提供了一站式、大規(guī)模處理訓練數據的能力,可以助力AI數據訓練綜合效率提升200%,標注精準度最高可達99.99%。
“作為AI技術的三大要素之一,數據從本質上決定了人工智能的落地水平。通常來講,數據標注得越精準,數據量越大,模型就越好,最后的AI產品效果也就越好?!睂τ谖磥?,賈宇航充滿了信心。他告訴記者:“人工智能被列入新基建中的新技術基礎設施,將會有更多的資本或者政策關注,而人工智能三要素之一的數據,勢必會伴隨著人工智能行業(yè)的增長而增長?!?br/>在人工智能的大潮中保持技術和行業(yè)的領先性并非易事。賈宇航也道出了他們發(fā)展的秘密,那就是“一橫一縱”戰(zhàn)略。
談到“一橫”,賈宇航解釋道:“伴隨著整個人工智能的發(fā)展,我們在自動駕駛、智能家居、智慧城市和智慧金融等多個行業(yè),有端到端的訓練數據服務解決方案。隨著越來越多的行業(yè)進行智能化、數字化轉型,我們將積極地為這些具有潛力的賽道和行業(yè),去制定數據解決方案,幫助更多的人工智能技術商業(yè)化落地?!?br/>“‘一縱’更多地是對熱門行業(yè)和技術發(fā)展趨勢進行前瞻性預測,提前準備相關的工具鏈以及數據服務能力,確保有充足的準備去應對新的AI數據需求。”賈宇航說。