提起賽博,通常會(huì)想到“賽博朋克”。
其實(shí),賽博朋克(英文:Cyberpunk)是“賽博”與“朋克”的結(jié)合詞。在英語(yǔ)中,賽博這個(gè)詞脫胎于Cybernetics(中文:自動(dòng)控制論),起源于希臘語(yǔ) kubernetes,意思是導(dǎo)航員、駕駛員。
而在科幻小說的范疇中,“賽博”廣義上涵蓋了這些主題:機(jī)器人、自動(dòng)化、計(jì)算機(jī)、智能等等。如果進(jìn)一步縮窄“賽博”的范圍,我們可以發(fā)現(xiàn)這個(gè)詞最常用于指代“人工智能的創(chuàng)建”。
在現(xiàn)實(shí)生活中,AI的本質(zhì)就是生產(chǎn)力。而易道博識(shí)創(chuàng)立的初心,就是借助人工智能,來簡(jiǎn)化復(fù)雜枯燥的工作。
我們?cè)凇百惒边@個(gè)詞上,傾注了許多我們美好的期許:我們希望并且相信,科技充當(dāng)?shù)慕巧粌H是一個(gè)簡(jiǎn)單的技術(shù)提供者,我們希望不僅能授人以魚,還能授人以漁,我們希望能讓用戶擁有一個(gè)可以自主可控、成本可控的、可現(xiàn)場(chǎng)應(yīng)用的平臺(tái)產(chǎn)品。
我們知道,開發(fā)一項(xiàng)人工智能模型并上線應(yīng)用大致需經(jīng)歷從業(yè)務(wù)理解、數(shù)據(jù)采標(biāo)及處理、模型訓(xùn)練與測(cè)試到運(yùn)維監(jiān)控等一系列流程。?
過程中,不僅需要大量的AI算力、高質(zhì)量數(shù)據(jù)源,還需要AI應(yīng)用算法研發(fā)及AI技術(shù)人員的支持,但大部分中小企業(yè)用戶并不具備在“算力、數(shù)據(jù)、算法”三維度從0到1部署的能力,而財(cái)力雄厚的大型企業(yè)亦需高性價(jià)比的AI開發(fā)部署方案。
智能化轉(zhuǎn)型趨勢(shì)下,企業(yè)部署AI項(xiàng)目的需求正經(jīng)歷著變化,對(duì)數(shù)據(jù)質(zhì)量、模型生產(chǎn)周期、模型自學(xué)習(xí)水平、模型部署方式、人力成本及資金投入、投資回報(bào)率等的要求都逐步走高。
假如,每次開發(fā)模型都需要算法工程師單獨(dú)完成從生產(chǎn)到上線的全流程招建,就會(huì)導(dǎo)取很多時(shí)間的耗損與AI模型開發(fā)成本的浪費(fèi)。所以集標(biāo)注、訓(xùn)練、推理于一體的賽博(CyberBot)深度學(xué)習(xí)平臺(tái)應(yīng)運(yùn)而生。
數(shù)據(jù)閉環(huán),自成有機(jī)整體
賽博學(xué)習(xí)平臺(tái)是易道博識(shí)基于深度學(xué)習(xí)自主研發(fā)的一站式機(jī)器學(xué)習(xí)訓(xùn)練平臺(tái)。賽博平臺(tái)集數(shù)據(jù)管理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練和模型應(yīng)用于一身,提供及時(shí)、現(xiàn)場(chǎng)化的數(shù)據(jù)驅(qū)動(dòng)模型應(yīng)用解決方案。
賽博平臺(tái)充分利用現(xiàn)有的經(jīng)過長(zhǎng)期迭代的基礎(chǔ)模型能力,包括圖像、OCR和NLP等,在少量樣本的驅(qū)動(dòng)下,利用遷移學(xué)習(xí)和小樣本學(xué)習(xí)等技術(shù),高效完成增量模型的訓(xùn)練,生成最優(yōu)的模型文件,并通過推理平臺(tái)實(shí)現(xiàn)模型的快速部署與生產(chǎn)應(yīng)用。
產(chǎn)品組成上,賽博平臺(tái)由管理中心CyberCenter、數(shù)據(jù)標(biāo)注平臺(tái) CyberData、深度學(xué)習(xí)訓(xùn)練平臺(tái) CyberLearning和深度學(xué)習(xí)推理平臺(tái) CyberServing幾個(gè)子平臺(tái)組成,各子平臺(tái)依次承擔(dān)平臺(tái)管理、數(shù)據(jù)管理與標(biāo)注、模型訓(xùn)練和模型服務(wù)的功能,各個(gè)子平臺(tái)之間相互獨(dú)立又有效配合,形成一個(gè)有機(jī)整體,從而有效支撐數(shù)據(jù)驅(qū)動(dòng)模型應(yīng)用的整體功能。
賽博平臺(tái)設(shè)計(jì)中充分考慮并兼顧了企業(yè)應(yīng)用的綜合性復(fù)雜場(chǎng)景以及C端客戶相對(duì)單一的場(chǎng)景。通過對(duì)各種應(yīng)用場(chǎng)景的深入研究與有效融合,以及先進(jìn)的架構(gòu)設(shè)計(jì)和技術(shù)選型,平臺(tái)最大化兼顧了專業(yè)性與易用性,從而在滿足各種應(yīng)用場(chǎng)景需求的前提下,提供最佳的用戶操作體驗(yàn)。
值得一提的是,賽博平臺(tái)打造了數(shù)據(jù)驅(qū)動(dòng)模型應(yīng)用的閉環(huán)。推理平臺(tái)支持對(duì)于自身所產(chǎn)生的生產(chǎn)數(shù)據(jù)根據(jù)不同的條件進(jìn)行自動(dòng)采集的功能,采集后的數(shù)據(jù)可以方便地導(dǎo)入標(biāo)注平臺(tái),形成數(shù)據(jù)集,并支持進(jìn)一步的數(shù)據(jù)處理與標(biāo)注。標(biāo)注完成的數(shù)據(jù)集可以用于模型的訓(xùn)練調(diào)優(yōu),從而得到性能更佳的模型,用于更新推理平臺(tái)生產(chǎn)模型,從而形成一個(gè)完整的數(shù)據(jù)閉環(huán)。
數(shù)據(jù)標(biāo)注平臺(tái) CyberData
數(shù)據(jù)平臺(tái)主要功能包括數(shù)據(jù)管理、數(shù)據(jù)處理、樣本擴(kuò)充、數(shù)據(jù)標(biāo)注與采集。數(shù)據(jù)平臺(tái)內(nèi)置exLabeler標(biāo)注客戶端,提供強(qiáng)大專業(yè)的CV、OCR、結(jié)構(gòu)化和NLP任務(wù)標(biāo)注功能。同時(shí),數(shù)據(jù)平臺(tái)還支持單人和團(tuán)隊(duì)標(biāo)注模式。
用戶可以通過exLabeler客戶端完成樣本的標(biāo)注。exLabeler支持CV、OCR、結(jié)構(gòu)化和NLP等領(lǐng)域算法的標(biāo)注。標(biāo)注完成的數(shù)據(jù)集可以直接用于模型訓(xùn)練,或進(jìn)一步做后處理(如圖像處理、樣本擴(kuò)充等),然后再用于模型訓(xùn)練。
深度學(xué)習(xí)訓(xùn)練平臺(tái) CyberLearning
訓(xùn)練平臺(tái)通過自身對(duì)于訓(xùn)練資源池的集中管理與分配,以及與管理平臺(tái)的無縫對(duì)接,可以方便地實(shí)現(xiàn)訓(xùn)練基礎(chǔ)設(shè)施的管理,從而減輕用戶的管理維護(hù)工作。同時(shí),利用自動(dòng)超參搜索等技術(shù),訓(xùn)練平臺(tái)可以自動(dòng)搜索到最佳性能的模型。
通過分布式訓(xùn)練與多框架支持,訓(xùn)練平臺(tái)可以最大化利用計(jì)算資源,加速模型訓(xùn)練。同時(shí),利用自動(dòng)超參搜索等技術(shù),訓(xùn)練平臺(tái)可以自動(dòng)搜索到最佳性能的模型。最后,對(duì)于訓(xùn)練所得的最優(yōu)模型,訓(xùn)練平臺(tái)支持一鍵部署到推理平臺(tái),實(shí)現(xiàn)模型的快速應(yīng)用。
深度學(xué)習(xí)推理平臺(tái) CyberServing
推理平臺(tái)主要完成各種識(shí)別功能的部署。業(yè)務(wù)系統(tǒng)通過調(diào)用推理平臺(tái)提供的RESTful API提交圖像并獲得識(shí)別結(jié)果。整體上講,推理平臺(tái)產(chǎn)品需求可分解為模型管理、API過程定義、識(shí)別數(shù)據(jù)查看,接口統(tǒng)計(jì)和其它非功能項(xiàng)等部分。其中模型管理和API管理模塊屬于基礎(chǔ)核心模塊。
推理平臺(tái)對(duì)同一模型不同版本的管理,并支持在模型服務(wù)中同時(shí)加載和運(yùn)行多個(gè)版本的模型。推理平臺(tái)還支持一個(gè)API綁定多個(gè)模型服務(wù)。模型升級(jí)時(shí),用戶可以選擇先在部分服務(wù)中激活新版本的模型,完成測(cè)試驗(yàn)證后再升級(jí)其他服務(wù)。