科學報
 
收藏本站

電腦請使用 Ctrl + D 加入最愛
手機請使用
關閉
科學通

科學報 科學文摘 AI

眾包競賽:讓人工智慧更加普惠


字體大小:
更新日期:2025204
文章欄目:
文章標籤:                   
 

當我們遇到一個科技研發難題,譬如人工智慧在某個場景的應用與落地,應該怎麼做?

如果按照傳統的做法,那麼首先應該找來一些精英的專家組成研發團隊,將他們聚在一起群策群力,然後歷經反覆的研發與測試,耗費大約一兩年甚至更長的時間,最後開發出一套解決方案。

在很長一段時間裡,在絕大部分場景下,幾乎所有的公司都採用的是這種開發模式。

然而亞馬遜雲科技及其合作伙伴Biendata卻告訴我們,其實還有一種創新的開發模式,可以讓人工智慧應用創新的速度更快、門檻更低、更加普惠。

眾包競賽:一種創新的開發模式

Biendata由清華大學計算機系孵化,旗下產品與服務包含人工智慧競賽、資料科學社群、前沿人工智慧報道、專注於AI行業的品牌傳播服務等。

以競賽與社群為入口,Biendata致力於打造國內一流資料科學綜合服務平臺。在競賽方面,Biendata打造的人工智慧競賽平臺已經累計舉辦了100多場專業演算法賽事,累計參賽選手超過10萬人,累計總獎金超過700萬元,累計運營比賽社群總人數超過2萬人;在社群方面。Biendata運營的人工智慧學者社群使用者已經超過10萬人,主要分佈於大型網際網路企業、研究機構、學校,其中學生使用者佔比超過70%。

「在過去的幾年裡,如何降低人工智慧技術應用的門檻,實現人工智慧的普惠,一直都是大家關注的熱點。而在業務的發展和創新過程中,我們發現有一種眾包競賽的方式,有可能是傳統開發方式之外一種有益的補充,其開發效率甚至有可能會超過招募全職的專家團隊。」作為Biendata平臺的建立者,北京數競科技有限公司創始人兼CEO管心宇向趣味科技介紹道,「於是我們就做了一些關於人工智慧、開發者社群的一種新的組織模式,也就是Biendata眾包競賽平臺。其中Bien是法語,也就是‘好’的意思。我們希望能夠在這個平臺上匯聚很多很好的資料集和很好的開發者,這其實是我們對當時各種科技類創新模式的一種觀察和探索。」

管心宇指出,所謂眾包競賽,就是由需求方(或者主辦方、甲方)提出一種獎勵的機制,這種獎勵可以是現金,也可以是資源等其他形式。相比傳統開發模式,眾包競賽參與的門檻很低,不論國籍、性別、年齡、職業、全職還是兼職,都可以參賽。在每個人都可以參加比賽的原則之上,還有一個統一的評測方法,能夠對所有參賽者的作品進行排序,再把比賽獎勵頒發給獲獎的第一名或是前幾名。

「在探索與實踐的過程中,我們發現眾包競賽裡面其實有很多案例或者理論研究、行為經濟學或者管理學研究,而且這種方式是非常有效果的,於是我們就想探索看它是不是能被應用在人工智慧領域的創新裡。」管心宇透露,「結果我們發現,這種方式其實特別適合人工智慧,因為前面介紹過,競賽中有一個評測環節,而評測有時候是比較主觀的,很容易成為這種眾包競賽的問題所在。但是人工智慧不一樣,它往往都有一個Benchmark的標準資料集。大家在這個資料集上去執行模型,就能得到一個非常客觀的評測結果。譬如預測明天的天氣怎樣、溫度多少,到了明天我們就能知道評測結果與事實的差異。這也充分保證了眾包競賽結果的公平性。」

眾包競賽:讓人工智慧更加普惠

選擇亞馬遜雲科技的原因

amocity
amocity

  


像Biendata這樣的平臺,自然也離不開強大穩定的雲服務支撐。早在還處於原型階段的時候,Biendata就針對多家雲服務商進行了調研和對比,最終選擇了採用亞馬遜雲科技的雲服務。

談到Biendata為什麼在強手如林的雲服務商中選擇了亞馬遜雲科技時,管心宇表示主要有以下四個方面的原因:

一、資料安全保障性高。亞馬遜雲科技看重資料保護,合規性和資料隱私;並且從底層資料中心搭建、網路訪問以及操作許可權設定,都提供了多方面的安全保障。

二、可伸縮的強大計算能力。豐富的例項型別配合易用的工具,加速在雲中不同規模的深度學習的速度,Biendata可以更關注上層應用設計與演算法整合,而不用再擔心資源瓶頸。

三、穩定可靠的技術。系統的整體穩定性顯著提高,廣泛支援開源軟體與商用軟體的對接,應用程式的可用性達到99.9%,也無需為基礎架構服務的穩定性而擔憂。

四、具有成本效益的服務。節省了資源成本和人力成本。其中在資源分配方面,結合Amazon EC2 Auto Scaling和Amazon EC2 Spot例項的應用,使得資源佔用成本大幅降低;而在人工成本方面,亞馬遜雲科技的自動管理功能降低了對系統運維的需求,節省了僱用專職運維人員的成本。

「在過去幾年的合作過程中,我們發現幾乎每一個產品都可以在亞馬遜雲科技的產品線裡找到一個比較對應的功能,可以很好地支援我們去做快速的研發、上線、迭代,這極大地提升了我們的開發效率。」管心宇表示,「除此以外,在安全性和合規性方面,亞馬遜雲科技也擁有非常顯著的優勢,能夠滿足全球幾乎所有監管機構的合規性要求。舉例來說,我們在新加坡國立大學專案競標的時候,客戶就非常重視安全與合規的能力,因為當地法律特別嚴,對各項資料都要求有相應的安全標準和極強的保護措施。原本要滿足這些標準是非常麻煩的,光是申請的時候就需要提交大量材料,但因為我們的服務本身是在亞馬遜雲科技新加坡區域的雲上,所以它自動的、預設的就已經符合裡面絕大部分的標準和要求,很多材料也都是現成的。原本這個申請過程至少要準備三到五個月,後續可能還需要做一些測試,甚至還要找第三方機構來進行認證。但是因為亞馬遜雲科技已經滿足了這些嚴格的隱私和資料保護要求,所以以上這些過程全部都省略了,幫助我們節省了大量的時間和成本。」

amocity
amocity

  


眾包競賽:讓人工智慧更加普惠

將普惠人工智慧推向全球

作為一個技術專案,Biendata於2015年啟動,2017年開始獨立運營,並選擇了亞馬遜雲科技開展合作。2019年,Biendata加入亞馬遜雲科技全球合作伙伴網路(APN)。從此Biendata不只是亞馬遜雲科技的客戶,同時也成為了其堅實的合作伙伴,為更多使用者提供雲上的人工智慧方案。

amocity
amocity

  


2020年肆虐全球的新冠疫情,讓許多創業公司都遭遇了極大的業務挑戰。然而Biendata卻藉助雲上開展線上業務的優勢,透過更多雲原生的服務降低了運維成本,並將更多關注放在業務本身,實現了業務的迅猛發展。譬如新冠剛開始流行的時候,Biendata就聯合北京智源人工智慧研究院、晶泰科技組織了「藥物研發小分子性質預測賽」,加速藥物研發的速度和藥物篩選的過程;針對新冠流行趨勢,Biendata聯手智譜和清華大學組織了「新冠流行預測」,根據患病和疑似病例的人數預測未來七天新增人數趨勢,幫助政府部門和政策制定者更好地預測新冠流行趨勢,提前做好預警和備案;Biendata還聯合清華大學、Aminer等機構聯合組織了「COVID-19知識圖譜構建」競賽,從大量的科學文獻中自動提取關鍵知識,幫助科研人員更加高效地針對病毒開展科研工作。

除此以外,Biendata還在2015-2020年承辦過四次全球最具影響力、素有「資料世界盃」稱號的KDD CUP比賽。特別是2018年的比賽,當時Biendata做了一個空氣汙染預測的比賽,要求選手去預測北京和倫敦這兩個城市未來PM2.5的濃度的變化趨勢,這個其實跟新冠預測也是一樣的,如果有很好的預測模型,就可以幫助社會和政策制定者提前做好準備。

2021年,Biendata的業務發展也上升到了一個新的階段。藉助亞馬遜雲科技安全合規的能力,Biendata贏得了更多的海外專案,並且與亞馬遜雲科技的其他客戶合作開展了人工智慧普惠的競賽,透過比賽為K12及高校領域培養更多的人工智慧人才。以備受關注的Amazon DeepRacer無人駕駛訓練系統為例,就是Biendata與幾所高校合作,將DeepRacer的無人駕駛訓練系統和真車打包變成一個實訓產品,讓學生可以在線上的訓練系統中訓練自己的強化學習模型,然後將模型載入到小車中,線上下的賽道上實現自動無人駕駛。

眾包競賽:讓人工智慧更加普惠

「未來我們希望和亞馬遜雲科技攜手合作,透過這種人工智慧眾包競賽的方法,連線人工智慧的開發者、資料集、應用場景、模型,然後將這些結合產生的優秀成果普及到各行各業,讓大企業、小公司甚至個人,都可以享受到人工智慧技術帶來的成果。我們希望將普惠人工智慧作為企業使命推向全球,促進海內外人工智慧領域人才的交流合作,構建國際化的資料科學協同創新平臺,讓先進的人工智慧科研成果和競賽經驗能夠跨越國界,進行無縫連結與融合。」管心宇說道。

延伸閱讀
AI臉