人形機(jī)器人也要“進(jìn)校學(xué)習(xí)”?數(shù)據(jù)采集成必答題
記者 孫燕 鄧浩
7月9日,德馬科技與智元機(jī)器人合作建立全球首家具身智能人形機(jī)器人物流訓(xùn)練工廠,部署數(shù)十臺人形機(jī)器人開展真實(shí)物流場景(搬運(yùn)、拆箱、分揀等)的數(shù)據(jù)采集與訓(xùn)練。
此前在6月,合肥市具身智能機(jī)器人數(shù)據(jù)采集預(yù)訓(xùn)練場啟用,帕西尼具身智能超級數(shù)據(jù)工廠也投入運(yùn)營。
數(shù)據(jù)被認(rèn)為是具身智能的“卡脖子”問題。
東吳證券指出,不同于大語言模型可以使用互聯(lián)網(wǎng)海量信息作為訓(xùn)練數(shù)據(jù),機(jī)器人所用的具身智能模型沒有現(xiàn)成數(shù)據(jù)可以使用,需要投入大量時(shí)間和資源進(jìn)行機(jī)器人操作實(shí)踐或仿真模擬,以收集視覺、觸覺、力覺、運(yùn)動(dòng)軌跡以及機(jī)器人本體狀態(tài)等多源異構(gòu)數(shù)據(jù)。
為助力數(shù)據(jù)采集,訓(xùn)練場應(yīng)運(yùn)而生。
企業(yè)、政府爭相落地
去年下半年以來,具身智能數(shù)據(jù)采集廠密集落地。
企業(yè)率先搭建數(shù)據(jù)采集中心,如智元機(jī)器人數(shù)據(jù)采集中心于去年9月啟用,帕西尼主導(dǎo)建設(shè)的具身智能超級數(shù)據(jù)工廠于今年6月投入運(yùn)營。
之所以要采集數(shù)據(jù),是因?yàn)槿诵螜C(jī)器人在落地場景之前,需逐步學(xué)習(xí)并優(yōu)化技能。
通常而言,單個(gè)場景的訓(xùn)練就可能需要百萬量級的數(shù)據(jù),但是行業(yè)早期缺少高質(zhì)量且格式統(tǒng)一的數(shù)據(jù)庫,從而制約了機(jī)器人泛化能力的提升。
為了突破數(shù)據(jù)困境,行業(yè)內(nèi)出現(xiàn)了兩種思路。民生證券研究指出,其一,以英偉達(dá)、銀河通用為代表的企業(yè)試圖通過仿真數(shù)據(jù)的方式,生成數(shù)據(jù)用于機(jī)器人訓(xùn)練;其二,以智元機(jī)器人為代表的企業(yè)建立大規(guī)模數(shù)據(jù)采集廠以收集高質(zhì)量的真實(shí)場景數(shù)據(jù),再尋求合適的比例將真實(shí)數(shù)據(jù)與仿真數(shù)據(jù)混合,以實(shí)現(xiàn)較優(yōu)的訓(xùn)練效果。
一位產(chǎn)業(yè)人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,該企業(yè)先在數(shù)采中心搭建工廠實(shí)景,依靠人工遙操,讓機(jī)器人采集真機(jī)數(shù)據(jù),從而訓(xùn)練出單個(gè)工種的小模型(或算法),以達(dá)到客戶的交付要求!耙粋(gè)項(xiàng)目POC(概念驗(yàn)證)要兩個(gè)月左右時(shí)間,要達(dá)到較高準(zhǔn)確性可能要半年以上。但由于工廠作業(yè)環(huán)境以及其他安全考慮,人形機(jī)器人無法一直在現(xiàn)場采集數(shù)據(jù),所以我們根據(jù)制造現(xiàn)場搭建了實(shí)景給機(jī)器人訓(xùn)練!
除了廠商自采集,地方政府也在建設(shè)數(shù)據(jù)采集中心:國家地方共建人形機(jī)器人創(chuàng)新中心建設(shè)的全國首個(gè)異構(gòu)人形機(jī)器人訓(xùn)練場于今年1月啟用,合肥市具身智能機(jī)器人數(shù)據(jù)采集預(yù)訓(xùn)練場于今年6月啟用。
前述產(chǎn)業(yè)人士告訴記者,在G端,主要是工業(yè)、人工智能產(chǎn)業(yè)發(fā)達(dá)的地方政府采購人形機(jī)器人去建數(shù)采中心。由政府主導(dǎo)建設(shè)的數(shù)據(jù)采集中心一般是公共服務(wù)平臺,所采集的數(shù)據(jù)歸政府平臺所有,待積累了足夠多的數(shù)據(jù)后,可以提供給轄區(qū)內(nèi)的機(jī)器人企業(yè)訓(xùn)練。
青瞳視覺相關(guān)業(yè)務(wù)人士對記者表示,該公司從2023年左右開啟了人形機(jī)器人數(shù)據(jù)采集業(yè)務(wù)!爸饕莟o G和to B,目前在政府端、學(xué)校端、企業(yè)端都有落地。”
一套數(shù)據(jù)采集解決方案通常包括機(jī)器人、硬件、軟件、云數(shù)據(jù)處理服務(wù)、軟硬件售后維護(hù)、模型訓(xùn)練平臺等。據(jù)青瞳視覺相關(guān)業(yè)務(wù)人士透露,一套數(shù)采中心解決方案售價(jià)在40萬-50萬元。
效率有待提高
前述產(chǎn)業(yè)人士指出,目前人形機(jī)器人行業(yè)都在做數(shù)據(jù)采集!爸灰菍W⑾掠螒(yīng)用的企業(yè),哪怕不建大規(guī)模數(shù)采中心,也因?yàn)橐鯬OC、交付,會(huì)搭建小規(guī)模數(shù)采中心!
其預(yù)計(jì),這兩年行業(yè)內(nèi)人形機(jī)器人出貨量最多的可能在數(shù)據(jù)采集場景。“工業(yè)場景里幾十臺訂單,量已經(jīng)很大了。但建設(shè)一個(gè)數(shù)采中心,起碼要到百臺級別,否則經(jīng)濟(jì)效益不夠。 ”
但當(dāng)前,人形機(jī)器人數(shù)據(jù)采集仍然面臨挑戰(zhàn)。
一方面,硬件方案未收斂,數(shù)據(jù)孤島問題提高了數(shù)據(jù)采集成本。華源證券研究指出,目前廣義的人形機(jī)器人硬件結(jié)構(gòu)尚存在不確定性,例如本體存在輪式方案與雙足方案,手部結(jié)構(gòu)如夾爪、靈巧手、三爪等機(jī)械結(jié)構(gòu)尚未確定;傳感器方案中視觸覺、磁變傳感器的方案選擇與具體排布位置也未有定論。
前述產(chǎn)業(yè)人士也指出,人形機(jī)器人仍在快速迭代階段:每個(gè)星期都會(huì)有模組修改,一兩個(gè)月就會(huì)有零部件、局部改造,可能幾個(gè)月到半年就會(huì)更新一代。
另一方面,當(dāng)前人形機(jī)器人數(shù)據(jù)采集方法多數(shù)集中在關(guān)節(jié)層數(shù)據(jù),如各自由度的角度、速度、力矩等,硬件不統(tǒng)一導(dǎo)致不同機(jī)器人關(guān)節(jié)結(jié)構(gòu)差異較大,采集的數(shù)據(jù)具有極強(qiáng)的平臺依賴性,可復(fù)用性低,數(shù)據(jù)孤島問題極大提高了數(shù)據(jù)采集成本,使得產(chǎn)業(yè)端難以通過規(guī);档蛿(shù)據(jù)成本。
而本體高自由度的累計(jì)傳遞誤差帶來的本體精度問題以及機(jī)器人本體-人體自由度不匹配導(dǎo)致映射算法構(gòu)建困難,進(jìn)而導(dǎo)致真實(shí)數(shù)據(jù)采集精度不夠,有效數(shù)據(jù)比例較低。
前述產(chǎn)業(yè)人士指出,不同結(jié)構(gòu)的機(jī)器人所采集的數(shù)據(jù),若映射到新的本體上作業(yè),數(shù)據(jù)的準(zhǔn)確性、模型的有效性會(huì)大打折扣。
但在行業(yè)發(fā)展初期,采集數(shù)據(jù)依然是第一步。
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
[京B2-20230170] [京ICP備17012796號-1]
[互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120220005] [互聯(lián)網(wǎng)宗教信息服務(wù)許可證:京(2022)0000107]
違法和不良信息舉報(bào)電話:18513525309 報(bào)料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司