课代表趴下让我连桶了30分钟_一本色道久久综合亚洲精品不卡_国产男小鲜肉同志免费_亚洲国产精品福利片在线观看

400-0088-091
立即注冊

大熊貓的“電子奶爸”,和背后的一萬條代碼

所屬分類:行業(yè)新聞 發(fā)布時間:2024.11.02 發(fā)布者:Phoebe 點擊量:255

大熊貓有了“電子奶爸”——在騰訊云生成式AI產業(yè)應用峰會上,“全球首個大熊貓行為智能識別模型”正式亮相,識別準確率超過80%。而在這位“奶爸”背后,是11個留著鍋蓋頭、面容稚嫩的00后。

這是一次歷時一年多的“養(yǎng)娃”計劃。從去年7月開始,中國大熊貓保護研究中心、廣東工業(yè)大學信息工程學院電子信息工程班與騰訊云聯合組成項目小組,探索用騰訊云AI大模型技術自動識別大熊貓采食、喝水、睡覺等行為,并生成報告,全天候掌握熊貓的生活數據。

大熊貓行為智能識別系統(tǒng)

這群來自廣東工業(yè)大學的學生大多數還不滿20歲,卻已經過早地體會到了“帶娃”的不易。為了用有效數據訓練AI算法,項目組的第一個任務就是要從5000多個小時的視頻中,篩選出120個小時的有效數據。然后在這120小時的視頻里,每隔1秒抽取1幀圖片標注大熊貓的行為,平均耗費1個小時才能完成1分鐘視頻的行為標注。最忙的時候,項目組組織了8位組員,標注了72000張圖片,每天都要熬到凌晨四點。

但是,完全通過人工手動標注可以說是“吃力不討好”,不僅成本高、效率低,也無法保證數據標注的準確度。如果打標簽的范圍稍微大一點或者小一點,都會對標注的準確性和精度產生影響。在騰訊云TI平臺半自動標注的幫助下,學生們快速清洗篩選出具有鮮明行為特征的幀級圖像數據,效率提升了近40倍,精確度也大大提升。

騰訊云TI平臺提供半自動標注,提升標注效率

除了熬夜標注圖片,項目組還要早起“搶算力”。因為視頻數據太大,項目組把所有的原始視頻都存在了騰訊云上,而一些高速算力的資源很稀缺,需要云端組的成員林宇軒“拼手速”。除了騰訊云服務器上的算力資源,林宇軒還會借助騰訊云TI平臺的notebook功能,“它這個算力資源選會更加方便一點,可以隨時調用”。

而“帶娃”遇到的“bug”遠遠不止這些。到了需要用標注過的圖片進行算法訓練時,項目組發(fā)現,在120小時的有效視頻數據里,大熊貓喝水、睡覺的數據非常少,且這兩者難以區(qū)分。

“熊貓喝水基本上是靜止不動的,不像吃東西時嘴部會有明顯的咀嚼動作,”算法組成員陳潤宇說,“而且一個24小時的視頻,熊貓喝水的時長可能只有幾分鐘,但這對于算法訓練來說是遠遠不夠的。”一開始,項目組在熊貓喝水這個動作上的識別率只達到了20%左右。

為了增加特殊行為的數據量,算法組通過將視頻進行翻轉的方式,進行了數據增強,最終熊貓的吃、喝、睡三大行為數據量的標注、訓練、測試數據集均超過了120分鐘。此外,為了區(qū)分喝水和睡覺,算法組也對模型結構進行了優(yōu)化?!拔覀儠尤胍恍﹫鼍袄斫?,比如熊貓趴在水池邊時,模型會認為它大概率是在喝水,而不是睡覺?!标悵櫽钫f。

廣工騰創(chuàng)班學生討論算法優(yōu)化空間

今年,項目組針對算法進行了第二階段的優(yōu)化,讓“帶娃”變得更輕松。包括在室內光線較暗且有遮擋物的情況下,提升對大熊貓進食、睡覺和喝水行為的識別準確度。截至今年10月,覆蓋白天、黑夜等不同時間段的90分鐘測試數據顯示,識別準確率達到了80%。針對進食行為,項目組后期將對竹筍進行分類,并將人工飼養(yǎng)物細分為窩窩頭、胡蘿卜和蘋果三類。

在對算法一遍遍地進行優(yōu)化之后,項目組一共寫下了一萬多條代碼。后端組成員馮健君說,剛開始,后端管理代碼的效率非常低下。使用了騰訊一站式研發(fā)管理平臺CODING DevOps之后,項目組能夠方便地查看代碼修改前后的差異、解決代碼沖突、實現共享管理?!跋啾扔趥鹘y(tǒng)的那種共享文件,或者發(fā)送郵件修改代碼的方式,我們這個操作可以讓整個項目的完成周期縮短大概30%?!瘪T健君說。

大模型訓練過程示意

慢慢地,這11位年輕的“奶爸”從只想“帶娃”,開始學會從降成本、提效率的產業(yè)角度,把人工智能真正植入日常生活中。

項目組所在的班級也叫“騰創(chuàng)班”,“什么叫騰創(chuàng)班?我期待著他們的騰飛,也期待他們有創(chuàng)新性思維,”班主任蔡念教授說,“這個項目對學生們來說,最重要的收獲就是完成了從學生思維到工程師思維的轉變。”

在人工智能相關人才培養(yǎng)方面,騰訊云也為廣東工業(yè)大學提供了 cloud studio 等創(chuàng)新平臺工具, 便于師生開展更貼近實用場景的實踐訓練。

而這群“熊貓奶爸”希望呵護的不僅僅是熊貓,還有熊貓背后的人。

大熊貓飼養(yǎng)員們的工作甚至比“996”還辛苦——每天早上五點多就要起來給熊貓準備早餐,夜間也要經常巡視。為了時刻掌握熊貓的生理和健康狀況,他們每隔5分鐘左右就要觀察一次大熊貓采集進食、休息、喝水等重要行為,并進行文字記錄,形成書面的日報、周報、月報等。

而傳統(tǒng)的人工書面記錄方式存在效率低、分析使用難、易丟失、追溯難等限制,通過人工智能技術把大熊貓行為記錄下來,將大熊貓的行為數字化,生成可視化圖表,為大熊貓飼養(yǎng)員、管理員提供直觀、可靠的參考,也成了這11位00后的重要任務。

基于大熊貓采食行為識別模型,項目組學生開發(fā)了相配套的大熊貓智慧信息管理系統(tǒng)。工作人員只需輸入熊貓編號并選擇日期,就可以生成柱狀圖、折線圖、餅狀圖等圖標,直觀展示大熊貓的各行為在24小時內的占比情況,并形成電子版的日報、周報、月報。

大熊貓行為智能識別報告示意

而在一開始,前端組的成員沒有一個人學過網頁設計的代碼編寫。“我們搞出來雖然功能能實現,但是上面的布局比較難看,沒有規(guī)劃的那種,瀏覽器一拉升就會導致一些組件錯位之類的事情。”前端組成員周煊凱說。

為了讓頁面更簡潔、美觀,周煊凱和成員們參考了其他網站的布局模式,自學了頁面組件的代碼編寫,還在頁面標題的前面加上了一只黑白相間的熊貓頭像。每一只被標記過的熊貓都有屬于自己的個體信息、個體報告,甚至原始數據,方便管理員查看。針對不同的用戶,項目組設計了網頁端和小程序端,技術人員可以通過網頁端進行參數調整,而飼養(yǎng)員通過手機小程序就可以隨時查看熊貓的數據。

以大熊貓彩云為例,模型識別后生成的報告顯示,彩云一天中大概有4到5個小時都在進食,喝了2次水,睡覺時間超過了12個小時。中國大熊貓保護研究中心專家介紹,大熊貓每日進食時間較長,擁有豐富的行為數據,且進食、喝水、睡覺等行為是判斷大熊貓健康狀況的重要依據,也是日常飼養(yǎng)過程中非常關注的。比如,長時間不進食或進食時間不足均可能會導致營養(yǎng)不良,有的行為和飲食異常也是生病的征兆。有了AI這個“電子奶爸”,大熊貓就能得到24小時不間斷的“照顧”。

中國大熊貓保護研究中心的大熊貓

在中國,人工圈養(yǎng)大熊貓的歷史已經有70多年了。圈養(yǎng)大熊貓的種群數量從最初的10余只擴大到了670余只,而用來記錄繁育數據的紙張摞起來已經比珠穆朗瑪峰還高。

而這群00后大學生,正在用AI把這座“珠穆朗瑪峰”一點點削平。

 

*轉載自艾米手工作品,如有侵權請及時聯系

微信掃碼咨詢客服

銳拓榮耀客服