在AI科學家的幫助下,神經網絡將實現自我訓練

原創內容,轉載請注明:  [http://www.od-music.com]  謝謝!

在中國一家初創公司SenseTime的協助下,中國中山大學的研究人員在自己研究的基礎上進行了改進,他們試圖通過增加一些自我監督訓練,改進了計算機識別圖像中的人體姿勢的方法。這項研究將繼續努力減少人工智能對人類和“基本事實”的依賴。

人工智能開始更多地嘗試讓機器在人類干預最少的情況下自學。所謂的自我監督是一種可以添加到許多機器學習任務中的元素,這樣計算機就可以在更少的人工干預下學習,也許有一天甚至完全不需要人工干預。

中國中山大學和香港理工大學的科學家們在一項新的研究中利用自我監督功能,幫助計算機學習視頻片段中人體的姿勢。

AI豐富的機器學習研究脈絡可以幫助它理解一個人在圖片中做什么,這對包括視頻監控在內的許多事情都有很大用處。但這種方法依賴于“帶注釋的”數據集,各種標簽被應用于身體關節的各個方向。

觀看YouTube視頻可能會讓機器人有一天可以模仿人類

不過這是一個問題,因為越來越大的“深層”神經網絡迫切需要大量數據,但并不是一直都有足夠的標記數據來滿足它。

因此,中山大學的研究人員開始著手證明,神經網絡可以通過不斷地比較多個網絡之間的猜測來完善其對信息的理解,最終減少對標記數據集所提供的“基本事實”的需求。

正如作者所言,之前推斷人體姿態的努力已經取得了成功,但代價是“耗時的網絡架構(例如ResNet-50)和有限的可伸縮性,因為三維姿態數據不足”。

機器學習效果模擬圖

在一系列基準測試中,作者證明了這種方法在成功預測一個圖形的姿態方面優于其他AI方法。他們甚至在2017年通過增加這種新的自我監督方式超越了自己曾經的業績。

麻省理工學院開始更加關注用一個AI訓練另一個AI

一篇名為《具有自監督學習功能的三維人體姿態機》的論文在arXiv上發表,作者:王克澤、梁林、蔣辰涵、錢晨、魏鵬旭。其中錢晨是SenseTime的員工。SenseTime是一家中國的人工智能初創企業,銷售人臉識別等各種應用軟件,并發布了一種名為“鸚鵡”的機器學習編程框架。

在他們2017年發布的論文原告中,作者使用了一個帶注釋的數據集,即2014年由德國Max Planck信息研究院的米卡洛·安德里盧卡(Mykhaylo Andriluka)及其同事編制的“MPII人體姿勢”數據集。他們使用標記的數據集從靜態圖像中提取人體部位的二維圖像,基本上是四肢在空間中的簡筆畫。然后,他們將這些二維圖像轉換成三維狀態,從而更好的表達肢體在三維空間中的方位。

在這篇新論文中,作者通過MPII數據集進行同樣的“預處理”,從圖像中提取二維信息。就像在2017年,他們使用另一個數據集“人類360萬”來提取3D的地面數據?!度祟?60萬》共拍攝了360萬張在實驗室拍攝的演員執行各種任務的照片,例如跑步、散步、吸煙和吃飯。

谷歌認為所有的軟件都可以嵌入AI

這次的新發現是,在神經網絡的最后一部分,他們拋棄了2D和3D注釋。相反,他們將2D圖像轉換成的3D模型與第一步生成的2D圖像進行比較。初始化后,用2D和3D預測的信息代替2D和3D的ground-truth,以自我監督的方式優化模型。

他們將3D模型投影到平面中,得到投影的2D圖像,然后使這個新的2D圖像和最初的2D圖像之間的差異最小化。

從某種意義上說,神經網絡一直在問它生成的人體三維模型是否在三維空間中準確地還原了二維圖形所表達的信息。

現在有很多標準的機器學習方法:卷積神經網絡(CNN)允許系統提取二維簡筆畫。這種方法借鑒了卡內基梅隆大學(Carnegie-Mellon)研究人員2014年和2016年的一項后續研究。

然后,使用長短時記憶(long short-term memory,簡稱LSTM),即專門保留事件序列記憶的神經網絡,從多個連續的視頻中提取人體的連續動作,創建三維模型。這項工作是根據2014年亞歷克斯·格雷夫斯(Alex Graves)和他在谷歌旗下DeepMind公司的同事所做的工作進行建模的,DeepMind最初是為語音識別而建立的。

它的特別之處在于,強加自我監督,使整個模型保持一致,而不需要貼上基礎數據的標簽。通過采取這最后一步,能夠減少對3D數據的需求,更多的依賴2D圖像。他們表示:“這種強加的校正機制使我們能夠利用大量二維人體圖像數據來提高對三維人體模型估計的準確度?!?/p>

原文鏈接:https://www.zdnet.com/article/chinas-ai-scientists-teach-a-neural-net-to-train-itself/

分類目錄 國內動態, 國外動態, 行業動態.
掃一掃二維碼或者微信搜索公眾號ssdfans關注(添加朋友->點最下面的公眾號->搜索ssdfans),可以經??吹絊SD技術和產業的文章(SSD Fans只推送干貨)。
ssdfans微信群介紹
技術討論群 覆蓋2000多位中國和世界華人圈SSD以及存儲技術精英
固件、軟件、測試群 固件、軟件和測試技術討論
異構計算群 討論人工智能和GPU、FPGA、CPU異構計算
ASIC-FPGA群 芯片和FPGA硬件技術討論群
閃存器件群 NAND、3D XPoint等固態存儲介質技術討論
企業級 企業級SSD、企業級存儲
銷售群 全國SSD供應商都在這里,砍砍價,會比某東便宜20%
工作求職群 存儲行業換工作,發招聘,要關注各大公司招聘信息,趕快來
高管群 各大SSD相關存儲公司高管和創始人、投資人

想加入這些群,請微信掃描下面二維碼,或搜索nanoarchplus,加阿呆為微信好友,介紹你的昵稱-單位-職務,注明群名,拉你進群。SSD業界需要什么幫助,也可以找阿呆聊。