close

教授機器視物和理解——Facebook人工智能研究進展

摘要:Facebook已建立瞭一套應用和服務體系,為用戶之間相互交流和分享提供瞭廣泛的方式。Facebook AI研究院在圖像識別和自然語言理解等領域研究已久,本文主要宣佈其目標檢測、自然語言理解等方面裡程碑式的研究成果。

許多人認為Facebook隻是一個藍色圖標的大型應用,或者認為隻是個網站,但是近年來,我們已經建立瞭一套應用和服務體系,為用戶之間相互交流和分享提供瞭廣泛的方式。從文本到照片,再到視頻以及將來的虛擬現實(VR),這個世界產生的信息量無時不刻都在增加。事實上,我們為您提供新聞材料所需要的數據量以每年50%的增量增長——因此我可以說,我們的標準工作時間跟不上這增長速度來處理這些數據。我能夠想到跟上這種速度的最好方法是,構建一套智能系統來幫助我們清理泛濫的數據。

為瞭解決這個問題,FacebookAI研究院(FAIR)正在指導展開雄心勃勃的研究,諸如圖像識別和自然語言理解等領域。他們在這些領域發表瞭一系列開創性的論文,而今天,我們將要宣佈另外一些裡程碑式的研究成果。

目標檢測和記憶網絡第一個裡程碑是計算機視覺的子領域,也就是目標檢測。

目標檢測是件困難的事情,以下圖為例:

在圖中你看到瞭多少匹斑馬?很難看清,對嗎?想想這對計算機有多麼艱難,它壓根就看不到條紋——它隻能看到像素點。我們的研究人員一直在努力訓練系統來識別像素中的模式,讓計算機在一張又一張的照片中,區分物體的能力能夠與人類不相上下甚至超過人類——業內叫做“分割”——然後識別每一個物體。我們最新的系統在分割圖像的時候比其他大多數系統快30%,而使用的訓練數據則是十分之一,這套系統將在下個月的NIPS上展示。

下一個裡程碑式的研究是自然語言理解,使用瞭新技術記憶網絡(即MemNets)帶來瞭新的進展。MemNets在卷積神經網絡中加入瞭一種短期記憶來推動深度學習系統,讓這些系統可以像人類那樣理解語言。今年的早些時候,我展示瞭MemNets工作的案例,閱讀和回答關於《指環王》簡短概要的問題。現在,我們已經將系統基於十多行文字閱讀和回答問題擴展到能夠在數據集上回答超過10萬個問題,比之前要大幾個數量級。

在計算機視覺和自然語言理解方面取得的成就本身就令人興奮瞭,台中二手餐飲設備買賣但真正令人興奮的是將二者結合起來。看看下面這個例子:

視頻:https://www.facebook.com/Engineering/videos/10153621574817200/

這個案例中的系統叫做VQA或者visualQ A,你可以看到將MemNets和圖像識別結合起來會發生什麼:我們可以讓人們提出照片中有什麼的問題。試想一下,這種技術對世界上數以百萬計有視覺障礙的人來說意味著什麼。當在朋友之間分享照片時,他們並不會被冷落,而相反,他們能夠參與其中進行互動。雖然這項技術還處於早期研發階段,但是它的前景是明朗的。

預測和規劃我們在AI方面還有更大更長遠的挑戰。其中包括一些無監督和預測學習,系統可以通過觀察(而不是通過直接指令,即監督學習)來學習,然後基於這些觀察進行預測。這些都是你和我天生就會的——比如,沒有人要到大學裡才會學到如果將筆推下桌子它會掉落在地面上——並且人類大部分學習都是這樣進行的。但是計算機仍然無法做到這一點——我們在計算機視覺和自然語言理解所取得的進展仍然由監督學習推動。

FAIR團隊最近開始研究這些模型,你可以在下面的案例中看到我們一些早期成果。該團隊已經開發瞭一套系統,它可以“看”一系列視覺測試用例——在此情況下,不可靠堆放的方塊可能會也可能不會掉落——然後預測輸出。在短短幾個月的工作之後,這個系統的預測準確率達到瞭90%,比大部分人類的預測要準確。

視頻:https://www.facebook.com/Engineering/videos

長遠研究的另外一個領域是教系統進行規劃。我們構建瞭一個系統來幫助實現這個目標,一個為棋盤遊戲Go設計的AI玩傢。使用遊戲來訓練機器在AI研究領域是很常見的做法。在過去的幾十年中,AI系統在跳棋,國際象棋,甚至Jeopardy等方面超過瞭人類。但是,盡管在Go遊戲AI玩傢方面的研究已近50載,人類最好的棋手還是要比最好的AI玩傢要更出色。這是部分因為Go中不同著子方法。比如,國際象棋中,在前兩步著子之後,接下來會有400中可能的應對方法。在Go中,將會有近130000種。

視頻:https://www.facebook.com/Engineering/videos/10153621562717200/

我們在台中二手餐飲設備收購Go玩傢上工作瞭短短幾個月,但是它已經能和一個已經發佈的AI系統齊頭並進瞭,並且它已經能和人類高手玩傢相媲美。我們將傳統的基於搜索的方法——隨著遊戲的進行對每個可能的著子方式建模——與我們計算機視覺團隊開發的模式匹配系統相結合,以此來實現這個功能。最棒的人類Go玩傢善於隨著比賽的發展識別棋盤上的模式,使用這種技術,我們的AI玩傢可以模擬人類的這種行為——可以得到非常準確的初步結果。

那麼當你把這些全部聚集在一起會發生什麼呢?Facebook最近正在運行一個小型的人工智能助手M的測試。不像其他的機器驅動服務,M考慮的更長遠:它可以替你完成任務。它可以購物;安排禮品送到您心愛的人手中;預定餐廳,旅行安排,約會等等。這是一個巨大的技術挑戰——這很難起步,M是一套人類訓練的系統:人類操作員來評估AI給出的建議,然後他們對此進行回應,而AI則觀察學習這些人類給出的回應。

我們最終希望將這套服務擴展到全球數十億用戶,但為瞭要做到這點,AI在沒有人類幫助的情況下,需要能夠自身處理大部分請求。要做到這一點,我們需要在M上建立上圖中所有不同的功能——語言,視覺,預測和規劃,這樣它就能理解每個請求背後的上下文信息,然後未雨綢繆。這確實是一個巨大的挑戰,而且我們才剛剛開始。但是早期研究結果是有希望的。比如,最近我們在M上部署瞭新開發的MemNets系統,促使M加快瞭學習:當有人要求M幫忙預定鮮花,M現在知道首先要問的兩個問題是“你的預算是多少?”和“鮮花要送到哪?”

最後一點:有些人可能會這麼認為,“那又怎樣?人照樣能夠做這些事情”。當然,你說的沒錯——但我們大多數人沒有專門的私人助理。而這就是類似於M服務提供的“強大能力”:我們可以為這世界上數十億人提供他們自己的數字助理,這樣他們就能夠花費更少的時間在每天瑣事上,而有更多時間處理真正重要的事務。我們的AI研究——探索連通性的全新方式以及使用OculusVR身臨其境地感受分享的經驗——需要長期的努力。明白這一切技術原理,這將需要多年的艱苦工作,但如果我們能夠正確理解這些新技術,我們離連通世界又近瞭一步。

想要瞭解更多關於我們人工智能研究以及已經產生的影響,那就看看這個視頻。

視頻:https://www.facebook.com/Engineering/videos/10153621590557200/

英文原文:Teachingmachinestoseeandunderstand:AdvancesinAIresearch(譯者/劉翔宇審校/趙屹華、朱正貴 責編/仲浩)

關於譯者:劉翔宇,中通軟開發工程師,關註機器學習、神經網絡、模式識別。

第九屆中國大數據技術大會將於2015年12月10-台中二手冰櫃收購12日在北京隆重舉辦。在主會之外,會議還設立瞭16大分論壇,包含數據庫、深度學習、推薦系統、安全等6大技術論壇,金融、制造業、交通旅遊、互聯網、醫療健康、教育等7大應用論壇和3大熱點議題論壇,票價折扣中預購從速。

本文為CSDN編譯整理,未經允許不得轉載,如需轉載請聯系market#csdn.net(#換成@)

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 sed398n5t6 的頭像
    sed398n5t6

    綠色大桌面

    sed398n5t6 發表在 痞客邦 留言(0) 人氣()