微軟 AI 技術新進展，可以基于圖片內容回答自然語言問題_智能界—智能科技聚合推薦平臺

微軟 AI 技術新進展，可以基于圖片內容回答自然語言問題

時間：2015-11-27 09:27:53 來源：36氪作者：智播報

最近，據 ZDNet，微軟在卡耐基梅隆大學的一個研究小組開發出一個新的 AI 系統，這個系統可以訓練機器識別圖像的內容，并回答自然語言提出的問題。例如，現在有一張狗坐在自行車籃子里的照片，這項技術用來回答，“什么坐在自行車的籃子里” 這樣的問題。

微軟的研究人員表示，回答這樣一個問題并不簡單，需要多步驟推理，具體解決方案是 “堆棧注意力網絡（Stack Attention Networks）”，圖片經過多層深度神經網絡進行 “注意力” 分析，計算出哪些區域與問題有關。單層 “注意力” 分析技術曾用于圖像自動字幕和機器翻譯。具體技術原理參加他們的論文。

這項技術未來可以用于實時識別并預測人的需求，例如，自行車頭盔上的攝像頭預警系統，這個系統會不停地問自己問題，諸如 “我的左邊是什么?”，“旁邊是不是有車要超我？”，“有沒有跑向我但我沒注意到的人？”，這些問題的答案可以用來提示騎車人，預防危險的發生。

前些天，Google 的自然語言處理剛剛取得突破，可以通過文字或語音識別出 “最高級”、“基于時間的” 查詢和一些復雜組合問題。

智能界（www.xingtupian.com）中國智能科技聚合推薦平臺，秉承“引領未來智能生活”的理念，專注報道智能家居、可穿戴設備、智能醫療、機器人、3D打印、智能汽車等諸多科技前沿領域。關注智能創新對人的生活方式、價值的改變，致力傳播放大這部分聲量。聚合品牌宣傳、代理招商、產品評測、原創視頻、fm電臺與試用眾測，深入智能硬件行業，全平臺多維度為用戶及廠商提供服務，致力成為中國最具影響力的智能硬件聚合推薦平臺。

微軟 AI 系統識別圖像

人收藏

人贊過

關鍵字：微軟 AI 系統識別圖像