微軟 AI 技術新進展,可以基于圖片內容回答自然語言問題
時間:2015-11-27 09:27:53 來源:36氪 作者:
智播報
最近,據 ZDNet,微軟在卡耐基梅隆大學的一個研究小組開發出一個新的 AI 系統,這個系統可以訓練機器識別圖像的內容,并回答自然語言提出的問題。例如,現在有一張狗坐在自行車籃子里的照片,這項技術用來回答,“什么坐在自行車的籃子里” 這樣的問題。
微軟的研究人員表示,回答這樣一個問題并不簡單,需要多步驟推理,具體解決方案是 “堆棧注意力網絡(Stack Attention Networks)”,圖片經過多層深度神經網絡進行 “注意力” 分析,計算出哪些區域與問題有關。單層 “注意力” 分析技術曾用于圖像自動字幕和機器翻譯。具體技術原理參加他們的論文。
這項技術未來可以用于實時識別并預測人的需求,例如,自行車頭盔上的攝像頭預警系統,這個系統會不停地問自己問題,諸如 “我的左邊是什么?”,“旁邊是不是有車要超我?”,“有沒有跑向我但我沒注意到的人?”,這些問題的答案可以用來提示騎車人,預防危險的發生。
前些天,Google 的自然語言處理剛剛取得突破,可以通過文字或語音識別出 “最高級”、“基于時間的” 查詢和一些復雜組合問題。
智能界(www.xingtupian.com)中國智能科技聚合推薦平臺,秉承“引領未來智能生活”的理念,專注報道智能家居、可穿戴設備、智能醫療、機器人、3D打印、智能汽車等諸多科技前沿領域。關注智能創新對人的生活方式、價值的改變,致力傳播放大這部分聲量。聚合品牌宣傳、代理招商、產品評測、原創視頻、fm電臺與試用眾測,深入智能硬件行業,全平臺多維度為用戶及廠商提供服務,致力成為中國最具影響力的智能硬件聚合推薦平臺。
最新評論