釘釘 AI 功能多模態升級 能根據圖片識人、翻譯、
【環球網報道 記者 李文瑤】3月28日,釘釘 AI 助理宣布升級,上線圖片理解、文檔速讀、工作流等產品能力,探索多模態、長文本與 RPA 技術在 AI 應用的落地。基於阿裏通義千問大模型,升級後的釘釘 AI 助理擁有更強的視覺推理能力和長文本速讀能力。目前,用戶在釘釘 IM 消息框或點擊魔法棒按鈕進入 AI 助理對話框,發送長文件、在線文檔、網頁鏈接、視頻內容,即可根據內容識人、識地點、分析、答題、翻譯、摘要、提取文字,甚至可以通過多輪交互進一步做智能問答。

具體來看,基於通義千問 Qwen-VL-Max 視覺理解模型,釘釘 AI 助理能夠準確描述和識別圖片信息,並根據圖片進行信息推理、擴展創作、文字提取、翻譯等,相當於一個全能的“圖片小百科”。
同時,通義千問 Qwen-VL-Max 擁有更強的視覺推理和中文理解能力。此外,AI 助理也支持視頻內容的速讀。發送給 AI 助理的短視頻、直播切片或培訓視頻可以被快速“觀看”, AI 助理會根據視頻內容生成字幕,提取關鍵詞,並生成一份智能摘要,對於最高 2GB 的視頻內容,僅需 3 分鍾即可完成智能解讀。
基於通義千問大模型,釘釘 AI 助理可以快速閱讀本地文件如 Word、PDF、PPT、Excel 等、釘釘文檔、網頁鏈接等多種格式文件,輕鬆解析各類學術論文、產品手冊、使用教程、數據表格、新聞報道、多國語言的圖書等。
目前,隨著 OpenAI 帶火 Agent(智能體),大模型融入自動化技術成為當前最具共識的方向之一。今年1月,釘釘 AI 助理正式上線,企業和個人 AI 助理已進入到工作和生產力場景中。為讓 AI 助理可以完成一係列更複雜的任務,釘釘 AI 助理上線了工作流能力。
工作流是 AI Agent 的一種進階玩法,不僅可以在創建時對 AI 執行任務的流程進行拆解和編排,使得 AI 助理可以主動接管完成相應操作,還能夠打通外部的係統數據和 API 能力,進一步擴展了它的行動能力,比如搭建能自動寫腳本並生成視頻的創作 AI 助理。
為(wei)降(jiang)低(di)用(yong)戶(hu)的(de)使(shi)用(yong)門(men)檻(kan),釘(ding)釘(ding)官(guan)方(fang)還(hai)提(ti)供(gong)了(le)多(duo)種(zhong)工(gong)作(zuo)流(liu)模(mo)板(ban)。已(yi)有(you)企(qi)業(ye)使(shi)用(yong)工(gong)作(zuo)流(liu)創(chuang)建(jian)了(le)門(men)店(dian)信(xin)息(xi)收(shou)集(ji)助(zhu)理(li),將(jiang)用(yong)戶(hu)反(fan)饋(kui)自(zi)動(dong)化(hua)整(zheng)理(li),並(bing)存(cun)儲(chu)到(dao)一(yi)張(zhang)釘(ding)釘(ding)多(duo)維(wei)表(biao)中(zhong),幫(bang)助(zhu)員(yuan)工(gong)節(jie)約(yue)瑣(suo)碎(sui)的(de)時(shi)間(jian);個人用戶也通過連接微博 API,創建了自動追蹤熱點並撰寫文章的助理,一個指令就能批量執行,大幅提升內容生產的效率。
目前,用戶可在釘釘 APP 或 PC 客戶端直接使用 AI 助理的各項功能,包括多模態、長文本和工作流。
- 21-12-31銀泰百貨的2021:300家城市首店落地,雲店帶品牌
- 22-01-01給外賣餐盒上“保險”
- 21-12-31百度百科不斷拓寬知識的價值邊界
- 21-12-31龔宇談電影市場:觀眾愈加成熟,對多樣化影視作品需求更
- 21-12-30百度百科上線2500萬詞條,超750萬用戶參與共創科
- 21-12-30百度網盤青春版正式上線:提供無差別下載、上傳服務
- 21-12-30標準體係支撐工業互聯網高質量發展
- 21-12-30大人公司CEO:發揮整合優勢 在私域賽道上加速快跑
- 21-12-30長短視頻平台直麵需求才能留住用戶
- 21-11-01傳三星Galaxy S21 FE將在CES 2022期間發布


