經(jīng)濟資訊網(wǎng)北京消息周秋連報道:9月12日至9月16日,2024年中國國際服務(wù)貿(mào)易交易會(服貿(mào)會)在國家會議中心和首鋼園區(qū)盛大舉辦,本屆服貿(mào)會的主題是“全球服務(wù),互惠共享”。在北京首鋼會展中心2號館,智譜展示了多款最新產(chǎn)品,包括旗下清言App近期重磅推出的“視頻通話”功能、清影AI生成視頻功能,以及大模型開放平臺bigmodel.cn等,諸多AI黑科技亮相引發(fā)廣泛關(guān)注。
清言作為首批上線的C端大模型產(chǎn)品,過去一年中以文字和語音形式與用戶互動。如今,清言迎來重大升級,解鎖了“眼睛”,這是全球首個面向大眾用戶開放的視頻通話功能,讓用戶體驗到目前最前沿的AI/大模型技術(shù),正式進入視頻通話時代。
清言視頻通話功能跨越文本、音頻和視頻三大模態(tài),具備實時推理能力。用戶可以打開攝像頭,通過視頻通話窗口與清言交流,清言不僅能“看”到用戶畫面,還能聽懂指令并準確執(zhí)行。即使用戶頻繁打斷,清言也能迅速反應(yīng),帶來如同真人視頻通話的流暢體驗。另外可以用右下角小畫筆在畫面上劃重點,清言可以知道你著重讓它看的地方是哪。
使用方法也十分簡單,只需下載智譜清言APP, 點擊右下角的通話按鈕,進去之后再切換到視頻,就能開啟一個全新的世界與小智愉快暢談。
清言視頻通話功能可以成為你生活、學(xué)習(xí)和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、機器的使用方法、識別場景講述背景故事。
當大語言模型解鎖了“看見”和“說話”的能力,AI在學(xué)習(xí)和生活中的應(yīng)用更廣泛了。
首先,清言變身成了一位隨身的英語翻譯,以及能夠隨時隨地開展情景教學(xué)的英語老師。清言不僅能夠即時翻譯中英文,還能根據(jù)用戶所處的環(huán)境信息進行英語對話,并且協(xié)助糾正用戶的語音和語法錯誤。
其次,清言還可以是孩子們的“大眼百科”。孩子們可以用視頻拍攝環(huán)境,并且讓清言解釋環(huán)境中陌生的物體叫什么、能做什么、英語怎么說等等。此外,清言還可以為孩子們閱讀繪本故事、玩你畫我猜等游戲,成為孩子們益智啟蒙的最佳玩伴。
當然,有了視頻通話功能后,清言還可以成為旅游時隨時講解景點故事的導(dǎo)游,也能為視障人士提供識別環(huán)境的幫助。還有更多場景和功能,等待大家一同發(fā)現(xiàn)。
在工作當中,小智可以提供面試指導(dǎo)、會議中完成紀要和總結(jié)、分析復(fù)雜的數(shù)據(jù)圖表、實時解讀電腦屏幕的代碼。
小智還能成為你的學(xué)習(xí)搭子,為你提供學(xué)科作業(yè)輔導(dǎo)。無聊時小智還能是你的知心朋友,與你聊天玩游戲。
見證了視頻通話功能的強大之外,智譜近期推出的視頻生成模型CogVideoX以及在智譜清言App上線的“清影”功能也吸引了不少觀眾駐足打卡。據(jù)了解,清影面向所有用戶開放,只需輸入文本或上傳圖片,30秒內(nèi)即可生成6秒視頻。今年7月,清影上線清言App,六天時間用戶生成超過100萬支視頻。
實際上最近一段時間以來智譜動作頻頻,稱得上是技術(shù)動作最密集的大模型公司:一周前,智譜剛剛在KDD上發(fā)布了升級版基座大模型GLM-4-Plus,以及CogView-3-Plus和 CogVLM在內(nèi)的多模態(tài)模型,展示智譜對圖像、視頻等更多模態(tài)方面的研究進展,這正是業(yè)界公認的大模型的下一步。同時,類GPT-4o的視頻通話功能在C端產(chǎn)品智譜清言上率先上線。7月,智譜生視頻功能清影Ying上線智譜清言,并很快將其背后的生視頻模型 CogVideoX 開源。通過大模型鏈接物理世界億級用戶,智譜致力于為千行百業(yè)帶來持續(xù)創(chuàng)新與變革,加速邁向通用人工智能時代。