相比于ChatGPT問世時的火爆,大模型“聊天”的魅力似乎正在悄然消退。
在本月最新文章中,網絡分析公司Similarweb表示,隨著新鮮感的消失,ChatGPT的流量正在下降。據初步估計,今年6月ChatGPT網站的全球訪問量下降了9.7%,這是該網站訪問量首次錄得環(huán)比下降。在美國市場上,該網站訪問量環(huán)比降幅錄得10.3%。
很明顯,“Chat”并不是大模型的全部,只靠寫詩、作畫也無法重構人類社會。
不過,自問世以來,大模型“聊天”一直在向垂直領域下沉,不斷重塑著人們的生活。
國際權威期刊《JAMA Internal Medicine》一項研究表明,當需要仔細回答患者提問時,醫(yī)生平均回復長度是52個單詞,聊天機器人是211個單詞。它的回復不僅內容更多,而且質量更好,更加富有同理心。在評估中,78.6%的人更喜歡聊天機器人的回答,而不是醫(yī)生的回答。
將大模型投入產業(yè)應用,也正在成為國內外眾多企業(yè)的選擇。不久前在上海閉幕的第六屆世界人工智能大會(WAIC)上,京東等不少企業(yè)介紹了自己的解決方案和相關思考。圍繞“貼合行業(yè)場景”,有人選擇讓通用大模型下沉向行業(yè),也有人選擇直接打造垂直大模型。
頭腦風暴一下:除了更好地理解“場景”,人工智能今后還會往哪些方面發(fā)展?
京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬表示,通向真正的人工智能,多模態(tài)是必經之路。“人始終是一個核心存在,所有技術最后都要服務人。未來的AI需要通過語言、視覺和語音和人類進行交流,所以未來的AI也必須理解語言、語音。做好多模態(tài),才能更好的服務好人類。”
在當下的競爭環(huán)境中,“場景落地”,才是大模型的終極目標。
大模型應用落地,理解場景是關鍵?
今年WAIC最熱門的話題之一,就是如何讓大模型應用落地。
這本身不難理解:國內外大模型不能局限于“聊天”?;谥悄芙换ィ旧砭褪且环N提升生產效率的工具。任何大模型,未來最終都要落地于具體的行業(yè)應用,提高生產力;在大模型競爭中,中國和其他國家相比各有千秋,雖然存在差距,但中國行業(yè)多、發(fā)展成熟,這或許是一個可以“超車”的機會。
從數據來看,在算力等方面,中國未必就處于劣勢。
中國工程院院士鄔賀銓曾指出,按2022年年底的數據,美國占全球算力36%,中國占31%,單看算力總規(guī)模,中國與美國確實有差距,但差距并不大;若以GPU和NPU為主的智能算力規(guī)模來看,2021年美國智算規(guī)模占全球智算總規(guī)模15%,中國占26%。
但差距依然值得重視,例如深度學習框架還需要經受考驗、繼續(xù)打磨;例如生成式AI拓展到產業(yè)應用,需要將多個大模型高效融合,由此帶來很多問題;例如大模型需要海量數據訓練,但目前中文可供訓練的語料挖掘還不足;例如大模型訓練所依賴的英偉達A100芯片,被限制向中國出口……中國依然面臨眾多挑戰(zhàn)。
在新一輪全球人工智能競賽中,大模型本身確實是必啃的“硬仗”。但中國其實有一個出“奇兵”的機會。
數據、算力和“鈔能力”對大模型而言缺一不可,但大模型的發(fā)展同樣離不開“場景”。本質上,大模型改變的是人類獲取信息和服務的方式。它不僅需要滿足信息匹配的需求,更要讓AI精準地理解人類的用途,精準地完成人類交付的任務。“精準”,就基于對場景的理解。
在WAIC大會上,京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬表示,伴隨著大模型的出現,世界未來必然會走向智能交互時代,讓機器更好地幫助我們完成專業(yè)域、更廣泛的任務。何曉冬表示,訓練好大模型就需要場景,“場景和數據是這個時代訓練大模型的抓手?!?/p>
或許這會是中國的機遇所在。
拿工業(yè)來說,中國擁有41個工業(yè)大類、207個工業(yè)中類、666個工業(yè)小類,是全世界唯一擁有聯合國產業(yè)分類中所列全部工業(yè)門類的國家;在互聯網方面,中國有大量電商、社交、搜索領域的企業(yè),擁有成熟經驗和龐大數據,大模型和這些行業(yè)、場景的結合,或許會帶來大量機遇。
例如電商。網經社此前發(fā)布的《2022年度中國電子商務市場數據報告》顯示,2022年國內網絡零售市場交易規(guī)模達137853億元;中國網絡零售用戶規(guī)模達8.45億人,占網民整體的79.2%。這個“大場景”下涌現了直播、社交、美妝、母嬰等“子場景”,電商、物流、客服……它們都可能成為大模型應用落地的入口。
理解場景之后,AI的下一站是多模態(tài)能力?
圍繞行業(yè)場景,一些“解決方案”已經出爐。
據何曉冬介紹,通過5分鐘的形象和數據采集,基于大模型能力,京東可以重構整個數字人形象,并推向應用場景。比如在電商這個場景中。言犀虛擬主播已經在京東上線了4000+品牌直播間,累計帶動8億GMV(商品交易總額)。
不過重視場景應用,或許只是大模型全球競賽的現在,而非將來。
何曉冬表示,人們不要只關注到ChatGPT帶來的語言大模型。實際上,大模型技術在很多其他模態(tài)上也在迅速應用起來,比如語音識別和語音合成,比如視覺領域的圖像識別和視頻合成——當然也包括數字人?!皵底秩思扔行蜗?,又有語音,還有手勢,還有語義,還有各種情緒在里面?!?/p>
何曉冬表示,多模態(tài)是必經之路,無論是發(fā)明神經網絡或者是注意力機制,其實都是基于對人本身學習機制的理解和靈感的激發(fā),從而去引領我們發(fā)明一系列模型。有趣的是,今年不少參會企業(yè),似乎都對“數字人”情有獨鐘,由此可見各界對多模態(tài)能力的重視。
今年WAIC大會上,騰訊云MaaS(Model-as-a-Service)一站式服務迎來升級。騰訊云行業(yè)大模型能力將被應用到金融風控、交互翻譯、數智人客服等場景中。通過平臺提供的AI生成算法、生成式動作驅動,再結合行業(yè)大模型能力,企業(yè)可以獲得個性化、專業(yè)、逼真的數字員工。數字人,其實就涉及到多模態(tài)能力。
《人機共生——大模型時代的十大AI趨勢觀察》報告指出,多模態(tài)技術的發(fā)展正在助力AI解決更為復雜的問題。擁有圖像和語音的感知、輸入,大模型未來可以基于動作、表情、情感等信息進行分析,提升自己的交互能力和表現能力。目前基于文本的交互,也將走向基于語義的交互,強化對人類情緒的感知和表達。
需要承認的是,在多模態(tài)等通往未來的賽道上,挑戰(zhàn)依然存在。
ChatGPT-4早已開始接受圖像作為輸入介質,它已經能簡練地指出圖片的違和之處。如下圖所示,當用戶提問,“這張圖片有什么不尋常之處”時,GPT-4簡練地回答出“一名男子正在行駛中的出租車車頂上,使用熨衣板熨燙衣服?!?/p>
在今年的WAIC大會上,談及國內外在大模型方面的差距,曠視科技聯合創(chuàng)始人、CTO唐文斌對《科創(chuàng)板日報》表示,不管是基礎語言模型還是多模態(tài)模型,國內外都存在一定的距離?!安贿^,這是可以迎頭趕上的。在應用的探索上,也處于相對初期的狀態(tài)。但未來會是繁榮的生態(tài)?!?/p>
方興未艾,眼下正是國內企業(yè)積極作為之時。
在接受觀察者網采訪時,何曉冬表示,未來通用人工智能有兩個方向要走,一個方向是多模態(tài),大模型必須具有視覺能力,未來甚至可以更進一步延伸向嗅覺、觸覺;另外一個方向是走向具身智能,包括機器人、機械臂、無人車等,讓通用人工智能走向物理世界。
本文標題: 通用人工智能的發(fā)展方向在哪
本文地址: http://www.danbaochina.com/brand/news-s33st32776.html
內容均來源于網絡,錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁88版權所有 京ICP備2023012932號-1 │ 京公網安備 11010802023561號 京ICP證100626
內容均來源于網絡,錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com