2024年下半年以來,生成式AI的行業(yè)焦點(diǎn)逐步從模型端向應(yīng)用層轉(zhuǎn)移。除了在搜索、教育等應(yīng)用領(lǐng)域的進(jìn)展之外,人工智能在硬件領(lǐng)域的突破,如AI手機(jī),也成為備受矚目的創(chuàng)新趨勢。
在剛剛舉行的2024 vivo開發(fā)者大會(huì)上,vivo正式發(fā)布“藍(lán)心智能”全新AI戰(zhàn)略,將大模型技術(shù)與手機(jī)操作系統(tǒng)深度融合,利用AI賦能OS,給用戶帶來更自然、更“懂我”、更普惠的智能體驗(yàn)。同時(shí)發(fā)布了全面升級(jí)的自研藍(lán)心大模型矩陣、OriginOS 5、藍(lán)河操作系統(tǒng)2,以及在安全、人文、生態(tài)合作等方面的最新成果。

vivo副總裁、OS產(chǎn)品副總裁周圍認(rèn)為,真正的技術(shù)價(jià)值是要回到生活,回到用戶本身,把體驗(yàn)做到極致。AI手機(jī)也要從這一思路出發(fā)。周圍介紹,過去11個(gè)月,vivo在AI領(lǐng)域核心做了三件事,其一,用AI賦能傳統(tǒng)的產(chǎn)品功能,使其變得更強(qiáng)大;其二,構(gòu)建一系列系統(tǒng)的公共能力,不僅是自用,還要開放給行業(yè)第三方;其三,打造具有樣板性的小智能體,讓行業(yè)都來用。

三個(gè)“重構(gòu)” vivo發(fā)布“藍(lán)心智能”戰(zhàn)略
當(dāng)前,國內(nèi)廠商競相推出搭載生成式AI技術(shù)的智能手機(jī),各自的戰(zhàn)略也有所區(qū)別。vivo對(duì)于AI手機(jī)的定義分三個(gè)方面:一是要完整地重構(gòu)用戶交互體驗(yàn);二是重構(gòu)整個(gè)數(shù)字世界,整合vivo自有技術(shù)和第三方的能力,積極擁抱智能體,同時(shí)要確保記憶功能和數(shù)據(jù)處理能力,保護(hù)用戶的隱私和數(shù)據(jù)安全,讓手機(jī)成為個(gè)人助理。三是真正幫助人們在生活工作中提高效率,解決痛點(diǎn)問題,來連接社會(huì)、管理自我。
從這三方面出發(fā),vivo此次發(fā)布的AI戰(zhàn)略“藍(lán)心智能”,從3個(gè)方向上進(jìn)行實(shí)踐:重構(gòu)人與設(shè)備的交互體驗(yàn)、重構(gòu)人與數(shù)字世界的服務(wù)體驗(yàn)、重構(gòu)人與物理世界的溝通體驗(yàn)。
當(dāng)AI能力與OS系統(tǒng)進(jìn)一步融合,交互體驗(yàn)應(yīng)變得更自然、更符合直覺。vivo探索了更符合直覺的人機(jī)溝通方式,比如以圈選、拖放為代表的自然手勢,和支持多種語言互譯、更情感化的人機(jī)自然對(duì)話。

在生成式人工智能的推動(dòng)下,人類與數(shù)字世界的服務(wù)體驗(yàn)正迎來一次革命性的重構(gòu)。vivo則致力于讓智能更加個(gè)人化。首先,依托AI技術(shù)對(duì)手機(jī)的基礎(chǔ)功能進(jìn)行全面升級(jí),讓輸入法、電話、筆記、掃描等15項(xiàng)剛需功能煥然一新,還構(gòu)建了平臺(tái)化的AI公共能力。其次,搭建連接服務(wù)的框架和平臺(tái),包括為開發(fā)者搭建的集合開發(fā)和分發(fā)于一體的智能體平臺(tái),以及針對(duì)輕量化和原子化的服務(wù)構(gòu)建的完整的意圖框架體系,讓人找服務(wù)的同時(shí),服務(wù)也主動(dòng)匹配人的需求。第三,構(gòu)建個(gè)人智能系統(tǒng)框架,讓手機(jī)成為專屬個(gè)人助理。
人工智能的觸角不僅延伸至數(shù)字領(lǐng)域,更深刻地影響著我們所生活的物理世界。手機(jī)本質(zhì)上鏈接的是物理世界的人與人。vivo利用多模態(tài)大模型,讓手機(jī)成為視障人士的眼睛,幫助他們可以獨(dú)自安全地走到更遠(yuǎn)的陌生的地方,去探索世界的美好。
端側(cè)模型小而強(qiáng)大 多模態(tài)大模型首次亮相
基于全新的AI戰(zhàn)略,vivo發(fā)布了新一代藍(lán)心大模型矩陣,不僅升級(jí)語言大模型和端側(cè)大模型能力,其自研的語音大模型、圖像大模型以及多模態(tài)大模型也首次亮相。

其中,千億級(jí)藍(lán)心大模型的云端能力,重點(diǎn)優(yōu)化意圖理解與分發(fā)、任務(wù)規(guī)劃能力。相比去年,其整體能力提升30%,并在CMMLU和SuperCLUE的榜單上繼續(xù)領(lǐng)跑國內(nèi)第一梯隊(duì)。
30億參數(shù)的全新藍(lán)心端側(cè)大模型3B,在對(duì)話寫作、摘要總結(jié)、信息抽取等能力上可以越級(jí)比肩行業(yè)7B-9B模型。相比藍(lán)心7B模型,其性能提升300%,平衡模式下功耗優(yōu)化46%,出詞速度可以達(dá)80字/s,系統(tǒng)功耗僅450mA,內(nèi)存僅占用1.4GB,打破了“模型小、能力強(qiáng)、功耗低“的不可能三角定律,實(shí)現(xiàn)了以小搏大的效果。
在SuperCLUE和南開大學(xué)端側(cè)5B小模型綜合能力評(píng)測中,藍(lán)心大模型3B均排名第一,并且同時(shí)獲得泰爾實(shí)驗(yàn)室端側(cè)大模型綜合能力認(rèn)證以及AIIA安全防范能力認(rèn)證。
此外,vivo還發(fā)布了自研藍(lán)心語音大模型,可準(zhǔn)確理解自然語義、感知情緒、模擬人聲,并且支持中英日韓泰同聲傳譯,以及超過15種語言互譯。
