綜合報道,當?shù)貢r間周三,美國科技巨頭谷歌宣布推出其認為規(guī)模最大、功能最強大的人工智能模型Gemini,這種技術(shù)能夠處理視頻、音頻和文本等不同內(nèi)容形式的信息。
谷歌還發(fā)布了其最強大的人工智能晶片Cloud TPU v5p,它是在之前的版本基礎(chǔ)上進行的改進。根據(jù)谷歌的說法,與TPU v4相比,TPU v5p的浮點運算性能提升了兩倍,它訓練大語言模型的速度比TPU v4快2.8倍。
谷歌表示,該公司備受期待的人工智能模型名為Gemini,對比之前的技術(shù),能夠進行更複雜的推理,理解更加細微的信息。它通過閱讀、過濾和理解信息,可以從數(shù)十萬份文件中提取要點,將有助於在從科學到金融的許多領(lǐng)域?qū)崿F(xiàn)新的突破。
谷歌行政總裁桑達爾·皮查伊在一篇博文中寫道:「這個新模型代表了我們作為一家科技公司所做的最大的科學和工程努力之一,它也是一個多模態(tài)基礎(chǔ)模型,可以概括和理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻。」
自O(shè)penAI一年前推出ChatGPT以來,創(chuàng)造了當前人工智能熱潮背後大部分基礎(chǔ)技術(shù)的谷歌措手不及,一直在努力開發(fā)能夠與這家公司相抗衡的人工智能軟件。谷歌聲稱,已經(jīng)在其人工智能助手Bard上添加了部分Gemini模型的技術(shù),並表示計劃在明年年初將最先進的Gemini模型完全融入到Bard中。
Gemini Pro表現(xiàn)優(yōu)於GPT-3.5
谷歌高管們認為,Gemini Pro的表現(xiàn)優(yōu)於GPT-3.5,但迴避了與GPT-4相比如何的問題。而在今年3月,OpenAI推出了GPT-4。
谷歌DeepMind行政總裁、Gemini團隊代表德米斯·哈薩比斯(Demis Hassabis)在發(fā)布會上正面談及GPT-4與Gemini的對比,「我們對系統(tǒng)進行了非常徹底的分析,並進行了基準測試。谷歌運行了32個完善的基準測試來比較這兩個模型,從廣泛的整體測試(如多任務(wù)語言理解基準測試)到比較兩個模型生成Python代碼的能力?!构_比斯略帶微笑地表示,「我認為我們在32項基準中的30項中大幅領(lǐng)先?!?/p>
從發(fā)布日起,Gemini可開始應用於Bard和Pixel 8 Pro智能手機,並將很快與谷歌服務(wù)中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。
將發(fā)布三大版本
谷歌公司表示,將發(fā)布三種版本的Gemini,分別為Gemini Ultra、Gemini Pro和Gemini Nano。每個版本具有不同的信息處理能力,功能最強大的Gemini Ultra版本是為在數(shù)據(jù)中心運行而設(shè)計的,最弱的Gemini Nano版本將在流動裝置上高效運行。
從12月13日開始,開發(fā)者和企業(yè)客戶可以通過Google AI Studio或Google Cloud Vertex AI中的Gemini API訪問Gemini Pro。Android開發(fā)者也可以使用Gemini Nano進行軟件開發(fā)。
DeepMind負責產(chǎn)品的副總裁Eli Collins聲稱,Gemini是谷歌DeepMind人工智能部門幫助創(chuàng)造的最強大的人工智能模型,但與該公司之前的大模型相比,它為用戶提供的服務(wù)「明顯」更加便宜。
Collins補充說:「因此,Gemini不僅功能更強,效率也高得多。最新的模型仍然需要大量的計算能力來訓練,谷歌正在快速推進這一過程?!?/p>