Google 近日推出最新且最具突破性的人工智能模型 Gemini。Gemini 在各方面表現均比現有 GPT-4 AI 模型還要強大,是一款具有複合性能力的 AI,不論是 Coding、圖片、影片或文字的處理上都沒問題,並且共有三種版本:Gemini Ultra、Gemini Pro 和 Gemini Nano。Gemini 將逐步推出到 Google 各種產品和平台上,包括 Bard、Pixel 8 Pro 和其他產品中。此外,從 12 月 13 日起,開發者和企業可以透過 Google AI Studio 或 Google Cloud Vertex AI 存取 Gemini Pro 的 API。
從上方影片可以看到 Gemini 用鏡頭看桌面,Gemini 能夠聽懂人講話、看懂人類的畫、並且和人類與鏡頭互動。當人發問,Gemini 會回應並提供更多意見、想法,成果非常驚人。
Gemini 在許多領先的基準測試中表現出最先進的性能,是迄今為止 Google 最有能力和最通用的 AI 模型。Google DeepMind 的 CEO 和共同創辦人 Demis Hassabis 強調,Gemini 的推出是他們長期以來構建新一代 AI 模型願景的實現,Gemini 能夠理解和操作文字、Coding、音檔、圖片和影片在內的不同類型的資訊。Gemini 有三種版本:Ultra、Pro 和 Nano,分別針對不同的應用和需求進行優化。
UltraL:是最大型的模型,適用於高度複雜的任務
Pro:適用於廣泛的任務
Nano:則是最高效的模型,適合在行動裝置上的任務。
Gemini 在文字和 Coding 等一系列測試中效能皆超越了 GPT-4。與現有的 AI 模型如 GPT-4 相比,Gemini 在多模態理解和處理方面展現了更先進的性能。它在理解和處理複雜數據方面的能力可能超越了 GPT-4,特別是在處理圖片、音檔和影片在內的非文字數據方面。此外,Gemini 還能在移動裝置上運行,這是目前大多數 AI 模型,包括 GPT-4,所無法辦到的。在 MMLU(大規模多任務語言理解)上,它首次超越人類專家的表現。
上方影片清楚的說明 Gemini 在科學、研究領域的實際應用範例: