什么是 Gemini?
Gemini is built from the ground up for multimodality — reasoning seamlessly across text, images, video, audio, and code.
Google Gemini是谷歌最新发布的强大人工智能模型,不仅可以理解文本,还能处理图像、视频和音频。作为一种多模态模型,Gemini被描述为能够在数学、物理等领域完成复杂任务,同时能够理解并生成各种编程语言中的高质量代码。
Gemini由Google和其母公司Alphabet共同创建,并作为该公司迄今为止最先进的AI模型发布。Google DeepMind在Gemini的开发中也做出了重要贡献。
这次发布的 Gemini 其实是一个家族式大模型,分别是 Gemini Nano、Gemini Pro 和 Gemini Ultra,三种模型将应用于各种不同场景,能力依次增强。
从官方放出的数据来看,虽然每个版本都有自己合适的环境,但不同版本间,性能还是有着明显差异的。
目前现在大家能用上的都是 Gemini Pro (是一款中端型号,能够击败ChatGPT的基准版本 GPT-3.5。与此同时,它将很快为许多 Google AI 服务提供支持,今天率先在 Bard 上应用。),而大部分的测试演示都是基于 Gemini Ultra 来的,而Gemini Ultra的实力不仅在各种常规测试里战胜了GPT-4,甚至在MMLU测试里得分为 90%,而人类专家的得分为 89.8%。这很重要,因为“Gemini 是第一个在 MMLU(大规模多任务语言理解)方面优于人类专家的模型,MMLU 是测试 AI 模型知识和解决问题能力的最流行方法之一。
目前,可以通过与Google Bard和Google Pixel8的集成来访问Gemini。
通过以下网站进入Bard:https://bard.google.com/。由于 Gemini 官方表示现在 Bard 搭载的Gemini 仅支持英语,所以大家使用的时候一定要用英文。进入后登录谷歌账号即可使用。进入界面
Gemini 比 GPT-4 好吗?
自去年 OpenAI 率先推出 ChatGPT,似乎关于 AI 领域的“风头”便被其占领了大半。显然,其他布局 AI 的各大科技公司对此并不甘落后,在自己发布新品时,也忍不住会和 OpenAI 的产品对比一番,Google 当然也不例外。根据谷歌的说法,Gemini“代表了人工智能如何帮助改善我们日常生活的重大飞跃”。
而ChatGPT3.5版本,很多功能都是受限的,而GPT-4版本需要收费。此时,Bard或者Gemini的优势就出来了,他是可以上传图片提问的。总的来说,结合能力强弱和付费,在 Gemini Pro更值得一试。