Gemini是一款由Google DeepMind(谷歌母公司Alphabet下设立的人工智能实验室,是谷歌的兄弟公司)于2023年12月6日发布的人工智能模型,可同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。
首个版本为Gemini 1.0,包括三个不同体量的模型:用于处理“高度复杂任务”的Gemini Ultra、用于处理多个任务的Gemini Nano和用于处理“终端上设备的特定任务”的Gemini Pro。 [2] 谷歌AI模型的研发进程从2012年就已开始;2022年8月推出高级语言学习模型PaLM;2023年5月Google I/O大会上Alphabet首席执行官桑达尔·皮查伊发布了PaLM2与Bard,同时宣布Gemini即将问世;12月6日在一段官方公布的视频中,谷歌正式推出Gemini。 [29] [33] 凭借强大的性能,Gemini一夜爆红。
12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股价涨5.31%,收于136.93美元,迎来自2023年8月29日以来表现最好的一天,总市值达到1.72万亿美元。 [20] 谷歌计划逐步将Gemini整合到其搜索、广告、Chrome等其他服务中。从2023年12月13日开始,开发者和企业客户可以通过Google的AI Studio和Google Cloud Vertex AI中的Gemini API访问Gemini Pro。
12月7日,发布会一天后,科技界指出Gemini与ChatGPT测试方法存疑,且分数存在夸大嫌疑,同时发布会演示视频也存在虚假剪辑问题。
随后,对于视频“造假”一说,Gemini联合创始人奥里奥尔·维尼亚尔斯予以否认。