谷歌AI“大杀器”要来了,这是关于Gemini已知的一切(组图)
谷歌集大成之作——Gemini要来了,GPT-4的最强杀手即将问世。
9月14日,媒体援引三位直接知情人士消息称,谷歌已向一小部分公司提供了Gemini的早期版本,这意味着谷歌考虑将其纳入消费者服务。同时,谷歌还将通过公司的云计算服务出售给企业,这也意味着距离Gemini正是发布越来越近。
据知情人士透露,谷歌并将发布不同大小的Gemini版本,这样开发者就可以购买简化版本来处理较为简单的任务,且足够小的版本来在个人终端上运行。
为了与OpenAI抗衡,加快Gemini的开发周期,谷歌CEO劈柴在今年4月迈出了关键一步,将拥有完全不同文化和代码的团队——谷歌大脑和DeepMind合并。由原DeepMind创始人Demis Hassabis出任CEO。
对于合体后的全新团队,Haasabis显然非常自信。他表示,全新的团队汇集了两股对最近的人工智能进步至关重要的力量。谷歌创始人谢尔盖·布林也被AI的风吹回战场,亲自参与Gemini的训练。
此后的数月里,Gemini一点点掀开神秘面纱一点点被揭开,这是关于Gemini,目前已知的一切。
Gemini的多模态能力
语言模型的下一步飞跃可能是在计算机上执行更多任务,此前文章提到,Gemini的最大优势在于其多模态能力,不仅能够理解和生成文本、代码,还能够看懂和生成图像。相比之下,ChatGPT只是一个纯文本模型,只能理解和生成文本。
此外,制作和ChatGPT类似能力的语言模型的一个重要的步骤是使用人类反馈强化学习来完善其性能,DeepMind在强化学习方面的深厚经验可赋予Gemini新的能力。
在5月的谷歌开发者I/O大会上,谷歌就曾提到,从一开始,Gemini的目标就是多模态、高效集成工具、API。而当时谷歌的预告是:“虽然还在早期,但我们已经在Gemini中,看到了在之前的模型中从未见过的多模态能力,这让人印象太深刻了。”
Gemini与AlphaGo合体
谷歌DeepMind CEO Hassabis爆料,全新Gemini模型将结合进AlphaGo和大语言模型。
Gemini会将AlphaGo与GPT-4等大模型的语言功能合并,系统解决问题和规划的能力将大大增强。
一些人工智能专家认为,语言模型通过文本间接地学习是其发展主要的限制。而AlphaGo的优势可以解决这一点,2016年,DeepMind设计的AI系统AlphaGo以4比1的比分击败了世界围棋冠军李世石,是史上首个战胜围棋世界冠军的机器人。
AlphaGo基于DeepMind开创的强化学习技术,该技术通过让AlphaGo反复尝试并接受表现的反馈,学会处理需要选择采取何种行动的棘手问题。同时,AlphaGo使用了蒙特卡洛树搜索技术方法来探索和记忆棋盘上的可能行为。
它将有各种尺寸和功能
谷歌指出 Gemini 正在接受培训,一旦经过微调,它将可以“以各种尺寸和功能”使用,就像 PaLM 2 一样。谷歌表示,它可以部署在不同的产品中,为每个人带来利益。
除了在企业服务中的应用之外,Gemini 在医疗用例方面还拥有巨大的潜力。谷歌一直在测试一款名为 Med-PaLM 2 的人工智能工具,该工具可以通过 Gemini 功能得到增强。该模型可用于医疗聊天机器人或机器人技术,以协助手术和医疗程序。
此外,谷歌在构建 DeepMind 的 Gato(一种“通用”系统)以及最近推出的 RT-2(一种机器人 Transformer 模型)方面的见解也可以集成到 Gemini 中。Google Brain 和 DeepMind 之间的合作对 OpenAI 和人工智能领域的其他竞争对手构成了重大挑战。
Gemini融入谷歌各类应用
劈柴在9月的采访中透露了有关Gemini融入谷歌产品的信息。他表示,像Bard这样的对话式AI“不是最终状态”,而是通向更高级聊天机器人的中间点。
劈柴表示,Gemini和Bard融合的最终版本将成为“令人惊叹的通用个人助手”,融入人们日常生活的各个方面,如旅行、工作和娱乐。
他重申,Gemini将结合文本和图像的优势,称当前的AI聊天机器人在几年内将“显得微不足道”。
与现有模型相比,Gemini将提高软件开发人员代码生成能力。谷歌希望用它来超越微软的GitHub Copilot代码助手。
TOB销售是重点,谷歌云全力追赶微软云
谷歌希望借助Gemini为旗下产品吸引更多用户,尤其是云计算业务。
谷歌计划通过其谷歌云的Vertex AI服务向企业提供Gemini模型,并将发布不同参数的版本,变相促进了谷歌的云服务业务。
今年5月,谷歌宣布将通过Vertex AI为谷歌云客户提供一套Palm 2的LLM。近期,谷歌还通过编码平台初创公司Replit,为客户提供了谷歌大模型一个月的免费试用。