Google秀肌肉, I/O大会快变成AI大会了!
撰文 | 小不董
编辑 | 李信马
题图 | Google I/O 2023 开发者大会
来源 | DoNews
北京时间5月11日凌晨 1 点,Google I/O 2023 开发者大会采用线上+线下的形式举办,和往年一样再次席卷了科技界的关注。但和以往不同的是,人工智能成为了本次大会的主角,重点发布层出不穷,可以说,千言万语都汇成了一句话:我的AI也很强!
以下就是2023 Google I/O大会的重点内容,“AI浓度”极高:
- Gmail推出help me write“帮我写”功能
- 谷歌maps推出沉浸式路线视图
- Google photos让用户把照片改得更好
- 一键搜图!谷歌推出人工智能图像打击虚假信息
- 官宣最新的大模型PaLM 2
- Gemini正在推进
- 人工智能Bard新增更多功能,将完全运行在PaLM 2之上
- 预览的新方式:Labs
- Google Cloud:创建每个人自己的模型
- Google基础设施家族的新成员:基于英伟达H100GPU的A3虚拟机
- Alpha Fold带来医学突破
- Google要确保生成的每一张图像都必须要具有原数据
- 魔力撰写打造个性化手机
- Fast Pair让硬件设备无缝协作
- Pixel 7A、Pixel Tablet、Pixel Fold发售
01.官宣大模型PaLM 2
会上,最值得期待的PaLM 2如约而至,大会上宣布了超过25种基于PaLM 2的产品和功能。谷歌将PaLM 2模型基本分为Gecko、Otter、Bison和Unicorn。意思分别是壁虎、水獭、野牛和独角兽,对应不同的尺寸。
Gecko可以在移动设备上进行工作,其速度快到足以在移动设备上运行出色的交互式应用程序,哪怕是在离线的状态之下也可以做到这一点。
由于对科学和数学主题进行了广泛的训练,PaLM 2模型的逻辑和推理能力更强,而且还接受逾百种语言文本的训练,因此能够理解并且生成精确的结果,结合强大的编码能力,PaLM 2还可以帮助世界各地的开发者进行合作。
Med-PaLM 2与基础的PaLM 2相比使得不准确的推理减少了9倍,而且运用于医学上,也接近于回答同一组问题的临床医生专家的表现,它也是第一个在医学执照考上展现出专家水平的语言模型。谷歌还在努力使其能够结合医学影像信息,帮助医生,尤其是放射科医生解释图像,并且交流结果。
02.对话机器人Bard持续加强
被寄予厚望的Bard也得到加强,作为一个非常轻量型的大语言模型,有PaLM 2作为加持,使它的数学逻辑和推理的能力大步向前,现在可以在整个代码生成、代码调试、对于代码的片段进行解释方面,做到彼此之间相互协作,且已经学会了超过20个编程语言,能够帮助开发者进行更好的编程。
甚至Bard还能做一个象棋里的“四步杀”脚本。
对于开发者来说,Bard可以解释代码,化繁为简,并且将代码加以改善。
从Google中可以向Bard嵌入一些服务,例如问在新奥尔良有没有不得不去的景点,Bard就会及时运用Google Search和Knowledge Graph去找到最相关的图片。
或者学生应该报考哪个大学?输入感兴趣的几个词,就能生成一份大学名单,并在图表中详细标明,再运用谷歌地图,在视觉上展示这些学校在哪里。
接下来几个月会有Adobe Firefly,加上Bard会生成一个全新的图片。
03.Gmail接入AI,实现“帮我写”
Gmail方面,之前Google推出了Smart Compose智能撰写功能,可以在用户打字的时候提供协作建议,Smart Compose也被不断的完善,在过去一年当中被使用了超过1800亿次。
现在通过更强大的生成式模型,谷歌在Gmail中实现了help me write“帮我写”功能。
会上,谷歌演示了如何在航班取消的情况下写一封要求全额退款的电子邮件。
04.谷歌地图也升级了
自推出街景视图以来,AI已经拼接了数10亿张全景图像,让人们可以在自己的设备上探索世界。去年的I/O大会上,谷歌推出了沉浸式视图,也就是利用AI创建一个地方的高保真地图,让用户可以在到达之前就可以获得亲身的体验。现在谷歌将同样的技术拓展到maps最擅长的领域,也就是帮助用户到达目的地。
谷歌地图每天提供了200亿公里的路线指引,沉浸式路线视图作为一种全新的旅程视角,可以缩放地图,能获得鸟瞰视图,能详细到出行方式的车道,甚至还可以提前看到空气质量、交通和天气情况。沉浸式路线试图将会在今年夏天推出,并且在今年年底前会在15个城市上线,包括伦敦、纽约、东京和旧金山。
05.“美图爱好者”的福音
另一个通过AI得以提升的产品就是Google Photos,每个月有17亿张图片在Google Photos上被编辑,谷歌率先在Pixel上推出的魔法橡皮擦,可以消除不必要的干扰。今年晚些时候,谷歌还会推出结合语义理解和生成式AI的魔法编辑器,让用户能够获得更多新的体验。
与此同时,一个代号为Gemini的项目正在推进,谷歌计划开发一种新的大型机器学习模型,尽管它还处于早期阶段,但是已经能看到其在以往模型当中没有出现的多模态能力。
其中就包括让客户拥有可识别出合成生成式内容的工具,水印和原数据就是两个重要的方式。当人们看到一张合成图片,可能会觉得它很真实,这就需要水印的存在了,Gemini让AI生成的图片从一开始就将水印融入其中,人们看到就知道,这是张合成图片。
原数据可以允许内容创作者将原数据与原始文件相关联,每当用户看到一张图片的时候,原数据就会提供其背景信息,且每一张由AI生成的图像都会绑定这种原数据。
06.Duet AI:专家级的协作程序员
有没有一种方式帮助开发者更好的完成编程任务?谷歌的建议是在Google Cloud当中加入Duet AI。它作为一个AI专家级的协作程序员,可以灵活运用于云端控制台、聊天对话框甚至提供上下文的代码股权,实时生成函数,在你需要的任何地方提供帮助。
07.A系列最新款、折叠屏手机、平板电脑发售
据谷歌介绍,Pixel是唯一一个以AI为中心的手机,也是唯一一台结合了Google Tensor、安卓和AI的手机,可以说就是一台AI设备。例如Pixel Call Assist呼叫助手这样的功能,可以避免长时间的等待电话,忽略不想接的电话,提高想接的电话的音质。
还有Pixel相机,它可以理解面部表情和肤色,谷歌还增加了实际色调和预览框引导的功能。
全新的Pixel 7A对A系列产品进行完全的升级,像所有Pixel7系列的设备一样,Pixel 7A采用的是Google Tensor G2芯片,配备8G内存,确保Pixel 7A具备最佳的性能和智能化的表现。而主相机传感器尺寸增加72%。
Pixel Tablet是唯一由谷歌设计的平板,有11英寸高分辨率显示屏,4个内置扬声器,高级铝制外壳采用了纳米陶瓷图层,而且在Google Tensor G2的芯片驱动下,具有持久电池寿命和顶尖的个人AI技能,Pixel Tablet语音输入速度点击输入速度快三倍。
Google I/O大会上,经常出现的一句话是:让AI惠及每一个人。这恰恰是当下大众的共同愿望,希望Google在未来的道路上继续带着担当和责任大步向前。
文中图片来源:2023 Google I/O大会