库克表示,Apple Intelligence 将改变用户使用苹果产品所能做的事情,以及苹果的产品能为用户做的事情。
同时,他还强调了隐私与个性化的重要性,并提出「个人智能是苹果下一阶段的重要举措」。
此外,借助私有云计算,Apple Intelligence 可以灵活扩展其计算能力,并利用基于服务器的大型模型来处理更复杂的请求。这些模型在由 Apple 芯片驱动的服务器上运行,进一步确保用户上传的数据不被保留或暴露。
具体而言,Apple Intelligence 能够实现:
* 邮件处理:基于「优先信息 」功能,收件箱顶部的新区域将显示最紧急的电子邮件。每份邮件都配有摘要,无需打开邮件即可查询内容。智能回复能识别电子邮件中的问题,确保所有问题都能得到回复。
* Image Playground:快速为朋友创建有趣的图片,甚至可以看到用户与他们的对话相关的个性化建议。
* Genmoji:用户可以通过文字描述,实现自由定制的 Genmoji 表情包。
* 写作改进: Apple Intelligence 将面向本地应用程序与第三方程序,引入全系统的校对和风格改进。
* 跨应用任务:Apple Intelligence 可以深入到用户的应用程序中,代表用户执行任务。
* ……
Siri 的前世今生:丧失领先优势,能否借力 OpenAI 浴火重生
从某种程度上讲,Siri 是乔布斯面向人机交互打出的致胜一枪,本是为苹果公司抢下了先机,后续发展却不遂人愿。如今,在 Apple Intelligence 的加持下,借助 GPT-4o,Siri 能否焕发新生呢?
收购 Siri,乔布斯生前做的最后一件事
Siri 最初是美国国防部旗下国防高等研究计划署的研究项目,定位为国家级的虚拟语音助理。2007 年,外部资金的引入促成了 Siri 公司的诞生,创始人有 Dag Kittlaus(任 CEO)、Adam Cheyer(任高级工程副总裁)及 Tom Gruber(任 CTO 和高级设计副总裁)。
2010 年,Siri 作为一款独立应用首次亮相。据报道,Siri 团队认为,Siri 最核心的竞争优势在于,其服务是与传统网络搜索信息方法的一次彻底决裂,Siri 不是搜索引擎,而是以虚拟助手形式出现、能够进行社交互动的智能 Agent。
Siri 展现出的创新性很快引起了乔布斯的注意,已经重病在身的他亲自致电 Siri 三巨头,邀请其到家中畅谈人机交互的发展,并表达了收购意愿。据 Norman Winarsky 在其演讲中回忆道,乔布斯在两周之内和 Siri 的管理团队及董事会谈了二三十次。最终,2010 年 4 月,苹果公司以 1.5—2.5 亿美元收购了 Siri。
2011 年 10 月,Siri 以智能语音助手的身份与 iPhone4s 一同面世,在深度整合之下,Siri 能够调用苹果系统的内置工具来处理预约会议、回复邮件、查看天气等简单任务。毫无疑问,Siri 凭借其前无古人的定位迅速引发热烈反响。
不幸的是,乔布斯在 iPhone 4s 发布的第二天猝然离世。有着「硅谷独家大王」之称的《纽约时报》高级科技记者约翰.马尔科夫表示,收购 Siri 是乔布斯生前做的最后一件事,带来的是苹果内部第一次翻天覆地的变化,他为苹果铺平了走向未来的道路——迎接将来人机交互的另一次重要转换。
令人意想不到的是,乔布斯的离世成为了 Siri 「泯于众人」的重要转折点。一位前苹果员工曾表示,「当史蒂夫在 Siri 发布的第二天去世的时候,他们(Siri 团队)就已经失去了愿景与蓝图,他的去世基本上标志着 Siri 原始团队计划的破灭。」
Siri 创始人三巨头中的 Adam Cheyer 和 Dag Kittlaus 于 2012 年先后离开苹果,并带走了一部分初创团队的工程师,随后联合创建了新智能语音公司 Viv Labs,这个公司最终也被三星收入囊中。Adam Cheyer 曾表示,「在乔布斯去世后,苹果公司发生了一些变化。如果乔布斯还在的话,我或许不会离开。」
这期间,苹果挖来了亚马逊搜索部门以及广告业务的高管 Bill Stasior,其主要负责语音识别、自然语义理解和搜索等多个 Siri 核心团队的管理工作。据苹果前员工向媒体透露,Bill Stasior 更倾向于将 Siri 打造成一个世界一流的搜索引擎,他将当时苹果在搜索功能方面的资源和 Siri 聚合在一起,以进一步提升 Siri 的性能,包括在网页、媒体资源以及 Wiki 百科领域的搜索能力。
这一发展方向显然与团队最初对于 Siri 「能够进行社交互动」的定位有很大不同,在 Bill Stasior 掌舵期间,出现了不少资深员工出走事件。
内忧外患,在苹果内部囿于人才流失时,三星、微软、亚马逊、谷歌已经乘胜追击,也进入了智能语音助手的赛道。
三星于 2012 年在 Galaxy S3 上推出了 S Voice;2013 年,Google Now 可在 iOS 版本的 Google 搜索移动应用程序内使用;微软于 2014 年在 Windows Phone 上公布了 Cortana 小娜;亚马逊也于 2014 年在 Echo 智能扬声器上推出了 Alexa;谷歌还在 2016 年推出 Google Assistant。
与此同时,Siri 的更新却缺乏新意,在嘈杂环境中听错指令等问题也愈发凸显。如今,Siri 甚至逐渐沦为了 iPhone 的「鸡肋」功能。究其原因,笔者认为主要是苹果公司早期对于 Siri 的定位不清晰——到底是成为「世界一流的搜索引擎」还是一个能够处理复杂指令任务的「智能助手」,这也导致其发展严重滞缓。
如今,生成式 AI 大行其道,以 ChatGPT 为代表的 ChatBot 展现出了巨大潜力,苹果不仅发布了 Apple Intelligence,还宣布与 OpenAI 合作,双管齐下,能否为 Siri 注入新鲜血液呢?
整合 ChatGPT 的 Siri
从刚刚的发布来看,答案是肯定的。
首先,Siri 变得更自然、更贴近语境、更个性化,能够简化、加速日常任务。如果用户说话磕磕绊绊,Siri 也能跟上,并保持从一个请求到下一个请求的上下文衔接。此外,用户还可以向 Siri 输入文字,并在文字和语音之间切换,以任何合适的方式与 Siri 交流。Siri 还采用了全新的设计,当 Siri 处于活动状态时,屏幕边缘会环绕着优雅的发光灯。
其次,基于屏幕感知功能,Siri 将能理解用户在更多应用中的操作并采取相应的行动。例如,如果朋友在「信息」中给用户发送了新地址的短信,接收者就可以发出指令:「把这个地址添加到他的联系人卡中」。
第三,Siri 还能在苹果和第三方应用程序中采取数百种新操作。例如,用户可以提出,「从阅读列表中调出那篇关于蝉的文章」,或者 「把周六烧烤的照片发送给马莉娅」,Siri 就会帮你处理。
此外,Siri 可以随时随地为用户提供设备支持,回答数以千个有关如何在 iPhone、iPad 和 Mac 上进行操作的问题。
更重要的是,Siri 将免费接入 ChatGPT,当 Siri 无法回答用户问题时,便能够「求助」ChatGPT 的专业知识,Siri 会询问用户「是否想与 ChatGPT 分享该问题」,用户能够向其发送文字、文件或图片,随后 Siri 将直接给出答案。
据 Greg Brockman 介绍,ChatGPT 将整合到 iOS、iPadOS、macOS 中,并于今年晚些时候上市,让我们拭目以待。
叠满 AI buff 的 iOS 18
虽然暂时还没有搭上 GPT 的「快车」,但 Apple Intelligence 也同样为 iOS 系统的更新注入了强大的动能。
主屏幕个性化控制
苹果向用户开放了对主屏幕的控制权,这意味着,iPhone 用户终于可以按照自己的喜好修改主屏幕,比如选择自己喜欢的照片作为壁纸,或者随意改变应用程序的位置,将它们摆放在底部右侧以便更轻松地访问。
此外,应用程序图标不仅支持暗色模式,还可以配合用户的壁纸选择其他颜色,实现个性化主屏幕设置。
升级控制中心
全新的控制中心采用多页面布局,新增了「控制中心组件库」,第三方开发者也可以将自己的应用程序接入 iOS 18 的控制中心,用户可以用更快的速度访问每天需要做的事情。
增强隐私保护
有时候用户会把设备借给别人短暂使用,为了避免信息泄露,苹果采用了锁定应用程序功能。一旦用户锁定了一个应用程序,其他人想要使用它就得先通过 Face ID、Touch ID 或者密码进行身份验证。此外,用户还可以隐藏自己使用的应用程序,将其放入一个被锁定的隐藏应用程序文件夹中,避免别人「偷窥」。
Messages 回复