“最美的整合”:从Vision Pro推演苹果LLM生态建设

竹田伊織
Jul 5, 2024

--

从Vision Pro建立的生态出发,尝试推演苹果之后将会在LLM方面打造的软硬件生态。本文最初发布与我的个人微信公众号,发布时间为2024年3约16日。

Source: made by meself

Apple Vision Pro解决了许多软件和操作系统提供商多年来难以解决的大问题,即:用户界面在“屏幕之外”无缝迁移,并且苹果在目前已有的技术能力下做到了尽可能舒适、流畅的体验。

而后者,恰恰是苹果得以在消费级硬件市场上一骑绝尘的护城河。

尽管Android这种相对开放的复杂生态下还是初步实现了PC和手机上的用户界面无缝迁移,微软还凭借更开放的软件开发环境,通过Hololens硬件向全球展示了Windows界面与MR头显之间,也可以做到用户界面的无缝转换,但是相比苹果更加专一、统合的软硬生态带来的整合能力依然有着一些差距。

在影响力者们发布的Vision Pro体验和评测内容中,大多数人都提及了这款头显利用苹果独家的无线连接协议与Mac进行的无缝连接 — — Mac用户可以直接将Mac的屏幕投影到头显空间中来,并利用头显提供的宽广显示范围浏览Mac上的内容。尽管最初依然伴随着繁琐的启动设置,但当设置完成后,这一切不仅在操作上非常流畅,显示效果本身也做到了无可挑剔。

当然,不可否认的是,开放生态厂商在该领域深耕多年,源头厂商和终端厂商持续致力于为Windows系统开发好用的跨屏互连工具,旨在让手机和头显这类设备提供方便快捷的使用体验,但不论如何设置,依然做不到“无感连接”,即用户所在统一区域内的设备无需通知即可立即连接,而非需要额外下载应用软件或利用设备搜索功能之后再开启互连模式。但是目前,多数跨屏互连方案依旧需要下载额外软件或利用NFC芯片进行手动触碰才能做到。尽管这一细节就操作难度上而言无足轻重,但驱动用户使用这一功能的启动操作,会让这种功能在用户不断提醒自己又不断忘记启动操作的恶性循环下逐步消散在繁琐的日常工作之中。

苹果全家桶用户则根本不会忘记这一点。相对较新的苹果设备,只要用户在不同设备上登录了同样的苹果账号,就能立即开始享受已经设置完成的跨屏互连功能,用户随时可以立即在Mac上操作iPhone、iPad甚至Airpods,或者把想要编辑的内容拖拽到高性能设备上进行处理。而同样地,Apple Vision Pro也已经实现了这一功能 — — 尽管这一功能目前仍处于早期阶段,有很多功能上的问题需要改进,但部分开发者和数码专家已经对目前仍在改进的新特性表达了赞许。

依赖强大的M2芯片,Vision Pro已经能够做到很多以往的VR/AR/MR头显无法做到的事情,比如脱机编程,以及在高分辨率下提供更流畅的视觉体验;并且强大芯片也能更好地支持VisionOS下的原生应用,包括3D建模软件、游戏以及更先进的大语言模型应用。如果您对消费电子、电子游戏和生活方式等相关内容感兴趣,请持续关注微信公众号:bradliublog。

虽然就目前而言,大语言模型的本地化仍然是一项处于实验中的概念,但从部分人工智能能力已经在手机上实现终端运行,并针对相机算法、听写和翻译等功能进行能耗优化的发展历程来看,将大模型以及更宽泛的人工智能工具的一部分能力安装在终端,利用本地硬件进行驱动的做法在未来一定会成为现实。而将大模型应用在各个苹果设备上无缝集成,并让用户在生活中随时使用的能力,将有可能是苹果在AI新时代引以为傲的实力展现。

就普通消费者而言,大模型在看懂人类自然语言方面有着先天性的优势,因此不论是模糊搜索还是通过自然语言向大模型询问各类问题,大模型往往能给出比人类和搜索引擎更人性化,且更加完善的回答。不过目前市面上的任何大模型工具最大的问题同样在于需要用户的启动操作,所以除非手上的工作必须每天都要用到大模型,否则如果用户想不起来打开大模型,用户就不会想到要去使用大模型。

苹果的强项就在于此,并且在今年开始加速推进了大模型的研发脚步。最近收购加拿大AI初创企业DarwinAI和已经被曝光的AppleGPT项目都表明,苹果希望在自研多模态大语言模型领域取得突破性进展,甚至有可能将于今年晚些时候看到其搭载在消费级设备上的初步成果。

我们可以提前想象一下苹果将会以何种方式推动个人设备成为最佳AI助理的场景:比如生成更具个人特色的Animoji,并用于照片和视频编辑;混合多种不同的emoji,创造出让用户眼前一亮或者眼前一黑的emoji;配合多模态能力帮助用户阅读并总结手机截屏的内容;在发送消息或者邮件时提供最符合当下语境的回复或者邀约;在日记、日历、便签和备忘录应用中直接通过用户的自然语言生成完整的计划、日志以及提醒事项;Siri也会因为大语言模型的加持而变得更加强大,更容易和用户进行多轮互动并解答疑问;以及让内置的搜索功能也拥有模糊搜索的能力;等等。

总之,苹果不仅仅是拥有完整、统合的软硬件生态,更有着维护这一生态的重要能力 — — 统一化的操作和使用体验。这种生态维护是多数竞争对手难以撼动苹果的重要护城河。这也就意味着当苹果的大模型到来之时,苹果也一定会通过其独到的交互理念,无缝为用户提供全新的AI功能,并最终让用户无感体验大模型AI带来的强大实力。

--

--

竹田伊織

Virtual Photographer | Former Xbox PR agent | Banner captured by myself