微软昨天推出了一系列CopilotPlusPC,其中包括直接内置于Windows11中的新AI功能。在幕后,该公司现在有40多个AI模型在Windows11上运行,这要归功于新的WindowsCopilot运行时,该运行时还允许开发人员将这些模型用于他们的应用程序。
在今天的MicrosoftBuild大会上,该公司提供了更多关于WindowsCopilotRuntime工作原理的详细信息。该运行时包含一个API库,开发人员可以利用它来开发自己的应用程序,其中包含AI框架和工具链,旨在帮助开发人员在Windows上发布自己的设备模型。
“WindowsCopilot库由即用型AIAPI组成,例如StudioEffects、实时字幕翻译、OCR、RecallwithUserActivity和PhiSilica,这些API将于6月向开发人员提供,”Windows和Surface负责人PavanDavuluri解释道。
开发人员将能够使用WindowsCopilot库将Studio效果、滤镜、人像模糊和其他功能集成到他们的应用中。Meta正在将WindowsStudio效果添加到WhatsApp中,因此您将在视频通话期间获得背景模糊和眼神交流等功能。开发人员几乎无需编写任何代码即可使用实时字幕和新的AI翻译功能。
微软昨天展示了其RecallAI功能,该功能允许CopilotPlusPC记录和存储您在PC上所做的一切,以便您可以回忆并搜索时间轴。这一切都由新的WindowsSemanticIndex提供支持,该索引可在本地存储这些数据,微软计划允许开发人员构建类似的功能。
Davuluri表示:“我们将为使用VectorEmbeddingsAPI的开发人员提供此功能,以便他们在应用程序内和使用应用数据构建自己的矢量存储和RAG。”
开发人员还可以通过向其应用程序添加上下文信息来改进Windows的新Recall功能,这些信息将输入到支持该功能的数据库中。“这种集成可以帮助用户从您的应用程序中上次中断的地方继续,提高应用程序的参与度以及用户在Windows和您的应用程序之间的无缝流动,”Davuluri说。
Windows内部为开发人员提供的所有这些改进都是在新的Arm驱动系统以及AMD和Intel即将推出的NPU之上构建更多AI应用的早期构建模块。虽然微软正在为开发人员构建用于Windows的人工智能应用程序的平台,但它现在寄希望于这成为下一个十年Windows开发的重要组成部分。今天在Build的舞台上,Davuluri站在一张幻灯片前,上面写着“Windows是最开放的人工智能平台”,这表明这一刻对微软来说是多么重要。