Hottest Videos AI Summarized 2025-10-07

00:00

00:00

52:39
6. 📝 OpenAI DevDay 2025: Opening Keynote with Sam Altman (13 times summarized)
🚀 OpenAI DevDay 2025:OpenAI 开幕致辞(Sam Altman 要点解读)
作者:OpenAI
OpenAI 在 Dev Day 2025 的开幕致辞中,Sam Altman 强调现在是“成为构建者的最佳时机”,聚焦四大核心方向:在 ChatGPT 内构建应用、加速代理(agents)的开发、让写软件变得更简单,以及持续更新的模型与 API 支持。演示展示了 Apps SDK 与 MCP 标准如何让开发者把应用直接嵌入对话、实现快速分发和潜在变现;Agent Kit 的完整构建块大幅简化从原型到生产的过程;并介绍 Codex、GPT-5 Codex、Sora 2 等新模型及其在编码、创作和实时交互场景中的应用。下面,我们把要点按主题梳理,并穿插演示中的关键画面。
🧭 方向纵览:四大核心方向
- 在 ChatGPT 内构建应用(Apps inside ChatGPT),让对话成为应用的入口,提升分发覆盖与变现能力。
- 加速代理开发(Agents),用更少的摩擦把从原型到生产的工作推向落地。
- 让软件开发更简单,减少重复性编码,让开发者把时间花在系统设计与创造力上。
- 持续更新模型与 API,提供更强的能力、可控性与生态扩展性。
在屏幕上,舞台滚动显示了那些已经在平台上突破里程碑的开发者名单,鼓励更多团队参与共同推动 AI 的落地应用。[0:00 时的场景截图]
🧰 App SDK:在 ChatGPT 内部构建可互动的应用
- 核心理念:让 ChatGPT 成为帮助人们更高效地工作、学习和创作的“入口+执行层”。开发者可以把数据源接入、触发行动、渲染完整 UI,并让应用在对话中被发现、使用,甚至在未来实现即时结账与变现。
- MCP 标准与全栈能力:Apps SDK 基于 MCP(开放标准),开发者可以控制后端逻辑和前端 UI,应用可覆盖在数以亿计的 ChatGPT 用户之中。
- 应用分发与发现:推出应用目录,聊天对话中可直接推荐相关应用,提升曝光与使用率;在对话中用户也能按需找到并使用应用。
关键点包括:从对话中直接访问与操作应用、在对话中展示全屏或画中画(PiP)等多种 UI 形式、以及未来的广告性电商模式(agentic commerce protocol)实现即时结账。
- 示例场景演示(如 Coursera、Canva、Zillow 等):用户可以在 ChatGPT 中直接启动 Coursera 学习、让 Canva 生成海报、通过 Zillow 的地图体验查看房源信息等,所有交互都在对话流里完成。Canva 的海报/演示文稿能力在应用内被直接调出并呈现。
- 实时演示要点:在演示中,Canva 先给出海报选项,随后可将海报转化为简报,进一步在 Canva 内导出成幻灯片。Zillow 作为地图与房源信息的嵌入式示例,展示了对话中对数据、视觉和交互的无缝整合。
画面示例:Canva 海报与后续转为幻灯片的过程,演示了在对话中直接生成和编辑多模态资产的能力。[947 秒时截图]
- Live demo 细节要点:
- 通过与 Coursera、Canva、Zillow 的组合演示,展示了“从对话到资产生成再到完整应用体验”的闭环。
- App 的全屏模式、在会话中嵌入的多模态 UI,以及对话中的上下文传递(Talking to Apps)能力,确保模型对用户正在交互的具体内容有清晰理解,从而提供更精准的帮助。
截图参考:会议现场对着屏幕展示应用内的交互过程,演示的场景片段用图像来呈现。 [139 秒时截图]
- 重要前提:Apps SDK 以 MCP 为基础,若你已有 MCP 资源,接入 AbSDK 将更容易扩展,应用可以在对话中实现快速分发与广域覆盖。
示例画面:演示中直接在对话内调用的 Canva 海报、Zillow 地图与图文并茂的媒体渲染,展示了一体化体验的可能性。[947 秒与 1788 秒时截图]
🤖 Agent Kit:把代理从原型带到生产
- 目标:为每位构建者提供一整套构建块,让从原型到生产的路径更短、风险更低、迭代更快。
- 三大核心组成:
- Agent Builder:可视化画布,设计、测试与部署代理流程。这一部分基于“Responses API”的理念,开发者熟悉的基础组件被抽象成可用的构件。
- Chat Kit:把高质量的对话体验带到你自己的应用中,提供可嵌入、可品牌化的聊天界面,支持跨代理节点的对话流与工具调用。
- Evals:为代理提供性能评估、数据集、提示优化、以及对外部模型的评估能力,帮助保障代理的可靠性与安全性。并支持与内部工具的无缝对接(OpenAI Connector Registry),通过管理面板实现访问控制和审计。
- 安全与治理:Guardrails、PII 检测与屏蔽、以及管理员控制面板,确保代理在访问内部工具和数据时遵循安全政策、范围可控且可追溯。
实际应用示例:
- Albertsons:在美國2000多家门店中,代理可以在销售下降时自动分析季节性、历史趋势和外部因素,给出优化建议(如调整陈列、投放本地广告等),减少人工沟通与延迟。
- HubSpot Breeze:通过代理从知识库中提取本地化治疗方法、政策细节等信息,为客户提供多种解决方案与建议。
现场演示了一系列从建模到上线的全过程,并展示了如何在 Dev Day 的站点中部署由 Agent Kit 构建的代理,直接在网站端同用户进行交互。这一环节强调了“无代码/低代码直达生产”的速度与可控性。
演示者 Christina 在现场以实际操作演示Agent Kit的搭建过程:从流程图绘制、引入会话与日程代理,到加入保安控件、再到发布和在网站中接入 ChatKit 组件,最后实现对话中的任务分发与执行。整个过程仅用几分钟就完成上线,体现了代理构建在实际落地中的高效性。[2778 秒时截图]
💻 Codex:软件开发进入 GA 时代
- Codex 的演进:GPT-5 Codex 现已成为强大的编码协作模型,能够在集成开发环境、终端、GitHub、云端等多处协同工作,实时响应并接入外部工具。
- 关键进展:
- GPT-5 Codex:更强的上下文感知、对复杂任务的自动化提示优化、以及对外部工具的动态对接能力提升。
- Codex 进入 GA:自研的重大里程碑,Slack 集成、Codex SDK、企业级管理工具(环境控制、监控、分析、仪表盘等)一并推出,帮助团队进行规模化部署与治理。
- 实际成效:Codex 用户数量显著提升,日常消息量、任务与对话数量显著增加,开发者团队的代码提交与审查效率显著提升;Cisco 等公司通过 Codex 的广泛应用,代码审查时间显著缩短。
演示环节中,Raman 展示了一个以 Codex 为核心的端到端演示:从一个简单的控制面板开始,自动生成并接入相机控制协议(VISCA)实现对 Sony a7 和相关设备的控制;并将 Codex 集成到开发环境中,展示如何用极少的代码量实现复杂功能与实时交互。这一段强调了“ Codex 能力的无缝协作与即时改造能力”的强大潜力。甚至还演示了通过 Codex 云端任务来控制现场灯光、实现语音互动,以及在 React 应用中动态叠加代码来实时更新界面。
画面要点:
- 通过 Codex CLI 构建并生成对相机控制的服务器和可运行的节点,实际在本地与云端环境中验证功能。
- VS Code 插件内的 Codex 集成,展示本地与云端任务的双向协同与即时应用扩展。
- 现场语音交互演示,演示如何通过 Real-time API 将语言输入转换为对场景的直接控制。
截图参考:演示者展示了从代码生成到现场控制的全过程,以及实时语音交互对演示场景的驱动。[2778 秒时截图]
- 现实意义:Codex 生态包括 Slack 集成、Codex SDK、企业管理工具等,面向企业级团队的代码协作、治理与自动化水平提升,帮助大规模团队更高效地完成代码审查与开发任务。
🎬 Sora 2:创作者工具的新纪元
- Sora 2 是 OpenAI 的视频生成模型,提供高度可控的视频输出、画面状态保持、与声音场景的同步等能力,适用于广告、教育、娱乐等场景。
- 关键能力:
- 高度可控的画面风格与状态保持:详细指令控制输出,能在不同场景中保持一致性与美学。
- 声音与画面的协同:丰富的声景、环境音效与画面内容的同步,提升观感的沉浸感。
- 与现实世界的融合:可以将现实图片或物体引入视频,生成新的场景与交互效果。
- 应用展望:面向创作者、品牌和内容制作团队,a/b 测试、概念开发、广告制作等环节,通过 API 直接在自家产品中生成高质量视频,节省耗时与成本。
示例:描述了用 Sora 2 将一个概念性广告草图扩展成完整视频,并配以真实世界元素的场景化呈现。该模型为内容创作提供“从想法到成品”的快速通道。
画面参考:Sora 2 的概念演示与实际输出的对比,展示其在细节与风格上的控制力。[3061 秒时截图]
- 生态意义:Sora 2 与 Real-time Mini 等新模型共同扩大了 AI 在内容创作、市场传播等领域的应用边界,为开发者提供了更丰富的多模态表达能力。
💡 模型更新与对创作者的工具
- GPT-5 与 GPT-5 Pro:GPT-5 在代理与端到端编码方面表现出色,已经在多家编码相关初创企业的应用中落地并提升效率。GPT-5 Pro 作为更强的推理与准确性模型,正式进入 API,面向需要高准确性和深度推理的领域(金融、法务、健康等)。
- Real-time Mini:更小、成本更低的实时语音模型,保持同等语音质量与表达能力,降低语音交互的门槛。
- Sora 2 的 preview 与 API 公开:让开发者在自有产品中直接产出高质量的视频与音效输出,增强多模态内容的表现力。
画面要点:作者总结了自今年以来的模型进展与企业级应用案例,强调新模型在编码、创作和实时交互中的广泛潜力。[3061 秒时截图]
🧭 总结与展望
- 核心信念:AI 将把“从想法到产品”的时间大幅缩短。开发者无需一个庞大团队即可将创意变为现实,重点在于想法与执行能力,而非资源规模。
- 现有工具带来的变革:
- App DK(Apps SDK + MCP)让应用直接嵌入对话并实现快速分发与潜在变现。
- Agent Kit 将代理从原型到生产的路径大幅简化,降低门槛,提升治理与可维护性。
- Codex 与新模型(GPT-5、Sora 2、Real-time Mini)为编码、创作与实时交互提供强大支撑。
- 创作者工具与生态(如 Sora 2)的加入,扩展了 AI 的应用场景与表达能力。
- 生态建设与商业路径:应用目录、发现机制、即时结账与广告/电商化等能力逐步落地,为开发者提供更广阔的曝光与持续收益机会。
演讲者强调,希望通过这些工具让 AI 对所有人都有用,鼓励全球开发者参与共创,并对今天的团队与筹备工作的辛勤付出致以感谢。
画面与演示要点回顾:
- 现场多场景演示覆盖“对话即应用、对话中资产生成、代理生产力提升、编码协作的进化、以及创作者工具的落地能力”,展示了一个多模态、可控、可扩展的 AI 生态图景。[0:00, 2:19, 15:47, 29:48, 46:18, 51:01 的相关截图]
关键术语速览
- Apps SDK:在 ChatGPT 内构建、部署和渲染互动应用的开发工具包,支持数据连接、触发行动和前后端完整 UI 渲染。
- MCP(Open Standard):开放标准,确保应用与 ChatGPT 的无缝集成,统一数据、工具与 UI 渲染接口。
- Agent Kit:完整的代理构建块集合,包括 Agent Builder、Chat Kit、Evals,以及数据连接和安全控件,帮助从原型到生产的迁移。
- Codex / GPT-5 Codex:专为编码协作设计的模型,现支持在多种开发环境中协同工作,具备更强的上下文感知与外部工具对接能力。
- Sora 2:视频生成模型,提供可控性强的画面输出和声音同步,适合创作者与内容生产场景。
- Real-time Mini:更小巧、成本更低的实时语音模型,降低语音交互的成本与门槛。
附:现场画面参考
- 开场致敬与里程碑展示(0:00 时截图):舞台上展示开发者在平台上的里程碑成就,强调这是一个“让开发者成为核心驱动”的时刻。

- App 生态与 Live Demo(2:19 时段截图):演示中展示了 ChatGPT 内部应用的实际工作方式与交互。

- Canva 与多模态演示的海报/幻灯片场景(15:47 时段截图):Canva 将海报转化为演示幻灯片的过程。

- Zillow 地图与房源体验(29:48 时段截图):地图嵌入对话中的交互式房源浏览。

- Codex 实时编码与控制演示(46:18 时段截图):Codex 与现场设备、控制面板的即时协作。

- Sora 2 与未来创作场景(51:01 时段截图):Sora 2、Real-time Mini 及未来创作能力的展望。

如果你正在规划利用 AI 加速产品落地,这场致辞提供了清晰的路线图与落地工具。Apps SDK、Agent Kit、Codex 及新模型共同构成了一个强大且不断扩展的生态,帮助开发者以更短的时间把创意变成可用的产品。未来你也可以通过参与预览、提供反馈,和社区一起推动这场 AI 架构的快速迭代。










