腾讯研究院AI速递 20251219_linux资讯

创始人

2025-12-19 06:16:03

0次

生成式AI

一、谷歌联手Meta让TPU支持PyTorch，挑战CUDA护城河？

1. 谷歌推进代号"TorchTPU"战略行动，让PyTorch在TPU芯片上流畅运行，消除开发者迁移门槛，并考虑将部分软件开源；

2. 谷歌与Meta商讨合作协议，让Meta获得更多TPU使用权，Meta通过推动软件适配TPU降低推理成本并减少对英伟达依赖；

3. 华尔街分析师认为CUDA是英伟达最坚固盾牌，谷歌过去依赖内部Jax框架"圈地自萌"拉大了与外部客户实际使用习惯的鸿沟。

二、ChatGPT 版应用商店正式上线，通过「@ 应用名」触发

1. ChatGPT应用商店正式推出，按精选、生活方式、工作效率等分类列出Adobe Photoshop、Canva、Figma等应用，用户通过"@应用名"触发；

2. 开发者可在OpenAI开发者平台提交应用审核发布，OpenAI提供完整资源体系包括最佳实践指南、开源示例应用、UI库和测试阶段的Apps SDK；

3. OpenAI计划以约7500亿美元估值筹集新一轮资金，最高可能达1000亿美元，试图在AI时代复刻苹果App Store玩法。

三、Google 发布了高速、低成本模型 Gemini 3 Flash卷应用

1. Google发布Gemini 3 Flash作为今年收官之作，基准测试中Humanity's Last Exam得分33.7%（Gemini 3 Pro为37.5%，GPT-5.2为34.5%）；

2. 该模型延续Flash系列极致原生速度，性能超越Gemini 2.5 Pro的同时速度提升3倍，定价为输入每百万token 0.50美元、输出3美元；

3. Gemini 3 Flash已成为Gemini应用和搜索AI模式默认模型，响应速度基本在1秒以内，通过Google AI Studio、Vertex AI等渠道全球开放。

四、字节推出了通用 Agent 模型 Seed1.8，面向复杂工作流

1. 字节发布通用Agent模型Seed1.8，集搜索、代码与GUI Agent能力，支持三种思考模式根据任务复杂度自动调整处理方式；

2. 在GUI Agent评测中超越Seed1.5-VL，在电脑、网页、移动端三类环境中展现多步任务可靠性，BrowseComp-en基准测试得分67.6；

3. ZeroBench获11.0最高分，VideoMME长视频理解得87.8分，加入"VideoCut"视频工具调用能力。

五、限时免费，阶跃星辰 GUI Agent 全面升级，技术全公开

1. 阶跃星辰Step-GUI云端模型全量上新，支持200+任务场景、手机PC汽车多端可用，最短10分钟部署一台"AI手机"；

2. 该模型具备更长推理步骤、更强语义理解和泛化能力，当用户指令模糊不足以支撑任务执行时会自主提问；

3. 开放GUI-MCP协议实现端云协同，API限时免费开放，技术报告全公开，发起"星际探索官"召集令邀请用户创作showcase和二次开发应用。

六、Grok Voice Agent API发布：实时语音、可配置人格

1. xAI正式发布Grok Voice Agent API，首次将Grok实时语音能力以API形式向开发者开放，面向语音优先应用场景；

2. 内置Sal、Rex、Eve、Leo等多种声音，支持Mika、Valentin等陪伴型人格，开发者可精细化控制系统指令和行为参数；

前沿科技

七、曝苹果放弃VR头显，转向AI眼镜！附未来两年产品图

1. MacRumors曝光苹果未来2年产品路线图共39款产品，折叠iPhone将于2026年9月发布采用书页式设计，iPhone 18推迟至2027年；

2. 苹果全面暂停AR/VR头显项目转而专注AI智能眼镜开发，预计2027年或2026年底推出，停售4年多的iMac Pro或将于2026年回归搭载M5 Max芯片；

3. 2027年推出20周年纪念版iPhone，采用前后壳体弯曲包裹设备边缘设计，前置摄像头移至屏下，成为没有显示屏开孔的iPhone。

报告观点

八、a16z：只有当投入打水漂才能确认AI泡沫，这尚未发生

1. a16z合伙人认为现在不是泡沫因为它还没破，企业若停止开发更大模型只靠现有模型运营按当前利润率很快就能实现盈利；

Agent Meta 速递苹果模型 Pro 支持 Gemini 任务应用谷歌