腾讯研究院AI速递 20250303
创始人
2025-03-03 07:23:56
0

生成式AI

一、 DeepSeek 开源周彩蛋,披露成本利润率!还有大量技术细节

2. 采用H800 GPU配置,根据负载差异动态调整节点数量,每台H800的prefill吞吐约73.7k tokens/s;

3. 应用大规模跨节点专家并行技术与双批次重叠处理策略,针对不同场景优化并行策略提高效率。

二、 腾讯直播谈最新快思考模型:API 成本只有 deepseek 不到一半

1. 腾讯发布快思考模型Turbo S,吐字速度提升一倍,首字时延降低44%,API成本仅为deepseek的1/2-1/4;

2. 采用创新Hybrid-Mamba-Transformer融合架构,降低计算复杂度和KV-Cache占用,实现成本下降;

3. 通过长短思维链融合技术,在保持快速响应的同时提升数学、代码等强推理任务表现。

三、 实测腾讯元宝电脑版:满血DeepSeek,装上就是AI PC

1. 腾讯元宝电脑版上线,内置自家混元大模型和满血版DeepSeek,支持深度思考和联网搜索功能;

2. 元宝电脑版特色是利用微信公众号资源进行搜索,支持多模态功能,可生成图片、解析截图和生成代码;

3. 元宝数据激增,APP单日下载突破50万,DAU超530万进入TOP3。Web端访问量跃升至第四。

四、 Meta无预警发布新一代AI眼镜,专为AI和机器人研究打造

1. Meta无预警发布第二代Aria智能眼镜(Aria Gen 2),专为AI和机器人研究人员打造,将向第三方科研人员开放使用;

2. 新眼镜升级传感器套件,鼻托处新增心率监测PPG传感器和接触式麦克风,支持全天候使用(主动使用6-8小时);

3. 集成多项本地化机器感知系统,包括SLAM空间定位技术,可在GPS信号薄弱环境实现自主建图与导航,已与Envision合作开发视障辅助功能。

五、 字节视频生成新突破!Phantom搞定多人物/主体一致性

1. 字节跳动推出主体一致性视频生成模型Phantom,突破性解决多主体一致性挑战,能同时保持多个主体的完整性特征;

2. 模型支持身份保持、单参考和多参考主体视频生成,可以精准抓取人物、动物、服装等关键特征,实现自然融合;

3. Phantom基于DiT架构,采用主体到视频(S2V)生成方案,通过文本-图片-视频三元组数据训练,平衡创造性和可控性。

六、 终于!AI语音不再"像AI"?Sesame的语音存在感突破

1. Sesame团队专注开发自然对话语音伴侣,致力于跨越语音助手的"恐怖谷",让AI声音更自然、富有情感;

2. 团队开发"对话语音模型"(CSM),将情感智能、对话节奏、情境意识和一致性格融入语音生成,使用变换器技术整合对话上下文;

3. CSM模型用百万小时英语音频训练,测试显示大模型生成的语音更接近真人,主观测试中在无上下文情况下人们难以分辨AI与真人声音。

前沿科技

七、 Meta把数字人成本打下来,普通人手机拍照即可生成3D数字人

1. Meta推出新技术Avat3r,仅需4张手机拍摄的面部照片,5分钟内即可生成可动的3D数字人模型;

2. 采用动态3D高斯重建模型+ViT视觉Transformer架构,结合DUSt3R和Sapiens技术,单块RTX3090显卡即可实现实时渲染;

3. 支持单图/画作/雕塑跨次元建模,通过FLAME面部编码和跨注意力层实现微表情捕捉,大幅降低数字人制作门槛。

报告观点

八、 GPT-4.5不如DeepSeek?OpenAI首席研究官正面回应

1. OpenAI发布GPT-4.5后遭遇"群嘲",不少用户认为其在某些方面不如DeepSeek,OpenAI首席研究官Mark Chen对此作出回应;

2. Chen解释OpenAI走两条技术路线:无监督学习(GPT-4.5)和推理(O1/3),两者互补而非对立,GPT-4.5在知识量和创意写作方面优于推理模型;

3. 关于DeepSeek高效率的专家混合模型(MoE),Chen表示OpenAI也在GPT-4.5中探索这一技术,并称"几乎所有大型语言模型都在使用它"。

九、 a16z报告:原生AI产品与业务外包模式存在根本性冲突

1. BPO市场规模庞大(2024年超3000亿美元),但现代AI技术已能高效处理传统外包工作,语音AI助手已具备大规模生产应用的成熟度;

2. 原生AI产品与BPO商业模式存在根本性冲突——BPO依赖"人力溢价",向AI转型将压缩利润率,对上市公司而言等同于"文化自杀";

3. AI创业窗口期有限,基础模型"平民化"后初创企业竞争优势将减弱,成功关键在于迅速将技术转化为客户锁定护城河。

十、 马斯克:5年内AI超越人类,2029年文明终结概率20%

1. 马斯克预测2029年AI将超越人类总智能,认为AI对人类文明有80%概率带来好处,但也有20%概率导致人类灭绝,并不会存在"中间状态";

2. 马斯克批评OpenAI背离初衷,从非营利开源变成追求最大利润的闭源组织,并质疑谷歌AI(如Gemini)存在价值观问题,未重视安全;

3. 谷歌联创谢尔盖·布林在内部备忘录中呼吁员工每周工作60小时并全勤到办公室,称"通往AGI的最后角逐已经开始"。

相关内容

聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
国泰海通:维持海外AI算力...
国泰海通维持海外AI 算力及应用产业链“增持”评级。其研报指出,O...
2026-06-01 00:54:38
AI图片 | 联村党委“一...
黔东南州雷山县达地水族乡推出联村党委“订单式”社会化服务机制,以党...
2026-06-01 00:52:51
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
科大讯飞进军AI眼镜,内置...
新京报贝壳财经讯(记者罗亦丹)5月28日,科大讯飞在澳门威尼斯人金...
2026-05-28 20:46:43
全球首次单机降服万亿巨模D...
从数学、代码、复杂推理,到多轮工具调用,大模型的很多能力的提升都离...
2026-05-28 20:34:56

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...