生成式AI
一、 DeepSeek V3/R1满血版低成本监督微调秘籍,4万GitHub Star
1. Colossal-AI发布开源工具箱,支持DeepSeek V3/R1等大模型的低成本微调和训练加速;
2. 通过LoRA等优化技术,将671B参数模型训练的硬件需求降低近10倍,支持多种硬件平台;
3. 提供完整的强化学习工具链和灵活的训练配置接口,包含PPO、GRPO等算法实现。
二、 撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA
1. MoBA通过将MoE原理应用于注意力机制,采用块稀疏注意力和无参数门控机制,实现了对长序列的高效处理;
2. 实验表明MoBA性能与完全注意力机制相当,在处理1M token时速度提升6.5倍,具有良好的扩展性;
3. 月之暗面开源的MoBA已经过一年实际部署验证,支持完全注意力与稀疏注意力的无缝切换,且代码可用性强。
三、 全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
1. OpenAI推出SWE-Lancer基准测试,从Upwork平台精选1400多个真实软件工程任务,总价值达100万美元,采用端到端测试评估AI编程能力;
2. 测试包含个人贡献者任务和软件经理任务两大类,前者评估代码实现能力,后者考验技术判断和决策能力;
3. Claude 3.5 Sonnet在所有测试模型中表现最佳,在完整数据集上"赚取"超40万美元,但通过率仍有较大提升空间。
四、 OpenAI前CTO新公司:北大校友翁荔加盟,2/3来自OpenAI
1. OpenAI前CTO Mira Murati等多位ChatGPT核心成员组建新公司Thinking Machines Lab,团队成员来自OpenAI、Meta、Character.ai等顶级AI公司;
2. 新公司将专注三大核心基础:SOTA模型智能、高质量基础设施和先进的多模态能力,承诺通过论文和代码开放研究成果;
3. 核心团队阵容豪华,包括PPO算法创始人John Schulman任首席科学家、翁荔等30多位AI领域顶尖专家。
五、 曾爆火Ai Pin,ChatGPT版iPhone终结,惠普1.16亿美元接盘
1. AI硬件Ai Pin被惠普以1.16亿美元收购,主要获取其AI驱动平台Cosmos及300多项专利技术,用于打造新一代智能设备生态;
2. Ai Pin自上市以来表现惨淡,2024年5-8月退货量超过销量,累计销售额仅900万美元,用户持有量跌至7000台;
3. 这家由前苹果设计师创办、获奥特曼投资的公司,将并入惠普新部门,负责PC、打印机和智能会议室的AI技术整合。
前沿科技
六、 宇树机器人跳舞被疑AI合成,王兴兴小红书重发新视频自证
1. 宇树G1机器人舞蹈视频效果太过逼真被疑是AI合成,CEO王兴兴发布带镜子的无BGM实拍视频作为反驳;
2. 即便有实拍证明,小红书平台仍给视频打上"疑似包含AI创作信息"的标签,显示真假难辨;
3. 宇树机器人动作自然程度已接近人类,从走路、跑步到舞蹈,每次发布新视频都会引发网友质疑其真实性。
七、 中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
1. 南方科技大学薛其坤院士团队在Nature发表高温超导新突破,首次让镍基化合物超导转变温度达到45K,突破麦克米兰极限;
2. 团队自研强氧化原子逐层外延技术,实现了在纳米尺度精确控制材料生长,成功制备出高质量La2.85Pr0.15Ni2O7超导薄膜;
3. 该研究由平均年龄仅28岁的年轻团队完成,35岁的陈卓昱副教授与薛其坤院士共同领衔,展现出新生代科研力量。
八、 刚刚,「诺奖风向标」2025年斯隆奖出炉:28位华人学者获奖
1. 2025年斯隆研究奖名单出炉,共126位获奖者中华人学者占28位,比例达22.2%,每人获得75000美元研究资助;
2. 计算机科学领域表现尤为突出,22位获奖者中8位为华人学者,占比高达36.4%,展现了华人在该领域的学术实力;
3. 斯隆研究奖作为"诺奖风向标",历史上已有58位获奖者后获诺贝尔奖,17位获菲尔兹奖,体现其在发掘优秀早期职业科学家方面的重要性。
报告观点
九、 a16z 联合创始人:DeepSeek、宇树和 AI 影响下的权力结构
1. Marc Andreessen认为DeepSeek开源模型将使AI成本降低30倍,推动行业爆发式增长,但开源与闭源模型公司将在竞争中各有优势;
2. 机器人是继手机、无人机、汽车之后的中国产业升级第四阶段,宇树科技等厂商依托深圳供应链生态系统,可能在价格和创新上领先;
3. 面对全球权力结构重组,马克认为当前是精英与反精英阶层的博弈,科技创新需要在技术变革、社会变革、金融与政策四条主线中寻求平衡。