腾讯研究院AI速递 20250210
创始人
2025-02-10 08:17:46
0

生成式AI

一、 推理和RL加速GPT-5到来?奥特曼公开GPT-4.5已就绪

1. GPT-4.5已在OpenAI内部实现,通过推理模型和强化学习技术突破,GPT-5.5不需100倍算力即可达成;

2. OpenAI计划年底推出除科学发现外所有高难度任务都能解决的全自主智能体,支持多模态输入和互联网访问;

3. 奥特曼预测2035年单个数据中心的AI算力将超过当前地球总智力容量,但强调人类本质不会改变,工作形态会改变。

二、 DeepMind祭出神经网络与符号AI融合新招AlphaGeometry2

1. DeepMind发布AlphaGeometry2系统,成功解决过去25年IMO中84%的几何题,超越数学奥赛金牌得主平均水平;

2. 该系统结合神经网络(Gemini模型)与符号AI的混合架构,实现了更强大的数学推理能力,而OpenAI的o1推理模型未能解出任何题目;

3. DeepMind通过自创3亿个定理和证明的合成数据集突破训练数据稀缺问题,但系统仍存在无法处理点数可变等技术限制。

三、 被 DeepSeek 抢的风头,OpenAI 决定在「审美」上找回来

1. OpenAI进行全面品牌重塑,更换新字体、新标志和新配色,推出专属OpenAI Sans字体和"情绪点"动态设计,目标是展现更统一和人性化的品牌形象;

2. 新Logo在原"花朵"基础上优化为更规整的"生命之种",新字体以圆为设计核心,特意在完美圆形中加入不规则设计,以体现人性化理念;

3. 这次品牌重构主要依靠人工设计而非AI,整体设计传递"人工智能应增强而非取代人类创造力"的理念。

四、 开源LLM微调神器Unsloth,7GB GPU体验啊哈时刻?

1. 开源项目Unsloth AI实现重大突破,通过优化GRPO训练方法,将内存使用减少80%,让7GB显存GPU就能本地运行DeepSeek-R1级别的推理模型;

2. Unsloth实现了与vLLM的深度整合,可将模型吞吐量提升20倍,同时仅需一半VRAM,使单张48GB GPU就能微调Llama 3.3 70B;

3. 该项目在GitHub获2万多星,其核心团队仅由两兄弟组成,成功大幅降低了AI推理模型的部署门槛。

五、 OpenAI或正在内测Sora图像生成器,代号「papaya」

1. OpenAI正在内部测试Sora的图像生成功能,包括视频和图像生成切换按钮,视频推送将分为"Best"和"Top"两个类别;

2. 新增的图像生成功能代号为"papaya",可能由现有"sora-turbo"模型驱动,而非DALL-E 4;

3. 内测版Sora界面出现"Images Internal"类别,暗示即将推出独立的图片生成和展示功能。

前沿科技

六、 苹果机器人新突破:机器人“灵动”手势,和人类一样有魅力

1. 苹果AIML研究团队提出EMOTION框架,结合大语言模型和视觉语言模型,让机器人能生成自然且符合情境的手势动作;

2. EMOTION通过"上下文学习"理解情境,并通过人类反馈不断优化手势表现,实验显示机器人手势与人类手势在自然性和可理解性上差异不大;

3. 该技术目前仍面临硬件限制、动作流畅度和计算时间等挑战,初始动作序列生成需要24-33秒。

七、 AI又一突破!解码人类思想,脑损伤患者能实现“无障碍”交流了?

1. Meta发布两项重磅脑机接口研究,其AI模型能通过非侵入式方法解码多达80%的大脑语言信号,最佳参与者的错误率仅19%;

2. 研究采用MEG和EEG技术记录大脑活动,并开发Brain2Qwerty深度学习架构进行解码,性能比传统方法提升1.14-2.25倍;

3. 研究揭示大脑语言生成遵循层次化过程,从上下文到词汇、音节和字母,但该技术仍存在实时解码和应用场景等局限性。

报告观点

八、 云、芯片、软件、汽车、手机都接入DeepSeek 到底接了什么?

1. 英伟达、AMD、英特尔等芯片厂商纷纷宣布适配DeepSeek,但由于芯片架构差异,需要开发额外软件和算法实现适配,英伟达凭借CUDA生态优势率先在NIM上线;

2. 国内外主流云计算服务商相继提供DeepSeek模型部署工具和API服务,通过降低企业使用门槛来扩大市场份额,部分还开发了基于DeepSeek的增值服务;

3. 手机、汽车等终端厂商虽声称接入DeepSeek,但因原版模型参数量过大(6710亿),实际只能使用15亿、70亿参数的小型版本,性能与原版存在较大差距。

九、 DeepSeek是否有国运级创新?2万字硬核分析V3/R1的架构

1. DeepSeek通过MLA(多头潜注意力)和改进版MoE架构实现重大突破,将模型计算效率提升约10倍,并在AI基础设施层面实现了接近GPU性能上限的优化;

2. DeepSeek的R1模型首次证实推理能力可通过纯强化学习训练(R1-Zero),无需人工标注数据,为未来AI超越人类思维上限提供了新的可能路径;

3. 尽管DeepSeek的创新意义重大,但媒体过度炒作其打破CUDA垄断、引发英伟达市值大跌等说法并不准确,其技术仍在英伟达GPU生态内优化,属于软件层面的Scale-up。

十、 DeepSeek的创新源于芯片封锁,Anthropic或成最大输家?

1. DeepSeek的成功源于被迫创新:面对H800算力受限,通过MLA和MoE等架构创新实现了效率突破,训练成本称仅为557.6万美元,证明封锁反而促进了技术进步;

2. DeepSeek的出现对美国影响深远:挑战了美国芯片封锁战略,暴露出"通过封锁过去创新来竞争"的局限性,且可能加速中国AI创新发展;

3. 对AI产业格局的影响复杂:OpenAI可保持消费级优势,但Anthropic损失最大;对大科技公司长期有利,因为AI成本降低扩大了应用场景。

相关内容

前海开源深圳特区精选股票A...
金融界2025年7月6日消息,前海开源深圳特区精选股票A(0117...
2025-07-06 12:44:29
雷鸟 V3 拍摄眼镜夏季更...
IT之家 7 月 6 日消息,RayNeo 雷鸟创新官方微博昨日宣...
2025-07-06 09:41:27
智能门锁预算3500元+用...
快科技7月5日消息,随着物联网与人工智能技术的迭代,智能门锁市场渗...
2025-07-05 21:13:22
约翰斯·霍普金斯大学研发新...
IT之家 7 月 5 日消息,据新华社今日报道,美国约翰斯・霍普金...
2025-07-05 21:12:58
钢材产量同比增长2.1%!...
记者今天从中国钢铁工业协会了解到,1—5月,在政策利好、原燃料价格...
2025-07-05 18:43:20

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...