腾讯研究院AI速递 20241104
创始人
2024-11-04 06:32:55
0

生成式AI

一、 o1满血版泄露!奥数题图片推理轻松搞定,奥特曼上线剧透o2

1. OpenAI泄露了完整版o1,用户可以通过官网体验其功能;

2. 泄露模型展示了强大的图像推理能力,能处理复杂的数学题;

3. 有网友认为此次泄露可能是故意策划的,旨在为即将发布的模型制造预期。

https://mp.weixin.qq.com/s/hzXIVc0wYJV3mOaAE8H-tA

1. Anthropic公司推出的Claude AI助手更新增强了对PDF文档中图片和表格的分析能力;

3. Claude在数据分析、文献研究和财报分析等领域提供了多种实用应用场景,帮助用户提取和分析信息。

https://mp.weixin.qq.com/s/bprok6HQhcPi225LYZNNvQ

三、 全球首款AI游戏,无需游戏引擎,视频模型直出「我的世界」

1. 初创公司Decart和Etched推出Oasis,全球首款无需游戏引擎的实时可玩AI游戏模型;

2. Oasis通过数百万小时的游戏视频训练,能够实时生成开放世界游戏并支持多种玩家操作;

3. 新模型利用Transformer架构和Etched的Sohu芯片,提供高效的视频生成能力,未来有潜力在交互式视频领域引领创新。

https://mp.weixin.qq.com/s/GSf5vr1oUYTcvM6PLaxTPg

四、 Runway Gen-3 Alpha Turbo:AI视频摄像机控制,创意无限!

1. Runway推出的Gen-3 Alpha Turbo模型提升了AI视频生成的保真度和一致性,并增加了先进的摄像机控制功能;

2. 用户能够精确控制摄像机运动,实现平滑环绕和戏剧性变焦,创造沉浸式观影体验;

3. Gen-3 Alpha Turbo支持动态控制和行业定制化,满足特定艺术和叙事需求,为视频创作者提供无限创意空间。

https://mp.weixin.qq.com/s/u_P5R_o3_scdIyw-NdDyTQ

五、 Suno AI音乐平台推出了Personas的突破性功能:固定风格

1. Suno AI推出Personas功能,允许用户提取和复用歌曲的声乐风格、情感和音乐特点,增强个性化创作;

2. 用户可以创建公开或私密的Persona模板,促进音乐创作的社交价值,增加互动;

3. 该功能简化创作流程,使用户能快速生成具有个人特色的音乐作品,目前向专业版和高级会员开放。

https://mp.weixin.qq.com/s/Pc5MBoE_qxuxFjd0zggNOw

六、 3D建模标杆Autodesk收购的Wonder Dynamics发布AI工具

1. Wonder Dynamics推出Wonder Animation技术,能将视频一键转化为可编辑的3D场景,简化动画制作流程;

2. 新工具支持多摄像机拍摄,实时估计角色动作,提高动画制作的灵活性和效率;

3. 该技术不依赖传统动作捕捉设备,利用AI进行运动捕捉,增强小型工作室和独立开发者的创作能力。

https://mp.weixin.qq.com/s/0NaI9HWYN39Ni4OyTcMc_g

七、 D-ID发布两款数字人工具Express和Premium+,生产力UP

1. D-ID推出Express和Premium+两款虚拟人工具,帮助企业在营销、销售和客户支持等领域提升交互效果;

2. Express虚拟人仅需一分钟训练,支持头部动作同步,适合快速生成内容;Premium+需五分钟训练,支持更复杂的肢体动作,提供更高的真实感;

3. 新工具具有个性化、便捷性和经济高效等特点,支持多语言和大规模内容创作,提升品牌参与感和转化率。

https://mp.weixin.qq.com/s/df_vmxrglglvSP5hYjil-g

八、 精准狙击!ChatGPT搜索前1分钟,谷歌宣布了自家AI搜索

1. ChatGPT正式推出搜索功能,允许用户通过自然语言查询实时信息,并提供参考链接,标志着AI搜索的新时代;

2. 同时,谷歌也发布了自家的AI搜索功能,名为Grounding,强调实时更新和准确性,双方在AI搜索领域展开激烈竞争;

3. 新功能使用户能快速获取全面的信息,同时改善了搜索体验,但仍存在内容质量不稳定和幻觉等问题。

https://mp.weixin.qq.com/s/5ATeCL99oEdR3UkV7qqKow

前沿科技

九、 2mm芯片植入视网膜,盲人重获阅读能力,马斯克老部下创业

1. 由马斯克前部下创立的Science公司开发了一款2mm的视网膜植入芯片PRIMA,使盲人能够恢复部分视力,重新获得阅读和辨别面孔的能力;

2. PRIMA通过与带摄像头的眼镜配合使用,利用红外光将视觉信息转换为电信号,但患者所看到的图像与正常视力存在差异;

3. 初步临床试验结果显示,患者视力显著提高,使用植入物后可在视力表上平均多看清五行,表明该技术具有良好的安全性和应用前景。

https://mp.weixin.qq.com/s/uhjLXCpuZMhkF3GSlrK_QA

报告观点

十、 OpenAI华人科学家翁荔:如何培养出下一代聪明且安全的AI

1. OpenAI研究副总裁翁荔强调,AI的安全性是其智能化与自主化发展的基础,确保其符合人类价值观至关重要;

2. 通过提供多样、准确的数据和基于人类反馈的强化学习(RLHF),可以减少AI的偏见,提升其输出质量;

3. AI安全不仅是研究者的责任,公众的参与同样重要,社区共同努力可以塑造一个安全、可靠的AI环境。

https://mp.weixin.qq.com/s/IFINmOlRE1kOeNZY1BINOQ

十一、 Altman 携高管「回答一切」,Reddit的AMA,Ask Me Anything

1. Sam Altman表示AGI可在现有硬件上实现,Ilya对未来的洞察力至关重要;

2. 预计到2025年,ChatGPT将能独立执行任务,AI产品线将迎来重大突破;

3. LLM架构的突破可能推动AGI的发展,所有LLM基准测试将在2025年前趋于饱和。

https://mp.weixin.qq.com/s/_-7zn3h_6Np1H5lXS5906g

相关内容

“AI搜索功能很强大,但我...
这要命的幻觉率! 听筒Tech(ID:tingtongtech)原...
2025-07-04 21:42:16
拥抱AI:开放与理性|如何...
7月4日,2025亚布力论坛第十一届创新年会在浙江杭州圆满举行。在...
2025-07-04 21:42:04
卓易信息:通过多智能体协作...
证券之星消息,卓易信息(688258)07月04日在投资者关系平台...
2025-07-04 18:13:00
马克·库班预言:AI将催生...
人工智能技术的飞速发展正在重塑全球财富格局。美国知名投资人马克·库...
2025-07-04 16:42:00
AI+将给汽车产业打开什么...
作者 / 路 行 编辑 / 黄大路 设计 / 柴文静 编者按: ...
2025-07-04 16:41:55
锐捷网络:推出"...
金融界7月4日消息,有投资者在互动平台向锐捷网络提问:董秘你好,请...
2025-07-04 16:13:30

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...