谷歌发布Pixel手机以及AI功能,xAI发布Grok-2 系列模型,这就是这周的AI大新闻!
创始人
2024-08-19 06:16:53
0

8.12~8.18,又是刺激的一周。

这周的AI大事件,就都在这里啦。

1.谷歌发布Pixel手机以及AI功能

链接:https://blog.google/products/platforms-devices/made-by-google-2024-collection/

谷歌上周集中发布了他们的24年硬件内容包括新的Pixel 9手机,Pixel 9 Pro Fold,Pixel Watch 3和Pixel Buds Pro 2。

同时出了硬件之外大部分的时间都是在讲AI跟硬件的结合,而且其中的重头戏Gemini live已经在美国开始推送了,而且新手机上立刻可用,在AI硬件的进度上安卓这次领先苹果不少。

主要的AI内容有:

  • Gemini升级推出Gemini Live,支持实时语音对话和摄像头视频沟通,而且跟系统内置APP深度打通,比如可以直接通过Gemini展示谷歌地图内容和记录Todo。
  • Pixel的摄影和视频加了AI功能,Add Me可以帮助你拍合照,支持20倍的AI变焦功能,MagicEditor支持用AI编辑你的照片,Auto Frame扩图可以重新构图照片。
  • Pixel Studio Al画图应用,imagen3模型驱动,可以通过输入提示词生成图片和编辑生成的图片。
  • 新的Pixel Weather应用程序使用AI来补充传统的天气报告,可以获得更准确的天气预报,比如雨何时开始和停止。
  • Keep支持让Gemini帮你创建列表比如一些事情的详细待办。
  • Pixel Screenshots支持帮你保存、组织和回忆你手机里面所有截图的信息,截图可检索这个太重要了,这是手机上最方便的记录形式。
  • 通话备注支持帮你整理和保存对话中的关键信息,激活的话通话的人会收到通知。
  • Pixel Watch 使用机器学习自动检测睡眠并开启睡眠模式。
  • Pixel Watch 3引入脉搏丢失检测功能,可以检测心脏突然停止跳动时发生的脉搏丧失事件。
  • Pixel Buds Pro 2耳机支持AI降噪技术,降噪幅度是上一代产品的两倍。
  • Pixel Buds Pro 2,可以在不拿出手机的情况下获得Gemini的帮助,Gemini可以在耳机里面跟你对话,这个在面试和演讲作弊很有用啊,户外没办法用手机的场景也很有用。

2.xAI发布Grok-2 系列模型

链接:https://x.ai/blog/grok-2

老马的XAI发布Grok-2 Beta版本。在LMSYS的成绩超过了Claude 3.5Sonnet和GPT-4-Turbo。

Grok-2和Grok-2 mini目前在X上测试,这个月可以通过API使用。

X上的Grok界面也获得了更新,X Premium和Premium+用户都可以访问新模型。图片生成能力用的最近非常火的FLUX图像生成模型。

XAI还说他们内容使用类似LMSYS的流程来对模型进行评估,在每次互动中,AI导师模型会看到Grok生成的两个回应。根据指南中概述的具体标准选择更优秀的回应。专注于评估模型在两个关键领域的能力:遵循指示和提供准确的事实信息。

Grok-2在推理检索内容和工具使用能力方面显示出显著改进,例如正确识别缺失信息、推理事件序列以及丢弃无关的帖子。

这一点在结合推特内容分析上明显变好了,你可以让Grok分析你的内容以及互动来改善账号的运营情况。

他们下一步将会发布Grok多模态模型的预览。

3.Genie:新的世界最强AI编程Agent产品

链接:https://cosine.sh/blog/genie-technical-report

Genie宣布自己打造出了世界上最强的AI编程Agents产品。在SWE-Bench评估中获得了30.08%的分数,在SWE-Lite中获得了50.67%。可以完美模拟人类工程师的认知过程、逻辑和工作流程。

Genie的设计目标是使其具有“自主性”,能够根据所见内容逻辑行动。为了实现这一点,数据集需要能够代表这种逻辑行动,包括在未知代码库中找到执行任务所需的先决信息。

Genie的推理特性包括规划、检索、编写和运行代码四个主要过程,通过模拟人类的行为而非基础语言模型的行为,从而实现了更高的性能。

Genie的训练中还采用了自我改进的方法,通过使用模型自身生成的数据来提高性能,这种方法使得模型在面对错误时的反应能力得到了显著提升。

4.The Al Scientist:可以进行自主科学发现和论文撰写的Agents

链接:https://sakana.ai/ai-scientist/

Sakana Al 宣布开发了一个名为“The Al Scientist”的系统,它能够自动化地进行科学发现过程。

包括自动生成研究想法、编写代码、执行实验、总结实验结果、生成图表、撰写科学论文,并且还能进行自动化的同行评审。该系统能够在大约15美元的成本内完成每篇论文的生成,尽管当前版本的论文可能存在一些缺陷,但已经能够达到顶级机器学习会议的“弱接受”标准。

该系统的创新之处在于它能够在不断迭代的过程中,利用先前的想法和反馈来改进新一代的研究想法,从而模仿人类科学社区的行为。

The Al Scientist 已经在机器学习领域的多个子领域进行了研究,包括扩散模型、transformers和grokking,并发现了新的贡献。

这里是The Al Scientist 自动生成的完整论文:

https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf

The Al Scientist 生成内容主要包括四个过程:

  • 创意生成。给定一个起始模板,AI科学家首先“脑力激荡”出一系列新颖的研究方向。
  • 实验迭代。给定一个想法和一个模板,AI科学家的第二阶段首先执行提出的实验,然后获得并生成图表以可视化其结果。
  • 论文写作。最后,AI科学家以LaTeX标准机器学习会议论文的风格,撰写了简洁而富有信息的进展报告。
  • 自动论文审阅。这项工作的关键方面是开发一个自动LLM驱动的审阅者,能够以接近人类准确度评估生成的论文。

其他动态 ✦

1.Anthropic API 推出提示缓存功能,输入成本降低90%,并将延迟降低80%。

https://x.com/alexalbert__/status/1823751966893465630

2.InstantX发布了FLUX的UnionControlnet模型。这一个模型集合了Canny、Depth、Pose、Tile等多个Controlnet 模型。

https://huggingface.co/InstantX/FLUX.1-dev-Controlnet-Union-alpha

3.DeepSeek 开源数学定理证明模型Prover-V1.5,通过构建类似AlphaGo的封闭图学习环境,在高中和大学的数学定理测试中都获得了非常好的结果。

https://mp.weixin.qq.com/s/O4aC9dvJC30sfSQyYgbcow

4.Midjourney网页版终于修复了稀烂的图像编辑功能。局部重绘加上更改图像比例以及提示词编辑都融合到了一个新的界面中。

5.Gen-3 Alpha Turbo模型正式开放给所有用户使用,生成速度可提高7倍,价格仅为原版 Gen-3 Alpha的一半。

https://x.com/runwayml/status/1824070782768529629

6.Synclabs 发布他们的新版唇形同步模型lipsync-1.7.1,牙齿和嘴型极其精准,英文效果比中文好。不足是嘴部清晰度低,如果原视频清晰度本身很高的话,割裂感很重。

https://x.com/synclabs_so/status/1805649915030421995

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:歸藏

>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com

相关内容

高玩发布任天堂经典主机Wi...
日前有高玩在著名开源站上发布了关于任天堂经典主机Wii魔改版,尺寸...
2025-07-10 16:12:19
OpenAI的开源语言模型...
据报道,OpenAI的开源语言模型即将发布。
2025-07-10 15:12:37
中国电信刘桂清:拥抱AI,...
瑞士时间7月9日,人工智能向善全球峰会(AI for Good S...
2025-07-10 11:12:36
原创 ...
国行苹果的AI功能要凉了!这可能是最近这两天听到讨论最多的内容。至...
2025-07-09 22:13:44
AI商用:阿里云和火山云的...
7月9日,2025阿里云中企出海峰会上,Vidu、Question...
2025-07-09 22:13:29
快手张迪:AI将进一步拓展...
日前,在2025全球数字经济大会“人工智能融合应用发展论坛”上,快...
2025-07-09 22:13:24

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...