长江证券:OpenAI推出API新功能“结构化输出”,国内厂商发力开源多模态
创始人
2024-08-13 13:11:33
0

智通财经APP获悉,长江证券发布研报认为,OpenAI新推出的模型API全部支持结构化输出,提高AI输出可靠性,简化开发流程,从而使得开发者可以精确控制AI模型的输出格式,确保数据的准确性和一致性。国内厂商推动多模态大模型开源,或将加速AI技术的创新和发展。

事件描述

OpenAI新推出的模型API全部支持结构化输出,JSON Schema匹配率高达100%,从而使得开发者可以精确控制AI模型的输出格式,确保数据的准确性和一致性。国内厂商推动多模态大模型开源,智谱CogVideoX-2B、面壁智能MiniCPM-V2.6、阿里Qwen2-Audio相继开源,或将加速AI技术的创新和发展。

事件评论

结构化输出提高AI输出可靠性,简化开发流程。1)提升输出准确性,使用性价比凸显。性能方面,开发者可通过定义JSON Schema模式,实现对AI输出的精确控制,解决以往AI输出格式不稳定的问题。带有结构化输出的新模型gpt-4o-2024-08-06对复杂的JSON Schema的跟踪评估中,评分高达100%,显著优于旧版模型。此外结构化输出功能兼容多种API,并支持视觉输入,拓宽AI技术的应用范围。成本方面,最新的gpt-4o-2024-08-06模型与此前的gpt-4o-2024-05-13相比,可在输入上节省50%(2.5美元/100万输入tokens)、在输出上节省33%(10美元/100万输出tokens)。2)降低技术门槛,提供个性化智能体验。结构化输出功能的应用范围广泛,从动态生成用户界面、分离最终答案与推理过程,到从非结构化数据中提取结构化数据等,均能够提供更加精准、高效的支持。例如在.NET开发中,开发者可利用该功能生成动态用户界面,根据用户意图创建代码或UI;或在会议记录中提取待办事项、截止日期和负责人等。结构化输出功能简化了AI应用的开发流程,使开发者能够更专注于创新和应用逻辑的构建。

开源模式持续发展,推进技术普及与应用创新。1)智谱开源其与“清影”同源的视频生成模型CogVideoX,消费级显卡即可运行。目前开源的版本CogVideoX-2B能够生成长度为6秒、每秒8帧、分辨率为720*480的视频。同时模型在FP-16精度下推理需要仅需18GB显存,微调仅需40GB显存。因此单张4090显卡即可进行推理,而单张A6000显卡即可完成微调。2)面壁智能上线开源模型MiniCPM-V2.6,引领端侧多模态。模型参数仅8B,在端侧实现实时视频理解、多图联合理解、多图ICL视觉类比学习、多图OCR等功能。模型能力方面,MiniCPM-V2.6在端侧实现单图、多图、视频理解等多模态核心能力全面对标GPT-4V。3)阿里开源最新语音模型Qwen2-Audio,性能大幅优化。功能方面,Qwen2-Audio支持语音聊天和音频分析两种模式,能够提供更自然的语音交互体验和深入的音频分析能力;模型还引入了监督式微调(SFT)和直接偏好优化(DPO)两种方法,能够通过高质量的微调数据与人类意图对齐,并通过人类标注的响应数据来优化模型,从而使其输出更符合人类的期望和偏好。同时Qwen2-Audio支持中文、粤语、法语、英语、日语等主流语言和方言,或将有助于开发翻译、情感分析等应用。

I技术的进步提升了输出的准确性和开发效率,开源模式的推广加速了技术的普及和创新应用的涌现。长江证券认为AI技术及应用领域持续突破,建议持续关注AI在广告、电商、影视、游戏和教育等各领域的商业化落地。

风险提示

1、AI技术发展不及预期风险;

2、内容监管风险。

来源:智通财经网

相关内容

微信原生AI助手“小微”灰...
目前该功能仍在小范围内测中,若未获得内测名额,建议您后续留意版本更...
2026-06-20 18:27:04
原创 ...
目前 iOS 微信又上线了新功能:小微。 我们进入微信主界面,之前...
2026-06-20 18:26:20
亚马逊开源感知智能体工具:...
今天,亚马逊 AGI 实验室宣布开源发布感知智能体工具套件的首批两...
2026-06-20 18:24:17
聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
国泰海通:维持海外AI算力...
国泰海通维持海外AI 算力及应用产业链“增持”评级。其研报指出,O...
2026-06-01 00:54:38
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...