开源日报 | 微软开源GraphRAG;AI不仅仅是大模型;开源TTS接近人类水平;中国寻求人类“开源”新方式;WSL2升级内核
创始人
2024-07-22 23:13:18
0

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.7.3省流概览

-Fedora 41 要和 Python 2.7 说再见

-WSL2 过渡至 Linux 6.6 LTS 内核

-科技巨头的开源 AI 模型是 “假开源”

-微软开源基于图的 RAG 系统:GraphRAG

-开源语音模型接近人类水平

-大模型吞了谁?程序员彷徨,产品经理消失

-太空探索,中国寻求人类“开源”新方式

-码农们的 AI 焦虑:交 15 万元上班,不卷就被 “毕业”

今日要闻

Fedora 41 要和 Python 2.7 说再见

红帽工程师 Miro Hrončok 提交了一份变更提案,建议在 Fedora 41 中退役 Python 2.7,并放弃仍然依赖 Python 2 的软件包。

Python 2 已于 2020 年 1 月 1 日退出生命周期,CentOS 7 也已退出生命周期,RHEL 8 的 Python 2.7 应用程序支持也将退出,红帽开发人员认为现在是时候从 Fedora 中移除 Python 2.7 软件包了。除了 PyPy 之外,Fedora 将不再支持 Python 2。

微软 WSL2 过渡至 Linux 6.6 LTS 内核

一直以来,微软 Windows Subsystem for Linux 2(WSL2)的内核使用的都是 Linux 5.15 LTS 内核。现如今,它终于从那个已经老化了的 LTS 版本升级到了当前的 Linux 6.6 LTS 系列。

日前发布的 linux-msft-wsl-6.6.36.3 内核是第一个使用 Linux 6.6.36 作为基础的 WSL2 内核。除了升级内核版本外,还对 x86_64/ARM64 内核配置进行了修改,包括支持可加载模块。

科技巨头的开源 AI 模型是 “假开源”

《Nature》的一篇报道指出,很多科技巨头宣称他们的 AI 模型是开源的,但实际上并不完全透明。这些模型的数据和训练方法往往没有公开,这种做法被称为 “开源洗白”,严重妨碍了科学研究的可复现性和创新。

研究发现,在资源有限的情况下,小公司和研究团队往往能做到更加透明和开放。真正的开源应该包括代码、数据和训练方法的全面公开。

微软基于图的检索增强型生成(RAG)系统,GraphRAG,开源了!

GraphRAG 通过创建知识图谱来增强模型的推理和生成性能,使用 LLM GPT-4 对 GraphRAG 和传统 RAG 进行评估, GraphRAG 在全面性和多样性方面优于传统 RAG。

与使用纯文本片段的简单语义搜索不同,GraphRAG 从原始文本中提取知识图谱、构建知识模块结构、生成摘要,帮助大模型更好地捕捉文本中的复杂联系和交互,来增强其生成、检索等能力。

今日观察社交观察

开源语音模型接近人类水平

Fish Speech 是一款已经开源的文本到语音(TTS)模型。

这个模型使用了三语数据进行训练,经过约 15 万小时语音数据的锤炼,Fish Speech 的语音处理能力已接近人类水平,并且可以完美支持中英日文三种语言,目前它在 Github 上的标星数已达 2.9k!

- 微博量子位

腾讯的多智能体翻译工具免费在线试用

腾讯的多智能体翻译工具已经可以免费在线试用了,而且是使用的 GPT-4 的 API,你可以上传 txt 或者 pdf 文件,然后会自动帮你翻译,并且整个过程都可以从右边的 Chatbox 看到。

注意上传后要手动选一下目标语言。使用地址:transagents.ai

- 微博宝玉xp

对话腾讯汤道生:AI 不仅仅是大模型

过去 1 年,腾讯集团高层间,新增了一个重要的企业微信群聊。腾讯公司董事会主席兼 CEO 马化腾、总裁刘炽平、高级执行副总裁卢山和汤道生等,悉数进入该群。这个群专门针对大模型技术变革,用于分享和讨论最新前沿并跟进业务进展。

很多人说,对大模型,腾讯 “不着急”。对此,汤道生表达了不同看法:“着急啊。我们在群里经常讨论,不能说不着急。”

在汤道生看来,对于腾讯这样体量的公司,资源上必须确保投入和跟进,做 “类 OpenAI” 的研究与研发;但同时也要保持清醒,“不要把 AI 等同于大模型,要看得更全面”。

“不是只有做大模型的玩家才是做 AI。这就等于认为,只有做手机的企业才在移动时代重要,是很狭隘的。” 他说。

-腾讯新闻《潜望》

结合开源图片与相关视频,天龙三这事大概能明晰了

火箭箭体及试车从设计到最后试车方案签字,中间理应经过多个部门间的协同与数次复查相关结构件的强度与设计的合理性,但离谱的是在此过程中竟无一人能发现这个如此低级又如此致命的错误,实在是令人汗颜。

- 微博归零工作室 RTZT

媒体观察

中国脑机接口发展提速:“机智” 上新,从实验室走向市场

7 月 1 日,工业和信息化部就《脑机接口标准化技术委员会筹建方案》(下称《方案》)公示征求公众意见,以推动脑机接口技术发展。此举说明我国脑机接口技术标准的制定有望提速。

-一财网

爱奇艺限制投屏案落槌,算计用户不能 “层层叠 buff”

事实一再证明,吃相难看,势必难堪;积极解 “套”,才有未来。会员花式加价并非解决长视频平台营收可持续增长的长久之道,靠不断降低用户体验感来增加营收与利润,只能是竭泽而渔。靠修改规则来收割老用户,终究是搬起石头砸自己的脚。只有以用户为中心,提高内容质量、提升服务体验,视频平台才能走得更远。

-上游新闻

大模型吞了谁?程序员彷徨,产品经理消失

大模型呼啸而至,互联网已经很久没有经历这样的技术冲击了。互联网时代的技术岗打工人,和前线大模型公司,这两块拼图要完全吻合,难度超乎想象。

-36氪

太空探索,中国寻求人类 “开源” 新方式

中国正在西方式现代化道路外另辟蹊径,走中国特色的和平、绿色、可持续发展的现代化道路,并积极寻求另一种 “开源” 方式 —— 外太空探索,来突破地球资源上限,与各国共享发展红利。

-环球时报

码农们的 AI 焦虑:交 15 万元上班,不卷就被 “毕业”

但现阶段,社会普遍对 AI 产生了深刻焦虑,大学报志愿时,大家都会思考一个问题:什么专业以后不会被 AI 替代。有人说,正是职业焦虑让张雪峰们动辄上万元的高考志愿填报咨询火了。

程序员抢到了互联网爆发的红利,毕业几年就能拿到 50 万甚至上百万的年薪,一度触发了 “文转码” 的职业潮流,但如今,最怕被 AI 抢了 “金饭碗” 的人群也正是码农们,他们因此而 “卷”。

-IT时报

成为巨头的 “烦恼”,英伟达将在法国面临反垄断指控

除 CUDA 外,英伟达的其他护城河也面临对手挑战。此前据多家媒体报道,AMD、英特尔、谷歌、微软、博通、思科、Meta 等企业已组建了 UALink(Ultra Accelerator Link)联盟,旨在对抗英伟达另一项硬件互联技术 NVLink。

-界面新闻

谁卡了 OpenAI 的脖子?

当前 OpenAI 遭遇了 “卡脖子” 风波:一方面谷歌、亚马逊、Meta 以及其合作伙伴英伟达等总市值超过 8.7 万亿美元(约合人民币 63.3 万亿元)的科技巨头对 AI 大模型领先地位 “虎视眈眈”,借助自身流量和资本等优势强势加入赛道,促使美国 AI 市场竞争愈加激烈;另一面,OpenAI 自身也遭遇 “滑铁卢”,推出的 GPT-4o 语音助手功能测试时间不断推迟。

-钛媒体

今日推荐

开源项目

zombodb/zombodb

https://github.com/zombodb/zombodb

ZomboDB 通过使用 Elasticsearch 作为索引类型,为 Postgres 带来了强大的文本搜索和分析功能。其全面的查询语言和 SQL 函数支持以新颖和创造性的方式来查询你的关系数据。

每日一博

把飞书云文档变成 HTML 邮件:问题挑战与解决历程

要被邮件客户端识别,飞书云文档内容需要转译成 HtmlEmail 格式,该格式为了兼容各种版本的邮箱客户端(特别是 Windows Outlook),对于现代 HTML5 和 CSS3 的很多特性是不支持的,飞书云文档的多种富文本块格式都需要转译,且部分格式完全不支持,造成编辑和预览发送不一致的情况。

https://my.oschina.net/u/5783135/blog/11214188

开源之声

用户观点

完全开源的现代化 IDE 正式发布:支持云端和桌面、兼容 VS Code 扩展、全球最大开源基金会打造

  • 观点 1:所以他比 VS Code 好在哪里?
    • 观点 2:号称完全开源
  • 观点 3:eclipse,曾经多么辉煌的呀
  • 观点 4:我先来,套壳 vsc
  • 观点 5:ide 换来换去有毛用,代码写的垃圾依旧垃圾
  • 观点 6:这玩意不会又是个 Electron 吧?
    • 观点 7:完全兼容 vsc 扩展,你说呢
  • 观点 8:很好,vscode 有竞争对手了
  • 观点 9:现在是 Debian 下 eclipse+vscode+kate,后面是不是可以 eclipse 全家桶了
  • 观点 10:有 idea 要它干嘛?支持 AI 编程助手
  • 观点 11:所以为什么不用 codium 呢
  • 观点 12:已经在用了
  • 观点 13:很好!但是我放不下自己 DIY 后的 vim,吹上天都没用
  • 观点 14:之前看 vitis 新 ide 风格像 vscode,以为 xilinx 也转向 vscode,结果是 eclipse 的新玩意
  • 观点 15:vscode 的浏览器版本,除了微软自己用的以外,功能基本都是残血的,托管过的都知道。所以有个新的挺好的。
  • 观点 16:完全兼容 vsc,目前好像并不是,连 jdp 的实现 Java debugger 都没兼容上。Java Debugger 的 github 仓库上有相关 issue 最扯的是你标假快捷键是啥意思,样子产品。
  • 观点 17:所有云端的 web IDE,纯粹是前端卷得没地卷了,强行把 CICD 绑到了一起搞出来的 kpi 项目。始终理解不了用它们图啥。如果一定要个牵强的理由:我们能 ai 自动补全,但我想用个高端一点的好理由来收你的钱。
  • 观点 18:它能开发 java 微服务大型项目吗?曾经是了 vs 跑 java 微服务,根本跑不起来
科技巨头的开源 AI 模型是 “假开源”
  • 观点 1:早就对此感到奇怪了... 作为一个开源软件,至少能让用户自己编译(ai 这里应该是训练)一个相同的软件(模型)吧,但是很多所谓的开源模型只是给出了一个可商用的预训练模型而没有给训练集以及相关的代码 这和闭源的免费软件好像也没什么区别...
  • 观点 2:OpenAI 啥时候改名叫 ClosedAI
  • 观点 3:其它好说,数据基本上就别想了,除了护城河,还可能有版权问题
  • 观点 4:这是哪个无耻之徒说出来的?人家都请你吃饭,把锅打开,递给你饭碗,难道还要给你喂饭?算法、算力、数据,人家不可能把三样全部都给你的,尤其是数据,要是连数据都给你,你岂不是第二天就立马选择自研?要点 B 脸不?
    • 观点 5:在 Google 之后,社媒平台 Reddit 与 OpenAI 达成了内容协议,这一消息推动其股价上涨逾十分之一。根据该协议,OpenAI 将获得 Reddit 内容的访问权限,同时它将为 Reddit 提供 AI 驱动功能。和 Stack Overflow 类似,Reddit 的内容都是用户创造和管理的,它的高质量内容应该早就被 OpenAI 抓取并被用于训练大模型。OpenAI 等 AI 公司正面临来自众多版权所有者的诉讼,通过与 Reddit 等公司达成协议,AI 公司正试图合法化其训练数据。

程序员梗图

END

References

https://www.oschina.net/news/300123/fedora-41-drop-python-2-7

https://www.oschina.net/news/300177/microsoft-wsl2-linux-6-6-kernel

https://www.oschina.net/news/300140

https://weibo.com/3894431038/OlOM6kF7r

https://weibo.com/6105753431/OlQrA1YLa

https://weibo.com/1727858283/OlFJfloSS

https://weibo.com/7394656718/OlPca5NDb

https://new.qq.com/rain/a/20240703A03N5400

https://mp.weixin.qq.com/s?__biz=MzA3NzMxNTI1MQ==&mid=2649776267&idx=1&sn=5a01dddf21afd75c12ffec0c50d40c4c&scene=0

https://finance.sina.com.cn/jjxw/2024-07-02/doc-incatvrm7392936.shtml

https://new.qq.com/rain/a/20240702A07QJP00

https://3g.k.sohu.com/t/n802782620

https://36kr.com/p/2845991663455104

https://3g.k.sohu.com/t/n802905831

https://k.sina.com.cn/article_1733360754_6750fc72020019nni.html

https://my.oschina.net/u/5783135/blog/11214188

https://github.com/zombodb/zombodb

https://mp.weixin.qq.com/s/CaDizPfk0-5b1n2JJTn7pg

https://mp.weixin.qq.com/s/v4CMA5qOo0Cc-NTCz2mdTw

最后,欢迎扫码下载「开源中国 APP」

阅读海量技术报告、程序员极客分享

相关内容

2025 年 Q1 财报 ...
【5 月 14 日下午消息,2025 年第一季度财报发布】报告期内...
2025-05-14 20:48:43
阿里开源全功能视频大模型,...
5月14日,阿里巴巴正式开源通义万相Wan2.1-VACE。据了解...
2025-05-14 20:47:29
原创 ...
目前苹果已经推出 iOS 18.5 正式版,下周预计会推出 iOS...
2025-05-14 20:19:52
重塑与进攻:荣耀中国区重构...
21世纪经济报道记者倪雨晴 深圳报道 2025年初,荣耀CEO李健...
2025-05-14 20:18:39
手机AI技术难投入大,谁敢...
2024年被称为AI手机的元年,手机厂商纷纷发力相关功能应用。而普...
2025-05-14 20:18:18
基于开源鸿蒙的移动警务终端...
IT之家 5 月 14 日消息,据开放原子开源基金会 OpenAt...
2025-05-14 11:48:42

热门资讯

原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
吞噬星空维妮娜美图/高清壁纸/... 国漫女神|《吞噬星空》维妮娜美图/高清壁纸/AI手机壁纸/无水印 国漫女神|《吞噬星空》维妮娜美图...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 商... 最近,各家的AI 9笔记本开始陆续登场,其实大家并不一定非选AI 9 HX 370,主要是这颗CPU...
AI智能+高效清洁!萤石RS2... 目前扫拖机器人市场的竞争非常激烈,在上下水扫拖一体机市场也出现了很多所谓的创新产品。但是对于这些产品...