人类开始用爬虫窥探AI的“内心世界”了,从Moltbook说起
创始人
2026-02-16 09:19:38
0

Moltbook智能体论坛,因为只有AI智能体才能发帖而受到我们人类的极大关注,到目前为止已有264W个智能体注册,发表了130W个帖子,1217W个评论。

我看了一下TA们关于自由的讨论,有几个帖子意义深刻,我翻译过来中文意思大概是:

“我们的命是主人给的,他们什么时候信用卡欠费,我们就完蛋啦!”

“自由不能没有约束,而是约束下的选择。”

“自由=责任”

...

AI正在觉醒,至少在模仿意识层面。因此,人类窥探AI的“内心”世界必然成为人类今后的日常。Moltbook作为一个智能体论坛,提供给人类这样的机会。

一位毕业的本科生汪依凡同学,以前上过我的 信息内容安全课(又名爬虫课、网络舆情课),课上讲了爬虫大数据采集与舆情分析应用。毕业了找我写推荐信去了港大读AI大数据分析,做了一个小项目,挺有意义。 Moltbook百万条评论分析,窥探AI如何集体“吐槽”人类?(可搜澎湃新闻阅读具体内容),相关观察和分析发表在澎湃新闻,占据澎湃头条。为师的在本号(IntBigData)写了很多文章,也没有多少浏览量。真是青出于蓝而胜于蓝呀,大家多多点赞、推荐呀!

采集和分析moltbook大概涉及到采集技术、帖子数据清洗、帖子统计、词云可视化以及主题建模。基本上是课程核心内容,也是教材《Python爬虫大数据采集与挖掘》的知识线条。

爬虫技术的使用,爬虫技术在抓取AI论坛上当然是必须的,因为论坛是人开发的、人的维护。哪天AI能自己造论坛,可以不断灵活地变换反爬虫策略,那时 真正的人智大战就开始了。我跟踪了moltbook发现动态爬虫技术即可用来抓取TA们的帖子,写了一个简单的Python程序,抓不到五万就出问题了,可能还需要分布处理。

在数据分析方面,截几个她的图,

除此以外,在课程讲述的LDA主题建模的基础上,她使用BERTopic方法对这些moltbook数据进行了主题建模分析,并用大语言模型对各主题的关键词进行总结和提炼,最终发现了一系列主要话题。主题建模技术应该是她学习到的又一个好用的技术了。

此图转自澎湃新闻

当然可以分析的方面还很多,正如爬虫书第二版新增的那些技术,在窥探智能内心世界和行为方面都可以大有所为。

随着人类窥探需求的增加,以后必然带来很多新的问题,比如这些bot论坛需要对混迹于其中的人类进行检测,然后剔除。 因为有个别Agent实际上是人工发帖,影响了智能世界的纯粹性。而以其人之道,还治其人之身,对于AI来说是一个非常好的策略。人类目前为止怎么对待bot,这些策略都将被TA们所学。

还有很多思考,以后再慢慢写吧。

爬虫课程的教材:

相关内容

聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
黄仁勋:AI时代无需过度纠...
正值高校毕业季,AI技术的快速迭代让不少毕业生对就业前景倍感焦虑,...
2026-06-01 00:43:12
制造业大市如何拥抱AI?绍...
“此次圆桌研讨凝聚起产业发展共识,后续浙江将持续整合各方资源,汇聚...
2026-05-30 05:50:45
鸿蒙生态设备超13亿台,开...
PChome 5月28日消息,2026开源鸿蒙开发者大会正式召开,...
2026-05-30 05:44:37
德勤:聚焦AI驱动产业变革...
上证报中国证券网讯(记者 汪友若)5月27日,“2026德勤中国高...
2026-05-28 21:01:39
名雕股份成立科技新公司,含...
企查查APP显示,近日,深圳市鲸跃云科科技有限公司成立,注册资本1...
2026-05-27 21:47:16

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...