Skip to content

未流行的未来,在变化的过去

又是一年的 GDC(全球开发者先锋大会)2025,

今年的内容、领域、形式也比较丰富,

在领域上,涵盖了具身智能、基础模型、AI 应用、AI 硬件,

在形式上,包括了行业会议,展台展商,以及实践手工坊等形式。

在这里,也稍微记录这次活动吧。

image.png

具身智能

今年的展会除了 AI 话题之外,

可能比较多的是“具身智能”了。

在今年 GDC 上,也有比较多的机器人展商,

有今年上过春晚的“宇树科技”,带来了双足机器人和机器狗,

image.png

也有“稚晖君”创办的“智元机器人”, AGIBOT,在演示一个做饭的场景。

image.png

image.png

最后还有一个展区,是几个机器人一起踢足球的。

image.png

image.png

由于不是这个行业,也不太清楚目前“具身智能”的发展情况,比如是否能家用,以及家用的场景具体有哪些,效率又是如何。

但记得去年看特斯拉的“擎天柱”,问了特斯拉的工作人员,说目前以及在做工厂的一些标准化的作业了。

image.png

具身智能目前可能还没有过多人接受,但也许在慢慢到来中。

AI 相关

AI 仍然是今年比较火热的话题,

  • 交流展览的厂商有:商汤,魔搭社区,上海人工智能实验室等,
  • 会议分享的公司有:阿里云,miniMax, 阶跃星辰等。
  • 线下的工作坊:有 WaytoAGI, 英特尔等
  • 算力&解决方案提供商:感觉也有至少 5 家吧。

相比 2024 的时候,会议的 AI 话题确实比去年多,但交流的内容可能也稍微变了。

想起去年“月之暗面”, dify, Xmind 也做了分享,

印象深刻的是“月之暗面”的长上下文能力, dify 则是做 AI Agent 相关的产品建设,而 Xmind 团队则结合 AI 开拓了新的产品。

image.png

image.png

image.png

比如 Kimi 的长上下文能力是一绝的,并且今年也推出了 K1.5 的推理模型;dify 开源的 star 也从去年三月的 20k → 71k;Xmind 没有过多了解现状,但我还是挺相信这家成立近20年的公司。

image.png

image.png

去年还是对基座模型的讨论比较多,但今年的展会听到更多的是算力供给,工程,应用,实践上的优化,下方是今年所观察到的。

  • 算力供给:展馆中刚好有算力提供商,请教了一下部署一个 671B 模型所需要的机器配置和资源,大概了解了下,需要8/9张 A100 的卡,可以跑动,但这个不适合短时间内多个人使用,提供租凭和售卖两张方式。其实算了下,部署成本实际也挺高的🤔。同时,近期一波部署潮,可能也是让供给有所溢价吧。

  • RAG 的发展:近几年听到越来越多人提及向量数据库和 RAG 概念,这也成为大模型应用开发不可缺少的一环吧。不过目前 RAG 的工程目前难点更多在于检索,这很考验工程能力。

  • AI Workflow:记不清 AI Agent 的概念是 22/23 年提出,也忘记是 coze, dify, langChain,还是哪个厂家提出了 AI workflow 的这种搭建形式。至少在目前来看,这种形式还是被认可的,具体表现在个体可以通过 coze, dify 完成商业化,部分公司平台也去建设内部的 AI Agent 的平台,市面上还有 coze, dify 的教程。

  • AI Coding:会议上还分享了 Github copilot,InsCode IDE,再结合这两年的 cursor, windsurf, marscode,trae, Devin 的发展, AI 在 Coding 层面其实发展的超出个人的预期,这部分个人在学习中。

  • AI 实践:大会设有工作坊,这也许是我这几年看到上座率最高的一次吧,而且报名者还分布不同的年龄段,也覆盖有一些不是技术背景的同学。

image.png

image.png

image.png

image.pngimage.png

image.png

整体看下来,技术和非技术背景的观众实际都对 AI 话题感兴趣,也许只是行业发展到一定程度,开始被更多人所接触认同。

AI 硬件/陪伴

今年还有一个展区是 AI 硬件/陪伴类相关的产品。

看了下,还是有些新奇感的,有眼睛,戒指,耳机,AI 宠物等。

个人做了下方几点分类,

  • 办公类:AI 耳机,AI 眼镜,这些可以通过硬件设备做翻译和理解, Apple Vision Pro 甚至是构建了一个数字世界。
  • 陪伴类: AI 宠物, AI 玩偶,AI 玩具这些挺可爱的,能让个人一些心理上的满足。

挺看好陪伴类 合实体的发展的,目前应该也有商业化的场景。

而类似与 Apple Vision Pro 和眼镜,现在也许场景没那么多,但如果基础设施建设好后,未来 VR/AR + AIGC 也许能产生新的内容载体和交互体验。

image.png

image.png

image.pngimage.png

开源与闭源

GDC 上有一个话题让我印象深刻,即“如何看待开源大模型和闭源大模型未来的发展,以及哪个更好些”。

前辈嘉宾也给了自己的看法,有支持开源的,也有看好闭源的,也有不确定的。

“闭源如 apple, 也许也能做的很好”,“开源是开放,可以普适大众”。

image.png

与此同时,我想起之前读过了一本书《有限与无限的游戏》。

从《有限与无限游戏》的视角看,闭源大模型是“赢家通吃”的有限游戏参与者,而开源大模型则是无限游戏的推动者。尽管闭源在短期内仍占据性能与商业化的高地,但开源通过生态共建和技术普惠,正在重塑行业的底层逻辑。正如詹姆斯-卡斯的观点:“无限游戏的参与者不追求胜利,而是渴望游戏的延续。” —— from DeepSeek。

IT 时报

image.png

参加展览的时候,看到了“IT 时报”这个报刊。

当时的第一反应是:“确实好久没有看实体报纸了”。

想起《娱乐至死》中也场景对报纸有过描述,

  • 报纸作为印刷时代的产物:印刷时代报纸的内容以深度报道和线性叙事为主,强调信息的完整性与语境关联。
  • 电报技术对报纸的冲击:电报时代后,报纸的价值不再取决于内容质量,而取决于“新闻的遥远程度和获取速度”,这导致新闻的碎片化和肤浅化。
  • 电视时代的报纸:电视的娱乐化逻辑渗透到所有公共领域,包括新闻业。报纸为了适应受众对感官刺激的偏好,逐渐模仿电视的娱乐化语言,例如简化叙事、增加图片比例、突出情感化标题等

报纸这种媒介也历史过程中不断得变化,

而今年纸质报纸,可能越来越少人看了,

当然,我在这里并不是主张“报纸消亡论”,

而是觉得报纸也在做转型和变更吧。

过去的某些事物可能也一样的。

"未来已来,只是尚未流行"

想起阮一峰老师的一篇博客 https://www.ruanyifeng.com/blog/2025/01/weekly-issue-335.html ,下方有这么一段话:

image.png

很多我们觉得未来的东西,实际上已经出现,只是我们还没看到。

有些我们觉得消亡的事物,有些消逝了,但也许有些做了转变,换了形式。

"未来已来,只是尚未流行"。

image.png

Released under the MIT License.