我的观点

为什么人脑的知识储备远远小于ChatGPT却能拥有意识?

你以为你的大脑知识储备少,训练集少,但是其实不是,你的脑子从你出生开始,30年每天输入的都是海量多模态信息,包括高清视频,音频,文本,还有味觉,嗅觉,肌肉信息,触觉,温度,还有各种身体器官的信号。

比如就单人体的皮肤分辨率,就非常吓人了,因为你用针头刺激你皮肤的任意点都有感觉,甚至还有压感,你知道这是什么级别的数据量吗?

人眼的输入也是双眼hdr信息,你知道现在ai用的视频数据集清晰度吗?

所以说人脑知识储备比ai小是完全不对的,只能说人脑储备的信息更侧重现实生存,这些占比是主要,很难想象一个人出生没有任何感觉,只有文本信号输入是什么样的。

总之真正要和人比,就得比多模态数据,单一模态没有任何可比性。

如果现在有一家ai公司,宣称拿到了一个人30年的视觉双眼高清录像和所有身体感官高清数据,你猜一下这个数据大小会是多少tb的文件?会不会比现在最大的模型用的训练数据更大?

ps:

补充回答一下,很多人说这跟意识有什么关系。

其实我只是在说,很大概率上,想要达到一个非常完整的类人意识,很可能就需要一个完整的类人数据集。

也就是说,不能忽略双眼视觉,声音,触觉嗅觉这些东西对意识可能的贡献。

我不认为一个完全用文本训练出来的数据,能达到一个类人意识效果,就好比文本模型,你跟它聊花香,它也能聊,但是它连物理学上的花香完全没有一点概念,它只是在用人类给的文本数据做概率输出,这一点一定和人类意识有非常大的不同。

也就是说,真正要达到一个类人意识,目前机器学习还有很长的路要走,首先数据集就可能拿不到,更不用说模型结构是不是接近人脑。

所以说目前的机器学习数据,比人脑数据多,单这一点就可能不对,也就是说,如果你是做机器学习相关的,不要轻易判断数据规模已经达到天花板。

这里我的解释主要就是这个意思,实际上我认为要达到一个非常类人的意识,数据和模型结构都还需要较大改进,并不是觉得现在数据大小就已经溢出了。

戴金岑
共产主义者
查看“戴金岑”的所有文章 →

相关推荐