为什么人脑的知识储备远远小于ChatGPT却能拥有意识？

你以为你的大脑知识储备少，训练集少，但是其实不是，你的脑子从你出生开始，30年每天输入的都是海量多模态信息，包括高清视频，音频，文本，还有味觉，嗅觉，肌肉信息，触觉，温度，还有各种身体器官的信号。

比如就单人体的皮肤分辨率，就非常吓人了，因为你用针头刺激你皮肤的任意点都有感觉，甚至还有压感，你知道这是什么级别的数据量吗？

人眼的输入也是双眼hdr信息，你知道现在ai用的视频数据集清晰度吗？

所以说人脑知识储备比ai小是完全不对的，只能说人脑储备的信息更侧重现实生存，这些占比是主要，很难想象一个人出生没有任何感觉，只有文本信号输入是什么样的。

总之真正要和人比，就得比多模态数据，单一模态没有任何可比性。

如果现在有一家ai公司，宣称拿到了一个人30年的视觉双眼高清录像和所有身体感官高清数据，你猜一下这个数据大小会是多少tb的文件？会不会比现在最大的模型用的训练数据更大？

ps：

补充回答一下，很多人说这跟意识有什么关系。

其实我只是在说，很大概率上，想要达到一个非常完整的类人意识，很可能就需要一个完整的类人数据集。

也就是说，不能忽略双眼视觉，声音，触觉嗅觉这些东西对意识可能的贡献。

我不认为一个完全用文本训练出来的数据，能达到一个类人意识效果，就好比文本模型，你跟它聊花香，它也能聊，但是它连物理学上的花香完全没有一点概念，它只是在用人类给的文本数据做概率输出，这一点一定和人类意识有非常大的不同。

也就是说，真正要达到一个类人意识，目前机器学习还有很长的路要走，首先数据集就可能拿不到，更不用说模型结构是不是接近人脑。

所以说目前的机器学习数据，比人脑数据多，单这一点就可能不对，也就是说，如果你是做机器学习相关的，不要轻易判断数据规模已经达到天花板。

这里我的解释主要就是这个意思，实际上我认为要达到一个非常类人的意识，数据和模型结构都还需要较大改进，并不是觉得现在数据大小就已经溢出了。

戴金岑

共产主义者