第34章 数据融合异常 (2 / 4) 首页

字体:      护眼 关灯

上一章 目录 下一章


第34章 数据融合异常 (2 / 4)
        这就是AI领域的问题之一,模型完全是黑盒的,你永远不知道你的数据在模型里是怎么变化传输的,可能某一行代码出了问题,就会导致各种奇奇怪怪的问题。

        不过还好,周昀在写代码的时候加入了大量的调试代码,因为每跑一次实验需要的时间太长了,

        甚至这次他并没有用到所有的数据,只用了其中的一部分,跑一组实验就得一周,这还是64张H100的显卡集群的情况下,

        如果用上全部的数据的话,虽然时间上不会是简单的倍乘关系,但至少也得两周。

        但这也就是第一次训练时候需要大量数据才要这么久,等第一次训练好了,后续的再有新的数据,就不需要从头训练,只需要利用新的数据微调就行。

        现在他就在看输出日志,观察到底是在哪一个环节出了问题,为了衡量模型的效果好坏,

        他在数据预处理,数据融合,模型训练,结果输出这几个方面设计了几个指标。

        经过观察,他大概确认了最为可能的一个原因。

        数据融合异常。

        因为模型接受的数据是多种模态的,所以在预处理之后还有一个数据融合阶段。

        根据实验日志来看,问题就出现在了这一阶段。

        原本的数据融合算法在只有两种模态数据的时候,效果很好,但是当数据的模态数量逐渐上升,

        一些原本没有发现的bug逐渐显现出来,这也是导致最终效果不如原来模型的最为重要的原因。

        当然,也可能是因为过拟合,数据泄露,这种普遍性的问题,只不过仅根据这次的输出日志来看,可能性不大。

        “嗯......特征维度贡献方差过大?”划动滚轮的手指停下,周昀敏锐地看到了一条异常的输出。

        内容未完,下一页继续阅读
新笔趣阁阅读网址:wap.xinbiquge.org
加入书签我的书架


上一章 目录 下一章