目前整个过程仍然需要依赖研究人员去手动处理特征值,去做筛查。

        非常依赖研究者经验和直觉,极可能遗漏重要信息。

        nature去年的子刊他们整出了一个MOD的学习框架,就是一个材料属性预测的机器学习框架。

        (《通过特征选择和MOD的联合学习实现有限数据集的材料属性预测》于2021年6月3日刊登在Nature子刊NPJ上)

        他们发现要预测材料的振动熵时,反向键长和p价电子是关键特征,但手动识别这些特征需深厚领域知识。

        这些数据的提取需要有足够丰富经验的科研民工来做,同时还要确保数据的精确,降低误差,整个过程非常繁琐。

        因为我们要做的东西远比他们更复杂,我们要做的是一个更大的,更复杂的模型,特征数据的归纳总结和收集,速度肯定很慢。

        毕竟这件事无法像网络空间的数据那样,可以通过特征值剔除,各种办法来确保数据的准确,它的数据用计算机术语来说,从外表看上去是结构化数据,但内核却非常的不结构化。

        因此按照我的估计,至少前五年,前五年华为的计算卡都够用。

        至于五年之后,华为的计算卡也会与时俱进,加上我们本身也会和华为合作来推进他们计算卡的进度。”

        内容未完,下一页继续阅读