nbsp; 【收集免费好书】关注v.x【书友大本营】推荐你喜欢的小说,领现金红包!
确实,那25次模拟训练的数据,就是袁朗得来,也是相当不容易。
他有这样的顾虑,也不难理解。
听了他言语,苏七月就抿嘴一笑。
“袁队长,我不知道那25次模拟训练里的数据,你是如何得来的。但是我在指挥部的时候粗略地看了一眼,觉得没什么参考价值,你大可不必当真……”
袁朗闻言就是一怔。
他是个聪明人,当然听出了苏七月这话的意思。
很显然,这位国科大的高材生,是在暗示自己,自己手中的那些数据并不怎么靠谱。
对于这一点,其实袁朗之前也有过怀疑。
但是又没有证据,加之这些资料的来之不易,他也就没有往深了考虑。
此时见苏七月十分肯定地给出这个建议,袁朗当然要仔细问清楚。
他放下酒杯,用请教地目光看向苏七月:“你能不能说得清楚点儿?”
苏七月本来就没打算藏着掖着,听了袁朗的询问,他就将自己的判断讲了出来。
“其实也没什么特别的理由,只是在指挥部看到那些数据的时候,发现其中很大一部分不符合‘本福特定律’。所以我判断,这些数据很可能是老美经过篡改之后流传出来的。可信度,其实并不怎么高……”
“本福特定律!?”
听了这话,袁朗和何子明顿时有些懵圈。
“嗯,一种检查数据是否造假的理论。”
苏七月点了点头跟着解释道:“根据这个理论,任何一堆从实际生活得出的随机数据中,以1为首位数字的数的出现概率约为总数的三成,接近直觉得出的期望值1/9的3倍。”
“用公式来表述,就是在b进位制中,以数n起头的数出现的概率为logb(n+1)-logb(n)。”
“延伸开来说,就是任何一组数据在随机出现的情况下,越大的数,以它为首几位的数出现的概率就越低……”
说到这里,苏七月就微微一哂道:“袁队长你之前用投影仪放出的那25组数据中,像躯体化、人际敏感、抑郁、焦虑、偏执、恐怖这些数字,按理说都是随机出现,因此它们理应是符合本福特定律。”
“但是我粗略看了下,25组数据里的上千名士兵的数据样本,似乎都不怎么符合,所以我判断这份数据,可能是经过篡改之后才流传出来的。”
“如果按照这些数据来印证的话,可能会有问题……”
听着苏七月的侃侃而谈,何子明就觉得自己的脑子好像不够用。
另一边,袁朗虽然同样没有听说过“本福特定律”极其相关理论。
但是他接受能力,是比自己的老战友强的。
这会儿经过苏七月这么仔细一分析,袁朗很快就释然了。
“原来数据模拟还可以这样来判断真假……”
苏七月肯定地点了点头,笑着说道:“袁队长,其实你要仿效老美这种模拟训练方式的话,只要知道其士兵创伤后应激障碍相关性分析的内容即可。”
“至于具体数据,还是自己重新建个模型比较准确一点。”
听完了苏七月讲述,袁朗深深看了他一眼,心中实在是庆幸不已。