英雄联盟之真人秀 第五十八章 随机取样_页2
胖的人是慢性子,看来尼傲还真不能算胖。
“你可别小看了这随机取样的方法,这是有讲究的。那可和在大街上随便抽个签碰碰运气大不一样,这里头的学问可多了去了。
随机的方式可以有很多种,比如均一型的,也就是在一定的取样区段内,所有点的出现频率是相同的;但也可以是跳跃型的,比如用多元方程的曲线为基础,出来的取样结果就会大大的不同。针对不同的对象,应用不同的取样方式,就能大大地加快筛选的进程。”
乔臻倩的话令尼傲恍然大悟,一说到和数学相关的东西,他理解起来总是非常迅速。
“那么若山的这个状况,应该用什么样的取样模式才最为合适呢?”
这个问题乔臻倩事先也有考虑过,还为此特意查了相关的资料:“资料都给你准备好了。
现在对于阿斯伯格的患者的了解比以前多得多了,很多国内国外的科研工作者对于他们的思考和行为模式,都进行了数学模型的构建和演绎。从现有的数据来看,阿斯伯格患者的定位区段,基本可以推导为幂函数的尾端靠近99。95%的位置,也就是说从一个一万个人的群体来说,只有五个正常人的想法有可能会和一个阿斯伯格患者的想法相类似。
所以做抽样的时候,如果重点考虑这个区段的样本,或者提高该区段以及其周围区段的数据的优先级别,就能够在很大的程度上提高筛选的效率。具体怎么用程序来抽,那可就是你的专长了。”
乔臻倩的解释顿时令得尼傲茅塞顿开,数据筛选可以分做两个大的类别。一个是没有任何背景知识,完完全全从数据本身当中去寻找规律。而另外一种就是对数据的特点有一定的知识,对于数据所可能产生的模板规律有一定的引导,而乔臻倩说的正是后面的这一种情况。
说穿了,和游戏的掉宝率也有那么点共通之处。当游戏运营商做活动推广的时候,两倍、三倍的掉宝率其实也就是把那个触发宝物掉落的随机数字给处理一下而已。
可是道理明白了,真要做起来却还是不容易。在尼傲看来,要想用这种有监控型的随机方式来自动产生能够和游戏互联的接引程序,有几个方面的工作要做。
首先要随机产生话题,然后产生的话题要经过过滤。绝大多数的热点话题,在这个步骤中都会被清除掉,只留下那些被界定在最后五个万分点里的冷门中的冷门。
再接下来,就要把这些冷门话题再尽量转化成为,能够均衡地影响到各个信息通道的全方位接引程序,随后再自动地接入到凌若山所戴的头盔里,这一切可一点都不简单。
虽然尼傲是个编程序方面的天才,可是再天才的牛人,程序也得要一行一行的才能够写出来。而且那些最终幸存下来的冷门话题,他可吃不准有几个是他知道的,估计多数都会是他闻所未闻的内容,那就还必须去做相应的背景了解,只有在做了足够的预备测试之后,这才能最后用到实际的试验里。
尼傲粗粗地估计了一下,这不吃不喝不睡觉,怕是,没有个三五天时间都下不来,而且这还没算上那不能预见到的实际筛选可能会花的时间。想到这里,本来满腔热忱的心,好像被那突如其来的暴风雨给浇了个通透,瞬时间就降到了冰点,以至于尼傲一时间给愣住了,似乎眼前这千头万绪的,一下子不知道应该从哪里着手才好。