起初,你觉得只要把六爻的因素都扔到统计学工具里,它就会给你一个很棒的结果。所以默默计算了一下,六爻卦涉及六神、六亲、卦支、阴阳,动爻,飞伏等等。乾坤网算命一条街六爻预测学首先,每个爻都会跟其它五个爻产生关系,而每个爻都有对应的变卦的爻,光本卦的上下爻关系,与平行的变爻关系,加起来便有36组特征。乾坤网算命一条街六爻预测学这个特征又有五行关系,又有地支间的刑冲合墓绝五种关系,此时有两种方法表达可以有两种方式,一种是类似onehot向量,另一种直接将它们也都呈现出来。如果是onehot相对还好,只是变成72组特征,但如果是直接呈现为某爻生某爻,标记为1或0这样的形式,那么总共得有36x10=360种特征。如果本卦六个爻,变卦六个爻,再考虑月令与日建的影响,是否旺相,是受刑冲害绝合影响,是否空亡,这样又是6x2x7x2=168种特征。光72组特征+168种特征这种,看起来有240个特征,但这意味着什么?

理论上,同类主题的案例起码不能少于240个,便很显然,如果你仅有240个案例是肯定不够的,因为这些案例,无法保证正好能够覆盖六爻所有的特征组合,因此如果想要能够对这些特征进行较好的归类与总结,至少要准备上千个同类案例,才有可能获取比较好的结果.最重要的是,这还是得建立在这些案例是专门针对不同特征、覆盖面足够广、案例准确度足够高的前提下才有意义。但是到这一块你就发现千难万难了,去哪里找它上千个同一类的、有准确反馈的案例?并且这个“同类”,并没有想象的那么简单,比如一般问工作,都要看官鬼爻,这听起来似乎很简单,但实际上并没有那么简单。比如同样是问工作,问是否找得到工作,与面试是否可以通过,这两种的断法便不是同一种方法。一开始,你觉得逻辑回归就好神妙,这个概念如此之优美。它可以将所有的特征串起来,然后反向计算出每个特征所具备的权重。这让你顿时兴奋起来,这样不就能反向检验用神了呢?毕竟用神是的权重肯定是最高的。然后你放数据一跑,虽然求出来了权重,但是你用这些权重去计算结果时,却发现正确率非常低下,也就比纯瞎蒙好一点点。于是你研读资料,发现有文章指出,其实逻辑回归,并不适合非线性的变量,很显然的,六爻的断法并不是一种线性的计算方法。但是,人类并不擅长解决非线性问题,因此只能采用数学工具它转换为近似的线性问题来解决。因此,你看到了如SVM(支持向量机),并且它虽然是线性的运算,但实际上是通过核函数的空间投影到高维空间进行运算,然后可以在低维空间拿最终的结果。听起来就像这个世界的出现一个BUG,突然出现了一架梯子,让你可以从天宫中偷取蟠桃。真人大师在线一对一算命本着如此强大的工具,加上对术数模型的信心,你拿数据一跑,眼珠子都快给你惊掉了,正确率接近100%。然后你美滋滋地拿着这个模型去尝试断新案例,然后却被啪啪啪打脸。于是你又回头研究,才发现原来做这些是要分为训练集与测试集的,训练集上效果再好也没用,因为可能训练数据中的特征分布并不均匀,覆盖并不全面。简单来说,这样训练出来模型都是只会刷题库,而实际上并没真正学会怎么解题,因此到了题库外的直接就不行了。于是你学会划分训练集与测试集,此时你心中更加忐忑了,本来案例就不够多,再一划分,这显然更加捉襟见肘。当测试结果出来,训练集上的接近100%,测试集上64%,你已经感觉顿时大事不妙。于是突然意识到测试集与训练集也有分布不均的情况,有时候也会是随机巧合。你觉得这可能是正负样本不够均衡的缘故,因此你不得不考虑解决这个问题,你研究了多种方法,上采样下采样smote样本等等.于是你发现,其实事情没那么简单,你还需要调各种参数,至于参数怎么调。翻了一堆资料,你最后得到结论,呵呵,这跟炼丹一样,自己蒙去吧。简单了就是自己猜测出一些参数的范围,然后用网格工具去搜索出来一个一个试。最终,你终于比原来最好的成绩,提升了大概两个百分点。然而一琢磨,这算下来无非就是比原来多算对了几个案例,可以说几乎没什么用。这又不是国内刷论文,只要能比SOTA高个一星丁点,就 敢叫嚣世界领先。于是你刻苦钻研,反复排查之后,六爻八卦解析认为这个还是特征工程没做好的缘故,不相关的特征会成为一种噪音,干扰整个统计过程。于是你咬牙开始做做各种特征工程,比如用卡方检验非负特征,用F检验分类特征,找出那些看起来相关性更高的特征时,又再次领教到什么叫离谱。你一眼望去,没有一个特征的相关性与结果是足够高的,只有其中几个似乎数值就稍微比其它的高一点点。于是你尝试删除一点特征,结果神奇地发现,相关性高的特性全变了,原来本来相关性高的变低,原来低的变高了。然后你又试删除几个,结果又变了,你反复试下来,发现几乎毫无规律可言。但是你看别人做的其它领域的统计,效果都杠杠的,到你这里用的数据就明显不行了。搜了搜资料,网络上大概告诉你的就是,这说明你这数据就不靠谱。要不是有坚定的信仰,你都开始觉得这数据纯粹是蒙人了。于是你又想,要不直接考虑特征降维度试试,于是试试用PCA降维,结果你发现了更恶心的事。两百多个特征,删掉一半后,一检查与原数据符合率直接降到50%。原本你以为这是一个科学研究是一个循序渐进的过程,再不济也是摸石头过河,结果发却现自己不过是柏拉图洞穴里的囚徒。不过你也显然开始了更进一步的思考,这些特征是否可以进一步处理?这如同一个人学习六爻,仅仅认识一个卦,而对于空亡,化变,爻间作用关系,空而逢冲、绝处逢生,还有更多的爻间如贪生忘克、一气连生等等几十关系。而这些特征应该如何组合或运算出来,统计工具是不会知道的,因此必须人为告诉它。但是,当基础特征与组合出高级特征在一起时,在统计上会出现一个更大的麻烦,因为统计分析理想上最好的效果是各个因子之间是正交的。简单来说,当组合的高级特征与基础特征放在一起时,基础特征很有可能会成为一种噪音乐,但尴尬的是,这些组合的高级特征往往都是在一定条件下出现的,而当它们没有出现的时候,基础特征又会很重要。到此,经过无数次研究后,你终于提取出来一些特征,确实获得到几个百分点的提高。但是结果非常不美丽,终究在百分之六十几到百分之七十之间来回跳动。在这个过程中,你也确实有进步,比如知道了正样本的准确率根本不能当作标准。如传统的那种评价,十个里算对八个,其实是没有意义的,因为错误率同样很重要,这就必须用ROC,更进一步,正样本里,会识别出多少是错的,负样本里,会识别错多少,都得进行理解,而这个叫作Recall,而要兼顾正确率与召回率,则应该采用F1 Score进行评估。这样评估出来的指标,才真正地具有意义,不然有的时候这些模型会制造出假象。闲来没事,你上网转悠,看到有人也在尝试用数据分析的方法研究六爻,于是你感兴趣地打开一看。发现这些人竟然用的是最原始的统计方法,什么财爻持世如何如何,评论区下面不少赞美之词。顿时,你有了一种自己正在驾驶着飞船浏览星辰大海时,却在意外地遇到了一群扳着手指的数数的猴子感觉。你很不厚道地笑了,本想跑去参与两句,但想了想,还是算了,因为你知道,他们根本不可能懂。然而回过头来一反思,突然觉得自己这不过是五十步笑百步罢了。这时候,你正好学习到了决策树,惊为人天,什么信息熵,简直是神来之笔,可以直接对规则进行组合测试。最重要的,这类高级机器学习模型,它们能够能够自动捕捉特征之间的复杂关系,包括条件依赖性,也就是说它们可以识别哪些是基础特征,哪些是高级特征,这很好地解决之前的问题,即提供的特征无法保证是正交的。根据之前的丰富特征工程经验,你把六爻关键的特征放进去,训练集中百分之九十几,测试集上一跑,百分之七十几。不错啊,你不禁感叹,然后又运行了一遍,结果看到又蹦到百分之五十几了。你不敢相信,拼命点鼠标运行,看着数据一会儿甚至跌到百分之四十几,一会儿五十几,一会儿百分之七十几。于是你又琢磨发现,很有可能是因为基本的数据的案例不够多,特征覆盖不够均均,于是每次随机切分数据集时,训练集与测试集中的数据分布并不一致。仍旧相当只不过是在考试正好考到了题库中刷到过的题,一旦遇到未知的就完了。于是你又研究,发现可以将测试集分成多份,每一份都测试,然后来回交叉验证,最后取个平均分,这样的分数更才有可信性。于是,在追加了交叉验证之后,你发现正确率可耻而稳定地暴跌了。顿时你眼前一黑,以前做出来看起来百分之七十几的,在交叉验证这个照妖镜面前,纷纷分数也原形大露。然后你狐疑地发现,回忆你翻的不少论文,发现学术界貌似造假也不少啊。不少声称结果还不错的,都是拿来跑一个看起来随机结果值高的,然后就拿去写灌水文了,结果是当然是难以复现。后来,你又看到了随机森林,理论更加地漂亮,相当于将各种小决策树分别运算,然后将树组合起来成为森林,这叫集成算法。反复研究之下,你发现之前的这些统计工具,虽然理论上可以识别特征之间的依赖,但那必须建立在庞大的数据的基础之上,而你无法人为地将事先知晓的依赖关系完美注入到其中。比如动爻如果旺相而动,动后又化空,空了又被月冲,此爻又可以作用于其它爻的影响时,由于案例中出现的本来便不多,因此机器学习中很容易就忽视过去。因此,这种深度的特征结构,机器模型通常是难以学习到的。于是你尝试,合并两个特征以及特征组合成为一个特征,然后通过赋与不同的值,然而很快你就发现这样的问题所在---会丢失内部细节。因为有时候基础特征与组合特征两者是共同在起作用,临门一脚,总是会觉得缺了些什么。慢慢地,sklean中几乎所有的工具,都被你玩过了。最后,你得到一个结论,要么是数据实在太少了,要么是这些数据只有弱关联性,哪有什么强大的预测,统统都是骗人的。幸好,本着坚定的信仰,这点挫折当然击败不了你,于是你又去四处学习,翻看各种数据分析大赛别人的心得或资料,折腾来折腾去。这过程中,你学会了不少大厂作弊刷分的技巧,比如利用随机特性,多试几次,弄点高分就赶紧停,比如针对系统规则漏洞,利用运算结果比较,不断地从测试题库里偷答案建题库.....而更多采用的是粗暴的方法,直接拿着随机森林和极端随机树,碰碰运气,时常有奇效。当然你也不是没有真正的收获,你将AdaBoost、CatBoost、LightGBM、XGBoost都统统拿来研究了一遍,对于一般的数据处理可以说是手到擒来。最后,你悟了,返璞归真了,明白了调包+特征工程+调参,这就是最核心的工作。与其把时间浪费在研究数据不足的卦例上面,还不如去研究一下那些数据充裕的领域。于是你发现,其实这些技术,在炒股量化平台上,也有不少人在探讨与应用,专业程度极高,为了提升技术,于是你也开始改玩量化炒股去了。然后,每天你泡上咖啡,坐在办公室里,一边就靠做数据分析拿着一份待遇还不错的薪水,一下了班,便将业余时间全花在了量化炒股上。量化技术界人才济济,虽然最赚钱的那些量化机构的技术都是保密的,但是在此之外,依旧有不少令人惊叹的想法。在这期间,你发现了一个秘密,小市值股票竟然非常重要,如果用它们作为因子,可以达到非常高的超额收益,这可以带来超额收益 (Alpha),通过挖掘这些Alpha因子,你赚得盆满钵满,不少赚钱的大机构也不过是这种方法。丰富的收获让你觉得自己似乎掌握了某种真理,在你的眼中,这个世界早已不一样,所谓大市场背后,都是由小市场所支撑的,因此这世上的大,其实终究被小的所决定的。每日观察着起起伏伏,你似乎像是看到了三千世界的生生灭灭,你颇有一些觉得,自己已然开悟,即便是还未得道,也离得不远了。然而某一天,一觉睡醒起来,发现世界变了,全世界的大小量化公司都恐慌成了一片,因为大家发现原来无往不利的那些因子,竟然大部分突然失效了。不仅如此,还有一些看起来可靠的因子,也正在以肉眼可见的速度在迅速失效中。整个世界像是突然涌起了巨大的变化,但是没有人知道发生了什么。。究竟发生了什么?你有一些慌了,这是涉及到整个世界观的问题。于是你与人探讨,不断总结,勉强总结出来了一些理由,比如这些年挖掘因子这事,是全世界所有的人都在疯狂地一起在干,因此出现了因子拥挤现象。这就像,很多的泡泡都挤在了一起,后来实在太多,相互挤爆了。还有一个重要的事情也被大家所认识,那就是阿尔法衰减。简单了说,当一个在效的因子被广泛认知和使用后,其带来的超额收益可能会逐渐被市场吸收和消化,导致阿尔法衰减,最后甚至完全没用。到了这里,你突然想到了,不少传说中高级的技法都是要保密的,是不是有可能也是这样。这完全也能解释,为什么有些技法被极少数人掌握时,它们非常有用,而一旦被公开大家都纷纷使用后,效果却慢慢变得不如人意。这本是简单的道理,只是人们往往在实际中,最难认识到的也是这些最简单的道理。社会是在变迁的,无论是遇到社会飞速发展还是快速衰退的时候,变迁都是极为剧烈的,这里面虽然有统一的不变的东西,但也有随时时代不断变迁的东西。于是,你突然间明白,为什么之前的研究总是遇到一个问题,世界不是简单的重复,而是在螺旋中变化,有时进,有时退。万事万物有兴有灭,但也会符合一个大的趋势,但社会失业率增长时,找到工作的人自然也会变少,但社会就业率增长时, 找到工作的人自然也会变多。外在的社会效应,虽然是一个宏观的体系,但在它会作为一个先验分布来影响到整个大局。因此,你又开悟了,频率学派的方法虽然有道理,但贝叶斯的方法似乎更合乎大道。时间流上配合贝叶斯概率推断加上频率学派的统计方法,两者结合起来,也必然会有更多的进步。回溯你了解的易学知识,你发现古人似乎也早就意识到了这一点。一个最典型的就是卦运的变化,你似乎开始领悟到了一些皇极的真义。于是你开始感觉,似乎自己看到了这世间有一个隐隐约约,说不清,道不明的东西在召唤着你。天马行空的一番沉浸之后,你觉得你悟了,然后决定开始尝试引入这些机制,然后再进行复验,当最后点击运行键的那一刻。正确率大幅度得到了提升,一瞬间,你的灵魂仿佛也得到了升华。然而没多久,你就冷静下来,一般只要效果太好了,通常就是哪里出问题了,正如当初你曾经组合出来一个模型,准确度非常高,后来一看是代码中犯了一个低级的错误。于是你反复检查,发现挑不出毛病,你知道,这次你真正的找对了方向。信心满满的你把它应用在了量化上,在经历了大量的回测的验证你,不管是盈利率还是回撤率都令你满意。然而,放到市场上后,你发现似表现似乎不如预期,于是你安慰自己说,你这个模型的验证周期比较长,初期看不来出来很给正常。一日又一日,仍旧是不死不活,你发现你的改进的这个模型,在真实的世界中,根本毫不出彩。那就是它要求你准确知道当前的世界是什么样,未来是怎么发展的,趋势是什么样的。而人类只有回望历史,才会知道发生了什么,对于当下,几乎没有任何人能看得清楚。一阵寒意涌来,你感觉自己就像被困在一个泥潭中,越努力想要挣脱,却越是下陷得越深。世界突然间,出乎所有人意料地又爆发巨大的变化,前所未有的疫情,忽然席卷整个世界。作为世界金融中心的M国的股市,前所未有的出现了融断,金融界的大佬出来感叹,这是他有生之年第一次看到这种事,话声还没落,该国股市又连续融断了两次。人类从来没有想像过会出现这样的事情,在科学昌明的时代,人类的信心空前高涨,感觉自己几乎可以无所不能。现实中,即使是一时不能的,未来也一定可能,而人类对于这个世界的掌握能力,也已经达到了最高,如果会出现席卷世界的灾难,也只有可能是人类自己引发并参与的。然而,如同整个世界狠狠给人类了一耳光,人类在疫情的几年中,努力寻找科技与现代医学对抗的方法,却发现根本无能为力。最终,疫情以一种自己慢慢平息的方式离去,就像是世界的大手,放过了人类。惶恐的人类经历过疫情后,本来以为是对于这场外来的意外,人类应该会更加团结。然而现实却是,全球分裂更加严重了,一些国家之间激烈的矛盾也爆发了,跟随而来的是有国家之间,有武力上的战争,有经济上的战争,还有相互之间的各种制裁。甚至一些自诩文明进步的国家也开始撕下了原来华丽的伪装,公然开始干了土匪勾当。一切可以理解,都是为了利益,然而,人类在利益面前,出奇地脆弱,现代的文明似乎一下子发生了大倒退。人类在现代文明不应该发展得越来越好吗?为什么反而越来越差了。看到这些,你不禁有些感叹,终究这个世界的本质,还是建立在经济基础之上的,文明外衣包装之下的,不过仍旧赤裸裸的野人。曾经你都在寻找那个历史变化就是像螺旋线一样,整个螺旋都会围绕着一个中,如果找到了这个中,如果将这些中连结起来,岂不就是一条路径?因此你一直以为,如果能把握这个路径的变化,便能将万事万物变化都可以把握住 。现在你却发现,这个“中”却是在不断变化的,历史的螺旋演进整体,也并非是直线,而是绕来绕去。事实上,并不是因为有了“中”,才有了事物的演变,而是有了事物的演变轨迹,才会出现一个“中”。如果把注意力放在中上,你永远只能等它产生之后,然后才能见到它。你脑海中突然蹦出来了一句话:“人心惟危,道心惟微,惟精惟一,允执厥中”。虽然世面上对这句话有公认的解释,然而你却似乎从中嗅到了另外的一番味道。然后,突然有一天,你看到了三符道长的这篇博客,末尾只有那么一句话:
本文由风雅颂易学网在线算命一条街整理提供,转载请注明来源(周易算命蕞准的网站)https://www.suansuangua.com