加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

股市猜测起源实践与领会

发布时间:2019-12-10 19:00:52 所属栏目:运营 来源:站长网
导读:图像来自 Pexels 当你开始你的第一个根基回归或分类模子的时辰,它至少会在你的脑海里闪现。海量的时刻序列数据,再加上让你提前退休的也许性,都有一种不行抗拒的吸引力,就像让你在祖父的阁楼里找到一张旧藏宝图。你怎么能不去全力呢?你能用呆板进修来预
股市猜测起源实践与领会

图像来自 Pexels

当你开始你的第一个根基回归或分类模子的时辰,它至少会在你的脑海里闪现。海量的时刻序列数据,再加上让你提前退休的也许性,都有一种不行抗拒的吸引力,就像让你在祖父的阁楼里找到一张旧藏宝图。你怎么能不去全力呢?你能用呆板进修来猜测股票市场吗?

我至少得试一试。这就是我所做的,也是我所学到的。

网上有许多小范畴的教程,是一个很好的出发点。它们向您展示了怎样提取股票的汗青数据,也许还管帐算一些指标,并将其输入回归算法,并实行猜测第二天的股价。可能,他们行使一个分类器来猜测股票是上涨照旧下跌,而不猜测一个值。

关于此后的成长偏向,我有两个设法。起首,我想做大一点。我的理论是,某些股票、钱币和金融指标之间也许潜匿着玄妙的相关,肉眼很难发明。我想一个呆板进修算法大概能找出它们的相关。

其次,我不会选择我想猜测的股票。我规划为他们全部人实习模子,看看哪些股票示意最好。我的设法是,有些公司也许比其他公司更轻易猜测,以是我必要找到它们。

我起首下载了尺度普尔500指数中大大都股票的汗青数据,一堆钱币代价汗青数据,以及几十个财政指标。一个Python剧本认真将它们转换成同等的名目,添补丢失的值,并删除至少不能追溯到2000年头的时刻序列。总之,蹬渚埃散去时,我在一个大度的Pandas表中有高出1000列,个中有18年的数据。

完成后,我行使优越的TA-lib库为5、10和30天的窗口计较每个时刻序列的一系列指标。我没有金融配景,也不知道哪些会真正增进代价,以是我采纳的要领是把它们加起来,让模子对它们举办分类。这使得列数激增。数据集已经筹备好输入高出32000列的实习模子。

我之以是选择XGBoost作为我的算法,是由于它具有整体机能,而且可以或许利便地查察模子行使哪些特征举办猜测。我将其配置为遍历数据齐集的全部股票,并为每个股票实习两个模子。第一个是分类器,它可以猜测第二天股票的涨跌。第二种是回归模子,猜测第二天的收盘价。

对付每个模子,我都将它实习在95%的可用数据上,然后行使剩下的数据举办验证测试,以模仿它从未见过的股票数据。剩下的5%是约莫3个月的买卖营业数据。任何呆板进修模子都能很好地猜测它所实习的数据——要害是要让它更通用,并在它从未打仗过的数据上示意精采。

对付验证运行,启动时举办了1000美元的模仿投资。假如猜测该股会上涨,它就会买进;假如猜测该股会下跌,它就会卖出。他们没有思量买卖营业本钱,由于我想看看假如不思量买卖营业本钱,功效会奈何。

我把Jetson TX2开了一个月。

它发明白什么?

正如预期的那样,对付大大都股票来说,功效都很糟糕——精确性并不比抛硬币好几多。不外,有一些好像在验证数据上示意得出格好。有好几家公司在3到6个月的时刻里把我的模仿资金翻了两倍乃至三倍,尚有几家公司在那段时刻里得到了20倍的利润。功效表现,一个图表可以让你的心率飙升。

请记着,这是算法之前从未见过的数据——最后的5%被保存在实习数据集之外。

股市猜测起源实践与领会

顶部是股票收盘价,底部是现金。跌到靠近零是买入。

我找到了吗?是否有一些股票与市场指标玄妙地接洽在一路,从而可以猜测?假如是这样,我可以从价值的颠簸中赚钱。

当我写完代码并运行它时,间隔我下载庞大的数据集已经已往了几个月。我对它举办了更新,包罗了最新的买卖营业数据,并抉择看看模子在这段时刻内会做些什么。他们的验证运行做得很好——假如我在已往几个月里一向与他们举办及时买卖营业,他们会有同样的示意吗?这一点让我很欢快。

功效令人费解,令人沮丧。在最初的实习和验证运行中示意精彩的模子,也许在往后的数据运行中示意精采,但也也许失败得很惨,并耗损掉全部的种子资金。一半的时刻,模仿会赚钱,一半的时刻,它会休业。偶然辰,这比掷硬币的结果好几个百分点,而偶然辰则糟糕得多。到底产生了什么事?它本来看起来布满但愿的。

履历教导

我终于大白了我所做的统统。

假如股票价值是随机颠簸,功效在50%阁下轮回正是你所祈望的。通过让我的措施在数百只股票中探求示意精采的股票,它确实偶尔发明白一些股票,而这些股票刚亏得验证时刻范畴内猜测精采。然而,仅仅几周或几个月后,在随机游走的差异阶段,它失败了。

没有玄妙的隐藏模式。这个模子只是由于偶尔的机遇而荣幸了屡次,而我选择了那些实例。这是不行一再的。

因此,呆板进修并不是把戏。它不能猜测随机序列,在实习模子时你必需很是警惕本身的成见。细心的验证是至关重要的。

我信托我不会是最后一个被阁楼里的旧藏宝图呼叫的人,可是要警惕。假如你想进修的话,随机的时刻序列要少得多。细心模仿、验证并意识到本身的成见。

原文链接:https://towardsdatascience.com/what-happened-when-i-tried-market-prediction-with-machine-learning-4108610b3422

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读