基于机器学习的金融舆情量化系统
NO.1大数据分析已被广泛应用于科学、娱乐、**等领域,通过实时信息聚集机制,分析信息的预期结果。金融市场中的分析也一直是热门话题。https://quant.la/attachment/article/20180717/1531796858329373685.jpg
对于大多数人来说,分析价格走势是一种非常具有诱惑力的事情,许多交易者都会选择研究基本面分析或者技术分析,来判断未来的价格走势。
NO.2基本面分析者认为价格围绕着价值波动,以价值为依据着重于对影响价格的内在因素加以分析,以此决定何时买卖,对于短期的价格波动较不在乎。而技术分析者认为价格本身就反映了一切,也包括基本面。通过历史数据和技术分析,研究价格本身的变化,从中找出规律,并以此判断未来的价格,对于可能改变价格的外部因素较不在乎。
https://quant.la/attachment/article/20180717/1531796876204923426.jpg
但是,不管是用基本面分析,还是技术分析,得到的结果只是市场片面的一部分,而非全貌。对于不同风格的交易者来说,市场不只是基本面和技术面,还有与品种相关新闻信息面。
NO.3新闻是我们日常生活中非常容易接触到的一种资讯来源,也是交易者可以用来得知交易标的相关资讯的主要媒介之一。
https://quant.la/attachment/article/20180717/1531796891996216194.jpg
新闻最鲜明特点是,其具有舆论导向和情感倾向,对市场价格波动具有正效应、负效应或超效应。
NO.4同时,新闻也属于影响价格变化的非结构化资料,因为新闻事件本身就会影响市场参与者的买卖决定。它即可以影响其交易决策由买方变为卖方,亦可以由卖方变为买方,这将会导致市场买卖双方的力量发生变化,进而影响价格。
https://quant.la/attachment/article/20180717/1531796919364542665.jpg
因此,新闻事件除了是市场参与者在决定买卖交易的重要参考依据,同时也隐藏着具有影响价格变化的可能性。为此我们开发了 —— Argus (阿尔戈斯)系统。
NO.5Argus 系统借助高性能分布式网络爬虫,并结合先进的机器学习和自主研发的自然语言处理技术设计开发。对文本化信息的新闻进行结构化处理、数量化应用,以使人们对海量新闻信息可以进行更高效率阅读和管理。https://quant.la/attachment/article/20180717/1531796936875716469.jpg
Argus 系统全天候抓取与金融市场有关的上百家数据源,形成实时流动的多元多类全球信息池。包括但不限于:国内外新闻、网络新闻、金融研报、供需数据、库存数据、论坛贴吧、博客文章、微博信息、实时天气、市场情绪等多元化的数据资源,并给予自适应平衡权重。
NO.6Argus 系统有两种数据处理方式,即:基本数据处理和自然语言处理。基本数据处理主要分析影响市场价格的内在因素,评估交易标的合理价位。
https://quant.la/attachment/article/20180717/1531796962960740468.jpg
自然语言处理则根据原始数据的不同,识别、提取、分类。分析大众反馈,并转化为具有社会学意义的非结构化数据。探索出他们对市场的主观感受,以及未来预期看法。
NO.7Argus 系统基于自主研发的机器学习技术,既考虑了传统金融领域的基本数据变量,也考虑了自然语言探索技术数据变量。
https://quant.la/attachment/article/20180717/1531796980659473972.jpg
作为一类新型机器学习方法,Argus 系统能较好地解决小样本、非线性、高维数等神经网络不能解决的问题,克服了传统方法的诸多缺点,并且具有更高的精确度。
NO.8如何使用 Argus?我们提供了 Argus 地址:https://quant.la/Argus/复制上述的 Argus 地址,到浏览器地址栏中,即可呈现:
https://quant.la/attachment/article/20180717/1531797004001642190.jpg
另外,我们开放 Argus 的 API 调用接口:http://quant.la/API/Argus/predict使用 发明者量化交易平台,对接 Argus 的 API,源码如下:https://quant.la/attachment/article/20180717/1531797030280707638.jpg
调用 Argus 接口并解析,返回一个包含字典的二维数组:
https://quant.la/attachment/article/20180717/1531797040197593636.jpg
其中字典中 key 的含义为:
[*]count:使用了多少数据信息
[*]time:最后一次更新数据信息时间
[*]label:标签 ID
[*]name:标签名称
[*]predict:舆情解读(临界点在0.5,即:大于 0.5 倾向于上涨)
NO.9尽管人工智能赋予 Argus 系统强大的功能,但 Argus 系统所产生的结果,都只是对所有的信息的绝对客观描述,它并不会掺杂任何主观偏见。换句话说,Argus 系统所产生的结果,并非是针对信息判断,而是对所有信息的即时反馈。
https://quant.la/attachment/article/20180717/1531797059419172760.jpg
总而言之,若想真正拥有盈利上的掌控感,Argus 系统无疑是最佳选择,她就像是超级网络情报员,实时向您提供全网络高纬度精准信息。通过其结构化处理生成量化信息因子,可用于量化投资领域。在 BotVS 量化交易平台中,即可开发 Argus 因子量化策略,获取超额投资收益。目前 Argus 系统仅支持内盘商品期货舆情量化,不久的将来,Argus 系统将会拓展到更多的金融领域,包括:A股、美股、港股、外盘商品期货、数字货币。同时 Argus 系统在未来将会不断的更新迭代,以及自我强化学习,未来将更加智能。近年 AI 的重新兴起,赋予了市场的无限可能。我们期盼 Argus 系统在最大化用户盈利的同时,更能引领一场群体智慧的进化变革。转载:宽客在线 原文链接:https://quant.la/Article/View/817/
页:
[1]