大数据与人工智能是密不可分的,大数据的发展离不开人工智能,没有人工智能的加持大数据就无法拥有智能。而人工智能的发展又离不开数据的支持,它需要海量数据作为思考决策的基础。
“大数据”这个词热了十几年,“人工智能”这个词也热了超过三年。回顾近几年的发展,我们会发现在很多领域机器其实都超过了人类。
海量的大数据在很多狭窄的领域远远击败人类所能够做的极限,可以说,在这些领域人类基本不会有任何机会胜过机器。比如:我们读一本书的速度是很慢的,而IBM人工智能参加电视比赛的时候,一天就能够把全部美国国会图书馆的所有藏书读完。
大数据和机器学习“革命”:目前,联网设备以电子方式获得了大多数的记录和观察。这原则上允许投资者实时访问广泛的市场相关数据。例如,可用于评估通货膨胀数百万项目的在线价格,可以实时估计销售量的商店访问和交易的客户数量,可以评估石油钻井平台或农业活动产量的卫星图像。
鉴于可用的数据量,有经验的量化投资者在理论上可以接近获得实时的某公司特定的数据,而这些数据不能从传统的数据源获得。在实践中,有用的数据不容易获得,需要购买,需要组织和分析另类数据集以提取可交易信号。大型或非结构化数据集的分析通常使用机器学习来完成。在设计定量策略方面,成功应用机器学习技术需要一定的理论知识和很多实践经验。
1)可用数据量的指数增加;
2)提高计算能力和数据存储容量的成本降低;
3)分析复杂数据集的机器学习方法取得了进展。
上图展示了这一分类。这种一方法扩展了Kitchin(2015年)和联合国报告(2015年)在非财务文本中早期的尝试。
虽然这种分类法在某种程度上只是理论上的,但是,在分析这三个类型的数据时,确实存在共同特征,分析方法和共同的挑战。例如,个人生成的数据通常是非结构化的文本格式,需要自然语言处理。传感器生成的数据往往是非结构化的,并且可能需要分析技术,例如计数对象,或消除天气/云从卫星图像的影响。许多商业上生成的数据集,如信用卡交易和公司的“废弃”数据都面临共同的法律和隐私问题。
鉴于风险和不确定的回报,许多投资者都在思考何时应该采用更具量化性的、数据驱动型的投资方法。首先我们简要概述实施过程中的主要步骤(例如有多少需要外包、内部构建大数据/机器学习所需的人才、典型的技术设置等等)。如下图所示:
大数据与机器学习革命将深刻改变投资环境。随着越来越多的投资者采用大数据,市场的反应将更快,并将越来越多地期待传统或“旧”数据源。这将为量化经理和愿意采用和了解新数据集和分析方法的人们提供优势。
那些不学习、拒绝进化的人将面临过时的风险。不管这些变化的时间表如何,我们认为,分析师,投资组合经理、交易者和首席信息官最终将不得不熟悉大数据和机器学习的发展和相关的交易策略。
以上就是JP摩根报告的部分内容,在报告中详细介绍了结合数据的人工智能在传统金融行业的应用,对于这方面感兴趣的同学肯定有了新的思考。但要实现这个目标我们需要具备什么呢?
在编程语言和相关理论基础的支持下,数据分析与人工智能暑期线上学术营,通过典型案例分析,使学员在短时间内了解与掌握大数据的知识与技能,培养其科学与创新思维,提高分析和解决实际问题的综合能力,为未来研究和工作奠定基础。