对话王俊:深度解读ChatGPT的金融领域应用,AI生产力革命

2023-02-27

Open AI 的CEO山姆·阿尔特曼前段时间在接受采访时说到,“从某种意义而言,ChatGPT的诞生,可以让创业公司不用从头开始训练大规模的模型,只需在这基础之上针对每个垂类进行训练。这1%的垂类训练对于模型来说才是真正重要的。”


王俊博士是长期从事专研机器学习及自然语言处理的人工智能专家,长期base在硅谷,与国内外顶尖人工智能从业者保持密切交流,在AI发展及落地应用上具有丰富经验,他还创立了金融大数据公司iWudao吾道科技,专研金融+AI的大数据业务发展模式,是当下最新热点。


借助王俊博士回国处理业务的机会,我们有幸跟他交流,用国际化的视野,站在金融科技从业者的角度,听他风趣地阐述GPT对金融业的潜在冲击和应用潜力。


GPT会对金融业界产生什么影响?


“GPT在一两年内就会完成在金融科技领域落地,产生革命性的影响,”王俊打趣道:“或许现在就如同革命的前夜,我们得主动投身变革。”


提到王俊最熟悉的投资和投行领域,他举了几个形象的例子:“首先是机构投资者,我们可以构思一个智能投资工具,结合GPT优秀的语言理解能力和生成能力,以后可能你提问:‘本周案例包含哪些赛道,有哪些推荐的案例’,机器就会帮你通读案头上的所有BP,并对标同行的投资事件,很短时间内给你提炼并比对投资价值。”




“又如投行业界的智能备忘录,以后只需要问一下项目可能会遇到什么问询,机器就可以提供同行业的案例和历史同类型项目的监管问题,还可以结合手头项目的质地,给你提供潜在的监管问询,甚至给你参考答案。而且你想要Bullet point形式或者表格形式,或者让GPT给你归纳要点和摘要,都没问题。”他进一步补充:“这些只是简单的例子,我的公司一直在做金融科技和大数据在投行和投资领域的应用,GPT的潜力之大,着实让我们这些做AI应用的非常兴奋。”


IMG_0915.JPG

▲ 王俊参加NeurIPS


“为什么说它具有革命性呢?”王俊说道:“ChatGPT去年11月底发布的时候,我就在美国的NeurIPS 2022会议,准备现场发布的一研究论文,当时AI Community都在讨论ChatGPT,对它表现出来的能力感到非常意外。以前,对于任何一个严肃的AI研究者,你只要谈到'AGI(通用人工智能)',大家都会不以为然,觉得是件遥不可及的事情,但现在ChatGPT让我们看到了一线可能的亮光。”


也许ChatGPT就是第四次工业革命的引信。


GPT要怎么落地于金融领域?


ChatGPT是一个LLM(大语言模型,它不是万能的。对于我们金融专业领域来说没办法做到plug and play(即插即用)。它虽然具备极其出色的自然语言理解能力,能够理解人的提问,但它毕竟只是一个空空的脑袋,他即使理解了你的问题,也没法给你倒墨水出来。说得通俗易懂一点,就像跟一个理解能力高超的门外汉对话,他能理解你说的所有问题,但知识储备跟不上,就只能跟你胡编瞎造了,专业上成为Hallucination,也就是随机生成的虚幻答案。所以要用好GPT,还需要专业领域在最后一公里做好适配


这其实就是专业垂直领域AI公司要补上的地方。我们的做法是对接GPT和我们本身的金融大数据库,对大模型做1%的fine tune(微调),通过垂类训练让GPT能充分理解金融专业领域的相关知识,从而在每次回答问题时,都能给予用户正确靠谱的答案。


“在成功学上,我们不是经常说成功靠得99%的努力和1%的天赋,在我们的训练过程也一样,99%依靠的是ChatGPT这个性能出色的基础模型,那1%就是我们注入的垂直领域知识。虽然说努力很重要,但天赋才是决定上限的因素。我们最近也在不断训练打磨完善这一套工具,目的也是希望让一级资本市场的从业者们能用上专业的金融科技版GPT类工具。”


在GPT的落地上,你目前在做什么工作呢?


“无论是GPT还是其它的自然语言处理模型,吾道已经做了大量预研实验工作,已经在开发落地应用,”王俊聊到具体方案:“ChatGPT其中一个突出能力是其能够自然流畅地生成长文本,让它可以直接辅助各类文档的撰写工作。目前市面上已经有基于GPT的辅助撰写系统,但主要还是应用于市场文案、体育新闻和财经新闻的写作。而金融专业领域对文档质量要求更严格,同时涉及到复杂的多数据源信息整合,我们后续会将ChatGPT落地到上述专业场景,并基于专业金融知识库,让其能根据用户的指示,并基于专业金融知识库来灵活高效生成各种文字风格的多类型金融报告和文档。ChatGPT在很大程度上改进人机交互的方式,这也是目前ChatGPT能产生如此大反响的最要原因。”



其次是在结构化数据抽取上,我们通常采用对pre-trained model(预训练模型,这需要标注很多的数据来训练模型才能达到高精度抽取。我们正在考虑利用GPT卓越的小样本学习能力,以提高在获取部分训练数据相对困难的场景的效率,同时根据实际应用场景,以及模型训练部署整个生命周期的综合成本来考虑如何让GPT落地。而对于这类任务,我们也可以利用ChatGPT快速高效产生一批质量还不错的金融领域专业文档的标注数据再微调常规模型。这可以协助我们未来提高构建金融专业领域知识图谱的效率。



除了前面提到的ChatGPT输出内容很容易一本正经的胡说八道外,目前还存在例如缺乏数学计算能力、推理能力有限等问题,所以尽管ChatGPT有很强的语言理解能力来理解用户的意图,但是往往还是需要利用外部的工具来完成特定的任务。现在已经有一些最新研究聚焦在如何让LLM可以自动的选择合适的外部工具来完成在整个工作任务。因此将来金融RPA领域,ChatGPT也能发挥很大作用。


111.jpg

▲ 电影《芬奇》剧照




用一段话来总结你对ChatGPT的看法?


电影《芬奇》里,机器人芬奇被注入大量数据,从而成为主人逃离末日的得力助手。而理想已逐渐演化成现实的当下,业界关注的不仅仅只是ChatGPT能实现多高的智能化,还有它的出现能为整个行业带来哪些机遇和改变?类似Open AI等基础模型提供者开疆拓土,而这1%的垂类训练的角色,是我和我公司一直在努力的方向。


★   王俊创立的公司为iWudao吾道科技,这是一家金融数据公司,最近一直在不断探索ChatGPT在金融垂直领域的应用。