首发最新研究成果!吾道科技亮相CCKS

2022-08-30

640.gif



2022年8月24日至27日,由中国中文信息学会(CIPS)主办的2022年全国知识图谱与语义计算大会(CCKS 2022)于秦皇岛召开。今年大会包含前沿技术讲习及主会讨论,主题为“知识图谱赋能数字经济”,旨在探讨数字产业化与产业数字化过程中的语言理解、知识获取、知识融合、知识推理等方面的关键技术,以知识驱动创新应用。

1669874446319364.jpg

清华大学孙茂松教授演讲现场

吾道科技(iWudao)携手华中科技大学在大会发布最新研究论文《从金融公告中自动构建股权结构知识图谱》,以构建金融知识图谱为核心目标,优化金融公告信息抽取并构建知识图谱,提供了一种更可靠的框图识别系统,专门应用于股权结构图识别,目标为进一步推动知识图谱在金融领域内的应用。

论文主要聚焦典型富格式金融公告的结构化识别与解析,专攻业内瓶颈问题,即金融公告文档中各类插图尤其是股权结构图的分析理解工作。各类金融公告作为典型的富格式(Rich-format)商业文档,富格式文档中插图的识别和理解研究目前还处于早期阶段,没有专门对金融公告文档中各类插图进行分析理解。股权结构图是金融公告中非常重要的一类框图(Diagram),通常比工商注册数据提供更及时、全面的信息。

640 (2).jpg
吾道科技交流参会论文

吾道科技研究团队从真实的金融公告中提取近两千份股权结构图实例,构建业务首个评测基准数据集,基于Oriented R-CNN,使用改进的关键点检测方法对股权结构图的节点和连线进行检测,并以目标检测的mAP和股权关系的准确率F1为评测标准,最后生成股权关系三元图,能够准确识别各种场景下的复杂连线,经过实验验证具有显著优势。此外,利用股权结构图“节点-连线”的结构特点,团队还自主开发了一套股权结构图数据生成工具和对应标注系统

吾道科技将持续利用最前沿研究成果,优化金融公告提取,并基于金融知识图谱为国内金融机构提供便利、全面、具有关联性、契合应用场景的金融大数据服务。