结构化数据与知识图谱的案例研究

柯基数据|企业知识图谱落地案例分享

柯基数据|企业知识图谱落地案例分享一、什么是知识图谱?知识图谱,是一种结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。每个节点代表现实世界中的某个实体,连边上则标记实体间的关系。其基本组成单位是“实体-属性-关系”,构成网状的知识结构,能够融合碎片化的信息,建立领域知识模型,挖掘复杂的关联关系和传递影响,辅助智能决策。从技术角度看,知识图谱是一套工程技术,包括知识抽取、知识表示、知识存储、知识推理、知识检索、知识问答等一系列技术。二、知识抽取知识抽取是实现自动化构建大规模知识图谱的重要技术,其目的在于从不同来源、不同结构的数据中进行知识提取并存入知识图谱中。知识抽取的概念最早出现于NLP研究领域,是指自动化地从文本中发现和抽取相关信息,并将多个文本碎片中的信息进行合并,将非结构化数据转换为结构化数据。知识抽取子任务包括:命名实体识别:发现实体名称,并将其进行分类。实体关系抽取:识别抽取实体及实体之间的关系。知识图谱的数据抽取包括面向结构化数据、半结构化数据和非结构化数据的知识抽取。面向结构化数据的知识抽取:垂直领域的知识往往来源于支撑企业内部系统的关系数据库。面向半结构化数据的知识抽取:从百科数据中抽取知识。面向非结构化数据的知识抽取:从文本中抽取实体信息元素,如人名、组织机构名、地理位置等。三、新冠肺炎知识图谱智能防控解决方案案例背景:面对新冠病毒疫情,快速准确的找到确诊病例的密切接触人员,圈定可能的扩散群体和小区,对这些人群和小区采取必要的隔离消毒措施是关键。同时,既要打赢疫情阻击战,也要考虑对经济发展、百姓就业的冲击程度。知识图谱作为认知智能的关键技术,可以发现数据中的关联关系并构建网络,为疫情防控提供辅助。应用场景:通过病人的LBS数据,结合政府调研的病例数据,以确诊病例为中心,结合疑似病例数据,辅助防疫人员:快速筛查可能的直接和间接接触人群列表,分级隔离。查找患者传播链,找到超级传播者进行重点关注。基于知识图谱的分析:超级传播者识别:早期发现、及时诊断和严格管理超级传播者对于传染病的防控非常重要。确诊病例之间传播特征分析:通过知识图谱直观展示确诊病例之间的接触关系,为疫情的隔离措施、公众防护提供指导。确诊病例传播方向冲突检测:提醒流行病学调查人员进行补充调查,直到图谱中不存在冲突的错误为止。疫情传播的本地扩散分析:显示本地的疫情防控措施薄弱,需要本地防控部门及早发现问题,堵住漏洞。隔离人群和区域分析:有助于精准施策,降低疫情防控对老百姓生活的影响。基于知识图谱的智能问答:柯基数据联合中国疾控中心的权威专家们开发了新冠肺炎智能问答小助手。该问答系统基于专家认可的知识分类和模型,对内容进行切分,形成标准问答对,并经过多轮训练和优化,实现准确问答。前端通过H5页面接入公众号,提供肺炎疫情问答服务。四、基于知识图谱的智能客服机器人南京柯基数据科技有限公司致力于通过知识图谱技术构建大数据关联挖掘平台,已帮助多家医药大健康企业打通内部数据孤岛,建立关联知识库。其中,九阳集团通过应用知识图谱平台,实现了智能客服机器人全年无休、秒级精准应答,有效提升了客服部门的服务效率和用户满意度。五、结语知识图谱是一个既充满挑战又非常有趣的领域。只要有正确的应用场景,知识图谱所能发挥的价值值得期待。未来,知识图谱技术将普及到各个领域当中,为企业和机构提供更加智能、高效的解决方案。


nginx