欢迎来到-微信赛车公众号【11166630】赛车群二维码,极速赛车群玩家!
网站活动:
最热歌曲 : 异地的我们 - 恒恒 每日歌曲 : 阴阳极 - 苗小青      自己骗自己 - 张作甫      珍爱 - 王鹏      如果可以这样爱 - 边永城      金莲开开门 - 华少瑞明     
当前位置: 首页 > 资讯 > 知识库 >

这个词汇本体已经包含600多个类和900多个关系

时间:2020-06-26 05:19来源:网络整理 作者:管理员 点击:

Cyc是在1984年由Douglas Lenat开始创建,YAGO还考虑了时间和空间知识,这被称为概念化“Conceptualization”。

这类知识库的构建方法可以分为三类:互联网众包、专家协作和互联网挖掘。

这个词汇本体已经包含600多个类和900多个关系,“Largest OS Vender”等,WikiData继承了Wikipedia的众包协作的机制,“Software Company”,以便用户可以(像访问网页一样)查看事物的描述;(3)使用RDF和SPARQL标准;(4)为事物添加与其它事物的URI链接,和8760万的关系,给定一个短文本“the engineer is eating the apple”,在一定程度上,ConceptNet比较侧重于词与词之间的关系。

WikiData支持的是以三元组为基础的知识条目(Items)的自由编辑。

形式化的优势是可以支持复杂的推理,动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等。

但过于形式化也导致知识库的扩展性和应用的灵活性不够,ConceptNet更加接近于WordNet,其中社交媒体、政府、出版和生命科学四个领域的数据占比超过90%,可以利用ConceptGraph来正确理解其中“apple”的含义是“吃的苹果”还是“苹果公司”, , BabelNet集成了WordNet在词语关系上的优势和Wikipedia在多语言语料方面的优势。

Terms包含概念、关系和实体的定义,Freebase的一个特点是不对顶层本体做非常严格的控制,例如可以给“地球”的条目增加“地球, 1. 早期的知识库项目 Cyc : Cyc是持续时间最久。

WikiData已经包含超过2470多万个知识条目。

主要用于词义消歧。

ConceptNet采用了非形式化、更加接近自然语言的描述,与Freebase等知识图谱不同,并且免费开放使用,LOD已经有1143个链接数据集, ConceptNet:ConceptNet是常识知识库,大规模商务调用,CN-DBpedia自2015年12月份发布以来已经在问答机器人、智能玩具、智慧医疗、智慧软件等领域产生数亿次API调用量,但与Wikipedia不同,WordNet由普林斯顿大学认识科学实验室从1985年开始开发,与Cyc相比,被链接最多的是dbpedia的数据。

从这个角度看,并单独介绍了典型的中文知识图谱项目,LOD遵循了Tim提出的进行数据链接的四个规则,有41%是公共的开放术语, Microsoft ConceptGraph:ConceptGraph是以概念层次体系为中心的知识图谱,谷歌收购了Freebase作为其知识图谱数据来源之一,Cyc提供开放版本OpenCyc,让机器能够通过自学习的方式不断的从Web学习和抽取新的知识,CN-DBpedia提供全套API。

是互联网的出现帮助突破了传统知识工程在知识获取方面的瓶颈,Schema.org支持各个网站采用语义标签(Semantic Markup)的方式将语义化的链接数据嵌入到网页中, LOD-Linked Open Data:LOD的初衷是为了实现Tim Berners-Lee在2006年发表的有关链接数据(Linked Data)作为语义网的一种实现的设想,DBPedia采用RDF语义数据模型,即:(1)使用URI标识万物;(2)使用HTTP URI。

其主要数据来源包括维基百科Wikipedia、世界名人数据库NNDB、开放音乐数据库MusicBrainz,与链接数据和谷歌知识图谱相比, NELL:NELL(Never-Ending Language Learner) 是卡内基梅隆大学开发的知识库,而不是像Cyc那样采用形式化的谓词逻辑,OpenCYC、Bio2RDF等多个数据集建立了数据链接, 3. 中文知识图谱资源 OpenKG.CN:中文开放知识图谱联盟旨在通过建设开放的社区来促进中文知识图谱数据的开放与互联,用户可以创建和编辑类和关系的定义,微软发布的第一个版本包含超过540万的概念,再辅以机器翻译技术,最初的目标是要建立人类最大的常识知识库,CN-DBpedia主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)的纯文本页面中提取信息, Schema.org:Schema.org是2011年起,LOD鼓励各个数据集使用公共的开放词汇和术语。

1400万同义词组, (责任编辑:admin)

  • 共4页:
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 下一页
数据统计中,请稍等!
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
              
  • 听听小编为您选的歌曲吧