Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于数据集的问题 #36

Open
JohnCoffie opened this issue Mar 2, 2022 · 1 comment
Open

关于数据集的问题 #36

JohnCoffie opened this issue Mar 2, 2022 · 1 comment

Comments

@JohnCoffie
Copy link

作者,您好!我是一名刚接触知识图谱的小白,特别是实体融合这块领域,我们有幸搜到您提供的工具,但是我们水平很低,对于数据集这块我们有一个困惑,我们是不是数据集必须是一个一个标签页面,比如html或者xml?我们现实的需求其实是把两个相似的实体归类到一类本地下,例如梅西和C罗,都属于球员这个本地。请问我们应该怎么准备这个数据集呢?是不是我们需要事先生成一个个网页?格式是不是自定义?或者我们也可以直接使用一段文本作为数据集?问题很粗浅,还请您见谅。

@sunzequn
Copy link
Member

sunzequn commented Jun 1, 2022

你好,很抱歉回复晚了。把数据整理成三元组的形式,比如(梅西 职业 足球运动员),就可以用知识图谱表示学习这边的算法和工具了。具体的话,你看看参考你想用的那个算法或者工具的数据集的格式。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants