Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

实体对齐任务新数据集 #77

Open
lizhixi212 opened this issue Jun 12, 2023 · 3 comments
Open

实体对齐任务新数据集 #77

lizhixi212 opened this issue Jun 12, 2023 · 3 comments

Comments

@lizhixi212
Copy link

在dbp15k等老数据集上,现在的实体对齐方法都已经99%。
实体对齐这个任务有什么新数据集嘛?
还有研究的潜力嘛?

@sunzequn
Copy link
Contributor

同学你好,感谢你对这个方向的关注。印象中,dbp15k好像没有达到99%的效果?另外,你提到的这种非常高的效果,可能是因为一些数据集最开始是面向基于structure的实体对齐的,他们没有考虑name bias的问题,即等价的实体大多具有相似甚至相同的名字,可以参考这里的讨论。所以,如果引入name作为特征,可以在这些数据集上达到非常高的效果,但是这样的方法未必鲁棒。综上,这个方向仍然可以研究,但是要选择好动机和数据集,保证实验的公平。

@lizhixi212
Copy link
Author

image
非常感谢你的回复,我是这里看到的。
论文题目:Rethinking GNN-based Entity Alignment on Heterogeneous Knowledge Graphs: New Datasets and A New Method

@lizhixi212
Copy link
Author

同学你好,感谢你对这个方向的关注。印象中,dbp15k好像没有达到99%的效果?另外,你提到的这种非常高的效果,可能是因为一些数据集最开始是面向基于structure的实体对齐的,他们没有考虑name bias的问题,即等价的实体大多具有相似甚至相同的名字,可以参考这里的讨论。所以,如果引入name作为特征,可以在这些数据集上达到非常高的效果,但是这样的方法未必鲁棒。综上,这个方向仍然可以研究,但是要选择好动机和数据集,保证实验的公平。

非常感谢孙师兄的回复,我想问问实体对齐目前还有什么值得研究的方向吗?这些模型的性能都这么高了。我看有些论文用对比学习、多模态(图、文本)、无监督等。我和即将毕业的研三学长随意聊了几句,他说这个方向很难发好的paper,比较卷。希望孙师兄能指点一二,研一科研萌新不胜感激。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants