给定一位研究者论文被引用次数的数组(被引用次数是非负整数)。编写一个方法,计算出研究者的 h指数。 h 指数的定义: “一位有
h指数的学者,代表他(她)的 N 篇论文中至多有 h 篇论文,分别被引用了至少
h 次,其余的N - h
篇论文每篇被引用次数不多于 h 次。”
示例
输入: citations = [3,0,6,1,5]
输出: 3
解释: 给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
` 由于研究者有 3 篇论文每篇至少被引用了 3 次,其余两篇论文每篇被引用不多于 3 次,所以她的 h 指数是 3。
说明: 如果 h 有多种可能的值,h 指数是其中最大的那个。
这道题翻译有问题,关于H指数的定义是:A scientist has index h if h of his/her N papers have at least h citations each, and the other N − h papers have no more than h citations each.
所以,实际上就是找到一个h,然后至少有h篇论文的引用指数大于h。
那么思路就比较明朗了,先排序,然后从小到大。对于每个i,可能的h值是min(n-i, citations[i])
,也就是至少有这么多文章和至少这么多引用的最小值。然后我们遍历整个数组,求解每个i可能的h值,取最大值就好了。
# 小于等于h篇论文 被引用大于等于h次
# 其他N-h篇 引用数小于等于h
class Solution:
def moreThan(self, citations, x):
count = 0
for e in citations:
if e >= x:
count += 1
return count
#如果一个学者的h指数为x,那么影响因子大于等于x的文章数也应该大于等于x
def hIndex(self, citations):
citations.sort()
n, h = len(citations), 0
for i in range(0, n):
h = max(h, min(n-i, citations[i]))
return h