Google新闻排名算法透视-深圳诺仁

时间: 2021-04-29 10:49 来源: 作者: 阅读:


       自2002年推出以来,Google News已成为Web上最大的新闻内容聚合器。在去年9月《大西洋月刊》的一篇文章中,Google News的主管曾说该网站收集的新闻来源超过5万个,每周的独立访客超过10亿。该网站完全由计算机生成,每天都会收集和展示从全球数千个新闻来源的头条新闻。

       Google甚少透露相关的算法和规则,只是说为了保证显示的内容质量会定期调整新闻排名。据信,Google自2003年以来已经三次调整了排名算法。

       Computerworld 在美国专利办公室网站查询时碰巧发现了Google去年的一项专利申请—《改进新闻文章排名的算法与系统》,专利申请号为20120158711。通过对申请文档的分析,从中可以了解到Google对新闻故事排名的一些指标。这些指标决定了哪些新闻可以被放在Google News的显著位置。

       专利申请中运用了超过12项指标来对其他网站的新闻文章进行排名。包括新闻网站定期产生的新闻数量、新闻来源的平均长度、新闻来源新闻报道的重要性、突发新闻得分、使用模式、舆论意见、流通量。