2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

要说互联网经济的代表,搜索引擎无疑是最有力的候选者之一,其在太平洋两岸更是分别造就了谷歌和百度这两大巨头。时至今日,即使App的崛起导致了互联网世界被撕裂,但搜索引擎依然是这个星球上绝大多数人通过互联网获取信息的主要途径,也还是整个流量大盘中的重要一极。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

但搜索引擎是如何向用户呈现网页链接,则是过去二十余年来无数互联网行业从业者期望揭开的秘密。如今在机缘巧合之下,谷歌努力保护了二十年的秘密被暴露在了阳光下。

日前,受众行为网站SparkToro联合创始人、知名SEO专家Rand Fishkin发布博客文章称,一位匿名人士向他分享了超过2500份谷歌内部文件,而这些有关谷歌搜索API(Content API Warehouse)的技术文档,以前所未有的方式揭示了谷歌搜索引擎的部分工作模式,其中涉及到谷歌收集和使用何种数据,以及如何处理小型网站等课题。

这批文档在2024年3月27日被上传到GitHub,直到2024年5月7日才被删除。让外界确信这一文档来自谷歌的原因,是其使用了与以往被公开的谷歌内部文档相同的符号风格、格式,甚至对于功能名称和引用也如出一辙,极为符合谷歌内部的规范。此外,Content API Warehouse又是谷歌给搜索引擎团队成员提供的索引,频繁被使用或许是其被某位谷歌员工错误上传到GitHub的原因。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

其实互联网大厂的内部文件被泄露是常用的事情,这也不足以引发讨论,真正让外界感到惊讶的,是这一批文件所提及的内容,与John Mueller等谷歌搜索的发言人多年来的说法直接矛盾。“撒谎这个词虽然很刺耳,但非常正确形容了谷歌所宣称的搜索算法内容”,这是数字营销机构iPullRank创始人Mike King对这一批文档进行解读后,所给出的评价。

尽管此次泄露的内容中,并没有直接表明决定谷歌如何使用特定数据来对搜索结果进行排名,但SEO专家们还是发现了一些端倪,包括其如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量,来影响搜索结果排名。例如作为谷歌搜索关系团队(Search Relations team)的负责人,John Mueller就曾声称,谷歌没有直接在搜索排名算法中使用点击量数据。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

然而在此次泄露的文档里,却频繁出现了“badClicks”、“goodClicks”、“lastLongestClicks”等与用户点击相关的描述。其中,lastLongestClicks和lastGoodClicks是用来衡量点击是否会随着时间衰减,badClicks和goodClicks则是评测用户在搜索结果中点击行为的指标,如果用户点击结果后不再跳出、并点击其他结果算是加分,否则是减分。

这些点击指标虽然看似无法证明谷歌在算法中使用了点击量,但联系之前美国司法部在谷歌反垄断诉讼中提及的内容,就几乎坐实谷歌说谎了。在此前的庭审中,谷歌搜索质量团队搜索副总裁Pandu Nayak确认了Navboost系统的存在,该系统会根据用户数据进行训练,能记住过去13个月的所有查询点击次数。此外,Navboost系统还有另一个名称Glue(胶水),后者聚合了不同类型的用户交互,例如点击、悬停、滚动和滑动,并创建了一个通用指标来比较网络结果和搜索功能。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

因此在Rand Fishkin、Mike King等SEO专家看来,以上种种迹象也证明了谷歌大概率在搜索引擎算法中使用了权重点击来作为影响排名的因素。另外相关专家也证实了Chrome数据被用于排名,但John Mueller此前在2022年却曾坚定地表示,“我们不使用Chrome的任何东西进行排名”。可是这些文档中所涉及与页面质量评分相关的模块中出现的“ChromeInTotal”参数,也就是网站在Chrome上的整体浏览量。

除此之外,这一批文档还解答了一个困扰SEO从业者许久的问题,即E-E-A-T在搜索排名中扮演什么角色?E-E-A-T所指的,就是作者模块。在这批文档中就出现了“author”参数,代表谷歌的算法会判断网页作者的属性。并提及了数个会导致“算法降级”的因素,包括网站导航链接的体验较差、链接锚文本与它所链接的目标网站不匹配等问题,都会导致相关网站在计算中被降级。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

这2500分文档尽管并未直接披露谷歌的搜索引擎排名算法,但还是让外界第一次了解了谷歌搜索引擎的具体工作原理。此外,更加重要的影响还体现在SEO领域,Rand Fishkin就明确表示,此次泄露的文档表明,在谷歌的搜索排名算法中品牌的作用极大。而这也就意味着,谷歌在台面之下将更多流量导向了大品牌建立的网站。换而言之,对于小型网站来说,SEO可能会是一个伪命题。

当然,受到此次内部文件泄露影响最大的莫过于谷歌。一直以来,外界都在质疑谷歌搜索缺乏透明度,现在这个质疑变成了现实。谷歌搜索关系团队本来应该是一个谷歌搜索和网站站长之间的桥梁,但谷歌方面却在某些方面误导后者,并试图控制站长们的SEO行为。谷歌此前一直在说要努力保护搜索结果的完整性免受操纵,结果自己却是这个“幕后黑手”。

2500份内部文档泄露,谷歌搜索的“黑匣子”被解密

无论如何,SEO从业者是谷歌的合作者而非敌人,欺骗合作伙伴的操作显然殊为不智,对他们撒谎被戳穿更是会让外界浮想联翩。那么未来谷歌的承诺、保证和声明,究竟还能保真吗?

【本文图片来自网络】

推荐阅读:

英特尔LunarLake架构解析:单核暴增、Xe2首秀

LunarLake“战未来”的潜力,或许比现在想象的还要更大一些。

游戏业务开启“第二阶段”,字节跳动再争朝夕

 能不能给新团队更多耐心,或是未来字节跳动游戏业务能否成功的基础。


本内容观点仅代表发布作者本人观点立场,欣文网平台只做信息内容展示和存储。发布作者:全网转载,转转请注明出处:https://www.xinenw.com/19841

(0)
上一篇 2024年6月7日 21:27
下一篇 2024年6月7日 21:28

相关推荐

  • “四小时睡眠法”?学动物睡觉真的靠谱吗?

    “转朱阁,低绮户,照无眠”(宋·苏轼《水调歌头·明月几时有》),失眠从古至今困扰着人类,人类也一直在努力解开关于睡眠的谜题。 你知道吗?虽然几乎所有生物体都需要睡眠,但不同物种甚至同一物种的不同个体间睡眠模式,却存在明显的差异。与人类相比,啮齿类动物的整个睡眠时长较短,睡眠时相切换频繁,遵循着多相睡眠模式。 图库版权图片,转载使用可能引发版权纠纷 什么是多相…

    2024年5月27日
    4700
  • 到底哪种死法,会被查手机隐私?🧐🧐

      博士一分钟,姿势涨不停   我是好奇博士 很高兴认识你们

    2024年5月28日
    5000
  • 生育率暴跌10年,日本结束内卷时代?

    越来越多的日企开始从“不想招人”转换成了“招不上人”,而之前“毕业就失业”的应届生们,则发现自己在少子化的“惠泽”下,反而逐步变成了人才市场的抢手货。 文 | 凯斯 编辑 | 闫如意 来源 | 凤凰WEEKLY(ID:phoenixweekly) 日本打工人,终于迎来了就业“反选时代”。 5月24日,日本公布了今年大学生就业率,98.1%,是自1997年以来…

    2024年6月8日
    3900
  • 2099元起,真我GT Neo6开箱体验 | 与SE版有哪些不同?

    就在今日下午,真我realme举办机圈首场AI数字人发布会,正式推出新品真我GT Neo6,由数字人AI”徐起“主讲,一起来看看有什么新品吧。 真我GT Neo6 (点击下方视频,观看新机开箱) 真我GT Neo6采用了和之前发布的真我GT Neo6 SE相同的设计,厚8.65mm,重191g,提供灵犀紫、流银骑士、苍野骇客三款配色。 性能方面,真我GT N…

    2024年5月21日
    7900
  • 钟薛高林盛开播卖红薯!直播带货成了「老赖」收容所…?

    △点击上方蓝字或下方卡片,和小柴一起防忽悠 还记得上个月,小柴写了一篇文章:钟薛高创始人称卖红薯也把债还上:网友,您可千万别…… 也就是上个月,跌落神坛的雪糕刺客钟薛高和其创始人林盛在沉寂一段时间后,残存的网红属性,又将其推向了热搜,原因是,林盛的「好兄弟」,也就是新浪财经CEO邓庆旭发了一条微博。 说林盛被限高,坐了一晚绿皮车到北京,告诉他,卖红薯也要把债…

    2024年5月30日
    6000

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
原欣文网读者需要重新注册,平台不断升级敬请见谅!