Google 如何检测复制的内容？

当你全心全意地发布一篇文章，但过了一段时间后，你发现竞争对手的文章内容相同，但排名却比你高，你会觉得不公平吗？事实上，谷歌长期以来一直在努力寻找检测抄袭内容的方法，并始终对此类行为进行相应的惩罚，那么谷歌是如何读取内容并检测抄袭行为的呢？让我们来 Minsoftware 查出！

Google 如何读取网站内容

Google 会做的第一件事就是读取网页内容，检查它是复制的文章还是新文章。然后，它会将该链接连同 Google 搜索排名一起收录。这意味着 Google 机器人已经收到了来自机器人的关于网站上出现新内容的信号，但并没有急于对其进行收录和排名。根据网站的历史记录和信任度，收录速度会随着时间而变化。例如：

1. 在内容质量历史良好的网站上发布独特的内容将提高索引速度。
1 从其他地方复制的内容有以下附加情况：
- 复制到低质量网站和独特内容历史较差的网站，会被谷歌索引更长时间，文章标题的精准搜索关键词排名也会低于有版权的网站（内容一次只加载一次的网站）。通过这种方式，谷歌可以限制“木材经纪人啄食真鹳”的行为，从而为那些花费时间和精力发布优质内容的作者带来公平。
- 复制到高信任度的网站：将作者的文章复制到 Google 认为信誉良好的网站后，Google 最初会在文章发布后立即将其编入索引。但是，经过一段时间后，Google 会根据机器人抓取作者网站上的文本数据返回的结果（该数据基于机器人抓取这些文本的时间）进行比对，从而对 Google 搜索中的关键词进行排名。

很多站长都会问：“为什么别人抄袭了我的文章，而且放在我自己的文章上面？”我觉得这类问题就好比：“如果你爬上梯子问上帝，你能把给女孩的钱要回来吗？上帝肯定不会回答……连我都这么蠢，更何况你呢？”

因此，我认为 Google 至少有 2 个新发布内容的索引数据可供比较。

参见：