Google phát hiện nội dung copy như thế nào ?

Khi bạn đăng một bài viết bằng tất cả tâm huyết, chất xám của mình mà sau một thời gian, bạn lại thấy bài viết của đối thủ có nội dung giống hệt mình nhưng họ lại có thứ hạng cao hơn bạn, bạn có thấy bất công không? Thật ra từ lâu Google đã luôn tìm mọi cách để phát hiện được nội dung đi copy và luôn có hình phạt thích đáng cho hành động đó, vậy google đọc nội dung và phát hiện copy như thế nào? Hãy cùng Minsoftware tìm hiểu nhé!

Cách google đọc nội dung của website

Việc đầu tiên google sẽ làm đó là đọc nội dung trang và kiểm tra xem nó là bài viết được copy hay một bài viết mới nhất. Sau đó mới đánh chỉ mục (index) cho link đó kèm theo xếp hạng trên google search. Tức là google bot đã nhận được tín hiệu từ BOT về một content mới xuất hiện trên website nhưng chưa vội vàng đánh chỉ mục và xếp hạng. Dựa trên lịch sử và độ trust của website mà tốc độ index được thay đổi theo thời gian. Ví dụ:
  • 1 unique content được xuất bản trên 1 website có lịch sử tốt về chất lượng nội dung thì tốc độ index sẽ được tăng lên.
  • 1 content được copy từ nơi khác thì có thêm các trường hợp như sau:
    • Copy lên các site chất lượng thấp và có lịch sử unique content kém sẽ được google đánh chỉ mục lâu hơn và thứ hạng từ khóa search chính sác title bài viết thấp hơn so với các trang có bản quyền về nội dung đó (Các website có nội dung đang tải đầu tiên và duy nhất trong một thời điểm). Với hình thức này Google có thể hạn chế được việc “cò gỗ mổ cò thật” đem lại sự công bằng cho các tác giả đã tốn tâm huyết và thời gian để xuất bản một nội dung tốt.
    • Copy lên các website có độ trust cao: Việc sau khi copy bài viết của tác giả lên các trang web được google đánh giá là uy tín ban đầu google vẫn đánh chỉ mục ngay lập tức sau khi post bài. Tuy nhiên sau một thời gian đối chiếu với những dữ liệu text mà BOT trên website tác giả đã chả về, dựa trên thời gian mà bot crawl được các text đó để xếp hạng từ khóa trên google search.

Có rất nhiều Webmaster đặt câu hỏi: “Tại sao bài thằng khác copy của mình mà nó ở trên cả bài của mình tự viết”. mình thấy những câu hỏi kiểu này giống giống câu: Bắc thang lên hỏi ông giời, lấy tiền cho gái có đòi được không? Ông giời ông chả lời không… Đến tao còn dại huống chi là mày”

Như vậy theo mình thấy là google có ít nhất 2 dữ liệu đánh chỉ mục cho các nội dung mới được xuất bản để đối chiếu.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

035.839.4040