Google Panda Back là gì? 9 tác nhân Website bị án phạt Panda

Bài viết này tôi sẽ giúp cho bạn hiểu khái niệm Google Panda là gì và đưa ra những nguyên nhân khiến cho website của bạn bị phạt bởi thuật toán Panda này.

Cùng chủ đề:

  1. Google Penguin: Triệu chứng, nguyên nhân và cách chữa trị
  2. Google Sandbox: Sự thật lý do website bạn bị kìm hãm & cách hóa giải

Mục đích chính của bản cập nhật thuật toán Google Panda là:

  • Xem xét chất lượng nội dung website. Qua đó nhằm loại bỏ phần nội dung sai phạm, nội dung rác hoặc được copy từ những trang khác.
  • Làm giảm sự hiện diện của các trang web chất lượng thấp trong kết quả Organic Search của Google.
  • Thưởng cho các trang web chất lượng cao.

Nếu trang website của bạn bị rớt hạng trong quá trình thuật toán Panda đang cập nhật. Điều này lặp đi lặp lại trong thời gian dài thì rất có thể là do nội dung website không đủ sức thuyết phục với Google.

Trên thực tế thì website đang tăng trưởng tốt vẫn có khả năng bị Panda phạt.

Dù website đang trên đà phát triển nhưng vẫn bị Google Panda “dòm ngó”

9 nguyên nhân website bị dính án phạt Panda

7 nguyên nhân được xem là do Onpage

#1 – Nội dung mỏng, thông tin ít (Thin Content)

Thin content (hay còn gọi là nội dung mỏng) ở đây bạn có thể hiểu theo cả nghĩa đen lẫn nghĩa bóng: content ngắn và chất lượng content thấp!

Về chất lượng content thấp có thể kể đến các lỗi như:

  • Nội dung copy từ web khác
  • Nội dung không cung cấp giá trị hữu ích cho người đọc
  • Topic ở mỗi bài viết không liên quan nhiều đến lĩnh vực chính của website, không đồng nhất về chủ đề.

#2 – Trùng lặp nội dung (Duplicate Content)

Nội dung copy thường xuất hiện ở nhiều website trên Internet.

Vì bạn không biết phải ghi gì, miêu tả như thế nào cho bài viết của bạn. Từ đó bạn buộc phải sao chép nội dung bài viết của người khác được lấy từ nhiều nguồn Internet ở nhiều nơi.

Duplicate Content cũng xảy ra ngay trên chính website của bạn khi bạn có nhiều trang chứa cùng một nội dung. Hoặc có rất ít sự biến đổi trong nội dung giữa các trang.

Lưu ý: Google tính trùng lặp về nội dung theo:

  • Nội dung từng trang
  • Thẻ Meta Description
  • Thẻ Heading
  • Code HTML
  • Khung giao diện
  • Khung design mặc định của website (Ví dụ: bài viết chữ quá ít nhưng khung design lại lớn)
Google tính nội dung trùng lặp dựa trên Code HTML
Website có nội dung thẻ titles hoặc H1, H2 giống nhau cũng bị Google panda tính là duplicate content.

Google định nghĩa content là toàn bộ code HTML của website.

Khi cào (crawl) dữ liệu website thì Google bot sẽ cào code html từ trên xuống dưới, từ trái sang phải.

Khung design mặc định của website giống nhau mỗi trang cũng được tính là trùng lặp. HTML của bạn phải unique 51% thì website mới an toàn. Nếu 1 bài của bạn chỉ cỡ 300 – 400 chữ mà khung design cố định của website lớn thì chắc chắn website bạn bị trùng lặp.

Do vậy hầu hết website Việt Nam bị duplicated content, nhất là các trang thương mại điện tử bán hàng.

Xem thêm: Content E-Commerce: Chiến lược nội dung cho Trang TMĐT

Google định nghĩa Content như thế nào?

Duplicate content là một điều vô cùng tối kị và cực kì nguy hiểm cho website của bạn. Mọi công sức của bạn có thể sẽ “đổ sông đổ bể” chỉ vì đạo một vài câu văn.

#3 – Nội dung có chất lượng thấp

Các website cung cấp ít giá trị hoặc nội dung chất lượng thấp cho người đọc vì thiếu thông tin chuyên sâu.

Nội dung content thường:

  • Truyền tải vắn tắt, qua loa
  • Thiếu ý
  • Không phân tích chuyên sâu, ít có sự đào sâu nghiên cứu.
  • Ít tìm tòi, mở rộng chủ đề

#4 – Website thiếu Authority/ không có độ tin tưởng cao

Nội dung được tạo ra bởi các nguồn không được xác minh về Entity. Thiếu thẩm quyền (authority), thiếu độ tin cậy (trust) cho người dùng. Điều đó sẽ làm webiste của bạn bị Google Panda loại bỏ ngay lập tức.

Xem thêm 11 Cách tăng độ trust cho website hiệu quả 2022: tại đây

#5 – Content farming

Content farming là thuật ngữ dùng để ám chỉ các website spam nội dung, thu thập và copy content của các web khác, sau đó bị nhồi nhét rất nhiều từ khóa và tối ưu SEO tốt hơn so với web gốc.

Các web sử dụng content farming này đều hướng tới mục đích tăng thứ hạng từ khóa trên công cụ tìm kiếm nhiều hơn là tập trung cung cấp giá trị cho người đọc.

#6 – Website có quá nhiều nội dung quảng cáo

Website chủ yếu đặt nhiều banner quảng cáo với rất ít nội dung thực sự cung cấp giá trị cho người đọc. Hầu hết các web này được tạo ra để kiếm tiền từ việc đặt banner quảng cáo, ít nội dung.

#7 – Lỗi Schema

Google đưa ra quy luật rõ ràng về vấn đề Schema như sau:

Nếu bạn khai gì trên schema thì người dùng phải thấy y chang như vậy trên website của bạn.

Ví dụ: bạn làm schema review và khai rằng website đang có 100 lượt review trên website, đồng thời website được đánh giá 5 sao,… thì lẽ dĩ nhiên, tất cả thông số ấy phải hiển thị chính xác trên trang web bạn đang quản lý.

Website bị phạt Google Panda do sai schema.

Nếu các thông tin này sai lệch hay nói cách khác là schema bạn làm sai với quy luật của Google; đến lúc nào đó Google scan qua và thu thập đủ dữ liệu về bạn, nó sẽ tiến hành phạt bạn ngay.

2 nguyên nhân còn lại do Offpage

#8 – Trộn nội dung (Spin content)

Spin content (trộn nội dung) lại với nhau để cho ra những bài viết mới.

Bài viết mới có thể cùng ý nghĩa với bài viết gốc nhưng khác về mặt câu chữ hoặc cũng có thể mang ý nghĩa khác hoàn toàn so bài viết gốc.

Tuy nhiên, hình thức Spin Content tạo ra những nội dung này, đã được Google xem như là nội dung rác.

Google liên tục cập nhật nhiều thuật toán nhằm xóa bỏ những nội dung rác này. Đặc biệt nhất là dùng thuật toán Google Panda để xóa bỏ nó.

#9 – Keyword Cannibalization

Keyword Cannibalization là từ khóa cạnh tranh lẫn nhau, hiện tượng khi bạn vô tình hay có chủ ý tạo lập nên nhiều bài viết cùng nói về một chủ đề hay cùng tối ưu một số từ khóa cụ thể.

Dẫn đến các URL này dù đều được hiển thị trên công cụ tìm kiếm, nhưng kết quả cuối cùng là không có trang nào lên vị trí top 10.

Google Panda khi vào xem xét website, nó sẽ ưu tiên quan sát những trang được tối ưu duy nhất.

Nếu nó vào scan một ngàn trang và thấy tất cả các trang đều tối ưu theo:

  • Các chủ đề bài viết khác nhau
  • Bộ từ khóa riêng biệt

Thì Google sẽ dễ dàng nhận diện và cho bạn lên đúng URL hơn.

Note: Cách kiểm tra Keyword Cannibalization:

Sử dụng công cụ Screaming Frog hoặc search google theo cú pháp site:domain + keyword seo.

Website bị phạt Panda do lỗi keyword cannibalization.

2 dấu hiệu website đang bị Google Panda phạt

Từ bài viết, bạn cũng nhận ra được dấu hiệu chính cho thấy website đang “dính” Panda đó là:

Organic traffic giảm dần theo thời gian

Đây được xem là dấu hiệu phổ biến và dễ nhận diện nhất.

Ở khoảng thời gian đầu giảm traffic, có thể bạn thấy nó không ảnh hưởng gì nhiều.

Tuy nhiên, qua 1 hay 2 tháng, thậm chí chỉ vỏn vẹn vài tuần, bạn sẽ nhận ra ngay độ giảm sút traffic ngày càng mạnh mẽ, trầm trọng. Nó kéo theo hàng loạt ảnh hưởng tiêu cực khác mà Google Panda mang đến cho website của bạn.

Ví dụ minh họa về sự sụt giảm organic traffic dưới tác động của Google Panda.

Nếu website bạn gặp tình trạng trùng lặp nội dung với số lượng ít thì Panda sẽ không phạt liền. Mà chờ đến khi mức trùng lặp lên đến 20%-30% mới kéo hẳn traffic xuống.

Lưu ý nhỏ:

Liên quan đến hiện tượng này, tôi xin có vài lưu ý về sự khác biệt giữa Panda và Penguin.

Nếu hình phạt từ Panda kéo traffic xuống dần dần thì Penguin hoàn toàn trái ngược. Penguin phạt thẳng tay và traffic giảm không phanh xuống tận đáy.

Traffic giảm một nửa

Một dấu hiệu nhận biết Google Panda khác nữa là:

Website đang hoạt động tốt bỗng dưng lại mất đi 1/2 traffic.

Từ đó khiến website từ top đầu trang 1 lập tức bay vèo xuống cuối trang 1 hay qua đến trang 2. Lúc này, số lượng organic traffic vẫn có nhưng còn rất ít và không đáng kể.

Vậy website bạn chưa bị phạt thì sao?

Đừng nghĩ rằng bây giờ bạn chưa thấy hiện tượng sụt giảm traffic thì nghĩa là bạn đang an toàn đâu. Việc Google ghé thăm và thu thập dữ liệu có thể tới vài tháng.

Đến một ngày đẹp trời, bỗng dưng bạn thấy từ khóa lặn tăm thì lúc ấy mới biết thì quá muộn.

Phòng bệnh hơn chữa bệnh bạn nhé!

Hướng dẫn 3 cách khôi phục website bị Panda phạt

Hầu hết SEOer đều cho rằng: Sẽ rất khó để phục hồi các web bị Panda phạt. Tuy nhiên, như đã đề cập ở phần đầu, bản cập nhật Panda chủ yếu dựa trên chất lượng trang web/nội dung. Vì thế các bước phục hồi thường tập trung vào cải thiện chất lượng trang web đó.

Kỹ thuật Noindex và thẻ Canonical

Để chặn việc lập chỉ mục nội dung trang web nội bộ trùng lặp hoặc trùng lặp ít và các yếu tố có vấn đề khác.

Đối với cách khắc phục, bạn có thể sử dụng kĩ thuật noindex và thẻ canonical. Tìm hiểu thêm: “Canonical URL là gì? 7 Sai lầm phổ biến khi sử dụng thẻ Canonical

(Xem kĩ trong phần video – trong video tôi sẽ giải thích lại thuật toán từ đầu và thậm chí kĩ hơn bài viết. Cũng như các case study và hướng khắc phục cụ thể)

Cải thiện content kém chất lượng và content mỏng

Google Panda luôn liên tục hoạt động và tiến hành loại bỏ từng chút một những website bị thin content hoặc kém chất lượng.

Thông thường, Panda đánh giá chất lượng cho toàn bộ trang web bằng cách xem xét một số lượng lớn các trang trong đó. Sau đó, nó sẽ điều chỉnh thứ hạng cho phù hợp.

Ngoài ra, Panda còn chấm điểm thứ hạng website dựa trên chất lượng các phần nội dung bao gồm trong đó.

Google Panda đánh giá website theo nội dung trong từng URL và chất lượng của tất cả các URL.

Do vậy cốt lõi của vấn đề chính là việc cải thiện nội dung chất lượng content của web.

Loại bỏ content kém chất lượng và content mỏng

Xóa bỏ content kém chất lượng khỏi website không chỉ nhằm mục đích SEO mà còn vì lợi ích của người dùng.

Nói cách khác, bạn hãy đặt mình vào vị trí của người dùng và thử truy cập vào website mình. Sau khi mở lên 1 bài blog lên và chẳng có nội dung gì cuốn hút hay không đáp ứng nhu cầu gì cả? Hay tệ hơn là truy cập vào 1 chuyên mục toàn quảng cáo, chẳng có thông tin gì giá trị hết?

Vì thế, việc mang đến nội dung và trải nghiệm người dùng tốt nhất khi họ nhấp vào 1 kết quả tìm kiếm và truy cập vào website của bạn là cực kì quan trọng.

Cách loại bỏ content kém chất lượng

Việc đầu tiên, bạn cần chắt lọc ra các phần nội dung kém chất lượng.

Và khi bạn tìm thấy phần nội dung kém chất lượng trên một URL đã bị Panda phạt, tôi gợi ý cách giải quyết bằng cách áp dụng:

Chiến lược “Giữ – Bỏ”.

Chiến lược này rất đơn giản:

Nếu có thể cải thiện phần content trong website của bạn thì nên làm ngay. Nếu content đó đã quá tốt, bạn không thể cải thiện hơn nữa và người dùng không phàn nàn gì khi họ truy cập vào thì hãy để noindex nó.

Chiến lược GIỮ & BỎ content kém chất lượng

Tôi còn gọi đây là chiến lược “quản lí index”.

Đối với các content đã được Add URL vào Google, việc duy trì chất lượng nội dung ở mức cao nhất (thậm chí phải cao hơn đối thủ) là cực kỳ quan trọng. Việc này có thể giúp website của bạn thoát khỏi các thuật toán kiểm tra chất lượng của Google, trong đó có Panda.

Chiến lược giữ bỏ không chỉ loại đi phần nội dung kém chất lượng, mà còn giúp người dùng dễ dàng tìm được những gì họ đang cần, đảm bảo content đạt hiệu quả cao. Hơn hết là đáp ứng đủ hoặc có khi hơn cả mong đợi của người dùng. Đồng thời, đảm bảo Google sẽ chỉ index những phần nội dung giá trị nhất của bạn.

Tất cả chung quy lại vẫn chỉ để cải thiện chất lượng. Hay nói cách khác là mang đến cho người dùng những website tốt nhất.

Nâng cao chất lượng tổng thể website

Trong quá trình hỗ trợ khách hàng – những người chịu ảnh hưởng tiêu cực từ thuật toán Panda, tôi luôn khuyên họ rằng:

Không bao giờ dừng lại ở việc loại bỏ các content kém chất lượng.

Mà còn phải xây dựng kế hoạch khắc phục toàn bộ nội dung, bao gồm:

  • Nâng cao chất lượng nội dung
  • Cải thiện các yếu tố trải nghiệm người dùng (UX) khác như cắt giảm banner quảng cáo vô nghĩa, form gây rối mắt…

Vì vậy, tôi không cho rằng chỉ loại bỏ mỗi phần nội dung kém chất lượng thôi sẽ mang lại những cải thiện. Cái chính là còn phải tập trung nâng cao chất lượng tổng thể của nó.

Cách tốt nhất để tránh Google Panda là hãy phát triển thương hiệu cho riêng bạn. Cùng đó là xây dựng một trang web của bạn trở thành một nguồn thông tin đáng tin cậy. Với nội dung tuyệt vời, mang lại giá trị cho người đọc.

2 công cụ hỗ trợ sửa phạt thuật toán Google Panda

Trong quá trình làm SEO, để tránh các hình phạt Google, đặc biệt là vấn đề copy bài viết, bạn có thể nhờ đến sự hỗ trợ của nhiều công cụ kiểm tra.

Dưới đây, tôi gợi ý 2 công cụ phổ biến sau:

Copy scape

Copy scape là công cụ trả phí. Nó giúp bạn theo dõi những nội dung bạn đã copy từ trang khác hoặc nội dung nào trên trang bạn đang bị trang khác copy. Chú ý cột Risk bài viết nào có màu càng đậm thì chứng tỏ đó đó là những bài viết bị copy nhiều nhất.

Công cụ hỗ trợ gỡ phạt Google Panda – Copyscape

Nên tập trung sửa chữa những trang bị đánh giá màu đậm, độ rủi ro Panda phạt cao.

Siteliner

Thêm 1 công cụ khác là siteliner với chức năng tìm nội dung copy dựa trên gốc domain của bạn (Duplicate content on your site). Công cụ này sẽ báo cho bạn chỉ số phần trăm giống nhau giữa các bài. Đây cũng là 1 công cụ trả phí!

Siteliner hỗ trợ tìm các content bị trùng lặp trên website

Panda vẫn chỉ được coi là một hình phạt của Google dành cho các website cố tình spam về nội dung. Và công cụ tìm kiếm này vẫn chưa thể áp dụng Panda như là một thuật toán gốc lõi của Google.

Thuật toán Panda có thể xử phạt trên tất cả website dù đang phát triển trên cả mặt Onpage & Offpage. Hầu hết các website ở Việt Nam đều có khả năng cao bị Panda dòm ngó và ảnh hưởng tiêu cực đến toàn domain.

Chúc bạn thành công!

Để tránh bị Google Panda “ngó nghiêng” website của mình thường xuyên, tại sao bạn không thử làm chuẩn mọi thứ SEO website ngay từ đầu.

Tài liệu tham khảo:

Đọc tiếp:

  1. SEO là gì? Lợi ích & Công việc của một nhân viên SEO
  2. Google Penalty: Cách kiểm tra website có bị Google phạt hay không?
  3. Các thuật ngữ trong SEO và định nghĩa bạn cần biết trong năm 2021
  4. Pagerank là gì?: Cách Check Pagerank, tối ưu Pagerank cho website
  5. Domain Authority: Hướng dẫn nhanh 9 Bước tăng DA cho website
  6. Duplicate Content là gì? 15 nguyên nhân và cách khắc phục lỗi Duplicate Content

Leave a Reply

Your email address will not be published. Required fields are marked *