Chuyển đến nội dung chính
Thời gian đọc 8 phút (1537 từ)

Cách giải quyết nội dung trùng lặp trong Joomla

Cách giải quyết nội dung trùng lặp trong Joomla

Nội dung trùng lặp là một vấn đề phổ biến trực tuyến và có thể xảy ra với bất kỳ trang web nào, ngay cả những trang lớn nhất. Điều này nguy hiểm và có thể gây tổn hại nghiêm trọng đến nỗ lực SEO Joomla của bạn và bạn cần giải quyết nó ngay lập tức.

Vì vậy, nếu bạn cần biết cách giải quyết và loại bỏ nội dung trùng lặp trên website Joomla một cách hiệu quả, hãy cùng tham khảo những phương pháp tốt nhất dưới đây nhé!

Nội dung trùng lặp là gì và tại sao bạn cần giải quyết vấn đề này?

Nội dung trùng lặp thường đề cập đến nội dung giống hệt hoặc về cơ bản tương tự xuất hiện trên nhiều website . Đây là vấn đề phổ biến trên bất kỳ trang web nào, ngay cả khi bạn tạo nội dung gốc 100% thì nội dung trùng lặp vẫn xảy ra. Nội dung trùng lặp có thể xảy ra vô tình hoặc cố ý. Nguyên nhân phổ biến nhất là do nhiều URL chuyển hướng đến một đích.

Trong bối cảnh của Joomla, nội dung trùng lặp có thể xảy ra vì nhiều lý do:
  • Nhiều URL
  • Phiên bản in
  • Phân trang
  • Danh mục và thẻ
  • ID phiên
  • HTTP so với HTTPS
  • Hợp thức hóa
  • Nội dung được sao chép
Như bạn đã biết, bất kỳ nội dung trùng lặp nào cũng có thể có tác động có hại đến SEO của bạn và sẽ gây rắc rối cho các bot công cụ tìm kiếm khi thu thập dữ liệu trang web của bạn. Các bot không biết URL hoặc phiên bản nào sẽ được liệt kê trên SERP và số liệu SEO từ một trang có thể được tách biệt giữa nhiều phiên bản của nó.

Quản trị viên web, đơn giản hóa việc cộng tác tệp cho websites của khách hàng với Dropfiles.

Trao quyền cho khách hàng để chia sẻ và cộng tác một cách an toàn trên các tệp, tăng năng suất và hợp lý hóa quy trình làm việc của dự án.
Có được lợi thế cạnh tranh ngay bây giờ!

NHẬN EXTENSION NGAY BÂY GIỜ

Làm cách nào để xóa nội dung trùng lặp trong Joomla?

Trong phần này, chúng tôi muốn trình bày cách tốt nhất để loại bỏ nội dung trùng lặp trong trang Joomla. Xin lưu ý rằng bạn cần kích hoạt URL SEF trong Cài đặt chung của Cấu hình Joomla. Bắt đầu nào.

1. Thiết lập Menu đúng

Một trong những lý do phổ biến nhất dẫn đến nội dung trùng lặp là khi một bài viết có thể truy cập được từ nhiều mục menu. Ngoài ra, nó cũng có thể bắt nguồn từ đường dẫn breadcrumb hoặc việc phân bổ các mô-đun.

Vì vậy, chúng tôi có hai giải pháp để giải quyết nội dung trùng lặp trong Joomla. Thứ nhất, tránh tạo liên kết mới cho cùng một nội dung hoặc sử dụng bí danh menu. Hãy giải quyết chuyện này đi!

Tránh một thực đơn mới giống hệt nhau

Với giải pháp đầu tiên, bạn có thể tạo mô-đun menu mới và gán nó vào vị trí bạn muốn. Hãy nhớ để có kết quả tốt nhất, đừng tạo các mục menu mới giống với những mục bạn đã có.

Sử dụng bí danh mục menu

Mặt khác, nếu bạn muốn sử dụng các mục menu hiện có trên một menu khác, phương pháp này sẽ phù hợp với bạn nhất. Thông qua quá trình này, bạn có thể tạo một menu mới có liên kết trực tiếp đến menu gốc mà không cần tạo URL mới.

Bạn có thể truy cập tính năng này trong Joomla như sau: Thêm mục menu mới -> Loại mục menu -> Chọn chọn -> Liên kết hệ thống -> Bí danh mục menu .

2. Sử dụng Thẻ Canonical

Việc sử dụng thẻ chuẩn cho phép bạn yêu cầu các công cụ tìm kiếm nhận ra nội dung gốc trong số nhiều nội dung trùng lặp và lập chỉ mục nội dung đó trong SERPs.

Ví dụ: một trang có thể được truy cập theo 2 cách.

https://www.joomla theme s.com/index.php?option=com_content&Itemid=130&catid=15&id=18&lang=en&view=article

hoặc

https://www.joomla theme s.com/abcd77

Bằng cách chèn thẻ chuẩn sau phần của liên kết đầu tiên, nó sẽ cho Google biết URL nào là nguồn gốc và phải được lập chỉ mục riêng.

Triển khai thẻ chuẩn là một quy trình đơn giản khi nói đến websites bao gồm HTML và mã thiết kế web khác. Tuy nhiên, quá trình này có thể trở nên khá phức tạp và đòi hỏi một chút kiến ​​thức về mã hóa khi bạn sử dụng một phần mềm. Nền tảng CMS, giống như Joomla.


Rất may, cộng đồng Joomla có rất nhiều nhà phát triển và cộng tác viên, những công cụ của họ có thể giúp chúng tôi thực hiện công việc dễ dàng hơn nhiều. Ví dụ: plugin

'Custom Canonical' của Daniel Morell Thậm chí tốt hơn, nó hoàn toàn miễn phí! Để tiết kiệm thời gian quý báu của bạn, đây là hướng dẫn gồm bốn bước để bắt đầu:

  • Tải xuống, cài đặt và kích hoạt plugin Canonical tùy chỉnh .
  • Đi tới Extension s -> Plugin -> Bật " Canonical tùy chỉnh "
  • Chuyển đến Nội dung -> Bài viết -> tab Xuất bản .
  • Nhập URL bài viết gốc vào trường " Canonical URL ".

3. Robot thẻ meta

Cách đơn giản và tốt nhất để ngăn chặn các bot tìm kiếm lập chỉ mục một trang cụ thể là sử dụng tính năng Meta Tag Robots trong tab Xuất bản của bất kỳ tùy chọn bài viết, danh mục hoặc mục menu nào.

Bạn có thể thực hiện phương pháp này bằng cách thay đổi trường Robots thành " No index ". Nếu bạn có hai bài viết giống hệt nhau và hướng dẫn Google không lập chỉ mục một trong số chúng , các bot tìm kiếm sẽ phải lập chỉ mục những bài còn lại .
Việc sử dụng chiến lược này đảm bảo rằng nội dung ưa thích của bạn được các công cụ tìm kiếm lập chỉ mục chính xác.

Ghi chú:
  • THEO DÕI – một lệnh để bot công cụ tìm kiếm theo dõi các liên kết trong trang đó
  • INDEX – lệnh để bot công cụ tìm kiếm lập chỉ mục trang đó

4. Sử dụng Google Search Console

Một cách khác để loại bỏ các URL trùng lặp là sử dụng Google Search Console.

Với công cụ mạnh mẽ này, nội dung trùng lặp sẽ xuất hiện trong bảng điều khiển khi họ tìm thấy. Có ba cách chúng tôi có thể sử dụng để xóa nội dung dư thừa: gửi sơ đồ trang web, sử dụng các tham số hoặc chọn miền ưa thích.

Đầu tiên, hãy gửi sơ đồ trang web, một trong những phương pháp bạn có thể cân nhắc khi có một trang web lớn. Thứ hai, sử dụng tên miền ưa thích là một bước thiết yếu để ngăn chặn nội dung trùng lặp có thể xảy ra khi cả hai phiên bản ' www ' và ' không phải www ' của một website đều có thể truy cập được. Với Google Search Console, cách tốt nhất là cho công cụ tìm kiếm biết phiên bản nào của tên miền sẽ được dùng làm liên kết chuẩn khi hiển thị trong kết quả tìm kiếm.

Hãy làm theo các bước bên dưới để chọn miền ưa thích với Search Console:

  • Bước 1: Đăng nhập vào Search Console
  • Bước 2: Chọn cài đặt Trang web
  • Bước 3: Chọn tên miền ưa thích


Cuối cùng nhưng không kém phần quan trọng là tham số, một giải pháp phức tạp nhưng hiệu quả để loại bỏ nội dung trùng lặp do có tham số trong URL. Các tham số có thể nằm trong phạm vi từ những thông số nổi tiếng, chẳng hạn như " sắp xếp ", " utm " và " aff ", cho đến những thông số ít người biết đến.

Đây là một ví dụ để bạn hiểu về phương pháp này: forum/question/jsn-cube-update.html? sắp xếp=mới nhất . Chúng ta có thể thấy rằng URL chứa tham số ở dạng 'sort=latest' .

Bằng cách triển khai tham số, bot công cụ tìm kiếm sẽ giúp bạn xác định xem có nên thu thập dữ liệu URL bằng tham số 'sắp xếp' hay không.

Hãy làm theo các bước sau để sử dụng tham số:

  • Bước 1: Đăng nhập vào Search Console
  • Bước 2: Trong bảng điều khiển, đi tới Tham số thu thập thông tin/URL
  • Bước 3: Bạn có thể thêm tham số khác hoặc xem danh sách họ có cho bạn.
  • Bước 4: Chọn hành động cụ thể để Googlebot thu thập dữ liệu

Kỹ thuật lỗi thời để quản lý nội dung trùng lặp trong Joomla

Một số kỹ thuật lỗi thời đã từng phổ biến nhưng các bản cập nhật gần đây của công cụ tìm kiếm khuyên bạn không nên sử dụng chúng.

1. Chặn bằng robots.txt

Tệp robots.txt là tệp hướng dẫn các công cụ tìm kiếm cách lập chỉ mục một website . Trong Joomla, nó được bao gồm trong gói tiêu chuẩn và có sẵn qua liên kết yourdomain.com/robots.txt .

Nhờ nó, chúng ta có thể tắt một số phần trong trang Joomla và xác định hướng dẫn cho dữ liệu mặc định để không cho phép phần tử " / * ? ".

Ví dụ: nếu tôi nhập " Disallow: /?/ " trong robot.txt , tất cả URL chứa " ? " sẽ bị chặn thu thập thông tin .

Tuy nhiên, sau khi cập nhật Google Panda, tất cả các trang web đã bị chặn sẽ được đánh dấu là trang duy nhất, trong khi chúng sẽ được đánh dấu là trang trùng lặp.

Ngoài ra, tất cả các liên kết đến trang bị chặn sẽ gặp lỗi 404 .
Nó sẽ gây tổn hại đến thứ hạng của bạn nói chung.

2. Xóa URL

Công cụ tìm kiếm cung cấp cho bạn tính năng " Xóa URL ". Giống như việc chặn bằng robots.txt , URL sẽ chỉ bị xóa trong trang web của bạn. Tuy nhiên, trong các trang kết quả của Công cụ Tìm kiếm, URL bị chặn vẫn được liệt kê cũng như trong các trang khác sử dụng liên kết.

Vì vậy, nó không tốt cho người dùng và không giải quyết đúng nội dung trùng lặp.

Hãy thử sử dụng các phương pháp khác mà chúng tôi đã liệt kê ở trên và tránh những kỹ thuật này.

Kêu gọi tất cả các quản trị viên web!

websites khách hàng của bạn với Dropfiles. Dễ dàng tải lên, phân loại và chia sẻ tệp, cung cấp cho khách hàng một cách quản lý tài liệu hiệu quả và thân thiện với người dùng.
Nâng cấp dịch vụ thiết kế web của bạn ngay hôm nay!

NHẬN EXTENSION NGAY BÂY GIỜ

Phần kết luận

Nội dung trùng lặp có thể gây bất lợi cho cả hiệu suất SEO của website Tuy nhiên, mọi vấn đề đều có giải pháp nên chúng tôi đã cung cấp cho bạn những cách tốt nhất để giải quyết.

Tôi hy vọng sau bài viết này vấn đề trùng lặp nội dung chỉ là "ai đó bạn đã từng biết". Ngoài ra, đừng quên thường xuyên kiểm tra website để phát hiện bất kỳ trường hợp nội dung trùng lặp mới nào.

0
Thông báo lưu trú

Khi bạn đăng ký vào blog, chúng tôi sẽ gửi cho bạn một e-mail khi có những cập nhật mới trên trang web để bạn không bỏ lỡ chúng.

bài viết liên quan

 

Bình luận

Chưa có bình luận nào được đưa ra Hãy là người đầu tiên gửi nhận xét
Đã đăng ký? Đăng nhập tại đây
Thứ Năm, ngày 21 tháng 11 năm 2024

Hình ảnh CAPTCHA