Thứ Tư, 17 tháng 9, 2014

Canonicalization là gì?

Canonicalization có thề là 1 khái niệm trừu tượng và khó khi phát âm "ca-non-ick-cull-eye-zay-shun", nhưng nó là yếu tố cần thiết khi tối ưu hóa trang web. Vấn đề cốt yếu liên quan đến thuật ngữ này đó chính là sự trùng lặp nội dung, có thể là 1 đoạn, hoặc 1 phần của trang web lặp đi lặp lại ở web của bạn, hoặc thậm chí trên những trang web khác. Đối với bộ máy tìm kiếm thì điều này thật sự nên tránh vì máy tìm kiếm không biết lựa chọn nội dung nào là phiên bản gốc để hiển thị cho người dùng. Theo các chuyên gia thì đây chính là vấn đề của sự trùng lặp nội dung.


Cách áp dụng tốt nhất trong SEO

Theo các chuyên gia seo, canonicalization đề cập đến các trang web cá nhân xuất hiện từ nhiều liên kết. Đây là vấn đề thực sự vì có cùng nội dung chỉ khác nhau đường link. Điều này đồng nghĩa với việc hiệu quả sẽ giảm xuống. Vấn đề này làm cho các nhà phát triển web phải đau đầu vì các thiết lập mặc định đã gây ra vấn đề này. Danh sách sau sẽ cho ta thấy lỗi canonicalization được gây ra bởi các thiết lập mặc định của 2 web server nổi tiếng:

Apache web server:

http://www.example.com/
http://www.example.com/index.html
http:/example.com/
http://example.com/index.html

Microsoft Internet Information Services (IIS):

http://www.example.com/
http://www.example.com/default.asp (or .aspx depending on the version)
http://example.com/
http://example.com/default.asp (or .aspx)
Các đường link này đều dẫn đến trang chủ. Điều này có nghĩa là nếu trang chủ có nhiều liên kết tương tự nhau như thế, thì máy tìm kiếm sẽ xem đó là 2 trang web khác nhau chứ không phải cùng 1 trang.

Nhưng may thay cho những người làm seo, các nhà phát triển web đã đưa ra phương pháp để khắc phục điều  này. 2 cách thường làm nhất là chuyển hướng 301 và chuyển hướng 302.
A 301 tương tự như 1 mã trạng thái HTTP và được "di chuyển vĩnh viễn"
A 302 tương tự như 1 sự chuyển hướng tạm thời.
Để tốt hơn cho người làm SEO thì các chúng tôi khuyên bạn nên dùng phương thức A 301 vì hiệu quả từ 90% đến 99% sẽ thành công còn A 302 thì hầu như không có giá trị.

Canonicalization không giới hạn các ký tự chữ và số. Nó cũng thiết lập dấu  gạch chéo trong các URL. Nếu một người dùng gõ http://www.google.com, họ sẽ tự động được chuyển đến http://www.google.com/ (chú ý dấu gạch chéo về phía trước). Điều này xảy ra bởi vì về mặt kỹ thuật thì định dạng có dấu gạch chéo là định dạng đúng cho URL. Mặc dù đây là một vấn đề được đa phần được giải quyết bởi các công cụ tìm kiếm, nhưng nó vẫn là điều cần chú ý vì nhiều máy chủ tự động chuyền hướng 301 từ phiên bản không có dấu gạch chéo lên phiên bản chính xác. Bằng cách này, một liên kết trỏ đến định dạng không đúng của URL sẽ mất từ 1% đến 10% giá trị của nó do chuyển hướng 301. Tham khảo thêm bài viết về liên kết nội bộ để có thể tối ưu hóa các đường liên kết trên trang web của bạn

Một trong những sai lầm phổ biến khi thực hiện các bản sửa lỗi canonicalization vô tình tạo ra một vòng lặp vô hạn giữa http://www.example.com và http://www.example.com/index.html. Các giải pháp cho vấn đề này đã được thảo luận trong bài viết này về việc chuyển hướng một tập tin chỉ mục đến tên miền của bạn mà không cần vòng lặp.

0 nhận xét:

Đăng nhận xét