CANONICAL là gì?

"CANONICAL" từ khá chuyên môn nên cũng hơi khó để giải thích cho các bạn không chuyên trong lãnh vực có thể hiểu được, đầu tiêu bạn có thể hiểu "CANONICAL" thẻ (tag) của HTML hay chính nói xác là một loại thuộc tính của thẻ trong HTML được dùng để thông báo với các bộ máy tìm kiếm như Google, Search, Bring,... biết đây là trang gốc của các trang khác có nội dung tương tự, để dễ hiểu hơn tôi xin đưa ra một ví dụ cơ bản là khi bạn ghé thăm một trang web bán điện thoại có địa chỉ như sau:
  • http://vnlives.net/dienthoai
Bạn sẽ thấy trang web hiển thị ra tất cả các điện thoại có trong cửa hàng chọ bạn, nhưng bạn muốn xem theo giá từ thấp đến cao bạn sử dụng chức năng sắp xếp cho trên website, và khi đó trang web của bạn đang xem sẽ có dạng gì đó như thế này:
  • http://vnlives.net/dienthoai?sapxep=giatuthapdencao
Bạn có thể dễ dàng nhập thấy được hai địa chỉ này thực chất là một trang hoặc nó có cùng một dung chỉ khác nhau cách nó hiển thị mà thôi, bây giờ ta sẽ đặt vấn đề giả sử thằng Google tìm kiếm được hai địa chỉ web này của bạn và nói rằng "hai trang này có một dung giống nhau, dữ liệu trên trang web của này bị trùng lập, tao sẽ đánh giá này thấp và không tìm kiếm này nữa", thế là chủ website lên tiếng phản đối "đây không phải lỗi của tao vì trang web của tao là động và các kỹ thuật website động thì đều tạo ra các địa chỉ website như vậy, và tạo không thể làm khác được, này đổ oan cho tao", thế là thằng Google kiểm tra lại à đúng rùi "không phải lỗi của này."

CANONICAL là gì?

Chính vì vấn đề trên nên các bộ máy tìm kiếm đã đưa ra thêm định nghĩa về "CANONICAL" hay còn gọi là "CANONICAL URL" bạn tạm hiểu là địa chỉ gốc, thuộc tính này sẽ giúp các trang tìm kiếm hiểu được địa chỉ nào là địa chỉ gốc trên website của bạn ví dụ như hai địa chỉ web ở trên:
  • http://vnlives.net/dienthoai
  • http://vnlives.net/dienthoai?sapxep=giatuthapdencao

như ta đã biết chúng là một và bộ máy tìm kiếm cần phải xác định địa chỉ nào gốc, thì lúc đó trong trang website này ta sẽ có thêm một định nghĩa là

khi đó bộ máy tìm kiếm tới địa chỉ "http://vnlives.net/dienthoai?sapxep=giatuthapdencao" nó sẽ hiểu rằng "http://vnlives.net/dienthoai" mới là địa chỉ gốc và hai địa chỉ là một. Vậy tại sao các bộ máy tìm kiếm cần phải làm như vậy? Hiểu đơn giản là họ không muốn lưu trữ thông tin các trang web có nội dung giống nhau trên cùng một website vì như vậy bộ máy tìm kiếm sẽ không biết trả về kết quả nào là chính xác hoặc việc lưu trữ thông tin các trang bị trùng sẽ tạo nên vấn đề lớn cho việc tìm kiếm hoặc lưu trữ.

Nói vòng vòng nãy giờ, giờ mình được tóm lại CANONICAL là một dạng đánh dấu do các hãng tìm kiếm đưa ra với mục định xác định địa chỉ gốc của các trang trên cùng một website, từ đó sẽ tránh được việc trùng lập trong quá trình tìm kiếm cũng như lưu trữ lại các thông tin tìm kiếm trên website đó.



Đây là một trong bài viết tổng hợp và giải thích đơn giản các thuật ngữ công nghệ thông tin, máy tính, hay các thuật ngữ trên internet,... trong bài viết này mục tiêu của mình là giúp cho những bạn không thuộc lãnh vực này có nắm bắt và hiểu được các định nghĩa ở mức cơ bản.

Vì thế mình cố gắng giải thích một cách đơn giản nhất, dễ hiểu nhất. Tuy nhiên sẽ nhược điểm là sẽ không thể giải thích đủ hoặc chính xác hoàn toàn các thuật ngữ, vì muốn hiểu rõ chúng bạn cần phải học tập và tìm hiểu một cách chuyên sau hơn, tuy nhiên cũng không phải ai cũng cần biết chuyên sâu làm chi.

Nếu bài viết khó hiểu, hoặc bạn không hiểu một phần nào đó, hoặc sai, xin hãy phản hồi (comment) tại đây mình sẽ biên chỉnh lại cho phù hợp hơn, việc này sẽ giúp mình hoàn thiện bài viết hơn nữa, cảm ơn các bạn đã quan tâm.



Writer: +Bui Ngoc Son




No comments:

Post a Comment