Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?

Khác với sitemap là dẫn hướng các bot tìm kiếm và chỉ mục các nội dung trên website. Thì đối với file robots.txt bạn có quyền cho phép hoặc ngăn chặn các bot của các công cụ tìm kiếm index một nội dung nào đó trên website của mình.

  • Bài viết tạo bởi: | Lượt xem bài viết: 385,318 (View) | Ngày cập nhật nội dung gần nhất: 27-01-2024 11:29:26
  • Ðánh giá: 1 11 21 31 41 5(4 sao 15 đánh giá)

Robots.txt là gì?


"Robots.txt" "dạng tập tin đặc biệt không phải là HTML hay một loại nào khác". Mục đích của việc có file robots.txt là khai báo cho công cụ tìm kiếm biết rằng những nội dung nào trên website của bạn được cho phép các bot tìm kiếm và lập chỉ mục.

Khác với SITEMAP là dẫn hướng các bot tìm kiếm và chỉ mục các nội dung trên website. Thì đối với file robots.txt bạn có quyền cho phép hoặc ngăn chặn các bot của các công cụ tìm kiếm index một nội dung nào đó trên website của mình.
 


Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?

Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?, Bản quyền truy cập link xem bài viết: https://vietadsgroup.vn/robotstxt-la-gi-tim-hieu-ve-robotstxt-la-gi.html



Hình 1: Robots.txt là gì?

 

Một ví dụ đơn giản về file robots.txt


User-agent:*
 

Disallow: /wp-admin/
 

Disallow: /wp-includes/
 

Trong đó:
 

User-agent:* /*Cho phép tất cả các loại bot tìm kiếm*/
 

Disallow: /wp-admin/, Disallow: /wp-includes/ : /*Ngăn không cho phép bot tìm kiếm trong 2 thư mục này*/
 

Tác dụng của file Robots.txt


Như mình có nêu ở phía trên, tác dụng của việc tạo file robots.txt cho website hay blog của mình. Nhằm mục đích cho phép và ngăn chặn bot của các công cụ tìm kiếm và index các nội dung trên website.
 

Bạn có thể chặn các bot tìm kiếm dữ liệu trong một thư mục nào đó trên website, hoặc chặn bot index một đường dẫn nào đó bằng cách Disallow: “….”
 

Có thể xét ví dụ bên trên: Chặn các bot của công cụ tìm kiếm index các nội dung trong thư mục /wp-admin/ và /wp-includes/.
 

Thì đó là tác dụng chính của file robots.txt này. Và điều này là rất cần thiết.
 


Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?

Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?, Bản quyền truy cập link xem bài viết: https://vietadsgroup.vn/robotstxt-la-gi-tim-hieu-ve-robotstxt-la-gi.html


 

Hình 2: Tác dụng của file Robots.txt
 

Cách tạo file robots.txt


Để tạo một file robots.txt bạn thực hiện các bước như sau:
 

Tạo file

Bạn tạo một file Text Document
 


Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?

Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?, Bản quyền truy cập link xem bài viết: https://vietadsgroup.vn/robotstxt-la-gi-tim-hieu-ve-robotstxt-la-gi.html


 

Sau đó save lại với tên là robots.txt
 


Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?

Robots.txt Là Gì? Tìm Hiểu Về Robots.txt Là Gì?, Bản quyền truy cập link xem bài viết: https://vietadsgroup.vn/robotstxt-la-gi-tim-hieu-ve-robotstxt-la-gi.html


 

Như vậy, việc tạo file hoàn tất. Tiếp theo ta cần thêm các lệnh vào trong file này.
 

Thêm các câu lệnh


Trong phần này, mình sẽ giải thích một số câu lệnh. Bạn có thêm bớt tùy nhu cầu của các bạn. Phía dưới cuối phần này mình sẽ nêu ra một file robots.txt hoàn chỉnh. Bạn có thể sử dụng nó cho website của mình.
 

Chặn bot không cho chỉ mục toàn bộ website

Bạn có câu lệnh như sau:
 

User-agent:*
 

Disallow: /
 

Lệnh này có ý nghĩa: “Không cho phép các bot của công cụ tìm kiếm truy cập và đánh chỉ mục trên toàn bộ tài nguyên có trên website của bạn.”
 

Chặn bot chỉ mục vào một thư mục nhất định


User-agent:*


Disallow: /wp-admin/


Disallow: /wp-includes/
 

Lệnh này có nghĩa: “Cho phép bot lập chỉ mục tất cả dữ liệu trừ 2 thư mục /wp-admin/ và /wp-includes/ là không cho phép.”
 

Chặn một trang hay đường dẫn đến bài viết nào đó


User-agent:*


Disallow: /gioi-thieu.html
 

Lệnh này có nghĩa: “Cho phép bot đánh chỉ mục tất cả các dữ liệu trừ đường dẫn /gioi-thieu.html”
 

Chặn một hình ảnh nào đó

 

User-agent:*


Disallow: /images/vietadsgroup.vn.jpg
 

Lệnh này có nghĩa: “Chặn một hình ảnh nào đó từ website của bạn, ngăn không cho các bot tìm kiếm và lập chỉ mục cho hình ảnh đó.”
 

Chặn một loại bot nào đó

User-agent:Spambot
 

Disallow: /
 

Lệnh này có nghĩa: “Chặn botspam truy cập tất cả dữ liệu trên website của bạn”. Trong khi đó các bot khác thì được quyền truy cập”
 

Chặn tất cả các dữ liệu trong một thư mục trừ một file nào đó

User-agent:*
 

Disallow: /thumucbichan/
 

Allow: /thumucbichan/filekhongbichan.html
 

Lệnh này có nghĩa: “Chặn bot tìm kiếm tất cả dữ liệu trong thư mục /thumucbichan/ nhưng cho phép lập chỉ mục file /filekhongbichan.html”
 

Trên đây là một số lệnh cơ bản khi bạn cần thêm vào file robots.txt. Tùy theo nhu cầu của các bạn mà thêm vào những lệnh cần thiết.

 

Một số lưu ý


Để tránh xảy ra sai sót khi bạn sử dụng một file robots.txt của người khác hoặc tự tạo riêng cho website của mình. Bạn cần lưu ý một số điều như sau:
 

  • Phân biệt chữ hoa và chữ thường
  • Không được viết thừa, thiếu khoảng trắng
  • Chỉ nên thêm các lệnh, ngoài ra không nên chèn thêm kí tự nào khác trong file.
  • Nên sử dụng 1 dòng cho 1 câu lệnh. Muốn viết lệnh mới nên xuống dòng sau đó viết tiếp

File robots.txt mẫu


Các bạn có thể sử dụng file robots.txt như của vietadsgroup.vn đang dùng dưới đây.
 

User-agent:*

Disallow: /wp-admin/

Disallow: /search?q=*

Disallow: *?replytocom

Disallow: */attachment/*

Allow: /wp-admin/admin-ajax.php

Allow: /wp-admin/images/*

Sitemap: https://vietadsgroup.vn/sitemap_index.xml
 

Lời kết:"Robots.txt" là "dạng tập tin đặc biệt không phải là HTML hay một loại nào khác". Mục đích của việc có file robots.txt là khai báo cho công cụ tìm kiếm biết rằng những nội dung nào trên website của bạn được cho phép các bot tìm kiếm và lập chỉ mục.


Trân trọng! Cảm ơn bạn đã luôn theo dõi các bài viết trên Website VietAdsGroup.Vn của công ty chúng tôi!

Quay lại danh mục "Hỏi đáp là gì" Quay lại trang chủ




  • VietAds

    "VietAds gửi lời cảm ơn tới quý khách hàng đã luôn tin dùng dịch vụ quảng cáo trực tuyến hiệu quả suốt chặng đường 9 năm vừa qua! - Đăng nhập"

  • CÔNG TY CỔ PHẦN TRỰC TUYẾN VIỆT ADS



Bài viết xem nhiều cùng chuyên mục
Bài viết mới nhất cùng chuyên mục