Thiết kế website


hotline thiet ke website

"...Mong muốn trở thành một tổ chức kiểu mới, nỗ lực trong công việc, luôn làm khách hàng hài lòng, đem lại cho mỗi thành viên của mình điều kiện phát triển tốt nhất tài năng và một cuộc sống đầy đủ về vật chất, phong phú về tinh thần..."

Web crawler - web spider - web robot - googlebot

Đăng ngày: 13/05/2010 02:29 PM - Lượt xem: 1362

Web crawler - web spider - web robot - googlebot? Là một chương trình tự động tìm kiếm trên Internet. Nó được thiết kế để thu thập tài nguyên Internet (trang Web, hình ảnh, video, tài liệu Word, PDF hay PostScrips), cho phép máy tìm kiếm đánh chỉ số sau đó.

Cùng phương thức, nhưng một số robots lại bị sử dụng để lượm các tài nguyên hoặc để lọc địa chỉ email. Để đánh chỉ số các tài nguyên Web, mỗi robot sẽ đi theo các liên kết mà nó tìm thấy tại một trang trung tâm. Sau đó, mỗi trang đã duyệt sẽ được ghi nhớ lại và gán cho tần số đánh lại chỉ số dựa vào mức độ cập nhật thường xuyên hay không của trang.

Để điểu chỉnh ứng xử các robots, một tệp tin ngoại trừ (
robots.txt) sẽ được đặt tại thư mục gốc của trang Web để chỉ định cho robots một danh sách những tài nguyên không được tiếp cận. Tệp tin robots.txt này còn đưa ra danh sách những bọ tìm kiếm nào được quyền đánh chỉ số trang Web. Qui tắc này cho phép giảm tải trên máy chủ và tránh đánh chỉ số những tài liệu không cần thiết hoặc nhạy cảm. Tuy nhiên có nhiều bọ tìm kiếm không tôn trọng chỉ định này, và hoàn toàn bỏ qua tệp tin ngoại trừ (robots.txt).

Một số bọ tìm kiếm phổ biến của các máy tìm kiếm:
- Googlebot của Google
- MSNBot của MSN
- Slurp của Yahoo
- Scooter của Alta Vista
- Baidu của Baidu

(Theo: vietseo.net)

[ Quay lại ]
  Các bài viết khác:

4 lý do khiến anchor text thất bại

Xử lý các vấn đề về trùng lặp nội dung?

Cập nhật thuật toán mới của Google tác động đến kết quả tìm kiếm?

Tối ưu hóa website với Mobile Seach

Marketing thế nào để người dùng click vào link của bạn?

Cẩm nang bí mật của nhân viên Google

Link Juice và phương thức triển khai sơ đồ link

Giải pháp thay thế Google Analytics với Piwik

Thay đổi cấp thiết khi Google cập nhật Panda?

Kho sách học Seo cho người mới bắt đầu - Books Seo for newbie