FIX CÁC LỖI TRUY CẬP WEB KHI SỬ DỤNG PROXY

Có thể là hình ảnh về văn bản cho biết 'http://www.website.com 404 Page not found The page you are looking for doesn't exist or an other error occurred.'
FIX CÁC LỖI TRUY CẬP WEB KHI SỬ DỤNG PROXY

Trong quá trình dùng proxy, đôi khi các bạn sẽ gặp lỗi không truy cập được web. Lúc này server web sẽ trả về thông báo mã lỗi (ví dụ thường gặp nhất là lỗi 404 khi bạn gửi request/truy cập 1 đường link không tồn tại). Trong post này ad sẽ giải thích kỹ hơn về các mã lỗi hay gặp khi truy cập web thông qua proxy và đưa ra cách xử lý để các bạn tham khảo.
LỖI TRUY CẬP SERVER WEB LÀ GÌ?
Khi sử dụng proxy để request truy cập web, bạn có thể gặp lỗi không truy cập được và nhận mã code server web trả về như 404 - Not Found, 403 – Forbidden, 500 – Internal Server Error,...Đây là mã lỗi truy cập server web, hay chính là lỗi HTTP status code (mã trạng thái).
NGUYÊN NHÂN GÂY RA LỖI TRUY CẬP WEB
  • Do IP: Dùng IP có vấn đề như nát, dính blacklist, location bị chặn,...
  • Do phía người dùng: Sai link URL, có hành vi khiến web nghi vấn như gửi cùng lúc nhiều request, dùng bot,… Các trường hợp này thường dẫn đến lỗi Client error response (4xx)
  • Do phía server: Server web gặp vấn đề kỹ thuật như quá tải, sập, bảo trì, bị tấn công,... Các trường hợp này thường dẫn đến lỗi Server error response (5xx)
CÁC LOẠI MÃ TRẠNG THÁI TRUY CẬP WEB
Tất cả các request mà server nhận được đều sẽ được trả về 1 response với 1 mã code tương ứng, bao gồm 5 loại trạng thái sau:
  • Informational response (1xx) - Mã lỗi thông tin. Lỗi 1xx có nghĩa là request của người dùng đã được nhận và server web đang trong quá trình xử lý request .
  • Successful status (2xx) - Mã kết nối thành công.
  • Redirection status error (3xx) Mã lỗi điều hướng. Lỗi 3xx yêu cầu bạn chuyển hướng sang web khác. Mặc dù sau khi chuyển hướng xong bạn có thể tiếp tục gặp lỗi này, nhưng các server web thường không tiếp tục sau 5 lần chuyển hướng của cùng một request.
  • Client error response (4xx) - Mã lỗi từ phía người dùng. Lỗi 4xx chỉ ra rằng request không thể hoàn thành hoặc chứa cú pháp sai. Mã lỗi này sẽ hiện ra khi có lỗi từ phía người dùng, chủ yếu là do không đưa ra một request hợp lệ.
  • Server error response (5xx) - Mã lỗi từ phía server. Lỗi 5xx cho biết server không thể hoàn tất request. Khi duyệt web và bắt gặp các lỗi 5xx, bạn chỉ có thể chờ đợi, vì lúc này lỗi xuất phát từ phía server web, không có cách nào can thiệp để fix lỗi ngoài việc ngồi chờ bên server xử lý xong.
Như vậy, các mã trạng thái lỗi bao gồm 1xx, 3xx, 4xx, 5xx. Tuy nhiên lỗi 1xx rất hiếm gặp, 3xx điều hướng sang web khác, nên ad chỉ đi sâu vào 2 loại mã lỗi 4xx và 5xx.
CÁC MÃ LỖI TRUY CẬP WEB THƯỜNG GẶP VÀ CÁCH GIẢI QUYẾT
1. LỖI CLIENT ERROR RESPONSE (4XX)
  • 400 – Bad Request
    • Ý nghĩa: Server không thể xử lý hoặc sẽ không xử lý các Request lỗi của phía người dùng (ví dụ Request có cú pháp sai).
    • Cách xử lý: Xem lại link URL và xóa cookie khỏi trình duyệt.
  • 403 – Forbidden
    • Ý nghĩa: Truy cập bị từ chối (ví dụ IP bị chặn do dính blacklist hoặc location).
    • Cách xử lý: Đổi IP khác. Không nên dùng proxy datacenter (dễ bị web detect), chọn proxy dân cư có pool lớn để tăng khả năng lấy được IP sạch.
  • 404 – Not Found
    • Ý nghĩa: Trang được request không tồn tại tại thời điểm hiện tại, tuy nhiên có thể tồn tại trong tương lai.
    • Cách xử lý: Xem lại link URL hoặc truy cập lại sau.
  • 407 – Proxy Authentication Required
    • Ý nghĩa: Bạn phải xác nhận với server proxy trước khi request được proxy gửi tới server web. Lỗi này thường do thông tin đăng nhập hoặc mật khẩu không đúng, hoặc do IP bạn dùng để gửi request tới server proxy không thuộc whitelist của proxy.
    • Cách xử lý: Kiểm tra lại thông tin đăng nhập, mật khẩu, và cập nhật thông tin IP whitelist trong cài đặt proxy.
  • 429 – Too Many Requests
    • Ý nghĩa: Khi bạn gửi cùng lúc quá nhiều request từ cùng 1 địa chỉ IP thì server web sẽ trả về lỗi này vì nghi ngờ bạn là bot chứ không phải người dùng thật.
    • Cách xử lý: Sử dụng proxy xoay để đổi IP liên tục hoặc giãn thời gian giữa các request.
2. LỖI SERVER ERROR RESPONSE (5XX)
  • 500 – Internal Server Error
    • Ý nghĩa: Server bị lỗi bất ngờ (chủ yếu do lỗi lập trình, kết nối database), không liên quan đến proxy, có thể server bị sập hoặc bảo trì.
    • Cách xử lý: Truy cập lại sau.
  • 502 – Bad Gateway
    • Ý nghĩa: Server nhận được response không hợp lệ từ server khác. Có thể do proxy bạn đang dùng không kết nối được với server hoặc server bị hỏng/ bị tấn công.
    • Cách xử lý: Thử truy cập lại không dùng proxy, nếu không được thì thử lại sau, nếu được thì đổi proxy khác hoặc liên hệ bên cung cấp proxy.
  • 503 – Service Unavailable
    • Ý nghĩa: Server bảo trì hoặc quá tải. Nói chung đây chỉ là trạng thái tạm thời.
    • Cách xử lý: Truy cập lại sau.
  • 504 – Gateway Timeout
    • Ý nghĩa: Server không thể hoàn thành request được gửi tới đúng hạn.
    • Cách xử lý: Kiểm tra lại kết nối mạng tới server.
TIPS SỬ DỤNG PROXY ĐỂ XỬ LÝ LỖI TRUY CẬP WEB
  • Dùng proxy dân cư xoay: Proxy dân cư khó bị server web detect hơn proxy datacenter. Proxy xoay đổi IP liên tục tránh bị dính blacklist của web và không bị web nghi ngờ khi gửi nhiều request.
  • Không gửi nhiều request cùng lúc: Để tránh bị web nghi là bot thì bạn không nên gửi cùng lúc hoặc liên tục quá nhiều request.
  • Yêu cầu bên cung cấp proxy hỗ trợ: Ngoài việc chủ động tìm hiểu về các lỗi này thì bạn nên yêu cầu hỗ trợ từ bên cung cấp proxy vì họ có kinh nghiệm xử lý hơn và hiểu rõ hơn về proxy mà họ cung cấp cho bạn
    - Mua proxy - vps chính hãng tại VPROXY.VN