Help Cách Crawl web bắt login captcha ?

E cảm ơn mn nhiều ạ, e làm thành công rồi.
E newbie nên giờ mới biết có cái trò lưu cookies này :)))

Cụ thể là trang nào thì mới phân tích được bro, tần suất crawl...
Nhiêu trang nó detect nhiều thứ lắm, phát hiện bot cái từng bước đều phải xác mình = capcha hết

captcha có nhiều loại, có loại đơn giản, có loại phức tạp, nhưng đa số là khó vượt. Muốn vượt thì thuê dịch vụ bên thứ 3 là nhanh nhất, còn không tự login thủ công xong lưu cookie lại thôi.

đc, bạn xem nó dùng cookie hay token rồii trích xuất ra thôi. Thông thường thì ok, trường hợp site nó khó hơn, ví dụ như khác IP thì cookie/token tự expired thì tính tiếp.

đúng rồi login trước rồi lấy cookie ra rồi request thôi

Nếu bạn có ý định dùng Selenium thì Selenium của Python sẽ tốt hơn là bạn sử dụng của nền tảng c#.
Vì Python có thư viên hỗ trợ được share trên nhiều nền tảng cộng đồng hơn so với C#.

Chưa kể DLL phổ thông của nó còn tốt hơn ở bản C#. Nếu bạn đang muốn thử hãy thử Selenium với Python.
 

Announcements

Today's birthdays

Forum statistics

Threads
417,431
Messages
7,058,802
Members
169,777
Latest member
stake123

Most viewed of week

Most viewed of week

Back
Top Bottom