Bác nào biết cách leech bài viết trên mấy trang DLE chuẩn không nhỉ ?
Mình dùng C#, lấy mã HTML của bài viết và dùng Regular Expression để lọc lấy nội dung nhưng làm như vậy bài viết không chính xác lắm, lúc thừa chữ, lúc thiếu chữ. Như mình thấy thằng Postnews nó lấy bài khá hay và không sai sót gì, với lại trang nào lấy được thì chỉ cần paste link vào là lấy thôi. Còn làm như mình dùng regular Expression thì mỗi trang DLE mình code mỗi kiểu.
Không biết mấy bác viết tool leech chỉ giáo xíu được không nhỉ, dùng hàm gì, hay lệnh gì cho cấu trúc bài viết chuẩn ? Mình không nghĩ là phải lọc qua HTML (
Mình dùng C#, lấy mã HTML của bài viết và dùng Regular Expression để lọc lấy nội dung nhưng làm như vậy bài viết không chính xác lắm, lúc thừa chữ, lúc thiếu chữ. Như mình thấy thằng Postnews nó lấy bài khá hay và không sai sót gì, với lại trang nào lấy được thì chỉ cần paste link vào là lấy thôi. Còn làm như mình dùng regular Expression thì mỗi trang DLE mình code mỗi kiểu.
Không biết mấy bác viết tool leech chỉ giáo xíu được không nhỉ, dùng hàm gì, hay lệnh gì cho cấu trúc bài viết chuẩn ? Mình không nghĩ là phải lọc qua HTML (