Share Lấy dữ liệu từ website khác bằng thư viện PHP Simple HTML DOM Parser

filiallion

Administrator
Staff member
Administrator
Messages
293
Points
10
Language
Tiếng Việt
Chắc hẳn các bạn khi sở hữu một website cũng đều có một công việc phải làm trước tiên và luôn luôn phải làm đó chính là cập nhật nội dung cho website. Nội dung chính là phần không thể thiếu đối với bất kỳ website nào. Vì vậy, đối với một số website các bạn sẽ nghĩ tới phương án cập nhật nội dung tự động từ nguồn của website khác. Hiện nay, có nhiều cách thức cũng như thư viện để lập trình tính năng này, mà trong PHP thường được sử dụng nhất có lẽ là cURL. Với cURL tôi sẽ có một bài viết hướng dẫn cụ thể sau, còn ở bài viết này thì tôi muốn giới thiệu với các bạn thư viện PHP Simple HTML DOM Parser (Hay thường được gọi ngắn gọn là Simple HTML DOM) cũng được sử dụng khá nhiều trước đây bởi tính đơn giản và dễ hiểu, dễ sử dụng cho các bạn mới làm quen.

Để sử dụng thư viện PHP Simple HTML DOM Parser, các bạn truy cập địa chỉ https://sourceforge.net/projects/simplehtmldom/files để tải. Thư viện PHP Simple HTML DOM Parser chỉ có một tập tin duy nhất là simple_html_dom.php, điều này cho thấy sự đơn giản đúng như tên gọi của nó.

Việc sử dụng thư viện PHP Simple HTML DOM Parser để lấy nội dung từ website khác cũng khá đơn giản, các bạn có thể tham khảo nội dung ví dụ sau để biết cách sử dụng:
PHP:
<?php
//Require tập tin thư viện
require 'path/to/simple_html_dom.php';

//Tạo đối tượng DOM
$html = file_get_html('http://www.domain.com');

//Tìm và lấy địa chỉ tất cả hình ảnh trên trang
foreach ($html->find('img') as $element) {
    echo $element->src;
}
Trên đây chỉ là một ví dụ đơn giản, các bạn có thể tìm hiểu thêm về thư viện PHP Simple HTML DOM Parser tại địa chỉ https://simplehtmldom.sourceforge.io/manual.htm.
 
Top