Share Truy vấn dữ liệu HTML bằng cú pháp SQL với thư viện htmlSQL

filiallion

Administrator
Staff member
Administrator
Messages
293
Points
10
Language
Tiếng Việt
Trong lập trình ứng dụng, việc các bạn truy vấn cơ sở dữ liệu từ MySQL, SQL Server hay Oracle là điều tất nhiên, nhưng có bao giờ các bạn thử truy vấn dữ liệu từ một trang HTML chưa? Bài viết này tôi sẽ giới thiệu cho các bạn một thư viện dùng cú pháp SQL để truy vấn lấy dữ liệu của một trang HTML như nội dung văn bản trong một thẻ HTML nào đó hay các thuộc tính của một thẻ, thư viện mà tôi đề cập đến đó là htmlSQL.

Về cơ bản, thư viện htmlSQL cũng gần tương tự như thư viện PHP Simple HTML DOM Parser mà tôi đã giới thiệu với các bạn ở bài viết "Lấy dữ liệu từ website khác bằng thư viện PHP Simple HTML DOM Parser", chỉ khác là cách thức sử dụng là bằng cú pháp SQL và sử dụng cURL để lấy nội dung HTML.

Các bạn có thể tải thư viện htmlSQL tại địa chỉ https://github.com/hxseven/htmlSQL.

Các bạn có thể tham khảo nội dung mã lệnh PHP sau để biết cách sử dụng thư viện htmlSQL:
PHP:
<?php
//Require thư viện
require 'path/to/snoopy.class.php';
require 'path/to/htmlsql.class.php';

//Khởi tạo đối tượng htmlsql
$htmlsql = new htmlsql();

//Kết nối tới nguồn dữ liệu HTML
if (!$htmlsql->connect('url', 'http://www.domain.com')) {
  echo 'Lỗi kết nối: ' . $htmlsql->error;
  
  exit;
}

//Truy vấn dữ liệu với cú pháp SQL
if (!$htmlsql->query('SELECT * FROM a WHERE $class == "nav"')) {
  echo 'Lỗi truy vấn: ' . $wsql->error;
  
  exit;
}

//In kết quả lấy được
foreach ($htmlsql->fetch_array() as $row) {
  print_r($row);
}
 
Top