IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> PHP知识库 -> 优雅的PHP采集框架QueryList -> 正文阅读

[PHP知识库]优雅的PHP采集框架QueryList

基本介绍:

QueryList是一套用于内容DOM解析的PHP工具,它使用更加现代化的开发思想,语法简洁、优雅,可扩展性强。相比传统的使用晦涩的正则表达式来做DOM解析,QueryList使用了更加强大而优雅的CSS选择器来做DOM解析,大大降低了PHP做DOM解析的门槛,同时也让DOM解析代码易读易维护,让你从此告别晦涩难懂且不易维护的正则表达式😀。

傻瓜教程:

1:安装

这里用的是v4最新版,php要求大于7.1,我是在tp里面安装的,安装也非常简单,在终端执行如下一行代码就可以

composer require jaeger/querylist

2:引用

在index控制器里面引用这个

use QL\QueryList;

3:确定采集地址

如历史上的今天,百度一搜索就有,地址是https://www.baidu.com/s?wd=历史上的今天

4:确定页面采集目标

打开采集地址,按F12,点击下图的小箭头或者ctrl+shift+c,选中要采集的内容。

可以看到:

要采集的东西就是一堆class=card_ZQsT-的<a>标签的合集;

img标签的src地址就是头像地址;

class="year-tag_3Iqeg" 里面内容为年份信息;

class="title_3qCGt" 里面包含的是事件信息;

?5:设置采集规则进行采集

public function index()
{
    $api = "https://www.baidu.com/s?wd=历史上的今天";
    $rules = [
        "content" => [".title_3qCGt","text"],
        "year" => [".year-tag_3Iqeg","text"],
        "img" => ["img","src"],
	];
    $range = '.card_ZQsT-';
    $data = QueryList::get($api)->rules($rules)->range($range)->queryData();
    echo(json_encode($data));die;
}

6:采集结果

?历史今天采集就此完成,当然,采集可能会遇到各种各样的问题,官方文档地址:http://www.querylist.cc/docs/guide/v4

  PHP知识库 最新文章
Laravel 下实现 Google 2fa 验证
UUCTF WP
DASCTF10月 web
XAMPP任意命令执行提升权限漏洞(CVE-2020-
[GYCTF2020]Easyphp
iwebsec靶场 代码执行关卡通关笔记
多个线程同步执行,多个线程依次执行,多个
php 没事记录下常用方法 (TP5.1)
php之jwt
2021-09-18
上一篇文章      下一篇文章      查看所有文章
加:2022-10-31 11:33:57  更:2022-10-31 11:34:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年4日历 -2024/4/20 20:58:03-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码