IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> PHP知识库 -> PHP抓取全国省市区数据 -> 正文阅读

[PHP知识库]PHP抓取全国省市区数据

感谢京东大哥的慷慨解囊

https://fts.jd.com/area/get?fid=4744

4744就是起始值,拿到的就是一级数据(全国各省的数据以及直辖市)
在这里插入图片描述
浏览器是经过编码的,unicode解码就可以看到数据,不过php不需要,直接就可以拿到数据
在这里插入图片描述
前三级的街道,一次性拿到,代码没有写请求失败后的处理,不过将请求失败时候,将complete改为flase,这样子请求完后只需要将为false的重新请求即可

/**
     * [CAN_POST].
     */
    public function address()
    {
        set_time_limit(3600);
        $province = $this->get_address('4744');
        if (false == $province) {
            throw new Exception('一级省份请求失败,fid:4744');
        }
        foreach ($province as $value) {
            if ('海外' == $value['name']) {
                continue;
            }
            $value = (array) $value;
            $province_add_info = [
                'name' => $value['name'],
                'parent_id' => '',
                'level' => 1,
                'order_no' => $value['id'],
                'complete' => true,
            ];

            $province_id = $this->db->default->insert('province_city', $province_add_info);
            $city = $this->get_address($value['id']);
            if (false == $city) {
                $this->db->default->update('province_city', ['_id' => $province_id], ['complete' => false]);
                continue;
            }
            if(empty($city)){
                continue;
            }
            foreach ($city as $value) {
                $value = (array) $value;
                $city_add_info = [
                    'name' => $value['name'],
                    'parent_id' => $province_id,
                    'level' => 2,
                    'order_no' => $value['id'],
                    'complete' => true,
                ];
                $city_id = $this->db->default->insert('province_city', $city_add_info);
                $area = $this->get_address($value['id']);
                if (false == $area) {
                    $this->db->default->update('province_city', ['_id' => $city_id], ['complete' => false]);
                    continue;
                }
                if(empty($area)){
                    continue;
                }
                foreach ($area as $value) {
                    $value = (array) $value;
                    $area_add_info = [
                        'name' => $value['name'],
                        'parent_id' => $city_id,
                        'level' => 3,
                        'order_no' => $value['id'],
                        "complete" => true,
                    ];
                    $this->db->default->insert('province_city', $area_add_info);
                }
            }
        }
    }

拿到第四级街道的数据

    /**
     * [CAN_POST].
     * [NOT_LOG].
     */
    public function get_four_address()
    {
    // 由于默认是超时时间是60s,所以要设置超时时间久一些
        set_time_limit(7200);
        // 拿到第三级的数据
        $area = $this->db->default->get_rows('province_city', ['level' => 3]);
        if(empty($area)){
            throw new Exception("没有第三级数据");
        }
        foreach ($area as $area_info) {
            $street = $this->get_address($area_info['order_no']);
            if (false == $street) {
            // 如果请求失败,就把这一级的complete字段设置为false,下次跑数据就可以直接跳过完成了的
                $this->db->default->update('province_city', ['_id' => $area_info['id']], ['complete' => false]);
                continue;
            }
            if (empty($street)) {
                continue;
            }
            foreach ($street as $value) {
                $value = (array) $value;
                $area_add_info = [
                    'name' => $value['name'],
                    'parent_id' => $area_info['id'],
                    'level' => 4,
                    'order_no' => $value['id'],
                ];
                // 插入数据
                $this->db->default->insert('province_city', $area_add_info);
            }
        }
    }

发起请求,通过传递fid参数来请求拿到下一级的数据

    public function get_address($fid)
    {
    //再次感谢京东,接口开放,直接拿fid发起请求就能拿到数据
        $result = http_get('https://fts.jd.com/area/get?fid='.$fid);
        //php 似乎无法识别数据中的空格字符,本来是数据中作为空格的,但是php需要做一些处理
        $result = str_replace('\ ', ' ', $result);
        $result = json_decode($result, true);
        // 请求失败可能会返回一个{}或者false
        if (!$result || is_object($result)) {
            return false;
        }
        return $result;
    }

拿到的数据,order_no既可以作为排序,也可以作为请求下一级的fid请求参数(比如天津的order_no是3,所以get_address(3)拿到的数据就是天津下一级的区,如果已经是叶子节点了,再往下就是[]空数组)
在这里插入图片描述

  PHP知识库 最新文章
Laravel 下实现 Google 2fa 验证
UUCTF WP
DASCTF10月 web
XAMPP任意命令执行提升权限漏洞(CVE-2020-
[GYCTF2020]Easyphp
iwebsec靶场 代码执行关卡通关笔记
多个线程同步执行,多个线程依次执行,多个
php 没事记录下常用方法 (TP5.1)
php之jwt
2021-09-18
上一篇文章      下一篇文章      查看所有文章
加:2021-08-09 10:01:53  更:2021-08-09 10:02:16 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/7 16:14:31-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码