标签: java(3 篇文章)
Java 爬虫实战:JSoup 抓取与 403 处理
2026-02-094 min read
请求列表页 HTML。 用选择器提取图片详情页链接或图片真实地址。 下载文件到本地目录。 处理 403、超时、重复下载等异常。 一些站点会拒绝默认 Java 请求头,常见现象是: 可通过 设置 、 等请求头提高成功率。 403:补齐 ,必要时加 。 下载慢:降低并发或分批抓取,避免被限流。 空链接:选择器失效,先打印 HTML 片段排查。 文件覆盖:按 URL 或哈希去重命名。 优先抓公开页面并遵...
java
爬虫
HttpClient获取302响应中的Location头信息
2022-12-181 min read
...
java
Map实现连表查询
2021-12-011 min read
通过Map实现连表查询...
java