16行代码采集原神官网角色全图+全语音
创始人
2024-05-26 17:12:11
0

嗨害大家好鸭!我是小熊猫~

本来是不玩原神的,

但是实在是经不住诱惑鸭~

毕竟谁能拒绝可以爬树、炸鱼、壶里造房子、抓小动物、躲猫猫的对战游戏捏~

在这里插入图片描述

准备工具

在这里插入图片描述

源码资料电子书:点击此处跳转文末名片获取


准备模块

import requests
import re
import execjs

请求链接

在这里插入图片描述
在这里插入图片描述

本次目标

所有角色的:

  • 基础介绍
  • 中日语音
  • 图片

分析数据来源

1. 右键点击检查(开发者工具)

在这里插入图片描述

2.刷新网页,找准对应数据

在这里插入图片描述

在这里插入图片描述

开始代码

url = 'https:///main/character/liyue?char=1'
html_data = requests.get(url).text
print(html_data)

源码资料电子书:点击此处跳转文末名片获取

筛选数据
在这里插入图片描述

随便搜索网站内包含内容:“南十字”

在这里插入图片描述

使用正则表达式匹配数据内容

在这里插入图片描述

js_text = re.findall('window.__NUXT__=(.*);', html_data)[0]

执行结果

html_data = requests.get(url).text
js_text = re.findall('window.__NUXT__=(.*);', html_data)[0]
result = execjs.eval(js_text)

此时会出现编码问题

在这里插入图片描述

加指定编码

import subprocess
from functools import partial
subprocess.Popen = partial(subprocess.Popen, encoding="utf-8")

再次运行,无报错

在这里插入图片描述

使用pprint查看数据结构

pprint.pprint(result)

在这里插入图片描述

返回网页查看我们需要的内容

在这里插入图片描述

在这里插入图片描述

打印所需数据

charList = result['data'][0]['charList']
for char in charList:cover1 = char['cover1']title = char['title']intro = char['intro']audio_list = char['cv'][0]['audio']print(title, intro, cover1, audio_list)

部分效果展示

在这里插入图片描述
在这里插入图片描述

全部代码

import requests
import re
import execjsurl = 'https://python学习交流:660193417/main/character/liyue?char=1'
html_data = requests.get(url).text
js_text = re.findall('window.__NUXT__=(.*);', html_data)[0]
result = execjs.eval(js_text)
# pprint.pprint(result)
charList = result['data'][0]['charList']
for char in charList:cover1 = char['cover1']title = char['title']intro = char['intro']audio_list = char['cv'][0]['audio']print(title, intro, cover1, audio_list)
👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

相关内容

热门资讯

【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
AWSElasticBeans... 在Dockerfile中手动配置nginx反向代理。例如,在Dockerfile中添加以下代码:FR...
AsusVivobook无法开... 首先,我们可以尝试重置BIOS(Basic Input/Output System)来解决这个问题。...
ASM贪吃蛇游戏-解决错误的问... 要解决ASM贪吃蛇游戏中的错误问题,你可以按照以下步骤进行:首先,确定错误的具体表现和问题所在。在贪...
月入8000+的steam搬砖... 大家好,我是阿阳 今天要给大家介绍的是 steam 游戏搬砖项目,目前...