可以使用GitHub REST API来获取有关GitHub存储库的信息。这可以帮助我们统计不同仓库的代码行数,而无需下载和克隆每个存储库。
首先,我们需要使用GitHub API建立一个访问令牌。可以在GitHub的个人设置页面中,进入“开发人员设置”,创建一个新的令牌并分配所需的权限。
接下来,我们可以使用以下API来获取特定用户的所有存储库:
GET /users/:username/repos
例如,如果要获取GitHub用户“octocat”的所有存储库,则可以使用以下API调用:
GET https://api.github.com/users/octocat/repos
这将返回一个JSON数组,其中包含用户的所有存储库。我们可以循环遍历这些存储库,并对每个存储库执行以下API:
GET /repos/:owner/:repo/contents
例如,如果要获取名为“example”所有者是“octocat”的仓库的默认分支内容,则可以使用以下API调用:
GET https://api.github.com/repos/octocat/example/contents?ref=master
此API将返回存储库的内容,需要使用解析JSON响应的方法将其转换为文本,并通过计算换行符来计算代码行数。
完整示例代码如下:
import requests
import base64
# GitHub用户名和访问令牌
username = "your_username"
access_token = "your_access_token"
# 获取所有存储库的API调用
repos_api = f"https://api.github.com/users/{username}/repos"
# 获取访问令牌
headers = {"Authorization": f"Token {access_token}"}
# 发送API请求并获取JSON响应
response = requests.get(repos_api, headers=headers)
repos_json = response.json()
# 遍历每个存储库并获取默认