2 闲云清风 1个月前 109次点击
require "import"
Http.get(
--注释,在下面的双引号之间输入链接地址,可以爬取所有该链接的文本内容。
"", nil, nil, nil, function(状态, 内容)
if 状态 == 200 then
local 页面内容 = "页面内容"
print(页面内容)
for title in 内容:gmatch("
print(title)
end
for h1 in 内容:gmatch("
print(h1)
end
for h2 in 内容:gmatch("
print(h2)
end
for h3 in 内容:gmatch("
print(h3)
end
for h4 in 内容:gmatch("
print(h4)
end
for h5 in 内容:gmatch("
print(h5)
end
for h6 in 内容:gmatch("
print(h6)
end
for p in 内容:gmatch("
(.-)
") doprint(p)
end
for li in 内容:gmatch("
print(li)
end
local 超链接列表 = {}
for 完整标签, 文本 in 内容:gmatch("]*)>(.-)") do
local 链接地址 = ""
local 起始, 结束 = 完整标签:find('href="([^"]+)"')
if 起始 then
链接地址 = 完整标签:sub(起始 + 6, 结束 - 1)
end
table.insert(超链接列表,
{
地址 = 链接地址,
显示文本 = 文本:gsub("%s+", "")
}
)
end
for _, 超链接 in ipairs(超链接列表) do
print("链接地址: ".. 超链接.地址)
print("文本: ".. 超链接.显示文本)
end
else if 状态 == 404 then
print("失败", "状态码", 状态, "未找到")
end
end
end
)