lua源码分享

2 闲云清风 1个月前 109次点击

require "import"

Http.get(

--注释,在下面的双引号之间输入链接地址,可以爬取所有该链接的文本内容。

"", nil, nil, nil, function(状态, 内容)

if 状态 == 200 then

local 页面内容 = "页面内容"

print(页面内容)

for title in 内容:gmatch("(.-)") do

print(title)

end

for h1 in 内容:gmatch("

(.-)

") do

print(h1)

end

for h2 in 内容:gmatch("

(.-)

") do

print(h2)

end

for h3 in 内容:gmatch("

(.-)

") do

print(h3)

end

for h4 in 内容:gmatch("

(.-)

") do

print(h4)

end

for h5 in 内容:gmatch("

(.-)
") do

print(h5)

end

for h6 in 内容:gmatch("

(.-)
") do

print(h6)

end

for p in 内容:gmatch("

(.-)

") do

print(p)

end

for li in 内容:gmatch("

  • (.-)
  • ") do

    print(li)

    end

    local 超链接列表 = {}

    for 完整标签, 文本 in 内容:gmatch("]*)>(.-)") do

    local 链接地址 = ""

    local 起始, 结束 = 完整标签:find('href="([^"]+)"')

    if 起始 then

    链接地址 = 完整标签:sub(起始 + 6, 结束 - 1)

    end

    table.insert(超链接列表,

    {

    地址 = 链接地址,

    显示文本 = 文本:gsub("%s+", "")

    }

    )

    end

    for _, 超链接 in ipairs(超链接列表) do

    print("链接地址: ".. 超链接.地址)

    print("文本: ".. 超链接.显示文本)

    end

    else if 状态 == 404 then

    print("失败", "状态码", 状态, "未找到")

    end

    end

    end

    )

    目前还没有评论
    添加一条新评论

    登录后可以发表评论 去登录