代码的1.1版本。

6 苏杭 8个月前 377次点击

import requests

import re

import time

def get_page_content(url):

r = requests.get(url)

if r.status_code == 200:

return r.text

return None

def filter_html_tags(html_content):

cleanr = re.compile('<.*?>')

filtered_text = re.sub(cleanr, '', html_content)

return filtered_text

base_url = 'https://bbs.tatans.cn/topic/'

for topic_id in range(1, 50):

url = f'{base_url}{topic_id}'

html_content = get_page_content(url)

if html_content:

# 过滤 HTML 标签,提取纯文本内容

filtered_html = filter_html_tags(html_content)

# 将提取的内容写入文件

file_path = 'D:/filtered_content.txt'

with open(file_path, 'a', encoding='utf-8') as file:

file.write(filtered_html + '\n')

print(f'成功获取并处理页面: {url}')

# 控制请求频率,避免给服务器造成过大压力

time.sleep(1) # 暂停1秒

print('翻页结束')

print('过滤后的内容已写入到文件:', file_path)

共 10 条评论
闭关翻身 8个月前
0 

这些是什么东西呀

苏杭 [楼主] 8个月前
0 

Python.

钱进 8个月前
0 

这个可以做什么

南宫雪飞 8个月前
0 

 

import os

import time

def lock_screen():

os.system("gnome-screensaver-command -l")

if __name__ == "__main__":

lock_screen()

 

这是一个简单的Python代码,用于锁定屏幕。请注意,这个代码适用于使用GNOME桌面环境的Linux系统。如果你使用的是其他类型的桌面环境,你可能需要修改 gnome-screensaver-command -l 这一行的命令。

苏杭 [楼主] 8个月前
0 

这。

▓▓▓ 8个月前
0 

唉,知识不到位,完全看不懂

浅月离殇 8个月前
0 

这个怎么运行?运行起来有什么效果?

西楚霸王 8个月前
0 

唉,别在这分享啦,有本事你们自己开发一个东西啊,别发代码了哦

梦雨梦夕 8个月前
0 

这东西有啥用吗

风无声 8个月前
0 

我本来说想把它转换成AndroLua的代码的。结果没成功

添加一条新评论

登录后可以发表评论 去登录