当前位置: 首页 > backend >正文

分享130个ASP整站程序源码,总有一款适合您

分享130个ASP整站程序源码,总有一款适合您
 

130个ASP整站程序源码下载链接:https://pan.baidu.com/s/1X8RcT6mEGL1jzizpi2L3ZQ?pwd=nul6 
提取码:nul6

Python采集代码下载链接:采集代码.zip - 蓝奏云

我的博客地址:亚丁号-知识付费平台 支付后可见 扫码付费可见

import os
import shutilimport requests
from bs4 import BeautifulSoupfrom framework.base.BaseFrame import BaseFrame
from sprider.access.SpriderAccess import SpriderAccess
from sprider.plugin.SpriderTools import SpriderTools
from sprider.plugin.UserAgent import UserAgentclass CNSourceCoder:base_url = "http://www.downcode.com"max_pager = 10  # 每页的数量 影响再次采集的起始位置.word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量page_end_number = 0word_content_list = []haved_sprider_count = 0  # 已经采集的数量sprider_detail_index = 0  # 明细方法采集的数量 累加

8c7.Com网址全站

Vqqq.Com美女写真全站集合(带19万数据库)

Vqqq.8c7.Com网页特效大全(含数据库)

湖北都市港

藍雨心靈修改3.20版

形象中国 CICHINA.Com 全站程序 C1.2 Sp2_04152004

高密商务信息港

中时空网络全站平台SnSites V1.0.1

绿色清爽型蓝雨版本,及配套Bbsxp

阳光音乐网(互动版)整站程序

287.Cn网址大全蓝色清爽无广告版......

流行时速网络空间整站系统下载

好55网址2.0版

镁都热线2.13

情感部落整站(蓝雨修改版本)

世纪医学网全站程序

镁都热线2.0

流行网络空间网址站无广告

蓝雨设计鸿枫业E路驿站美化

175网址大全

111vvv娱乐网址站

蓝雨心靈修改版

中国整形美容网

5y5网址精选美化版

蓝雨设计寒惜美化版

世纪全站程序

龙腾视觉网全站程序

华天科技整站程序 V2.0

无聊森林完美版2.0

射日联盟ASP自助建站系统

龙腾视觉网多用户个人小屋系统 V1.0

鸿枫业E路驿站V2.1无错版

先飞电脑技术网

佰居易房产中介联盟全站

Joekoe V6系列至CMS的数据库升级程序

Joekoe CMS V1.0 免费版

酷吧在线V2.01版

佰思科技第四版

仿265网址站

阿土的异想世界整站

陨落STAR整站整合BBSXP论坛

泉港企业信息网

视点(8see.Net)整站系统

庐江二中校园网主站系统 V2.0 SQL多风格版

中国国际旅行社全站代码(简、繁、英三个版)

网络艺术CS全站系统留念版

笨笨设计整站程序

Www.Cemlex.Com.Cn整站

Kaxi.Net全站程序

朝阳信息港

CN商务频道整站

盘锦先锋整站程序(Joekoe修改版)

中国在线[ON-LINE.CN]太平洋版

兰商-信息工程学院

Sohoman.Net整站

Tt588.Com网址

花太香全站修正版

常州正康电脑医院Czzk.Net

南京俱乐部(信息港)整站

211在线家教中心

木子料理饮食网站

陕西信息港全站代码

def sprider(self,sprider_name,sprider_count,start_number,pager_number,sprider_type,is_show_browse,root_path,first_column_name,second_column_name,is_record_db):"""http://www.downcode.com/sort/j_1_2_1.shtml:param sprider_name::return:"""self.first_folder_name=sprider_type.upper()self.base_path=root_pathself.first_column_name = first_column_nameself.second_column_name = second_column_nameself.sprider_start_count=start_numberself.is_record_db=is_record_dbBaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...")BaseFrame().right("本次采集参数:sprider_count(采集数量):" + str(sprider_count) + "")BaseFrame().right("本次采集参数:sprider_name(采集名称):" + sprider_name + "")sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URLBaseFrame().debug("本次采集参数:sprider_url:" + sprider_url)self.second_folder_name = str(sprider_count) + "个" + sprider_name  # 二级目录也是wordTitleself.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_nameBaseFrame().right("本次采集参数:file_path=" + self.file_path + "")# 浏览器的下载路径self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\Temp\\"BaseFrame().right("本次采集参数:down_path=" + self.down_path + "")# First/PPT/88个动态PPT模板/动态PPT模板self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_nameBaseFrame().right("本次采集参数:save_path=" + self.save_path + "")if os.path.exists(self.down_path) is True:shutil.rmtree(self.down_path)if os.path.exists(self.down_path) is False:os.makedirs(self.down_path)if os.path.exists(self.save_path) is True:shutil.rmtree(self.save_path)if os.path.exists(self.save_path) is False:os.makedirs(self.save_path)response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'gb2312'soup = BeautifulSoup(response.text, "html5lib")#print(soup)element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})page_end_number = 1page_end_url = ""page_end_title = soup.find("a", attrs={"title": '最后页'})page_end_url = page_end_title.get("href")if page_end_url is None or page_end_url == "":page_end_number = 1else:page_end_number = (page_end_url.split(".shtml")[0].split("_")[3])self.page_count = self.merchantwhile self.page_count <= int(page_end_number):  # 翻完停止try:if self.page_count == 1:self.sprider_detail(element_list, page_end_number,sprider_count)passelse:if int(self.haved_sprider_count) == int(sprider_count):BaseFrame().debug("sprider采集到达数量采集停止...")BaseFrame().debug("开始写文章...")SpriderTools.builder_word(self.second_folder_name,self.word_content_list,self.file_path,self.word_image_count,self.first_folder_name)SpriderTools.copy_file(self.word_content_list,self.save_path,self.second_folder_name,self.file_path)SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path)BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")breaknext_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name,self.second_column_name,self.page_count)response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'gb2312'soup = BeautifulSoup(response.text, "html5lib")element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})self.sprider_detail(element_list, page_end_number,sprider_count)passself.page_count = self.page_count + 1  # 页码增加1except Exception as e:BaseFrame().error("sprider()执行过程出现错误:" + str(e))

最后送大家一首诗:

山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。

http://www.xdnf.cn/news/11484.html

相关文章:

  • 【C语言进阶剖析】22.C语言中的条件编译使用分析
  • Windows Server安装SQL Server 2008 R2
  • euphoria游戏资源_游戏资源合集(一)——乙女游戏篇
  • 有关一级域名二级域名三级域名
  • Broadcast(广播)和BroadcastReceiver(广播接收器)
  • Web 四种常见的POST提交数据方式
  • texttospeech的使用
  • objectArx ---反应器
  • JAVA开发环境配置(保姆式教程)
  • 代码的两种命名方法:驼峰命名、匈牙利命名(优缺点)
  • ADB安装及使用详解(非常详细)从零基础入门到精通,看完这一篇就够了_adb是什么
  • 关于qt缺少xcb问题终极解决办法
  • android 使用SQLite数据库详解
  • HIS系统门急诊医保实时结算接口测试
  • 倍投计算机器在线,2021看图开特马50研究计算倍投【欢迎你】
  • css设置滚动条样式
  • 网络管理与维护基本知识
  • android x86怎么样,Android x86 4.4安装体验(转载)
  • nii与nii.gz格式的关系
  • DWZ简介以及使用
  • csdn是什么
  • Android中GridView解析
  • perl下载与安装教程【工具使用】
  • perl 5.10.0安装包下载
  • Spring AOP全面详解(超级详细)
  • 网络负载平衡(NLB)详解!
  • 虚拟机-安装与使用(详细教程)
  • 智能dns调研及bind9搭建
  • FlashFXP 4.0注册码key 及教程
  • MFC内存映射文件