phome_enewsinfoclass 数据表字段解释(采集规则主表)

字段名 类型 解释 附加说明
classid int(11) 节点ID
bclassid int(11) 父节点ID
classname varchar(100) 节点名称
infourl mediumtext 采集页面地址 多个地址用回车隔开
newsclassid smallint(6) 入库栏目ID
startday date 开始时间
endday date 结束时间
bz text 备注
num smallint(6) 采集记录数
copyimg tinyint(1) 远程保存图片到本地 1为开启,0为关闭
renum smallint(6) 每组信息采集个数
keyboard text 包含采集关键字限制
oldword text 内容替换原字符
newword text 内容替换新字符
titlelen smallint(6) 不采集标题相似超过字数
retitlewriter tinyint(1) 不采集标题相同的信息 1为限制,0为不限制
smalltextlen smallint(6) 截取内容简介字数
zz_smallurl text 信息链接区域正则
zz_newsurl text 信息页链接正则
httpurl varchar(255) 内容页地址前缀
repad text 过滤广告正则
imgurl varchar(255) 图片/FLASH地址前缀
relistnum smallint(6) 每组列表采集个数
zz_titlepicl text 列表页标题图片正则
z_titlepicl varchar(255) 列表页标题图片预定义值
qz_titlepicl varchar(255) 列表页标题图片地址前缀
save_titlepicl varchar(10) 列表页标题图片远程保存
keynum tinyint(4) 关键字截取标题字数
insertnum smallint(6) 每组入库数
copyflash tinyint(1) 远程保存FLASH到本地 1为开启,0为关闭
tid smallint(6) 数据表ID
tbname varchar(60) 数据表名
pagetype tinyint(1) 分页形式 0为上下页导航式,1为全部列出式
smallpagezz text 分页区域正则(上下页式)
pagezz text 分页链接正则(上下页式)
smallpageallzz text 分页区域正则(全部列出)
pageallzz text 分页链接正则(全部列出)
mark tinyint(1) 图片加水印 1为开启,0为关闭
enpagecode tinyint(1) 页面编码转换 0为不转码
recjtheurl tinyint(1) 是否重复采集同一链接 1为重复采集,0为不重复采集
hiddenload tinyint(1) 是否隐藏已导入的信息 0为不显示,1为显示
justloadin tinyint(1) 采集后是否自动入库 1为开启,0为关闭
justloadcheck tinyint(1) 自动入库是否直接审核 1为审核通过,0为需审核
delloadinfo tinyint(1) 入库后是否删除已导入的记录 1为开启,0为关闭
pagerepad mediumtext 整体页面过滤正则
newsztid text 入库专题ID 多个专题ID用“|”隔开,例如:|1|5|
getfirstpic tinyint(4) 提取第几张图片为标题图片
oldpagerep text 整体页面替换原字符
newpagerep text 整体页面替换新字符
keeptime smallint(6) 每组采集时间间隔
lasttime int(11) 最后采集时间 unix时间戳
newstextisnull tinyint(1) 内容为空不采集 1为开启,0为关闭
getfirstspic tinyint(1) 提取标题图片生成缩略图 1为开启,0为关闭
getfirstspicw smallint(6) 提取标题图片生成缩略图宽度
getfirstspich smallint(6) 提取标题图片生成缩略图高度
doaddtextpage tinyint(1) 入库是否保留原分页 0为保留分页,1为不保留分页
infourlispage tinyint(1) 采集页面为直接内容页 1为是,0为否