位置:采集 -> 管理节点 -> 修改节点
基本信息
节点名称: (比如:体育,娱乐等)
父节点:
采集页面地址:
(如是多个列表请用回车格开)
采集页面地址方式二:
(此方式,系统自动生成页面地址)
地址: (分页变量用 替换)
页码从 之间 (如:http://www.phome.net/index.php?page=[page])
内容页地址前缀:
(如地址前面没域名的话,系统会加上此前缀。如:http://www.phome.net+/news/2004/1.html)
图片/FLASH地址前缀(内容): (图片地址为相对地址时使用)
采集栏目: (如本节点不是采集节点,请不选)
开始时间: (格式:2004-04-01)
结束时间: (格式:2004-04-01)
备注:
选项
默认相关关键字: 截取标题前 个字

采集记录数:

采集前 条记录("0"为不限,系统会从头采到页面尾)
远程保存图片到本地(内容): (入库时才会保存)
远程保存FLASH到本地(内容): (入库时才会保存)
每组列表采集个数: 每组采集 个列表页(防止采集超时用的,单采集页面请填0/1)
每组信息采集个数: 每组采集 个新闻页(防止采集超时用的)
每组入库数: 每组入 条记录(防止入库超时用的)
过滤选项
采集关键字(包含关键字才会采): (只针对标题。如不限制,请留空。多个请用","格开)
替换:
(针对标题与内容)
将包含 替换成 (原字符多个请用","格开)
过滤广告正则:
格式:广告开始[!--ad--]广告结束
(针对内容)
(多个请用","格开)
过滤相似: 不采集标题相似超过 字的新闻[与入库新闻比较](如不限制请填"0")
  不采集标题完全相同的新闻(与入库新闻比较)
截取内容简介:

截取新闻内容 个字(在没有设置“内容简介”正则,系统采取的措施)

采集内容正则(不采集项,请留空)
列表页  
信息链接区域正则:
(如不限,请为空)
截取的地方加上
如:<tr><td>新闻区域</td></tr>
正则就是:
<tr><td>[!--smallurl--]</td></tr>
信息页链接正则:
截取的地方加上
如:<a href="新闻链接">标题</a>
正则就是:
<a href="[!--newsurl--]">*</a>

标题图片正则:
(如图片在内容页,请留空)

图片地址前缀: 保存本地
(如填这里,将为此字段值)
内容页(文件过大的请不要选择保存本地)
图片名称正则:
()
(如填写这里,将为字段的值)
发布时间正则:
()
(如填写这里,将为字段的值)
文件大小正则:
()
(如填写这里,将为字段的值)
图片尺寸正则:
()
(如填写这里,将为字段的值)
图片分辨率正则:
()
(如填写这里,将为字段的值)
来源正则:
()
(如填写这里,将为字段的值)
图片小图正则:
( )
附件前缀 远程保存
(如填写这里,这就是字段的值)
图片大图正则:
( )
附件前缀 远程保存
(如填写这里,这就是字段的值)
图片集正则:
(

)
格式:缩略图[!empirecms!]大图[!empirecms!]名称
地址前缀:
每行显示条数正则:
()
(如填写这里,将为字段的值)
缩图宽度正则:
()
(如填写这里,将为字段的值)
缩图高度正则:
()
(如填写这里,将为字段的值)
图片简介正则:
()
(如填写这里,将为字段的值)
内容页分页采集设置:(如没有分页请留空,只对newstext有效)
分页形式: 上下页导航式 全部列出式
"上下页导航"式正则设置:
分页区域正则([!--smallpagezz--]) 分页链接正则([!--pagezz--])
"全部列出"式正则设置:
分页区域正则([!--smallpageallzz--]) 分页链接正则([!--pageallzz--])
  *:表示不限制内容。行与行之间的间隔最好用*格开
 

注意事项:
1.*:表示不限制内容。行与行之间的间隔最好用*格开
2.增加节点后,最好先“预览”。
3.对于特殊字符请在前面加上“\\”,当然直接将特殊字符改为“*”最合适了。特殊字符如下:
),(,{,},[,],\,?
4.同一新闻链接系统不会重复采集。