下载此文档

火车头采集器使用流程说明.ppt


文档分类:IT计算机 | 页数:约42页 举报非法文档有奖
1/42
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/42 下载此文档
文档列表 文档介绍
中国国版电子商新中心
火车头采集器
使用流程说明

目录
路 Trade2cN:
、软件安装
、新建站点
、采集网址
■四、采集内容
五、发布内容
六、任务采集
■七、导出数据
、软件安装
路 Trade2cN:
1、,解压缩

将 phpcms 1剪切出来放到D:、 wampwww目录下,已“吗
将 phpcms1改名为 phpcms
2、打开WAMP5,启动 PHP sett ings栏目中的
impact fush
short open tag.
alone cal tme pass reference
3、安装PHP,输入
dsplay startp eTor
http://localhost/phpcms/。'画
4、解压 Locoy Sp derv2009SP4 Bui ld20090807·m
track eros
的| coy. php复制到:、Wam、 www\phpcms下。
将 Module文件下的 phpcms2o08-090109文件下
a scLiteMenaper
quotes sybase
安装部分完成
白 www rectory
a Log fies
a config files
aPache
PH extensor
、新建站点
路 Trade2cN:
打开火车头软件( Locoy Sp )
界面如下图
采燕作门)呆共任多(结点用⑤視图常用操作0)这说置轴助工只帮助
平,⑥开始⑥⑥件止②市⑩A斥谓所◎摇口●回品园回感
作炎黄网络新浪软件天空软件落伍者 Discuz PHPCMs Web开发两
伴:站长唱 DCMS KELTNK站八度网缩东[据
金屏
提示:站在重版权及法的范围内集,因宋集引起的妈蛤与敦汁无关
帮助:手身程序下h1nce助文挡支持说坛
程:点击查看火车采程示意图
开焰:没置
新建点
h在想发布置一重在魏发布地强
致据库发布置+数据库发布块资
开任
立升迟
好:当的贷用的本地保存物据库; cressy litex
击條
、新建站点
路 Trade2cN:
第一步:新建站点(如右图)
第二步:点击“新建站点”后出现如下界面。填写站点名和站点网址点击“更新
成姑内帝(任务改唐
H;献购如=
达三述
造***出世种,在四了对5m连计,任强的图从对验生,
三、采集网址
路 Trade2cN:
新建好的站点会排列在窗口左侧“站点&任务列表”中。右击新建好的站点,点击
“从该站点新建任务”,出现如下界面。
以本列表为例
送择所再点:网i句?别钟贴点名:柳日采问址回采实内回监村内密
网士平:1
区啦
理务系
2、点击“向导添加
包古: htp: infe. hn h,9n不挫
〔画内向区采康士:以
□米典器砍取以q(认目劝次咋本工查的匙
三、采集网址
路 Trade2cN:
点击向导添加后出现如下界面:批量/多页
加开始采集璃量
「单条让北多文本导入正则提职
多页类似地址北式::ja()
1、填写所采集文章的列表页通用序号以(*】代替
用:
数字要化从2到5间隔倍数1口补零[部
字变化

t 1Izc
埂写需要采集的页款
v全部址〔上面多种方式添加」一生加入起始地址y钷请在上面右击
bn hc360
sle) shtml
地址与页歉与完成点击泽加按钮则自动加到此
三、采集网址
路 Trade2cN:
单条网址选项下
加开始采集地址
单条冈址批量多页文本导入正则取
ttp: /kinfo bm. hc380 com/list/
在单条网址选项下,只需填写所需采集文章的表页链接点击訴加、完成即可
√全部地址(上面多种方式添加,一次生加入起地址,蝙请在上面右击
http
三、采集网址
路 Trade2cN:
填写完成后,点击“完成”。则出现以下界面
所属站点:花同[斜没有?新结点任务名;座材材
一步;不乐网近从郸二生:来事内窨则粥三步:布内设文件存及国分而设置
回校漫t网址
获取方式:
③手动埴写卧址现
导添
文章内存页面的比址必包含: =3cax2a1
贝面内选定区材采挑网
□来欺器获取Cak.(默认自动读取本电工
过为)开%式处学
处写红界文章地址的通用

火车头采集器使用流程说明 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数42
  • 收藏数0 收藏
  • 顶次数0
  • 上传人erterye
  • 文件大小4.26 MB
  • 时间2020-11-12