一个人的网络 一个人的网络

【原创】火车头采集发布成功未知成功标志码和特征码

in 学习网络read (204) 文章转载请注明来源!

原创文章转载请带本站链接

特征码:

特征码是什么!!!
先唠叨:
最近用火车头采集数据,当我配置好web在线发布模块!测试配置确提示:
发布失败,错误信息:
网页源代码:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>系统提示</title>
<style>
.container{ padding:9px 20px 20px; text-align:left; }
.infobox{ clear:both; margin-bottom:10px; padding:30px; text-align:center; border-top:4px solid #DEEFFA; border-bottom:4px solid #DEEEFA; background:#F2F9FD; zoom:1; }
.infotitle1{ margin-bottom:10px; color:#09C; font-size:14px; font-weight:700;color:#ff0000; }
h3{ margin-bottom:10px; font-size:14px; color:#09C; }
</style>
</head>
<body>
<div class="container" id="cpcontainer"><h3>系统提示</h3><div class="infobox"><h4 class="infotitle1">数据已保存</h4><p class="marginbot">如果您的浏览器没有自动跳转,请点击这里</p></div>
</div>
<span style="display:none"><script>function jump(){ history.go(-1); } setTimeout("jump()",1500);</script></span>
</body>

返回的Header:
HTTP/1.1 200 OK
Date:Fri, 22 Feb 2019 02:14:37 GMT
Server:Apache/2.4.23 (Win32) OpenSSL/1.0.2j mod_fcgid/2.3.9
X-Powered-By:PHP/5.6.27
Expires:Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control:no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma:no-cache
Keep-Alive:timeout=5, max=100
Connection:Keep-Alive
Transfer-Encoding:chunked
Content-Type:text/html;Charset=utf-8;charset=UTF-8
Content-Length:1090 我注意到有错误的同时返回的网页数据也包含有网页提示的成功数据相关信息。我认为采集成功了。这时我就去网站后台检查采集的数据,发现采集错误提示竟然也采集到数据了!然后在任务“规则测试”里的“典型页面”输入网址点击后面的“测试”,这里配置的没错可以采集到网页所以相关的内容;可当我右键鼠标点击“测试WEB发布数据”的时候,也同样错误,这里提示”WEB发布失败“,不管那么多我继续回到网站检查下有没有发布的数据,经过查看发现网站里发布有新数据;既然有错误也可以采集我也就不管那么多!由于我当时急着采集这些数据!然后直接开始正式采集,我知道采集一定是成功的只是发布的时候有报错,我就先只选择采集不选择发布!一步一步来,采集果然没错正常采集三四千数据到本地;接下来是发布了,我发布的时候心情紧张只怕发布失败!当我点击开始任务的同时我也观察到提示的错误,提示的错是:“发布成功未知并且显示的是红色字体”
这里是提示错误:(其中包含错误的红色字体)
初始化配置成功,开始数据采集...
任务开始运行
当前任务没有选择采网址,跳过采网址步骤
当前任务没有选择采内容,跳过采内容步骤
开始查找可发布的数据,如果您的数据比较多,可能需要一些时间,请稍等
共有2记录需要发布
发布成功未知 本地发布模块 - Id:1 - http://这里的地址我就省了了。。。。具体原因请查看文件D:火车头采集器DataLocoySpider2WebPostError.txt
发布成功未知 本地发布模块 - Id:2 - http://这里是网址我就省了了。。。
任务运行完成
本次发内容成功0条,失败2条
我认为应该也能发布到网站。我又去网站看数据发现网站正常出现新数据,就这样我把我的三四千数据一个不落的采集发布到网站了!

找原因:
后来经过询问度娘,基本找到答案!与火车头的发布成功标识有关、但是我是网络小白啊!好多都看不懂,在我不断琢磨研究发现还真是火车头软件里的成功标识问题,同理和我网上以前看的的特征码一样的道理,可当时我也没搞懂特征码是啥啊!可这成功标识填写啥呢?我真的不懂了,最后总于弄明白了这个其实就是在发布成功后出现的网页内里的独有代码、明白讲就是在你网站里发布新帖反正与发布相关的吧,返回的网页里的原代码里的独有(有点绕口的感觉“也就是和采集规则一样,找到只能搜索到一个数据的代码”中文也行。如果搜索出现多了数据,软件肯定就不能找到你所要的了。
最后还要说的是这个还有个“发表错误标志码”其实出现“发布成功未知”这个应该是我们的“发表错误标志码“、”成功标志码“都没找对的原因吧!同理登陆相关的也应该一样!其他方面还有啥的我就不知道了!
【这就是我理解的特征码和火车头里面的成功标志码,最后谢谢观看!如果有错,大神无喷!口下留情谢谢!】

意外发现:
我把“发表错误标志码“、”成功标志码“都不填写竟然也提示采集成功发布!也不知道只对我配置的这个网站有用还是啥情况!其他我也没有测试以后在测试下试试吧。。。。

jrotty WeChat Pay

微信打赏

jrotty Alipay

支付宝打赏

文章二维码

扫描二维码,在手机上阅读!

发表新评论
博客已萌萌哒运行
© 2020 由 Typecho 强力驱动.Theme by Yodu 备案号:豫ICP备14021083号-1|
前篇 后篇
雷姆
拉姆