注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

少华是也的笔记

编程:为生活?为兴趣?

 
 
 

日志

 
 

[Android]使用Apache HttpClient抓取网页信息  

2011-05-19 17:48:08|  分类: Android |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

因为可能在未来的移动产品上要用到,所以提前学习一下httpclient。
看了东西,总要有点输出吧,那用httpclient来做些什么呢,一想要不就用httpclient来抓页面吧,抓点有用的页面,那就杭州的车辆违章查询吧。
用chrome看了一下杭州违章查询的页面,囧,那个js呀,本人js不怎么好,直接跳过,wireshark抓包来瞧瞧。发现就是post一些Form Data;有好几个数据__EVENTTARGET&__EVENTARGUMENT&__VIEWSTATE&__EVENTVALIDATION这些都是之前Get页面上带下来的(ASP.NET机制的产物)

google之,发现如下内容

使用Apache HttpClient访问ASP.NET发送GET和POST请求


终于明白那些Form Data的意义;同时也出现另外一个问题,那就是认证码的问题,当认证码和下载过来的不符合的时候,就会返回“15|error|500|未将对象引用设置到对象的实例”错误,暂时也没有找到自动识别的好办法,只能人工识别验证码,手工输入了。

正在寻找绕过认证码的办法,求推荐!!!
  评论这张
 
阅读(1501)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018