利用R包RCurl登录新浪微博
准备工作
在火狐浏览器上安装插件“Live http headers”,重启浏览器。
在火狐浏览器上手动登录新浪微博。
手动成功登录后,鼠标右键单击“查看页面信息”,弹出如下信息:
选择“Headers”,点击“save as”,将内容保存为”weibo”。打开下载好的”weibo”,你会发现内容分为
两部分,即“Request Headers”和“Response Header”。这里我们只需要“Request Headers”的信息,
将内容:
1 2 3 4 5 6 7 8
| Host: xxx User-Agent: xxx Accept: xxx Accept-Language: xxx Accept-Encoding: xxx Referer: xxx Cookie: xxx Connection: xxx
|
修改成程序需要的格式即可,具体形式在代码中会详述。
Coding
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| require(RCurl) myHttpheader<- c( "Host"="xxx", "User-Agent"="xxx", "Accept"="xxx", "Accept-Language"="xxx", "Accept-Encoding"="xxx", "Referer"="xxx", "Cookie"="xxx", "Connection"="xxx" )#本段代码对应“weibo”文件中的“Request Headers”,“xxx”换成大家文件中的真实值 d =debugGatherer() cHandle<- getCurlHandle(httpheader=myHttpheader,followlocation=1, debugfunction=d$update,verbose=TRUE) temp<- getURL("http://d.weibo.com/",curl=cHandle,.encoding="gbk") grep("yourWeiboName",temp)#"yourWeiboName"请替换成大家真实的微博用户名,大小写一定要一致
|
运行上述代码,如果登录成功,会返回结果“1”,否则为“integer(0)”。
当然,本代码也可以用来登录其它网站,方法相同,大家可以自己尝试。
参考文章:http://cos.name/cn/topic/17816/
http://www.xueningzhu.com/用rcurl登录人人网/
标签: #R
发表于2015-07-21 17:00:40,最后修改于2015-08-02 22:11:15。
本站文章欢迎链接分享,禁止全文转载。
« 上一篇 R语言中barplot函数的用法 下一篇 » Hexo图床管理