C# HttpHelper帮助类,真正的Httprequest请求时无视编码,无视证书,无视Cookie,网页抓取

标签: httphelper 帮助 httprequest | 发表时间:2011-10-22 17:40 | 作者:苏飞 Bloger
出处:http://www.cnblogs.com/

之前我写过篇关于C# HttpWebRequest 绝技的文章 无视证书的方法请在篇文章里面查找谢谢,以下不做无视证书的方法

无论是Get还是Post 带Cookie,编码问题解决 ,这里完全做到了无视编码的问题

最近把上面的方法整理了一下,这个类相当于一个SqlHelper类一下,我把它叫做HttpHelper类,以后还会慢慢更新,希望大家多我支持,

给大家分享一下吧,不好的地方感谢大家留言指正,不多说了上代码吧!

/// <summary>
/// 类说明:HttpHelps类,用来实现Http访问,Post或者Get方式的,直接访问,带Cookie的,带证书的等方式
/// 编码日期:2011-08-20
/// 编 码 人: 苏飞
/// 联系方式:361983679 Email:[email protected] Blogs:http://sufei.cnblogs.com
/// </summary>
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Net;
using System.IO;
using System.Text.RegularExpressions;
using System.IO.Compression;
using _7c.BaseFunction;

public class HttpHelps
{
#region 预定义方法或者变更

//默认的编码
private Encoding encoding = Encoding.Default;
//HttpWebRequest对象用来发起请求
private HttpWebRequest request = null;
//获取影响流的数据对象
private HttpWebResponse response = null;
//读取流的对象
private StreamReader reader = null;
//需要返回的数据对象
private string returnData = "String Error";

/// <summary>
/// 根据相传入的数据,得到相应页面数据
/// </summary>
/// <param name="strPostdata">传入的数据Post方式,get方式传NUll或者空字符串都可以</param>
/// <returns>string类型的响应数据</returns>
private string GetHttpRequestData(string strPostdata)
{
try
{
//支持跳转页面,查询结果将是跳转后的页面
request.AllowAutoRedirect = true;

//验证在得到结果时是否有传入数据
if (!string.IsNullOrEmpty(strPostdata) && request.Method.Trim().ToLower().Contains("post"))
{
byte[] buffer = encoding.GetBytes(strPostdata);
request.ContentLength = buffer.Length;
request.GetRequestStream().Write(buffer, 0, buffer.Length);
}

#region 得到请求的response

using (response = (HttpWebResponse)request.GetResponse())
{
//从这里开始我们要无视编码了
if (encoding == null)
{
MemoryStream _stream = new MemoryStream();
response.GetResponseStream().CopyTo(_stream, 10240);
byte[] RawResponse = _stream.ToArray();
string temp = Encoding.Default.GetString(RawResponse, 0, RawResponse.Length);
//<meta(.*?)charset([\s]?)=[^>](.*?)>
Match meta = Regex.Match(temp, "<meta([^<]*)charset=([^<]*)[\"']", RegexOptions.IgnoreCase | RegexOptions.Multiline);
string charter = (meta.Groups.Count > 2) ? meta.Groups[2].Value : string.Empty;
charter = charter.Replace("\"", string.Empty).Replace("'", string.Empty).Replace(";", string.Empty);
if (charter.Length > 0)
{
encoding = Encoding.GetEncoding(charter);
}
else
{
if (string.IsNullOrEmpty(response.CharacterSet))
{
encoding = Encoding.UTF8;
}
else
{
encoding = Encoding.GetEncoding(response.CharacterSet);
}
}
returnData = encoding.GetString(RawResponse);
}
else
{
//开始读取流并设置编码方式
using (reader = new StreamReader(response.GetResponseStream(), encoding))
{
returnData = reader.ReadToEnd();
}
}
}

#endregion
}
catch (Exception)
{
//这里是在发生异常时返回的错误信息
returnData = "String Error";
}
return returnData.ToLower();
}

/// <summary>
/// 为请求准备参数
/// </summary>
/// <param name="_URL">请求的URL地址</param>
/// <param name="_Method">请求方式Get或者Post</param>
/// <param name="_Accept">Accept</param>
/// <param name="_ContentType">ContentType返回类型</param>
/// <param name="_UserAgent">UserAgent客户端的访问类型,包括浏览器版本和操作系统信息</param>
/// <param name="_Encoding">读取数据时的编码方式</param>
private void SetRequest(string _URL, string _Method, string _Accept, string _ContentType, string _UserAgent, Encoding _Encoding)
{
//初始化对像,并设置请求的URL地址
request = (HttpWebRequest)WebRequest.Create(FunctionServices.GetUrl(_URL));
//请求方式Get或者Post
request.Method = _Method;
//Accept
request.Accept = _Accept;
//ContentType返回类型
request.ContentType = _ContentType;
//UserAgent客户端的访问类型,包括浏览器版本和操作系统信息
request.UserAgent = _UserAgent;
//读取数据时的编码方式
encoding = _Encoding;
}

#endregion

#region 普通类型

/// <summary>
/// 采用https协议GET|POST方式访问网络,根据传入的URl地址,得到响应的数据字符串。
/// </summary>
/// <param name="_URL"></param>
/// <param name="_Method">请求方式Get或者Post</param>
/// <param name="_Accept">Accept</param>
/// <param name="_ContentType">ContentType返回类型</param>
/// <param name="_UserAgent">UserAgent客户端的访问类型,包括浏览器版本和操作系统信息</param>
/// <param name="_Encoding">读取数据时的编码方式</param>
/// <param name="_Postdata">只有_Method为Post方式时才需要传入值</param>
/// <returns>返回Html源代码</returns>
public string GetHttpRequestString(string _URL, string _Method, string _Accept, string _ContentType, string _UserAgent, Encoding _Encoding, string _Postdata)
{
//准备参数
SetRequest(_URL, _Method, _Accept, _ContentType, _UserAgent, _Encoding);
//调用专门读取数据的类
return GetHttpRequestData(_Postdata);
}

///<summary>
///采用https协议GET方式访问网络,根据传入的URl地址,得到响应的数据字符串。
///</summary>
///<param name="URL">url地址</param>
///<param name="objencoding">编码方式例如:System.Text.Encoding.UTF8;</param>
///<returns>String类型的数据</returns>
public string GetHttpRequestStringByNUll_Get(string URL, Encoding objencoding)
{
//准备参数
SetRequest(URL, "GET", "text/html, application/xhtml+xml, */*", "text/html", "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)", objencoding);
//调用专门读取数据的类
return GetHttpRequestData("");
}

///<summary>
///采用https协议GET方式访问网络,根据传入的URl地址,得到响应的数据字符串。
///</summary>
///<param name="URL">url地址</param>
///<param name="objencoding">编码方式例如:System.Text.Encoding.UTF8;</param>
///<param name="stgrcookie">Cookie字符串</param>
///<returns>String类型的数据</returns>
public string GetHttpRequestStringByNUll_GetBycookie(string URL, Encoding objencoding, string stgrcookie)
{
//准备参数
SetRequest(URL, "GET", "text/html, application/xhtml+xml, */*", "text/html", "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)", objencoding);
request.Headers[HttpRequestHeader.Cookie] = stgrcookie;
//调用专门读取数据的类
return GetHttpRequestData("");
}

///<summary>
///采用https协议GET方式访问网络,根据传入的URl地址,得到响应的数据字符串。
///</summary>
///<param name="URL">url地址</param>
///<param name="objencoding">编码方式例如:System.Text.Encoding.UTF8;</param>
///<returns>String类型的数据</returns>
public string GetHttpRequestStringByNUll_Get(string URL, Encoding objencoding, string _Accept, string useragent)
{
//准备参数
SetRequest(URL, "GET", _Accept, "text/html", useragent, objencoding);
//调用专门读取数据的类
return GetHttpRequestData("");
}

///<summary>
///采用https协议Post方式访问网络,根据传入的URl地址,得到响应的数据字符串。
///</summary>
///<param name="URL">url地址</param>
///<param name="strPostdata">Post发送的数据</param>
///<param name="objencoding">编码方式例如:System.Text.Encoding.UTF8;</param>
///<returns>String类型的数据</returns>
public string GetHttpRequestStringByNUll_Post(string URL, string strPostdata, Encoding objencoding)
{
//准备参数
SetRequest(URL, "post", "text/html, application/xhtml+xml, */*", "text/html", "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)", objencoding);
//调用专门读取数据的类
return GetHttpRequestData(strPostdata);
}

#endregion
}


在很多情况下我们会使用间进程的webBrowser去实现一些网页的请求和抓去,这个时候有部分网页是取不到Cookie的,那怎么办呢?下面我提供一个方法,应该99%的都能取到,

 //取当前webBrowser登录后的Cookie值
[DllImport("wininet.dll", CharSet = CharSet.Auto, SetLastError = true)]
static extern bool InternetGetCookieEx(string pchURL, string pchCookieName, StringBuilder pchCookieData, ref int pcchCookieData, int dwFlags, object lpReserved);

//取出Cookie,当登录后才能取
private static string GetCookieString(string url)
{
// Determine the size of the cookie
int datasize = 256;
StringBuilder cookieData = new StringBuilder(datasize);
if (!InternetGetCookieEx(url, null, cookieData, ref datasize, 0x00002000, null))
{
if (datasize < 0)
return null;
// Allocate stringbuilder large enough to hold the cookie
cookieData = new StringBuilder(datasize);
if (!InternetGetCookieEx(url, null, cookieData, ref datasize, 0x00002000, null))
return null;
}
return cookieData.ToString();
}

作者: 苏飞 发表于 2011-10-22 17:40 原文链接

评论: 7 查看评论 发表评论


最新新闻:
· 盖茨在 2006 年就预言了iPad?(2011-10-22 22:26)
· 知彼者知己:乔布斯对他的十个对手的评价(2011-10-22 21:15)
· 乔布斯生前最喜欢看的书(2011-10-22 21:13)
· 乔布斯的最终决战奥义:多位一体电视机(2011-10-22 21:11)
· Google TV 2.0 实测画面曝光(2011-10-22 21:08)

编辑推荐:消灭程序员需要百年吗?

网站导航:博客园首页  我的园子  新闻  闪存  小组  博问  知识库

相关 [httphelper 帮助 httprequest] 推荐:

C# HttpHelper帮助类,真正的Httprequest请求时无视编码,无视证书,无视Cookie,网页抓取

- Bloger - 博客园-首页原创精华区
之前我写过篇关于C# HttpWebRequest 绝技的文章 无视证书的方法请在篇文章里面查找谢谢,以下不做无视证书的方法. 无论是Get还是Post 带Cookie,编码问题解决 ,这里完全做到了无视编码的问题. 最近把上面的方法整理了一下,这个类相当于一个SqlHelper类一下,我把它叫做HttpHelper类,以后还会慢慢更新,希望大家多我支持,.

互相帮助

- 威 - 杜然的blog——i&#39;m blinded by blackness
每组动作之间,教练让我休息三四十秒钟的时间,说劳逸结合才能增肌增力. 增肌增力,这四个字听着就让人欢喜,觉得付给教练的钱太值了,连休息都能长肌肉长力气. 在这三四十秒的时间里,我跟教练一般会闲聊. 比如,我说如果北京每年都像今年这样多雨,没准儿以后可以北水南调,挖它三条运河,GDP冲得老高了. 有时候,教练会拿出手机中儿子的照片焦灼地等着我的夸赞——我特别理解新爸爸的心情,所以很配合.

怎样帮助他人(转)

- 阿昌 - 时间堂—GTD学习实践小屋
  我们基本上没有什么办法去帮助他人,即使全能的上帝都没有这个能力. 上帝只帮助那些能够自己帮助自己的人:耶稣也曾对人说过:是你们自己坚定的信心在帮助你,不是我. 因为他人的帮助只能解决一时之急,从长远看来,对一个人并没有什么真正的益处.   对于我们任何一个人,生活中总会有一个当下最根本的矛盾问题.

氮磷钾帮助抑制核辐射

- rIPPER - Solidot
提前四月一的超时空章鱼 写道 "核治愈权威Zombies教授的助手Asshole博士经过对日本沿海水质的对比测试,指出预防辐射最好方法是尽量吸收氮磷钾(Amifostine),连日来的实验数据表明一样中国特色小吃富含氮磷钾,但由于氮磷钾挥发性比较强,不能长期曝露在空气中,所以必须采取直接入口的方式吞食.

SignalGuru帮助司机躲开红灯

- hao - Solidot
MIT和普林斯顿大学的研究人员正在研发一套名叫SignalGuru(PDF)的系统,利用安装在仪表盘的智能手机摄像头网络收集的可视化数据,优化驾驶速度,避开路上的红灯,避免等待,同时减少汽油消耗,因为不时的停车和启动是相当耗油的. SignalGuru已在麻省剑桥和新加坡进行了测试. 在剑桥,交通信号灯是根据固定时间表变化的,因此系统可以以三分之二秒的误差预测红灯在何时亮起,能帮助司机平均减少20%的汽油消耗.

"各种电影对你有帮助

- Frankenstein - Cao Liu
1、缺乏学习动力:《幸福终点站》、《风雨哈佛路》. 2、对爱失望:《偷天情缘》、《初恋50次》. 3、自卑失落:《阿甘正传》、《肖申克的救赎》. 4、失败或绝望:《铁权男人》、《迫在眉梢》、《伊丽莎白镇》. 5、厌倦生活:《在世界的转角遇见爱》、《搏击俱乐部》. 《盗梦空间》、《记忆裂痕》、《生死停留》、《死亡幻觉》、《禁闭岛》、《穆赫兰道》、《蝴蝶效应》、《恐怖游轮》、《伤城》、《盗走达芬奇》、《88分钟》、《万能钥匙》、《决胜21点》、《沉默的羔羊》.

BlindSquare:利用 LBS 数据帮助盲人

- - 爱范儿 · Beats of Bits
最近 Foursquare 积累了数量庞大的真实地理位置数据,它拥有 2000 万名用户以及 20 亿次签到. 这些数据不但可以 帮助商户掘金,还可以帮助盲人导航. iOS 应用 BlindSquare 利用 Open Street Maps 来定位用户的位置,然后通过 Foursquare 的数据找出附近有什么地方,再通过苹果内置的 VoiceOver 或 Acapela Group 提供的文本转声音服务,将地名读出来,好让用户知晓,这样便为盲人创建了一个由语音构成的地图.

数据如何帮助业务

- - 小蚊子乐园
文 / 阿里巴巴集团商业智能部资深经理 欧吉良(勾践).        数据的重要性已经被越来越多的公司、个人所熟知与接受,甚至于有过犹不及之势头. 大数据的概念满天飞,似乎一夜之间人人都在谈论大数据,见了面不用 大数据打招呼,好像就不是在数据圈子里混的了. 那么,被外界传得神乎其神的数据,到底可以在哪些方面促进业务的腾飞.

Flutter Go:Flutter 开发者帮助 App

- - IT瘾-dev
帮助开发者快速上手 Flutter 内部测试中,1.0 正式版将于 2月 20日 发布. Release安装包下载地址. iphone下载地址: 暂无. Flutter 是什么?. 2018年6月21日Google发布Flutter首个release预览版,作为Google 大力推出的一种全新的响应式,跨平台,高性能的移动开发框架.

怎样让用户来帮助你做产品?

- Kings - 落花流水——elya妞╰_╯
好的产品设计师要学会“跟大多数人商量,听少数人的意见,自己做决定”,这句话来自百度论语,说的是产品团队内部做决策的一个基本方法. 但是我想把他引申一下,到产品外部,到产品的使用者那里,因为你的产品是做给人用的,而不是做给产品者自娱自乐的,所以,“挖掘大多数用户的需求,听少数用户的意见,自己做决定”是一个让用户帮助你做产品的基本方法.