VC++ 获取网页源代码,UTF8与ANSI相互转码

VC++ 获取网页源代码,UTF8与ANSI相互转码

编译开发环境:WIN10+64位,VC++6.0

功能:VC++ 获取网页源代码,并且进行转码;如果网站是UTF8码,,则需要转为中文ansi。

读取网页源码,利用CInternetSession及CHttpFile读取数据,代码如下:

  1. <div><font style=”background-color: rgb(255, 255, 255);”>CInternetSession mySession(NULL,0);
  2. CHttpFile* myHttpFile=NULL;
  3. m_SiteInfo=”连接到站点”+m_SiteName+”\r\n”;
  4. UpdateData(false);</font></div><div><font style=”background-color: rgb(255, 255, 255);”> CString myData;
  5. myHttpFile=(CHttpFile*)mySession.OpenURL(m_SiteName);
  6. while(myHttpFile->ReadString(myData))
  7. {
  8.   CString strTmp=Utf8ToAnsi(myData);
  9.   m_SiteInfo=m_SiteInfo+”\r\n”;
  10.   m_SiteInfo+=strTmp;
  11. }
  12. myHttpFile->Close();
  13. mySession.Close();
  14. </font></div>

复制代码

整体编译通过

由于网站为utf8编码,显示出来的中文为乱码,此处需要增加转换为ansi码,代码如下:

  1. <div>//UTF8 to Ansi
  2. CString CMyWinInet_1Dlg::Utf8ToAnsi(const char* str)
  3. {
  4.   //wchar_t * UTF8ToUnicode( const char* str )
  5.   int textlen ;
  6.      wchar_t * unicodestr=NULL;
  7.      textlen = MultiByteToWideChar( CP_UTF8, 0, str,-1, NULL,0 );
  8.      unicodestr = (wchar_t *)malloc((textlen+1)*sizeof(wchar_t));
  9.   if(NULL == unicodestr)
  10.   {
  11.    AfxMessageBox(“内存不足\n错误代码:U2A01”);
  12.    return “0E”;
  13.   }
  14.      memset(unicodestr,0,(textlen+1)*sizeof(wchar_t));
  15.      MultiByteToWideChar(CP_UTF8, 0,str,-1,(LPWSTR)unicodestr,textlen );
  16.   //char * UnicodeToANSI( const wchar_t* str )
  17.   char* ansistr=NULL;
  18.      textlen = WideCharToMultiByte( CP_ACP, 0, unicodestr, -1, NULL, 0, NULL, NULL );
  19.      ansistr =(char *)malloc((textlen+1)*sizeof(char));
  20.   if(NULL == ansistr)
  21.   {
  22.    AfxMessageBox(“内存不足\n错误代码:U2A01”);
  23.    return “0E”;
  24.   }
  25.      memset( ansistr, 0, sizeof(char) * ( textlen + 1 ) );
  26.      WideCharToMultiByte( CP_ACP, 0, unicodestr, -1, ansistr, textlen, NULL, NULL );</div><div>  free(unicodestr);
  27.   unicodestr=NULL;</div><div>  CString ansi=ansistr;</div><div>  free(ansistr);
  28.   ansistr=NULL;
  29.   return ansi;
  30. }
  31. </div>

复制代码

添加转码后正常。

下载说明:
1.本站资源都是白菜价出售,同样的东西,我们不卖几百,也不卖几十,甚至才卖几块钱,一个永久会员能下载全站100%源码了,所以单独购买也好,会员也好均不提供相关技术服务。
2.如果源码下载地址失效请联系站长QQ进行补发。
3.本站所有资源仅用于学习及研究使用,请必须在24小时内删除所下载资源,切勿用于商业用途,否则由此引发的法律纠纷及连带责任本站和发布者概不承担。资源除标明原创外均来自网络整理,版权归原作者或本站特约原创作者所有,如侵犯到您权益请联系本站删除!
4.本站站内提供的所有可下载资源(软件等等)本站保证未做任何负面改动(不包含修复bug和完善功能等正面优化或二次开发);但本网站不能保证资源的准确性、安全性和完整性,由于源码具有复制性,一经售出,概不退换。用户下载后自行斟酌,我们以交流学习为目的,并不是所有的源码都100%无错或无bug;同时本站用户必须明白,【安安资源网】对提供下载的软件等不拥有任何权利(本站原创和特约原创作者除外),其版权归该资源的合法拥有者所有。
5.请您认真阅读上述内容,购买即以为着您同意上述内容,由于源码具有复制性,一经售出,概不退换。
安安资源网 » VC++ 获取网页源代码,UTF8与ANSI相互转码