程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> C++ 字符串UTF8與GBK轉化,utf8gbk

C++ 字符串UTF8與GBK轉化,utf8gbk

編輯:C++入門知識

C++ 字符串UTF8與GBK轉化,utf8gbk


       第一次寫博客,有時候在工作中遇到解析XML文件,節點屬性值為中文的情況,需要轉換編碼,VC默認是的是GB2312,遇到中文就出現亂碼,下面是UTF-8和GBK2312的互相轉換,有畫蛇添足的地方,希望各位大神指出:

#include "windows.h"

// UTF-8轉為GBK2312 [1/18/2017/shike]
 std::string UtfToGbk(const char* utf8)
 {
   int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);
   wchar_t* wstr = new wchar_t[len+1];
   memset(wstr, 0, len+1);
   MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);
   len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL, NULL);
   char* str = new char[len+1];
   memset(str, 0, len+1);
   WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);
   if(wstr) delete[] wstr;
   return str;
 }

//GBK轉化為UTF8格式
 void ConvertGBKToUtf8(CString &strGBK)
 {
  int len=MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, NULL,0);
  wchar_t * wszUtf8 = new wchar_t [len];
  memset(wszUtf8, 0, len);
  MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)strGBK, -1, wszUtf8, len);
  len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
  char *szUtf8=new char[len + 1];
  memset(szUtf8, 0, len + 1);
  WideCharToMultiByte (CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL,NULL);
  strGBK = szUtf8;
  delete[] szUtf8;
  delete[] wszUtf8;
 }

 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved