程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> C/C++ 字符串 總結

C/C++ 字符串 總結

編輯:C++入門知識

1 字符基礎

1.1 單字節字符集(single-byte character set(SBCS))

顧名思義,在這種模式下,所有的字符都只用一個字節表示,常見的如,ASCII

1.2 多字節字符集(multi-byte character set(MBCS))

在Windows中MBCS包含兩種字符類型,單字節字符和雙字節字符.由於windows使用的多字節字符絕大部分是兩個字節長,所以MBCS常被DBCS代替。

1.3 unicode

Unicode是一種所有的字符都使用兩個字節編碼的編碼模式。Unicode字符有時也被稱作寬字符,因為它比單子節字符寬(使用了更多的存儲空間)。

常見的為utf-8,還有一個比較少用的是utf-16

1.3.1 utf-8 BOM頭

在浏覽器中或某些文本編輯器中會給utf-8 文本 加上bom頭。在程序讀取的過程中需要去掉BOM頭否則會出現亂碼。

BOM 格式為: EF BB BF,10進制格式為:-17 -69 -65

Utf8去BOM頭的方法:

string Utf8DeBOM(string s) {
	int c1 = s[0];
	int c2 = s[1];
	int c3 = s[2];

	if (c1 == -17 && c2 == -69 && c3 == -65)
	{
		s = s.substr(3, s.length());	
	}

	return s;
}

2 C/C++/VC++中的字符串

2.1 C中的字符串

C語言中, 沒有字符串的數據類型,使用一個以NULL('\0')字符結尾的字符數組來保存字符串。

char* p = "Hello world";

char* p = (char*)malloc (100 * sizeof(char));

char p[100] = "hello world";

2.2 C++ 中的字符串

C++ 語言中有單獨字符串類型,在string頭文件中,還有對應的寬字符串wstring.

string iStr = "Hello world";

wstring wStr = "Hello world";

2.3 VC ++ 中的字符串

在學Window是開發過程中最頭疼的莫過於一堆字符串宏。

類型 MBCS 中含義 Unicode 中含義

TCHAR char wchar_t

WCHAR wchar _twchar_t

LPSTR char* char*

LPCWSTR const wchar_t* const wchar_t*

LPCSTR const char* const char*

LPWSTR wchar_t* wchar_t*

LPTSTR TCHAR* TCHAR*

LPCTSTR const TCHAR* const TCHAR*

char 標准c的字符類型(1Byte)
wchar_t 保存UNICODE字符集的類型(2Byte)

TCHAR的定義如下:

#ifdef UNICODE
typedef wchar_t TCHAR;
#else
typedef char TCHAR;
#endif

再了解一個宏_T(),使用宏_T(),使代碼有了unicode的意識。

#ifdef UNICODE
#define _T(x) L##x
#else
#define _T(x) x

3 標准C++ 字符串操作

3.1 構造方法

string(const char *s); //用c字符串s初始化

string(int n,char c); //用n個字符c初始化

此外,string類還支持默認構造函數和復制構造函數,如string s1;string s2="hello";都是正確的寫法。當構造的string太長而無法表達時會拋出length_error異常

3.2 操作方法

3.2.1 字符操作

const char &operator[](int n)const; // 索引操作,取單個字符

const char &at(int n)const;// 同上

char &operator[](int n);//同上

char &at(int n);//同上

operator[]和at()均返回當前字符串中第n個字符的位置,但at函數提供范圍檢查,當越界時會拋出out_of_range異常,下標運算符[]不提供檢查訪問。


const char *data()const;//返回一個非null終止的c字符數組

const char *c_str()const;//返回一個以null終止的c字符串

int copy(char *s, int n, int pos = 0) const;//把當前串中以pos開始的n個字符拷貝到以s為起始位置的字符數組中,返回實際拷貝的數目

3.2.2 string的特性描述

int capacity()const; //返回當前容量(即string中不必增加內存即可存放的元素個數)

int max_size()const; //返回string對象中可存放的最大字符串的長度

int size()const; //返回當前字符串的大小

int length()const; //返回當前字符串的長度

bool empty()const; //當前字符串是否為空

void resize(int len,char c);//把字符串當前大小置為len,並用字符c填充不足的部分


3.2.3 string類的輸入輸出操作

string類重載運算符operator>>用於輸入,同樣重載運算符operator<<用於輸出操作。

函數getline(istream &in,string &s);用於從輸入流in中讀取字符串到s中,以換行符'\n'分開。

3.2.4 string的賦值

string &operator=(const string &s);//把字符串s賦給當前字符串

string &assign(const char *s);//用c類型字符串s賦值

string &assign(const char *s,int n);//用c字符串s開始的n個字符賦值

string &assign(const string &s);//把字符串s賦給當前字符串

string &assign(int n,char c);//用n個字符c賦值給當前字符串

string &assign(const string &s,int start,int n);//把字符串s中從start開始的n個字符賦給當前字符串

string &assign(const_iterator first,const_itertor last);//把first和last迭代器之間的部分賦給字符串

3.2.5 string的連接

string &operator+=(const string &s);//把字符串s連接到當前字符串的結尾

string &append(const char *s); //把c類型字符串s連接到當前字符串結尾

string &append(const char *s,int n);//把c類型字符串s的前n個字符連接到當前字符串結尾

string &append(const string &s); //同operator+=()

string &append(const string &s,int pos,int n);//把字符串s中從pos開始的n個字符連接到當前字符串的結尾

string &append(int n,char c); //在當前字符串結尾添加n個字符c

string &append(const_iterator first,const_iterator last);//把迭代器first和last之間的部分連接到當前字符串的結尾

3.2.6 string的比較

bool operator==(const string &s1,const string &s2)const;//比較兩個字符串是否相等

運算符">","<",">=","<=","!="均被重載用於字符串的比較;

int compare(const string &s) const;//比較當前字符串和s的大小

int compare(int pos, int n,const string &s)const;//比較當前字符串從pos開始的n個字符組成的字符串與s的大小

int compare(int pos, int n,const string &s,int pos2,int n2)const;//比較當前字符串從pos開始的n個字符組成的字符串與s中pos2開始的n2個字符組成的字符串的大小

int compare(const char *s) const;

int compare(int pos, int n,const char *s) const;

int compare(int pos, int n,const char *s, int pos2) const;

compare函數在>時返回1,<時返回-1,==時返回0

3.2.7 string的子串

string substr(int pos = 0,int n = npos) const;//返回pos開始的n個字符組成的字符串

3.2.8 string的交換

void swap(string &s2); //交換當前字符串與s2的值

3.2.9 string類的查找函數

int find(char c, int pos = 0) const;//從pos開始查找字符c在當前字符串的位置
int find(const char *s, int pos = 0) const;//從pos開始查找字符串s在當前串中的位置
int find(const char *s, int pos, int n) const;//從pos開始查找字符串s中前n個字符在當前串中的位置
int find(const string &s, int pos = 0) const;//從pos開始查找字符串s在當前串中的位置
//查找成功時返回所在位置,失敗返回string::npos的值
int rfind(char c, int pos = npos) const;//從pos開始從後向前查找字符c在當前串中的位置
int rfind(const char *s, int pos = npos) const;
int rfind(const char *s, int pos, int n = npos) const;
int rfind(const string &s,int pos = npos) const;
//從pos開始從後向前查找字符串s中前n個字符組成的字符串在當前串中的位置,成功返回所在位置,失敗時返回string::npos的值
int find_first_of(char c, int pos = 0) const;//從pos開始查找字符c第一次出現的位置
int find_first_of(const char *s, int pos = 0) const;
int find_first_of(const char *s, int pos, int n) const;
int find_first_of(const string &s,int pos = 0) const;
//從pos開始查找當前串中第一個在s的前n個字符組成的數組裡的字符的位置。查找失敗返回string::npos
int find_first_not_of(char c, int pos = 0) const;
int find_first_not_of(const char *s, int pos = 0) const;
int find_first_not_of(const char *s, int pos,int n) const;
int find_first_not_of(const string &s,int pos = 0) const;
//從當前串中查找第一個不在串s中的字符出現的位置,失敗返回string::npos
int find_last_of(char c, int pos = npos) const;
int find_last_of(const char *s, int pos = npos) const;
int find_last_of(const char *s, int pos, int n = npos) const;
int find_last_of(const string &s,int pos = npos) const;
int find_last_not_of(char c, int pos = npos) const;
int find_last_not_of(const char *s, int pos = npos) const;
int find_last_not_of(const char *s, int pos, int n) const;
int find_last_not_of(const string &s,int pos = npos) const;
//find_last_of和find_last_not_of與find_first_of和find_first_not_of相似,只不過是從後向前查找

3.2.10 string類的替換函數

string &replace(int p0, int n0,const char *s);//刪除從p0開始的n0個字符,然後在p0處插入串s
string &replace(int p0, int n0,const char *s, int n);//刪除p0開始的n0個字符,然後在p0處插入字符串s的前n個字符
string &replace(int p0, int n0,const string &s);//刪除從p0開始的n0個字符,然後在p0處插入串s
string &replace(int p0, int n0,const string &s, int pos, int n);//刪除p0開始的n0個字符,然後在p0處插入串s中從pos開始的n個字符
string &replace(int p0, int n0,int n, char c);//刪除p0開始的n0個字符,然後在p0處插入n個字符c
string &replace(iterator first0, iterator last0,const char *s);//把[first0,last0)之間的部分替換為字符串s
string &replace(iterator first0, iterator last0,const char *s, int n);//把[first0,last0)之間的部分替換為s的前n個字符
string &replace(iterator first0, iterator last0,const string &s);//把[first0,last0)之間的部分替換為串s
string &replace(iterator first0, iterator last0,int n, char c);//把[first0,last0)之間的部分替換為n個字符c
string &replace(iterator first0, iterator last0,const_iterator first, const_iterator last);//把[first0,last0)之間的部分替換成[first,last)之間的字符串

3.2.11 string類的插入函數

string &insert(int p0, const char *s);
string &insert(int p0, const char *s, int n);
string &insert(int p0,const string &s);
string &insert(int p0,const string &s, int pos, int n);
//前4個函數在p0位置插入字符串s中pos開始的前n個字符
string &insert(int p0, int n, char c);//此函數在p0處插入n個字符c
iterator insert(iterator it, char c);//在it處插入字符c,返回插入後迭代器的位置
void insert(iterator it, const_iterator first, const_iterator last);//在it處插入[first,last)之間的字符
void insert(iterator it, int n, char c);//在it處插入n個字符c

3.2.12 string類的刪除函數

iterator erase(iterator first, iterator last);//刪除[first,last)之間的所有字符,返回刪除後迭代器的位置
iterator erase(iterator it);//刪除it指向的字符,返回刪除後迭代器的位置
string &erase(int pos = 0, int n = npos);//刪除pos開始的n個字符,返回修改後的字符串

3.2.13 string類的迭代器處理

string類提供了向前和向後遍歷的迭代器iterator,迭代器提供了訪問各個字符的語法,類似於指針操作,迭代器不檢查范圍。
用string::iterator或string::const_iterator聲明迭代器變量,const_iterator不允許改變迭代的內容。常用迭代器函數有:
const_iterator begin()const;
iterator begin(); //返回string的起始位置
const_iterator end()const;
iterator end(); //返回string的最後一個字符後面的位置
const_iterator rbegin()const;
iterator rbegin(); //返回string的最後一個字符的位置
const_iterator rend()const;
iterator rend(); //返回string第一個字符位置的前面
rbegin和rend用於從後向前的迭代訪問,通過設置迭代器string::reverse_iterator,string::const_reverse_iterator實現

3.2.14 字符串流處理

通過定義ostringstream和istringstream變量實現,頭文件中
例如:

 string input("hello,this is a test");
     istringstream is(input);
     string s1,s2,s3,s4;
     is>>s1>>s2>>s3>>s4;//s1="hello,this",s2="is",s3="a",s4="test"
     ostringstream os;
     os<

3.2.15 字符串分割函數

vector split(string& str,const char* c)
{
	char * p;
	vector res;
	p = strtok(const_cast(str.c_str()),c);
	while(p!=NULL)
	{
		res.push_back(p);
		p = strtok(NULL,c);
	}
	return res;	
}

3.2.16 字符串替換函數

void Replace(std::string&srcstr,const std::string&oldstr,const std::string&newstr)
	{
		string::size_type pos=0;
		string::size_type a=oldstr.size();
		string::size_type b=newstr.size();
		while((pos=srcstr.find(oldstr,pos))!=string::npos)
		{
			srcstr.replace(pos,a,newstr);
			pos+=b;
		}
	}

3.2.17 字符串的Trim方法

std::string TrimLeft(const std::string& str) {
		std::string t = str;
		for (std::string::iterator i = t.begin(); i != t.end(); i++) {
			if (!isspace(*i)) {
				t.erase(t.begin(), i);
				break;
			}
		}
		return t;
	}

	std::string TrimRight(const std::string& str) {
		if (str.begin() == str.end()) {
			return str;
		}
		std::string t = str;
		for (std::string::iterator i = t.end() - 1; i != t.begin(); i--) {
			if (!isspace(*i)) {
				t.erase(i + 1, t.end());
				break;
			}
		}
		return t;
	}

	std::string Trim(const std::string& str) {
		std::string t = str;

		std::string::iterator i;
		for (i = t.begin(); i != t.end(); i++) {
			if (!isspace(*i)) {
				t.erase(t.begin(), i);
				break;
			}
		}
		if (i == t.end()) {
			return t;
		}

		for (i = t.end() - 1; i != t.begin(); i--) {
			if (!isspace(*i)) {
				t.erase(i + 1, t.end());
				break;
			}
		}
		return t;
	}

4 字符串轉換

4.1 string, char* , const char* 相互轉化

char * s = "hello world";
	const char * cs = "world";
	string str;
	str = s; // char* -> string
	s = const_cast(cs); // const char* -> char*
	cs = s;// char* -> const char*
	s = const_cast(str.c_str());// string -> const char* -> char*

4.1 整形和字符串相互轉化

// unsigned int to string 。用以取代atoi
static inline string Int2Str(unsigned int value)
{
	string result;
	stringstream buffer;
	buffer << std::dec << value;   
	buffer >> result;
	return result;
}

// string to unsigned int
static inline unsigned int Str2Int(string value)
{
	unsigned int result;
	stringstream buffer;
	buffer << std::dec << value; 
	buffer >> result;  
	return result;
}

4.1 16進制 數字和字符串相互轉化

// unsigned int to hex string
static inline string Uint2StrHex(unsigned int value)
{
	string result;
	stringstream buffer;
	buffer << hex << value;   
	buffer >> result;
	return result;
}

// hex string to unsigned int
static inline unsigned int StrHex2Uint(string value)
{
	unsigned int result;
	stringstream buffer;
	buffer << hex << value; 
	buffer >> result;  
	return result;
}

5 參考資料

http://www.cnblogs.com/fdyang/archive/2012/06/01/2858741.html

http://www.cnblogs.com/sexybear/p/Cpp_stringplus.html

http://www.cnblogs.com/Frandy/archive/2012/04/18/cpp_str_split.html

http://blog.csdn.net/beyondhaven/article/details/6679206

http://www.cnblogs.com/ider/archive/2011/07/22/cpp_cast_operator_part2.html


  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved