String

✏️ 1、成员函数

函数名称

功能

构造函数

产生或复制字符串

析构函数

销毁字符串

=,assign

赋以新值

Swap

交换两个字符串的内容

+ =append()push_back()

添加字符

insert ()

插入字符

erase()

删除字符

clear ()

移除全部字符

resize ()

改变字符数量

replace()

替换字符

+

串联字符串

==,! =,<,<=,>,>=,compare()

比较字符串内容

size()length()

返回字符数量

max_size()

返回字符的最大可能个数

empty()

判断字符串是否为空

capacity()

返回重新分配之前的字符容量

reserve()

保留内存以存储一定数量的字符

[]at()

存取单一字符

>>getline()

从 stream 中读取某值

<<

将值写入 stream

copy()

将内容复制为一个 C - string

c_str()

将内容以 C - string 形式返回

data()

将内容以字符数组形式返回

substr()

返回子字符串

find()

搜寻某子字符串或字符

begin()end()

提供正向迭代器支持

rbegin()rend()

提供逆向迭代器支持

get_allocator()

返回配置器

✏️ 2、创建与初始化

✏️ 3、类型转换

✏️ 4、关于split

C++11以前有很多原因不能提供一个通用的split,比如说需要考虑split以后的结果存储在什么类型的容器中,可以是vectorlist等等包括自定义容器,很难提供一个通用的;再比如说需要split的源字符串很大的时候运算的时间可能会很长,所以这个split最好是lazy的,每次只返回一条结果。

目前发现的史上最优雅的一个实现是这样的:

void split(const string& s, vector<string>& tokens, const string& delimiters = " "){
    string::size_type lastPos = s.find_first_not_of(delimiters, 0);
    string::size_type pos = s.find_first_of(delimiters, lastPos);
    while (string::npos != pos || string::npos != lastPos) {
        tokens.push_back(s.substr(lastPos, pos - lastPos));//use emplace_back after C++11
        lastPos = s.find_first_not_of(delimiters, pos);
        pos = s.find_first_of(delimiters, lastPos);
    }
}

但是分隔符只能是字符,为字符串时并不能有效,下面提供一种实现支持分割符是字符串的情况:

void SplitString(const std::string& s, std::vector<std::string>& tokens, const std::string& c){
    std::string::size_type firstPos, lastPos;
    lastPos = s.find(c);
    firstPos = 0;
    while(std::string::npos != lastPos){
        tokens.push_back(s.substr(firstPos, lastPos - firstPos));
        firstPos = lastPos + c.size();
        lastPos = s.find(c, firstPos);
    }
    if(firstPos != s.length())
        tokens.push_back(s.substr(firstPos));
}

从C++11开始,标准库中提供了regexregex用来做split

std::string text = "Quick brown fox.";
std::regex ws_re("\\s+"); // whitespace
std::vector<std::string> v(
    std::sregex_token_iterator(text.begin(), text.end(), ws_re, -1), 
    std::sregex_token_iterator()
    );
for(auto&& s: v)
    std::cout<<s<<"\n";    

C++17提供的string_view可以加速上面提到的第一个split实现,减少拷贝,性能有不小提升,参看此文: Speeding Up string_view String Split Implementation

从C++20开始,标准库中提供了ranges,有专门的split view,只要写str | split(' ')就可以切分字符串,如果要将结果搜集到vector中,可以这样用:

string str("hello world test split");
auto sv = str
    | ranges::views::split(' ') 
    | ranges::views::transform([](auto&& i){
        return i | ranges::to<string>(); }) 
    | ranges::to<vector>();
    
for(auto&& s: sv)
    cout<<s<<"\n";

其实C语言里面也有一个函数strtok用于char*split,例如:

void split(char *src, const char *separator, char **dest, int *num) {
     char *pNext;
     int count = 0;
     if (src == NULL || strlen(src) == 0)
        return;
     if (separator == NULL || strlen(separator) == 0)
        return;
     pNext = strtok(src,separator);
     while(pNext != NULL) {
          *dest++ = pNext;
          ++count;
         pNext = strtok(NULL,separator);
    }
    *num = count;
}

这里要注意的是strtok的第一个参数类型是char*而不是const char*,实际上strtok会改变输入的字符串。

最后更新于