Algorithm-Pattern
  • Introduction
  • C & C++
    • C语言
      • C/C++编译器
      • 宏的使用
      • 编译过程
      • 指针 & 数组
      • 柔性数组
      • 函数指针 & 回调函数
      • C标准库之stdio
      • C标准库之string
      • C标准库之errno
      • C标准库之stdarg
      • C标准库之regex
    • C++基础语法
      • 自增(++) & 自减(--)
      • c语言到c++
      • 可变模板参数
      • 强制类型转换
      • C/C++类型转换的本质
      • 指针 & 引用
      • const的用法
      • static的用法
      • 重要的关键字(一)
      • 重要的关键字(二)
      • 内存申请和释放
      • 内联函数
      • 函数 & 运算符重载
      • 面向对象之封装
      • 构造函数 & 析构函数
      • 面向对象之继承
      • 面向对象之多态
      • 泛型编程
      • 异常
      • 再谈函数指针
    • C++并发编程
      • C++的锁
      • 并发与多线程
    • C++高级特性
      • 函数对象
      • 移动语义 & 完美转发
      • lambda表达式
      • RTTI技术
      • RAII技术
      • 智能指针
      • 模板的特化
      • C++静态库和动态库
      • 内存溢出和内存泄漏
    • STL基础
      • String
      • array/vector/list
      • deque/priority_queue
      • set/map
      • unordered_set/unordered_map
      • algorithm_1
      • functional
      • allocator
    • C++标准库
      • IO
      • Tuple
      • regex
      • bitset
      • numeric
    • STL深入源码
      • vector内部实现
      • deque内部实现
      • sort函数实现
    • 第三方库
      • JsonCpp
      • ProtoBuf
  • 数据结构
    • 线性表
    • 字符串
    • 栈和队列
    • 二叉树
    • 平衡二叉树
    • 平衡多路搜索树
    • 树结构的延申
    • 图
    • 二进制
    • 散列表
  • 算法基础
    • 排序算法
    • 查找算法
    • 数学问题
    • 并查集
    • 递归算法
    • 附加——主定理
    • Catalan数
  • 算法设计思想
    • 滑动窗口思想
    • BFS/DFS
    • 二分法
    • 回溯法
    • 贪心算法
    • 分治法
    • 动态规划
    • 分支限界算法
    • 有限状态机(FSM)
  • LeetCode系列
    • 死磕二叉树
    • 股票买卖问题
    • 打家劫舍问题
    • 跳跃游戏问题
    • 括号匹配问题
    • 石子游戏问题
    • 子序列问题
    • 数组 & 矩阵
    • 排列 & 组合
  • 经典算法问题
    • 几何问题
    • 区间问题
    • 背包问题
    • 石子堆问题
    • 表达式求值
  • 面试题
    • 数据结构和算法基础
    • 程序设计题
      • 实现双线程交替打印
      • C++实现读写锁
      • 实现阻塞队列
      • 实现环形队列
      • 实现线程池
      • 实现智能指针
      • 实现string类
      • 实现高性能local cache
      • 实现内存池
      • 生产者-消费者模型
      • 设计定时器
    • 经典的算法题
    • C++面试题总结
    • 面试算法题总结
由 GitBook 提供支持
在本页
  • 1、成员函数
  • 2、创建与初始化
  • 3、类型转换
  • 4、关于split

这有帮助吗?

  1. C & C++
  2. STL基础

String

上一页STL基础下一页array/vector/list

最后更新于4年前

这有帮助吗?

1、成员函数

函数名称

功能

构造函数

产生或复制字符串

析构函数

销毁字符串

=,assign

赋以新值

Swap

交换两个字符串的内容

+ =,append(),push_back()

添加字符

insert ()

插入字符

erase()

删除字符

clear ()

移除全部字符

resize ()

改变字符数量

replace()

替换字符

+

串联字符串

==,! =,<,<=,>,>=,compare()

比较字符串内容

size(),length()

返回字符数量

max_size()

返回字符的最大可能个数

empty()

判断字符串是否为空

capacity()

返回重新分配之前的字符容量

reserve()

保留内存以存储一定数量的字符

[],at()

存取单一字符

>>,getline()

从 stream 中读取某值

<<

将值写入 stream

copy()

将内容复制为一个 C - string

c_str()

将内容以 C - string 形式返回

data()

将内容以字符数组形式返回

substr()

返回子字符串

find()

搜寻某子字符串或字符

begin(),end()

提供正向迭代器支持

rbegin(),rend()

提供逆向迭代器支持

get_allocator()

返回配置器

C++11以前有很多原因不能提供一个通用的split,比如说需要考虑split以后的结果存储在什么类型的容器中,可以是vector、list等等包括自定义容器,很难提供一个通用的;再比如说需要split的源字符串很大的时候运算的时间可能会很长,所以这个split最好是lazy的,每次只返回一条结果。

目前发现的史上最优雅的一个实现是这样的:

void split(const string& s, vector<string>& tokens, const string& delimiters = " "){
    string::size_type lastPos = s.find_first_not_of(delimiters, 0);
    string::size_type pos = s.find_first_of(delimiters, lastPos);
    while (string::npos != pos || string::npos != lastPos) {
        tokens.push_back(s.substr(lastPos, pos - lastPos));//use emplace_back after C++11
        lastPos = s.find_first_not_of(delimiters, pos);
        pos = s.find_first_of(delimiters, lastPos);
    }
}

但是分隔符只能是字符,为字符串时并不能有效,下面提供一种实现支持分割符是字符串的情况:

void SplitString(const std::string& s, std::vector<std::string>& tokens, const std::string& c){
    std::string::size_type firstPos, lastPos;
    lastPos = s.find(c);
    firstPos = 0;
    while(std::string::npos != lastPos){
        tokens.push_back(s.substr(firstPos, lastPos - firstPos));
        firstPos = lastPos + c.size();
        lastPos = s.find(c, firstPos);
    }
    if(firstPos != s.length())
        tokens.push_back(s.substr(firstPos));
}

从C++11开始,标准库中提供了regex,regex用来做split:

std::string text = "Quick brown fox.";
std::regex ws_re("\\s+"); // whitespace
std::vector<std::string> v(
    std::sregex_token_iterator(text.begin(), text.end(), ws_re, -1), 
    std::sregex_token_iterator()
    );
for(auto&& s: v)
    std::cout<<s<<"\n";    

从C++20开始,标准库中提供了ranges,有专门的split view,只要写str | split(' ')就可以切分字符串,如果要将结果搜集到vector中,可以这样用:

string str("hello world test split");
auto sv = str
    | ranges::views::split(' ') 
    | ranges::views::transform([](auto&& i){
        return i | ranges::to<string>(); }) 
    | ranges::to<vector>();
    
for(auto&& s: sv)
    cout<<s<<"\n";

其实C语言里面也有一个函数strtok用于char*的split,例如:

void split(char *src, const char *separator, char **dest, int *num) {
     char *pNext;
     int count = 0;
     if (src == NULL || strlen(src) == 0)
        return;
     if (separator == NULL || strlen(separator) == 0)
        return;
     pNext = strtok(src,separator);
     while(pNext != NULL) {
          *dest++ = pNext;
          ++count;
         pNext = strtok(NULL,separator);
    }
    *num = count;
}

这里要注意的是strtok的第一个参数类型是char*而不是const char*,实际上strtok会改变输入的字符串。

2、创建与初始化

3、类型转换

4、关于split

C++17提供的string_view可以加速上面提到的第一个split实现,减少拷贝,性能有不小提升,参看此文: 。

✏️
✏️
✏️
✏️
Speeding Up string_view String Split Implementation