带你用C语言实现strtok和字符串分割函数
作者:^jhao^ 时间:2021-11-07 10:09:59
前言
字符串分割函数strtok,大家可能都知道他怎么使用,一旦要用的时候就会心生疑惑,不知道它的内部的实现,废话不多说,本篇就来带大家看看strtok的基本使用和实现
一、strtok的基本使用
解析:函数大概说了以下几点
1.str就是我们要去拆分的字符串,注意,我们会对该字符串进行更改,所以一般我们会拷贝一份然后去分割拷贝的那份字符串!!
2.delimiters 就是我们定义的切分的符号,假如想要用空格作为分割符,我们就可以定义 char delimiters [NUM]=" " ** 请注意里面放了一个空格的呀!!
此处NUM可以自己定义大小,这里的delimiters 可以有多种分割方式。
3.strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将会有一个设置保存他修改了的下一个位置的地址,如“wo ai ni”,其中若用空格作为分隔符就会将空格处换成*"\n"**,返回w的位置,并且函数内部保存a的位置。
4.strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置(即上面所说的位置w)开始,查找下一个标记。
5.如果字符串中不存在更多的标记,则返回 NULL 指针。
分析完后我们看一段代码,对一段字符串做一个切割
int main()
{
char a[] = "wo shi bo zhu";
char* retArr[10];
retArr[0] = strtok(a, " ");
int i = 1;
while (retArr[i++] = strtok(NULL, " "));
for (int i = 0; i < 10; i++)
{
printf("%s ", retArr[i]);
}
return 0;
}
二、strtok的实现
分析:进来的情况大致分为两种,str为空和不为空的情况,函数第一次调用的话因为我们要记录下一次进来时的位置,我们选择在函数内部创建一个static的静态变量,static char* p_last = NULL ,并且第一次我们设置为NULL,函数又分为两种情况,我们切割的话用tmp指针往后走,str指针保存当前位置,所以tmp指针走到\0时我们还要将p_last处理成NULL,其他的情况(str串还能被delimiters分隔)我们就在函数内部把*tmp = ‘\0',再将p_last处理为下一次进来的位置即可。
例子:
int main()
{
char a[] = "wo ai ni";
char* retArr[10];
retArr[0] = my_strtok(a, " ");
int i = 1;
while (retArr[i++] = my_strtok(NULL, " "));
for (int i = 0; i < 10; i++)
{
printf("%s ", retArr[i]);
}
return 0;
}
第一次分割
第二次分割
第三次分割
第四次切割
实现代码如下,有需要自取:
char* my_strtok(char* str, char* delimiters)
{
//str传NULL的时候如果上次有记录,则用上一次的下一个位置,不然就为NULL
static char* p_last = NULL;
if (str == NULL && p_last == NULL)
return NULL;
if (str == NULL)
{
//用来返回的当前位置
str = p_last;
char* tmp = p_last;
int len = strlen(delimiters);
while (*tmp)
{
for (int i = 0; i < len; ++i)
{
if (*tmp == delimiters[i])
{
p_last = tmp+1;
*tmp = '\0';
return str;
}
}
//走到这里表示当前的tmp没有在delimiters中能找到的
tmp++;
}
//走到这里就是自己走到斜杠\0的位置,就要将p_last 设置成为NULL
char* ret = p_last;
p_last = NULL;
return ret;
}
else
{
char* tmp = str;
int len = strlen(delimiters);
while (*tmp)
{
for (int i = 0; i < len; ++i)
{
if (*tmp == delimiters[i])
{
p_last = tmp+1;
*tmp = '\0';
return str;
}
}
//走到这里表示当前的tmp没有在delimiters中能找到的
tmp++;
}
//找到了,找不到
char* ret = p_last;
p_last = NULL;
return ret;
}
}
来源:https://blog.csdn.net/weixin_52344401/article/details/120220585