Java切割字符串的踩坑实战记录
作者:小的~~ 时间:2023-02-05 14:13:25
坑出现的环境
一般情况下切割字符串会使用split或者StringTokenizer,如下代码
String s = ",,o,,";
String[] split = s.split(",");
期望得到数组["","","o","",""],但是实际上会得到["","","o"],后面两个直接被忽略了,如IDEA运行
StringTokenizer默认情况下
String s = ",,o,,";
StringTokenizer token = new StringTokenizer(s,",");
String[] arr = new String[token.countTokens()];
int i = 0;
while (token.hasMoreElements()){
arr[i++] = token.nextToken();
}
在IDEA中得到的运行结果
当StringTokenizer第三个参数改为true时
StringTokenizer token = new StringTokenizer(s,",",true);
貌似得到了想要的结果,但是当要切割的字符串改为下面这样时
String s = ",k,o,,";
StringTokenizer token = new StringTokenizer(s,",",true);
String[] arr = new String[token.countTokens()];
int i = 0;
while (token.hasMoreElements()){
arr[i++] = token.nextToken();
}
得到的结果是
数组的数量与预期也不符。
实际上java的split内部会按照预期的样子把字符串切割好,但是第二个参数不传的情况下默认是0,这就是会导致后面空字符串的值被丢弃
在String的split方法中可以看到
从注释说明中可以看到,通过改变第二个参数可以得到预期的结果
StringTokenizer内部也会判断切割后的值长度是否大于0,大于的情况下才会存储起来
问题的解决
通过设置split的第二个参数为-1
String s = ",k,o,,";
String[] split = s.split(",",-1);
补充:java分割字符串常见语法
一.java.lang.String.split()
在java 默认的分隔符是空格("")、制表符(\t)、换行符(\n)、回车符(\r)
示例:
for(String revaal:s.split(" ")){//用空格分隔
System.out.println(count+"ci"+revaal);
}
或者
String sourceStr = "1,2,3,4,5";
String[] sourceStrArray = sourceStr.split(",");
for (int i = 0; i < sourceStrArray.length; i++) {
System.out.println(sourceStrArray[i]);
}
如果需要指定分割后的数量的话,可以在split方法中再传入指定数量即可。
String[] sourceStrArray = sourceStr.split(",",4);
split 的实现直接调用的 matcher 类的 split 的方法。在使用String.split方法分隔字符串时,分隔符如果用到一些特殊字符,可能会得不到我们预期的结果。在正则表达式中有特殊的含义的字符,我们使用的时候必须进行转义,
1.字符"|","*","+“都得加上转义字符,前面加上”\"。
2.而如果是"",那么就得写成"\\"。
3.如果一个字符串中有多个分隔符,可以用"|"作为连字符。
二.java.util.StringTokenizer()
StringTokenizer 构造方法:
StringTokenizer(String str) :构造一个用来解析 str 的 StringTokenizer 对象。java 默认的分隔符是空格("")、制表符(\t)、换行符(\n)、回车符(\r)。
StringTokenizer(String str, String delim) :构造一个用来解析 str 的 StringTokenizer 对象,并提供一个指定的分隔符。
StringTokenizer(String str, String delim, boolean returnDelims) :构造一个用来解析 str 的 StringTokenizer 对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。
示例:
public static void main(String[] args)
{
String str = "runoob,google,taobao,facebook,zhihu";
// 以 , 号为分隔符来分隔字符串
StringTokenizer st=new StringTokenizer(str,",");
while(st.hasMoreTokens()) {
System.out.println(st.nextToken());
}
}
StringTokenizer 常用方法:
int countTokens():返回nextToken方法被调用的次数。
boolean hasMoreTokens():返回是否还有分隔符。
boolean hasMoreElements():判断枚举 (Enumeration) 对象中是否还有数据。
String nextToken():返回从当前位置到下一个分隔符的字符串。
Object nextElement():返回枚举 (Enumeration) 对象的下一个元素。
String nextToken(String delim):与 4 类似,以指定的分隔符返回结果。
来源:https://blog.csdn.net/k7gxn56/article/details/127751164