Java的split方法使用详解

相信大家都经常使用String 的split方法,但是大家有没有遇到下面的这种情况:

大家想想下面的代码执行结果是什么

public static void main(String[] args) {
    // TODO Auto-generated method stub

    String str1 = "a,b,c,,,a";
    String str2 = "a,b,c,,,";
    String str3 = "a,b,c, , ,";
    String[] s1 = str1.split(",");
    String[] s2 = str2.split(",");
    String[] s3 = str3.split(",");
     System.out.println("str1长度:"+s1.length);
    System.out.println("str2长度:"+s2.length);
    System.out.println("str3长度:"+s3.length);
}

执行结果:

为什么会出现这样的结果呢,查找API发现了解决方法

解决方法:  

    通过查看API我们发现我们常用的split方法默认传递的是0,现在解决str2输出空的解决方法是传递的第二个参数为负数,即可

  public static void main(String[] args) {
    // TODO Auto-generated method stub

    String str1 = "a,b,c,,,a";
    String str2 = "a,b,c,,,";
    String str3 = "a,b,c, , ,";
    String[] s1 = str1.split(",");
    String[] s2 = str2.split(",",-1);
    String[] s3 = str3.split(",",-1);
    
    System.out.println("str1长度:"+s1.length);
    System.out.println("str2长度:"+s2.length);
    System.out.println("str3长度:"+s3.length);
  }

经查找API发现在String类中,存在两个split重载方法

1.public String[] split(String regex)

根据给定正则表达式的匹配拆分此字符串。

该方法的作用就像是使用给定的表达式和限制参数 0 来调用两参数 split 方法。因此,所得数组中不包括结尾空字符串。

例如,字符串 "boo:and:foo" 使用这些表达式可生成以下结果:

Regex 结果

: { "boo", "and", "foo" }
o { "b", "", ":and:f" }

参数:
    regex - 定界正则表达式
返回:
字符串数组,它是根据给定正则表达式的匹配拆分此字符串确定的
抛出:
PatternSyntaxException - 如果正则表达式的语法无效

2.public String[] split(String regex,int limit)

根据匹配给定的正则表达式来拆分此字符串。

此方法返回的数组包含此字符串的子字符串,每个子字符串都由另一个匹配给定表达式的子字符串终止,或者由此字符串末尾终止。数组中的子字符串按它们在此字符串中出现的顺序排列。如果表达式不匹配输入的任何部分,那么所得数组只具有一个元素,即此字符串。

limit 参数控制模式应用的次数,因此影响所得数组的长度。如果该限制 n 大于 0,则模式将被最多应用 n - 1 次,数组的长度将不会大于 n,而且数组的最后一项将包含所有超出最后匹配的定界符的输入。如果 n 为非正,那么模式将被应用尽可能多的次数,而且数组可以是任何长度。如果 n 为 0,那么模式将被应用尽可能多的次数,数组可以是任何长度,并且结尾空字符串将被丢弃。

例如,字符串 "boo:and:foo" 使用这些参数可生成以下结果:

Regex Limit 结果

: 2 { "boo", "and:foo" }
: 5 { "boo", "and", "foo" }
: -2 { "boo", "and", "foo" }
o 5 { "b", "", ":and:f", "", "" }
o -2 { "b", "", ":and:f", "", "" }
o 0 { "b", "", ":and:f" } 

 
调用此方法的 str.split(regex, n) 形式与以下表达式产生的结果完全相同:

    Pattern.compile(regex).split(str, n)

参数:

regex - 定界正则表达式
limit - 结果阈值,如上所述

返回:
字符串数组,它是根据给定正则表达式的匹配拆分此字符串确定的

抛出:
PatternSyntaxException - 如果正则表达式的语法无效