Java中List集合去重方法以及效率对比

作者:格姗知识圈 时间:2021-11-03 00:15:52 

List集合相信大家在开发过程中几乎都会用到。有时候难免会遇到集合里的数据是重复的,需要进行去除。然而,去重方式有好几种方式,你用的是哪种方式呢?去重方式效率是否是最高效、最优的呢?今天就给大家讲解一下List集合去重的常见及常用的四种方式。

01

实现思路:使用两个for循环遍历集合所有元素,然后进行判断是否有相同元素,如果有,则去除。这种方式是大部分最先想到的,也是最简单的实现方式。其中,这种方式可以保证List集合原来的顺序不变。

代码实现:


/**
* notes:使用两个for循环实现List去重
* @param list
* @return
*/
public static List repeatListWayOne(List<String> list){
for(int i = 0;i < list.size();i++){
 for(int j = i+1;j < list.size();j++){
  if(list.get(i).equals(list.get(j))){
   list.remove(j);
  }
 }
}
return list;
}

02

实现思路:我们知道HashSet实现了Set接口,不允许出现重复元素。可以基于这个想法,把List集合所有元素存入HashSet对象,接着把List集合元素全部清空,最后把HashSet对象元素全部添加至List集合中,这样就可以保证不出现重复元素。而HashSet有一个构造函数,在初始化时可以直接添加元素。其中,HashSet不能保证顺序不变,所以此方式不能保证List集合原来的顺序不变。

代码实现:


/**
* notes:使用HashSet实现List去重
* @param list
* @return
*/
public static List repeatListWayTwo(List<String> list){
//初始化HashSet对象,并把list对象元素赋值给HashSet对象
HashSet set = new HashSet(list);
//把List集合所有元素清空
list.clear();
//把HashSet对象添加至List集合
list.addAll(set);
return list;
}

03

实现思路:TreeSet集合也是实现Set接口,是一个有序的,并且无重复元素集合。同理,我们可以根据上面方式二的思想进行去重。其中,去重后的List集合可以保证和原来的顺序一致。

代码实现:


/**
* notes:使用TreeSet实现List去重
* @param list
* @return
*/
public static List repeatListWayThird(List<String> list){
//初始化TreeSet对象,并把list对象元素赋值给TreeSet对象
TreeSet set = new TreeSet(list);
//把List集合所有元素清空
list.clear();
//把TreeSet对象添加至List集合
list.addAll(set);
return list;
}

04

实现思路:利用List集合contains方法循环遍历,先创建新的List集合,接着循环遍历原来的List集合,判断新集合是否包含有旧集合,如果有,则不添加至新集合,否则添加。最后,把旧集合清空,把新集合元素赋值给旧集合。

代码实现:


/**
* notes:利用List集合contains方法循环遍历去重
* @param list
* @return
*/
public static List repeatListWayFourth(List<String> list){
 //新建新List集合,用于存放去重后的元素
 List<String> newList = new ArrayList<String>();
 //循环遍历旧集合元素
 for(int i = 0; i < list.size(); i++ ){
   //判断新集合是否包含有,如果不包含有,则存入新集合中
   boolean isContains = newList.contains(list.get(i));
   if(!isContains){
     newList.add(list.get(i));
   }
 }
 //把List集合所有元素清空
 list.clear();
 //把新集合元素添加至List集合
 list.addAll(newList);
 return list;
}

上面给大家介绍了四种List集合去重方式。那么,哪种方式效率是最好的呢?下面就演示一下进行对比。

为了演示方式,随机生成0-500之间的20000个整数字符串,并存入List集合,并在相应代码打印相关时间进行对比。其中,随机生成List集合代码如下:


/**
* 随机生成0-500之间的20000个整数字符串,并存入List集合
* @return
*/
public static List<String> getRandomList(){
 List<String> list = new ArrayList<String>();
 //随机生成20000个整数字符串
 for(int i = 1; i <= 20000; i++){
   //任意取[0,500)之间整数,其中0可以取到,500取不到
   int number = new Random().nextInt(500);
   String number_str = "geshan"+number;
   list.add(number_str);
 }
 return list;
}

为了保证List集合元素一致,创建四个List集合,分别对应List去重方式。效率对比代码如下:


public static void main(String[] args){
 //随机生成0-500之间的1000个整数字符串List集合
 List<String> list = getRandomList();

//为了演示四种方式效率,创建四个List集合,保证List集合元素一致
 //方式一List集合
 List<String> oneList = new ArrayList<>();
 oneList.addAll(list);
 //方式二List集合
 List<String> twoList = new ArrayList<>();
 twoList.addAll(list);
 //方式三List集合
 List<String> thirdList = new ArrayList<>();
 thirdList.addAll(list);
 //方式四List集合
 List<String> fourthList = new ArrayList<>();
 fourthList.addAll(list);

System.out.println("方式一:使用两个for循环实现List去重");
 System.out.println("原来集合大小:"+oneList.size()+",集合元素>>"+oneList);
 Date oneDateBegin = new Date();
 repeatListWayOne(oneList);
 System.out.println("集合去重大小:"+oneList.size()+",集合元素>>"+oneList);
 Date oneDateEnd = new Date();
 System.out.println("去重所需时间:"+(oneDateEnd.getTime()-oneDateBegin.getTime())+"毫秒");

System.out.println("方式二:使用HashSet实现List去重");
 System.out.println("原来集合大小:"+twoList.size()+",集合元素>>"+twoList);
 Date twoDateBegin = new Date();
 repeatListWayTwo(twoList);
 System.out.println("集合去重大小:"+twoList.size()+",集合元素>>"+twoList);
 Date twoDateEnd = new Date();
 System.out.println("去重所需时间:"+(twoDateEnd.getTime()-twoDateBegin.getTime())+"毫秒");

System.out.println("方式三:使用TreeSet实现List去重");
 System.out.println("原来集合大小:"+thirdList.size()+",集合元素>>"+thirdList);
 Date thirdDateBegin = new Date();
 repeatListWayThird(thirdList);
 System.out.println("集合去重大小:"+thirdList.size()+",集合元素>>"+thirdList);
 Date thirdDateEnd = new Date();
 System.out.println("去重所需时间:"+(thirdDateEnd.getTime()-thirdDateBegin.getTime())+"毫秒");

System.out.println("方式四:利用List集合contains方法循环遍历去重");
 System.out.println("原来集合大小:"+fourthList.size()+",集合元素>>"+fourthList);
 Date fourthDateBegin = new Date();
 repeatListWayFourth(fourthList);
 System.out.println("集合去重大小:"+fourthList.size()+",集合元素>>"+fourthList);
 Date fourthDateEnd = new Date();
 System.out.println("去重所需时间:"+(fourthDateEnd.getTime()-fourthDateBegin.getTime())+"毫秒");
}

多次运行结果如下:

第一次四种方式运行时间如下:223、10、16、30;

第二次四种方式运行时间如下:164、10、17、43;

第三次四种方式运行时间如下:164、9、16、37;

综合代码及运行时间对比,方式二是最好的去重方式,代码最简洁、耗时最短,但是顺序可能会被打乱,如果需要按原顺序,方式三比较好。你平时List集合去重,方式用对了吗?

来源:https://blog.csdn.net/HM0106/article/details/86438615

标签:list,集合,去重
0
投稿

猜你喜欢

  • 解决nacos升级spring cloud 2020.0无法使用bootstrap.yml的问题

    2021-12-02 19:44:29
  • java使用静态关键字实现单例模式

    2023-11-29 13:37:33
  • java开发之MD5加密算法的实现

    2022-05-13 23:44:35
  • Mybatis之typeAlias配置的3种方式小结

    2023-11-26 16:42:14
  • Flutter利用Hero组件实现自定义路径效果的动画

    2023-06-25 13:46:29
  • 详解Spring中的Environment外部化配置管理

    2023-11-23 05:24:24
  • JAVA字符串占位符使用方法实例

    2021-09-20 17:30:27
  • Spring Boot示例分析讲解自动化装配机制核心注解

    2022-07-26 15:56:14
  • springboot实现异步任务

    2023-04-23 01:25:21
  • 基于ReentrantLock的实现原理讲解

    2023-11-23 22:43:23
  • 基于Mybatis-Plus的CRUD的实现

    2023-09-10 14:38:45
  • Jenkins安装以及邮件配置详解

    2023-04-20 12:42:39
  • Mybatis-Plus sum聚合函数及按日期查询并求和的方式详解

    2022-07-09 12:58:07
  • springcloud中RabbitMQ死信队列与延迟交换机实现方法

    2023-05-04 04:25:54
  • 基于Spring depends-on的使用详解

    2021-09-29 16:23:20
  • 深入浅析Java 抽象类和接口

    2022-12-17 19:19:27
  • SpringMVC数据响应详细介绍

    2023-09-24 04:12:41
  • C#实现3步手动建DataGridView的方法

    2021-10-13 22:35:56
  • Idea里github的图形化操作配置方法

    2021-12-29 15:03:17
  • java实现分页显示效果

    2021-12-29 20:17:43
  • asp之家 软件编程 m.aspxhome.com