Spring Boot与Spark、Cassandra系统集成开发示例

作者:汪云飞 时间:2021-06-03 13:40:51 

本文演示以Spark作为分析引擎,Cassandra作为数据存储,而使用Spring Boot来开发驱动程序的示例。

1.前置条件

  • 安装Spark(本文使用Spark-1.5.1,如安装目录为/opt/spark)

  • 安装Cassandra(3.0+)

创建keyspace


CREATE KEYSPACE hfcb WITH REPLICATION = { 'class' : 'SimpleStrategy', 'replication_factor' : 3 };

创建table


CREATE TABLE person (
id text PRIMARY KEY,
first_name text,
last_name text
);

插入测试数据


insert into person (id,first_name,last_name) values('1','wang','yunfei');
insert into person (id,first_name,last_name) values('2','peng','chao');
insert into person (id,first_name,last_name) values('3','li','jian');
insert into person (id,first_name,last_name) values('4','zhang','jie');
insert into person (id,first_name,last_name) values('5','liang','wei');

2.spark-cassandra-connector安装

让Spark-1.5.1能够使用Cassandra作为数据存储,需要加上下面jar包的依赖(示例将包放置于 /opt/spark/managed-lib/ 目录,可任意):


cassandra-clientutil-3.0.2.jar
cassandra-driver-core-3.1.4.jar
guava-16.0.1.jar
cassandra-thrift-3.0.2.jar
joda-convert-1.2.jar
joda-time-2.9.9.jar
libthrift-0.9.1.jar
spark-cassandra-connector_2.10-1.5.1.jar

在 /opt/spark/conf 目录下,新建 spark-env.sh 文件,输入下面内容


SPARK_CLASSPATH=/opt/spark/managed-lib/*

3.Spring Boot应用开发

添加 spark-cassandra-connector 和 spark 依赖


<dependency>
  <groupId>com.datastax.spark</groupId>
  <artifactId>spark-cassandra-connector_2.10</artifactId>
  <version>1.5.1</version>
 </dependency>
 <dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-core_2.10</artifactId>
  <version>1.5.1</version>
 </dependency>
 <dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-sql_2.10</artifactId>
  <version>1.5.1</version>
 </dependency>

在 application.yml 中配置 spark 与 cassandra 路径


spark.master: spark://master:7077
cassandra.host: 192.168.1.140
cassandra.keyspace: hfcb

此处特别说明 spark://master:7077 是域名形式而不是ip地址,可修改本地 hosts 文件将 master 与 ip 地址映射。

配置 SparkContext 和 CassandraSQLContext


@Configuration
public class SparkCassandraConfig {
@Value("${spark.master}")
String sparkMasterUrl;
@Value("${cassandra.host}")
String cassandraHost;
@Value("${cassandra.keyspace}")
String cassandraKeyspace;
@Bean
public JavaSparkContext javaSparkContext(){
 SparkConf conf = new SparkConf(true)
   .set("spark.cassandra.connection.host", cassandraHost)
//    .set("spark.cassandra.auth.username", "cassandra")
//    .set("spark.cassandra.auth.password", "cassandra")
   .set("spark.submit.deployMode", "client");
 JavaSparkContext context = new JavaSparkContext(sparkMasterUrl, "SparkDemo", conf);
 return context;
}
@Bean
public CassandraSQLContext sqlContext(){
 CassandraSQLContext cassandraSQLContext = new CassandraSQLContext(javaSparkContext().sc());
 cassandraSQLContext.setKeyspace(cassandraKeyspace);
 return cassandraSQLContext;
}
}

简单调用


@Repository
public class PersonRepository {
@Autowired
CassandraSQLContext cassandraSQLContext;
public Long countPerson(){
 DataFrame people = cassandraSQLContext.sql("select * from person order by id");
 return people.count();
}
}

启动即可如常规Spring Boot程序一样执行。

源码地址: https://github.com/wiselyman/spring-spark-cassandra.git

总结

以上所述是小编给大家介绍的Spring Boot与Spark、Cassandra系统集成开发示例网站的支持!

来源:http://www.wisely.top/2018/02/01/spring_boot-spark-cassandra-integration/

标签:sping,boot,集成开发
0
投稿

猜你喜欢

  • 详解Java目录操作与文件操作教程

    2023-12-05 13:45:48
  • java实现微信红包 拼手气红包

    2023-09-28 10:31:45
  • Java爬虫实现Jsoup利用dom方法遍历Document对象

    2023-06-15 07:52:36
  • java中对字符串每个字符统计的方法

    2023-09-23 13:53:16
  • Java深入了解数据结构之二叉搜索树增 插 删 创详解

    2023-02-14 08:08:00
  • Java执行SQL脚本文件到数据库详解

    2023-08-08 08:30:00
  • MyBatis配置的应用与对比jdbc的优势

    2023-08-27 07:03:47
  • java调用openoffice将office系列文档转换为PDF的示例方法

    2023-11-29 11:42:53
  • Spring spel表达式使用方法示例

    2023-08-25 00:43:32
  • 如何只返回实体类中的部分字段问题

    2022-11-28 05:09:53
  • Java实现的求解经典罗马数字和阿拉伯数字相互转换问题示例

    2023-10-15 23:17:36
  • 详解Spring Bean 之间的特殊关系

    2022-10-25 21:12:17
  • mybatis-plus 扩展批量新增的实现

    2023-07-14 14:24:13
  • 为什么Spring和IDEA都不推荐使用 @Autowired 注解

    2023-12-08 17:54:44
  • Java实现的校验银行卡功能示例

    2022-01-28 19:33:53
  • 一文解决springboot打包成jar文件无法正常运行的问题

    2021-11-03 14:54:28
  • Flutter瀑布流仿写原生的复用机制详解

    2023-06-20 17:02:08
  • Mybatis步骤分解实现一个增删改查程序

    2021-09-16 01:12:43
  • maven中profile的使用

    2022-03-31 10:43:53
  • Java面向对象基础知识之抽象类和接口

    2023-02-10 03:02:58
  • asp之家 软件编程 m.aspxhome.com