SparkSQL在MySQL数据库写入数据的具体方法是什么
Admin 2022-06-10 群英技术资讯 745 次浏览
SparkSQL不仅能够查询MySQL数据库中的数据,还可以向表中插人新的数据,实现方式的具体代码如文件4-5所示。
文件4-5 SparkSqlToMysql.scala
import java.util.Properties import org.apachen.spark.rdd.RDD import org.apache.spark.sq1.{DataFrame, SparkSession} //创建样例类Person case class Person (id: Int, name:String,age: Int) object SparkSqlToMysql { def main(args:ArrayL String]): Unit ={ //1.创建sparkSession对象 val spark: SparkSession=sparksession.builder() .appNamne("SparksqIToMysql") .master("local[2]") . getOrCreate() //2.创建数据 val data=spark.sparkContext .patgoarrav("3,wangwu,22","4,zhaoliu,26")) //3.按MySQL列名切分数据 val arRRD:RRD[Arey[String]] =data.map(_.split(",")") //4.RDD关联Person样例类 val personRDD:RDD[Person]= arrRDD.map(x=>Person(x(0).toInt,x(1),x(2).toInt). //导人隐式转换 import spark.implicits_ //5.将RDD转换成DataFrame val personDF:DataFrame=personRDD.toDF() //6.设置JDBC配置参数 val prop =new Properties() prop.setProperty("user","root") prop.setProperty("password","123456") prop.setProperty("driver","com.mysql.jdbc.Driver") //7.写入数据 personDF.write.mode("append").jdbc( "jdbc:mysql://192.168.121.134:3306/spark","spark.person",prop) personDF.show() } }
在文件4-5中,第5行代码首先创建case class Person样例类;第9~ 12行代码用来创建SparkSession对象;第14~15行代码则通过spark.SparkContext.parallelize( )方法创建一个RDD,该RDD值表示两个person数据;第17~24行代码表示将数据按照逗号切分并匹配case class Person中的字段用于转换成DataFrame对象;第26~29行代码表示设置JDBC配置参数,访问MySQL数据库;第31行代码personDF. write. mode()方法表示设置写人数据方式,该参数append是一个枚举类型,枚举参数分别有append、overwriteerrorIfExistsignore4个值,分别表示为追加、覆盖、表如果存在即报错(该值为默认值)、忽略新保存的数据。
运行文件4-5中的代码,返回sQLyog工具查看当前数据表,数据表内容如图4-7所示。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要给大家介绍的是关于Python内置函数zip的使用。对于zip()函数,是用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个原则,再返回由这些元组组成的列表。那么具体Python内置函数zip如何使用呢?下面一起来看看。
这篇文章介绍了Python中的re正则表达式模块,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
这篇文章主要给大家介绍了关于python学习之panda数据分析核心支持库的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
这篇文章主要介绍了python中的metaclass详情,在python中的metaclass就是帮助developer实现元编程,更多详细内容需要的小伙伴可以参考一下
这篇文章主要介绍了Python matplotlib绘图建立画布及坐标系,建立画布 figsize,它用width和height来控制画布的宽和高,下面来一起俩姐更多内容吧
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008