主要有两个思路,一个是旧的,spark 1.3 之前,自己动手丰衣足食,后来有了 spark sql,使用它的 dataframe,也是可以的
=================================
旧的有:
这种 jdbc rdd 的,貌似是 scala 专属,Spark SQL: JdbcRDD
==================================
新的有:
这一个也是用 dataframe,但是也是 scala 的,Spark: Connecting to a jdbc data-source using dataframes
Loading database data into Spark using Data Sources API
Spark SQL MySQL Example With JDBC,这一个还带视频
长文:Using Apache Spark and MySQL for Data Analysis
How to work with MySQL DB and Apache spark,各种语言的样例
==============================
买一送一,hbase 的:
Pingback: spark 操作 hbase | ZRJ