1
leonme 2023-07-20 20:19:45 +08:00 via iPhone
spark 也不好直接和 MySQL 交互,事务可以通过 RPC 内的方法自行控制
|
3
lbbff 2023-07-21 18:31:10 +08:00 via Android
可以,但是没必要。spark 你可以拿来当做分布式的基座,但是并不提供事务类的算子,还是得自己写
|
4
dtgxx OP @lbbff #3 因为数据量特别大,用之前的方法估计要部署 30 几台机器,每个机器部署很多进程去并发处理,这样维护起来感觉比较吃力,所以想用 spark 来解决; 您的意思是用 spark 来写代码,这样就天然可以用 spark yarn 来管理资源,并且分布式执行了, 然后实际的逻辑代码在 spark 的代码厘米自己实现就可以? 我其实就是这么想的,只是不知道业内有没有这么搞的,不知道会出啥问题。😂
|