IDEA新建一个spark项目_编程开发

IDEA新建一个spark项目

创始人

2024-03-20 22:24:22

0次

第一步：新建一个maven工程
在这里插入图片描述

第二部：命名工程名
在这里插入图片描述

第三步：新建一个文件夹，并设置为sources root
在这里插入图片描述
第四步：pom编写


4.0.0com.cn.sparkspark-day011.0-SNAPSHOT88org.apache.hadoophadoop-client2.7.1org.apache.maven.pluginsmaven-compiler-plugin3.6.11.81.8UTF-8

第五步：新建一个Scala类
在这里插入图片描述
注意：此步可能找不到Scala，需要引入
具体步骤为
1.项目构建

2.点击+

3.添加Scala，如果有Scala环境，会默认识别版本

最后会引入Scala，如下

第六步：引入spark相关jar包
在这里插入图片描述

选择自己的spark安装包，里边有jar包目录
在这里插入图片描述
第七步：新建一个Scala

第八步：编写代码验证

package com.cn.wordcountimport org.apache.spark.{SparkConf, SparkContext}object Driver {def main(args: Array[String]): Unit = {val conf = new SparkConf().setMaster("local").setAppName("wordCount")val sc = new SparkContext(conf)val data = sc.textFile("hdfs://hadoop01:9000/data", 2)val result=data.flatMap{line=>line.split(" ")}.map{word=>(word,1)}.reduceByKey((x,y)=>x+y)
//    result.foreach(line=>println(line))result.saveAsTextFile("hdfs://hadoop01:9000/result03")}}

第九步：运行结果（打印到控制台，并且将数据存储到Hadoop中hdfs中）
在这里插入图片描述

词库加载错误:未能找到文件“E:\highferrum_mysql\Configuration\Dict_Stopwords.txt”。

上一篇：Js逆向教程20-Hook基础

下一篇：GitHub上热门的Java开源项目

IDEA新建一个spark项目

相关内容

热门资讯