首页 优德88下载正文

w88优德体育_w88优德注册_w88优德娱乐平台亚洲

admin 优德88下载 2019-05-16 208 0

在本文中,咱们将从零开端,教您怎么构建第一个Apache Flink (以下简称Flink)应用程序。

开发环境预备

Flink 能够运转在 Linux, Max OS X, 或者是 Windows 上。为了开发 Flink 应用程序,在本地机器上需求有 Java 8.x 和 maven 环境。

假如有 Java 8 环境,运转下面的指令会输出如下版别信息:

$ java -version
java version "1.8.0_65"
Java(TM) SE Runtime Environment (build 1.8.0_65-b17)
Java HotSpot(TM) 64-Bit Server VM (build 25.65-b01, mixed mode)

假如有 maven 环境,运转下面的指令会输出如下版别信息:

$ mvn -version
Apache Maven 3.5.4 (1edded0938998edf8bf061f1ceb3cfdeccf443fe; 2018-06-18T02:33:14+08:00)
Maven home: /Users/wuchong/dev/maven
Java version: 1.8.0_65, vendor: Oracle Corporation, runtime: /Library/Java/JavaVirtualMachines/jdk1.8.0_65.jdk/Contents/Home/jre
Default locale: zh_CN, platform encoding: UTF-8
OS name: "mac os x", version: "10.13.6", arch: "x86_64", family: "mac"

别的咱们引荐运用 ItelliJ IDEA (社区免费版已够用)作为 Flink 应用程序的开发 IDE。Eclipse 尽管也能够,可是 Eclipse 在 Scala 和 Java 混合型项目下会有些已知问题,所以不太引荐 Eclipse。下一章节,咱们会介绍怎么创立一个 Flink 工程并将其导入 ItelliJ IDEA。

创立 Maven 项目

咱们将运用 Flink Maven Archetype 来创立咱们的项目结构和一些初始的默许依靠。在你的作业目录下,运转如下指令来创立项目:

mvn archetype:generate \
-DarchetypeGroupId=org.apache.flink \
-DarchetypeArtifactId=flink-quickstart-java \
-DarchetypeVersion=1.6.1 \
-DgroupId=my-flink-project \
-DartifactId=my-flink-project \
-Dversion=0.1 \
-Dpackage=myflink \
-DinteractiveMode=false

你能够修改上面的 groupId, artifactId, package 成你喜爱的途径。运用上面的参数,Maven 将主动为你创立如下所示的项目结构:

$ tree my-flink-project
my-flink-project
├── pom.xml
└── src
└── main
├── java
│ └── myflink
│ ├── BatchJob.java
│ └── StreamingJob.java
└── resources
└── log4j.properties

咱们的 pom.xml 文件现已包含了所需的 Flink 依靠,并且在 src/main/java 下有几个示例程序结构。接下来咱们将开端编写第一个 Flink 程序。

编写 Flink 程序

发动 IntelliJ IDEA,挑选 "Import Project"(导入项目),挑选 my-flink-project 根目录下的 pom.xml。依据引导,完结项目导入。

在 src/main/java/myflink 下创立 SocketWindowWordCount.java 文件:

package myflink;
public class SocketWindowWordCount {
public static void main(String[] args) throws Exception {
}
}

现在这程序还很根底,咱们会一步步往里面填代码。留意下文中咱们不会将 import 句子也写出来,由于 IDE 会主动将他们增加上去。在本节结尾,我会将完好的代码展现出来,假如你想越过下面的过程,能够直接将最终的完好代码粘到修改器中。

Flink 程序的第一步是创立一个 StreamExecutionEnvironment 。这是一个进口类,能够用来设置参数和创立数据源以及提交使命。所以让咱们把它增加到 main 函数中:

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

下一步咱们将创立一个从本地端口号 9000 的 socket 中读取数据的数据源:

DataStream text = env.socketTextStream("localhost", 9000, "\n");

这创立了一个字符串类型的 DataStream。DataStream 是 Flink 中做流处理的中心 API,上面界说了十分多常见的操作(如,过滤、转化、聚合、窗口、相关等)。在本示例中,咱们感兴趣的是每个单词在特定时刻窗口中呈现的次数,比如说5秒窗口。为此,咱们首要要将字符串数据解析成单词和次数(运用Tuple2表明),第一个字段是单词,第二个字段是次数,次数初始值都设置成了1。咱们完成了一个 flatmap 来做解析的作业,由于一行数据中可能有多个单词。

DataStream> wordCounts = text
.flatMap(new FlatMapFunction>() {
@Override
public void flatMap(String value, Collector> out) {
for (String word : value.split("\\s")) {
out.collect(Tuple2.of(word, 1));
}
}
});

接着咱们将数据流依照单词字段(即0号索引字段)做分组,这儿能够简略地运用 keyBy(int index) 办法,得到一个以单词为 key 的Tuple2数据流。然后咱们能够在流上指定想要的窗口,并依据窗口中的数据核算成果。在咱们的比如中,咱们想要每5秒聚合一次单词数,每个窗口都是从零开端核算的:。

DataStream> windowCounts = wordCounts
.keyBy(0)
.timeWindow(Time.seconds(5))
.sum(1);

第二个调用的 .timeWindow() 指定咱们想要5秒的翻滚窗口(Tumble)。第三个调用为每个key每个窗口指定了sum聚合函数,在咱们的比如中是依照次数字段(即1号索引字段)相加。得到的成果数据流,将每5秒输出一次这5秒内每个单词呈现的次数。

最终一件事便是将数据流打印到控制台,并开端履行:

windowCounts.print().setParallelism(1);
env.execute("Socket Window WordCount");

最终的 env.execute 调用是发动实践Flink作业所必需的。一切算子操作(例如创立源、聚合、打印)仅仅构建了内部算子操作的图形。只要在execute()被调用时才会在提交到集群上或本地核算机上履行。

下面是完好的代码,部分代码经过简化(代码在 GitHub 上也能访问到):

package myflink;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.util.Collector;
public class SocketWindowWordCount {
public static void main(String[] args) throws Exception {
// 创立 execution environment
final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
// 经过衔接 socket 获取输入数据,这儿衔接到本地9000端口,假如9000端口已被占用,请换一个端口
DataStream text = env.socketTextStream("localhost", 9000, "\n");
// 解析数据,按 word 分组,开窗,聚合
DataStream> windowCounts = text
.flatMap(new FlatMapFunction>() {
@Override
public void flatMap(String value, Collector> out) {
for (String word : value.split("\\s")) {
out.collect(Tuple2.of(word, 1));
}
}
})
.keyBy(0)
.timeWindow(Time.seconds(5))
.sum(1);
// 将成果打印到控制台,留意这儿运用的是单线程打印,而非多线程
windowCounts.print().setParallelism(1);
env.execute("Socket Window WordCount");
}
}

运转程序

要运转示例程序,首要咱们在终端发动 netcat 取得输入流:

nc -lk 9000

假如是 Windows 渠道,能够经过 https://nmap.org/ncat/ 装置 ncat 然后运转:

ncat -lk 9000

然后直接运转SocketWindowWordCount的 main 办法。

只需求在 netcat 控制台输入单词,就能在 SocketWindowWordCount 的输出控制台看到每个单词的词频核算。假如想看到大于1的计数,请在5秒内重复键入相同的单词。

作者:伍翀

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

w88体育_w88手机版登录_w88优德中文手机版

  • 优德88手机中文版_w88手机版登录_w88优德中文网

    优德88手机中文版_w88手机版登录_w88优德中文网

  • 十大将军,别被脊柱侧弯毁了气质!三个小动作助你纠正-优德88下载

    十大将军,别被脊柱侧弯毁了气质!三个小动作助你纠正-优德88下载

  • 强生,女星卡米拉·门德斯现身纽约街头,她有着炽热的魅力-优德88下载

    强生,女星卡米拉·门德斯现身纽约街头,她有着炽热的魅力-优德88下载

  • w优德88亚洲_w88优徳官方网站_w88Win优德

    w优德88亚洲_w88优徳官方网站_w88Win优德

  • 派瑞松,「今日前史」10月22日,前史上的今日发生了什么?-优德88下载

    派瑞松,「今日前史」10月22日,前史上的今日发生了什么?-优德88下载

  • 优德888官网手机版_优德88手机网址_优德888官网

    优德888官网手机版_优德88手机网址_优德888官网

  • 优德88官方网站手机版_优德88注册_优德88金銮俱乐部

    优德88官方网站手机版_优德88注册_优德88金銮俱乐部

  • 最近发表

      优德88下载_w88优德下载网址_w88官网

      http://www.pagerankcounter.com/

      |

      Powered By

      使用手机软件扫描微信二维码

      关注我们可获取更多热点资讯

      w88出品