flink面试-基础篇海量资源.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

本文由简悦SimpRead转码,原文地址

到目前为止,关于Flink的学习我们就告一段落了,接下来进入最后一个面试模块的学当

前大背景下,面试这一关是求职者必须要面对的,也能从侧面对Flink的掌握情况,最后一模块将

结合部分实际面试中出现的问题,进行详细分析,帮助大家顺利拿到Offer。

最后一个面试模块分为了4个:

Flink面试基础篇,包含了Flink的整体介绍、概念、算子等点;

Flink面试进阶篇,包含了Flink中的数据传输、容错机制、序列化、数据热点、反压等实际生产

环境中遇到的问题等点;

Flink面试源码篇,包含了Flink的代码实现、Job提交流程、数据交换、分布式快照机制、

FlinkSQL的原理等点;

Flink面试方案设计篇,主要是生产环境中常见业务场景下的解决方案设计。

本将分析Flink面试基础相关的面试题,总结出了经常面试的12道题。

面试题1:请介绍一下Flink。

这道题是一道很简单的题,我们队Flink整体的掌握情况,我们应该从以下几个基本的概念入

手。

Flink是大数据领域的分布式实时和离线计算引擎,其程序的基础构建模块是流(Streams)和转换

(Transformations),每一个数据流起始于一个或多个

Source,并终止于一个或多个

Sink。数据流

类似于有向无环图(DAG)。

Flink提供了诸多高抽象层的API以便用户编写分布式任务:

DataSetAPI,对静态数据进行批处理操作,将静态数据抽象成分布式的数据集,用户可以方便地

使用Flink提供的符对分布式数据集进行处理,支持Java、Scala和Python;

DataStreamAPI,对数据流进行流处理操作,将流式的数据抽象成分布式的数据流,用户可以方

便地对分布式数据流进行,支持Java和Scala;

TableAPI,对结构化数据进行查询操作,将结构化数据抽象成关系表,并通过类SQL的DSL对关

系表进行各种查询操作,支持Java和Scala。

此外,Flink还针对特定的应用领域提供了领域库,例如,FlinkML,Flink的机器学习库提供了机器学

习PipelinesAPI并实现了多种机器学习算法;Gelly、Flink的图计算库提供了图计算的相关API及多种

图计算算法的实现。

面试题2:Flink的主要特性是什么?

这道题我们在使用Flink的过程中用到的哪些强大的特性。我们在开篇词和第01“Flink的应

用场景和架构模型”中提到过,Flink的主要特性包括:批流一体、Exactly-Once、强大的状态管理等。

同时,Flink还支持运行在包括Yarn、Mesos、Kubernetes在内的多种资源管理框架上。Flink可以扩

展到数千,其状态可以达到TB级别,且仍能保持高吞吐、低延迟的特性。

面试题3:Flink的适用场景有哪些?

这道题是一道很典型的我们掌握Flink的广度的问题,要求我们开发者不要局限在自己的一小块业

务中,能主动地去学习其他人是如何玩转Flink的。我们可以从以下几个方面回答:

Flink从诞生之初就因为其独特的流式计算特性迅速被各个公司采用到各行各业中,主要的应用场景包

括:

实时数据计算

实时数据仓库和ETL

驱动型场景,如告警、

此外,随着Flink对机器学习的支持越来越完善,还可以被用作机器学习和人工智能领域的引擎。

面试题4:Flink和SparkStreaming的异同点有哪些?

分析:这是一个非常宏观的面试题,因为两个框架的不同点非常之多。但是在面试时有非常重要的一点

一定要回答出来:Flink是标准的实时处理引擎,基于驱动;而SparkStreaming是微批(Micro-

Batch)的模型。

在“03|Flin

文档评论(0)

zhishifuwu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档