BD笔记

Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 31

Digital Transformation Pillars:

Big Data+Mobile+Cloud Computing+Social Media+AI+IoT


(The combined effects of Cloud Computing, Big Data & AI will deeply transform the
organization more than the other technologies such as Internet)

Turning data to business insight is challenging


• Many sources of Data : data often resides in disparate locations, making it difficult
to see a complete picture of the business(70% are noise)
• Data Cleaning & quality concerns
• Need to build the Data warehouse (75% of project time)
• Lack of expertise & experience

Oil has been one of the most valuable commodities and has ruled the world’s
industrial growth and economy until perhaps the 20th century.
• In the 21st century; oil has been replaced by data; the ubiquitous, and the most
valued asset of today, given the rapid rise of technology and the beginning of the
digital era.
• What oil is to the industrial economy, data is to the information economy!
Why does Big Data Analytic matter?

1. Digitalization
Big Data Strategy:
strategy&vision people&culture
governance&change technology&capabilities

2. Explosion&complexity of Data Management


Human- and machine-generated data is experiencing an overall 10x faster growth rate
than traditional business data, and machine data is increasing even more rapidly at
50x the growth rate.人和机器生成的数据的总体增长率是传统业务数据的 10 倍,
而机器数据的增长速度更是快 50 倍。
Data Complexity:
Network, Explosion, Integration, New Partners, Computational Infrastructure,
Security, Business Process Changes, architecture transformation
Data Quality:
Relevance, Existence, Accuracy, Validity, Completeness ,Consistency
相关性、 存在性、 准确性、 有效性、 完整性、 一致性
3. Needs of taking good Decisions

Transaction Processing:focus on managing all the data transactions of the company


交易处理:专注于管理公司所有的数据交易
Analytical Processing:focus on data analysis and decision support
分析处理:专注于数据分析和决策支持

It isn’t so much the volume of data that matters, it is more what is being done with
that data, what analysis is applied and how is it used to generate insights that can lead
to more informed decision making and better business outcomes.
重要的不是数据的数量,更重要的是如何处理这些数据,应用了什么分析,以
及如何使用它来产生见解,从而导致更明智的决策和更好的业务结果。

Managers’ challenge:
1.Business environment is becoming more and more complex and rapidly changing,
making decision is more difficult then ever 商业环境变得越来越复杂和瞬息万变,
决策比以往任何时候都更加困难
2.Managers must respond and adapt by making faster and better decision.
管理者必须通过做出更快更好的决策来做出响应和适应
3.Intuition may not be enough, hence computerized systems are required.
直觉可能还不够,因此需要计算机化系统。
What to do with data?
Data Management:foundation
Business Intelligence:basic reporting,performance management
Analytic:predictive,prescriptive

Business Intelligence
BI is an umbrella term that includes the applications, infrastructure and tools, and best
practices that enable access to and analysis of information to improve and optimize
decisions and performance 一个涵盖性术语,包括应用程序、基础架构和工具,以
及支持访问和分析信息以改进和优化决策和性能的最佳实践
BI helps to
understand past
BD goes into
the future

BI tools just
make lives of business much easier by simplifying the complexity and
giving the power of visualization to be able to predict future of the business and the
consequences of business decisions.

What is BI used for?


Analyzing customer behaviors, buying patterns and sales trends
分析客户行为、购买模式和销售趋势
Measuring, tracking and predicting sales and financial performance
衡量、跟踪和预测销售和财务业绩
Budgeting and financial planning and forecasting
预算编制和财务规划与预测
Tracking the performance of marketing campaigns
跟踪营销活动的绩效
Improving delivery and supply chain effectiveness
提高交付和供应链效率
Web and e-commerce analytics
网络和电子商务分析

Peter Luhn, IBM computer scientist→BI 之父


History of BI

How does BI work?


Data source→Extract,Transform,Load→Data warehouse→Reports(KPIs,dashboard)
Collection→Integration→Diffusion 扩散→Presentation
Data Warehouse
Storage for high-level structured data:ERP,CRM,Biling
Can have access to data without impacting daily operations
Data mart:subset of the data WH for easier access to data
Data modeling 数据建模是创建软件系统及其包含的数据元素的简化图表的过程,
使用文本和符号来表示数据及其流动方式。可被认为是一个流程图

Data Mining
Process to find correlations and patterns between different data.
查找不同数据之间的相关性和模式的过程。
Are based on complex and sophisticated algorithms that help to segment data and
evaluate probabilities 基于有助于分割数据和评估概率的复杂算法

OLAP : Online Analytical Processing


Front end of BI,providing powerful capabilities for data mining and trend analysis.
OLAP tools allow users to access, run queries against, and report on data stored in
their data warehouse.访问存储在其数据仓库中的数据、对其运行查询和报告数据。
Why BI matter?
1. Discover Information
2. Maximize Visibility
3. Uncover New Insights
4. Operate Seamlessly

How BI can help?


Justify BI ALL ABOUT PROFITABILITY
Increasing Revenue Reducing Costs
Improving Efficiencies Better Asset Management

BI Market

Market Share 2019


Pure-play BI vendors:analytic only(SaaS)---tableau,Micro
Diversified tech/full-stack BI:analytic+...---SAP,SAS,Oracle
Data and infrastructure:data warehousing(AAS)---AWS
Application vendors---Salesforce,Netsuite
Open-source BI:Free and help customize ---ZOHO,pentaho,BIRT,TIBC
Jaspersoft

Cloud BI performs any BI functions


• Data Visualization
• Data Mining
• Online Analytical Processing (OLAP)
• Querying
• Business Performance Management
• Statistical Analysis
• Forecasting
• Reporting

Challenge of BI
Building the connections:human part,no cognitive part
BI only helps with structured data
Big Data in Digital World

Definition:
Data set that are so large and complicated such that they cannot be stored,managed
and analyzed by typical software tools.

What makes big data big?


(unstructured)90% (structured)10% Social+Enterprise=Big Data
5V:
Volume:very large quantity/amount of data
Storage problem→IaaS

Velocity 速度(Frequency or speed of data generation and frequency of data delivery)


extremely fast streams of data
Both creation and movement

Variety(data source) wide range of data type and characteristic


Large variety of sources and formats, and multidimensional data fields
Cannot collect all

Veracity 真实性(uncertainty of data) importance of quality data and the level of trust
in various data sources

Value:Economic benefits from the available big data


Do I really need invest in big data? Is BI enough?

Other Vs:
Visualization is becoming important→lack of read time
Why BD important?
Big Data is set to transform the work of enterprises, by improving information,
efficiency and responsiveness to environmental change.
大数据旨在通过提高信息、效率和对环境变化的响应能力,来改变企业的工作。
The ability to analyse and draw knowledge from the vast amounts of data provides us
with insight, market intelligence, and predictions.
从大量数据中进行分析和获取知识的能力为我们提供了洞察力、市场情报和预测

Big Data Analytic


Descriptive:info on past/current trends 描述性:关于过去/当前趋势的信息
Predictive:predictions based on past data 预测性:基于过去的数据进行的预测
Prescriptive:suggest possible actions based on prediction
规定性:基于预测,建议可能的行动
Two Approaches to Information Management for Analytic:
Top-Down & Bottoms-Up

Data Warehousing Uses Top-Down Approach/ Data Lake Uses Bottoms-Up Approach
Data Lake + Data Warehouse Better Together

Data lake:for unstructured data,format of database where data keeps flowing


A storage repository, usually Hadoop, that holds a vast amount of raw data in its
native format until it is needed 一个存储库,通常是 Hadoop,以其本机格式保存大量
原始数据,直到需要为止
Ingest all data(regardless of requirements)
Store all data(in native format without schema definition)
Do analysis(Using analytic engines like Hadoop)

Hadoop
一个开源的分布式计算和存储框架,为庞大的计算机集群提供可靠的、可伸缩的应用层

计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,

并且支持在单台计算机到几千台计算机之间进行扩展。
Distributed, scalable system on commodity HW 商品硬件的分布式可扩展系统
Composed of a few parts:
 HDFS – Distributed file system MapReduce – Programming model
 Other tools: Hive, Pig, SQOOP, HCatalog, HBase, Flume, Mahout, YARN, Tez, Spark,
Stinger, Oozie, ZooKeeper, Flume, Storm
 Main players are Hortonworks, Cloudera, MapR
Input →ETL→Output
Not a data lake,but a transformation tool
Also can use Amazon Redshift,Google Bigquery,Snowflake

Key Business drivers for Big Data


1. Acquire,grow and retain customers
2. Optimize operations and reduce fraud
3. Maximize insights and improve economics
4. Transform business performance
5. Create new business models

How BD create value?


•Replacing/supporting human decision 取代/支持人类决策
•Enabling experimentation to improve performance 启用实验以提高性能
•Innovating new business models, products and services 创新商业模式、产品和服务
•Segmenting populations to customize actions 细分人群以定制行动
•Creating transparency 创造透明度

BD Issue
•Technology and techniques 技术
•Access to data 数据来源
•Organizational change and talent 组织与人才
•Industry structure 行业结构
•Data policies 政策

What are the conditions to success


•Establishing organizational culture and capabilities
•Having HR able to understand and master technical and human issues
•Good quality of big data

Relevant BD Skills
Tech skills, Statistical and Communication skills
Speak business and helping leaders reformulate their challenges in BD way
Data scientists(algorithm) Statistician(KPI)
Database Administrator(storage) Data Analyst(process data)

Obstacles of using data effectively

Poor organization and poor processes for sharing data.


Departmental Data Access Constraints : Part of this fragmentation can be attributed to
data being housed in different silos. The same business can have multiple databases to
store customer data.部门数据访问限制:这种碎片化的部分原因是数据存放在不同的孤
岛中。同一个业务可以有多个数据库来存储客户数据。

What Makes Big Data Projects Succeed ?


1. A clear business objective
2. Technology
3. Identify the right people
4. Goog change management
5. Project management institute
Machine Learning Big Data
Data Use Technology behind self- Variety of purposes, including
driving cars and advance financial research, collecting sales
recommendation engines. 自动 data etc
驾驶汽车和高级推荐引擎背后

的技术

Foundation of Learn from the existing data Pulls from existing information to
Learning and provide the foundation look for emerging patterns that can
required for a machine to help shape our decision-making
teach itself 从 现 有 数 据 中 学 processes 从现有信息中提取信息,以
习,并为机器自学提供所需的 寻找有助于塑造决策过程的新兴模式

基础。

Pattern Using the same algorithms Reveal some patterns through


Recognition that big data analytic uses to classifications and sequence analysis.
automatically learn from the 通过分类和序列分析揭示一些模式
collected data 使用与大数据分
析相同的算法自动从收集的数

据中学习

Data Volume Small datasets where over- Large-scale datasets where the
fitting is the problem problem is dealing with the large
存在过度拟合问题的小型数据 volume of data 处理大量数据的大规模
集 数据集

Purpose Learn from trained data and Store large volume of data and find
predicts or estimates future out pattern in data 存储大量数据并找
results. 从经过训练的数据中学 出数据中的规律
习并预测或估计未来的结果。

Data Warehouse Big Data


Meaning An architecture A technology
stands on volume,velocity and variety
of data
Preference Wise decision Compare lot of data
Reliable and believable Help take decision
Accepted Data One ore more sources come from Any kind of sources
Source Database Management System No matter DBMS or not

Accepted Type Structured data All formats


of Formats Relational data
要一次连接到单个数据源中的多个表,必须指定什么?
c. 联接
Tableau 可以创建特定于工作表的筛选器。
a. 对
盒须图中的框代表什么?
b. 中间一半数据点的范围

2、Tableau 常见面试题有哪些:各种 BI 工具和 Tableau 有什么区别?


传统 BI 工具与 Tableau 的根本区别在于效率和速度。

传统 BI 工具的架构存在硬件限制。虽然 Tableau 没有任何依赖关系


传统的 BI 工具处理复杂的技术,而 Tableau 使用简单的关联搜索使其动态化。
传统 BI 工具不支持多线程、内存或多核计算,而 Tableau 在集成复杂技术后支
持所有这些功能。
传统 BI 工具具有预定义的数据视图,而 Tableau 对业务运营进行预测分析。

3. Tableau 产品有哪些不同?
Tableau 与其他 BI 工具一样具有一系列产品:
Tableau Desktop:桌面产品用于从数据图片中创建优化查询。一旦查询准备就绪
你就可以执行这些查询而无需编码。Tableau Desktop 将来自各种来源的数据纳入
其数据引擎并创建交互式仪表板。
Tableau Server:当你使用 Tableau Desktop 发布仪表板时,Tableau Server 有助于
在整个组织中共享它们。它是安装在 Windows 或 Linux 服务器上的企业级功能。
Tableau Reader: Tableau Reader 是桌面上提供的一项免费功能,可让你打开和
查看数据可视化。你可以过滤或向下钻取数据,但限制编辑任何公式或对其执行
任何类型的操作。它还用于提取连接文件。
Tableau Online: Tableau Online 也是一项付费功能,但不需要独家安装。它随软
件一起提供,用于随时随地共享已发布的仪表板。
Tableau Public: Tableau public 是另一项免费功能,可通过将数据可视化保存为
Tableau Server 上的工作表或工作簿来查看数据可视化。
4. Tableau 中的参数是什么?
参数是一个变量(数字、字符串或日期),用于替换计算、过滤器或参考线中的
常量值。例如,你创建一个字段,如果销售额大于 30,000,则返回 true,否则返
回 false。参数用于替换这些数字(在本例中为 30000)以在计算期间动态设置它
参数允许你在计算中动态修改值。参数可以接受以下选项中的值:

全部:简单的文本字段
列表:可供选择的可能值列表
范围:从指定范围中选择值

5. 请告诉我一些有关度量和维度的信息?
在 Tableau 中,当我们连接到新数据源时,数据源中的每个字段都映射为度量
或维度。这些字段是数据源中定义的列。每个字段都分配有一个数据类型(整数
字符串等)和一个角色(离散维度或连续度量)。

度量包含由维度表分析的数值。度量存储在一个表中,该表允许存储多条记录并
包含唯一引用关联维度表的外键。

而维度包含定性值(名称、日期、地理数据)以定义综合属性以对数据详细信息
进行分类、细分和显示。

6. 什么是连续和离散字段类型?
Tableau 的专长在于以连续格式或离散格式以不同方式显示数据。它们都是用于
定义数据的数学术语,其中连续均值没有中断,离散均值是单独分开和不同的。

蓝色表示离散行为,而绿色表示连续行为。一方面,离散视图定义标题并且可以
轻松排序,而连续视图定义图形视图中的轴并且无法排序。

图像 - tableau.com
7. 什么是数据的聚合和分解?
数据聚合意味着以聚合形式显示度量和维度。Tableau 工具中可用的聚合函数有:

SUM(表达式):将表达式中使用的所有值相加。仅用于数值。
AVG(表达式):计算表达式中使用的所有值的平均值。仅用于数值。
Median(表达式):计算表达式中使用的所有记录的所有值的中值。仅用于数
值。
Count(表达式):返回表达式集中值的数量。排除空值。
Count (distinct):返回表达式集中唯一值的数量。
实际上,Tableau 允许你更改视图的聚合类型。

数据的分解意味着分别显示每个数据字段。

8. Tableau 中有哪些不同类型的联接?
Tableau 与 SQL 非常相似。因此,Tableau 中的联接类型是相似的:

左外连接:从左表中提取所有记录,从右表中提取匹配的行。
右外连接:从右表中提取所有记录,从左表中提取匹配的行。
全外连接:从左表和右表中提取记录。所有不匹配的行都带有 NULL 值。
内连接:从两个表中提取记录。
了解更多

9. 告诉我与数据集建立的不同联系?
Tableau 中有两种类型的数据连接:

LIVE:实时连接是一种通过直接连接到数据源来提取实时数据的动态方式 。
Tableau 直接针对数据库条目创建查询并在工作簿中检索查询结果。

EXTRACT:数据的快照,提取文件(.tde 或 .hyper 文件)包含来自关系数据库


的数据。数据是从静态数据源(如 Excel 电子表格)中提取的。你可以安排刷新
使用 Tableau 服务器完成的快照。这不需要与数据库的任何连接。

10. Tableau 常见面试题有哪些:Tableau 支持哪些文件扩展名?


Tableau Desktop 中使用的支持的文件扩展名是:

Tableau 工作簿 (TWB):包含所有工作表、故事点、仪表板等。


Tableau 数据源 (TDS):包含有关数据源的连接信息和元数据
Tableau 数据提取 (TDE):包含从其他数据源提取的数据。
Tableau 打包工作簿 (TWBX):包含工作簿、连接数据和元数据的组合,以及
TDE 形式的数据本身。它可以压缩和共享。
Tableau 打包数据源 (TDSX):包含不同文件的组合。
Tableau 书签 (TBM):指定特定工作表。
11. Tableau 支持哪些数据类型?
Tableau 支持以下数据类型:

数据类型 可能的值
布尔值 真假
日期 日期值(2016 年 12 月 28 日)
日期时间 日期和时间戳值(2016 年 12 月 28 日
下午 06:00:00)
地理值 地理测绘(北京、孟买)
文本/字符串 文本/字符串
数字 十进制 (8.00)
数字 整数 (5)
12. 什么是集?
集是作为 Tableau Desktop 中数据子集创建的自定义字段。集合可以根据条件计
算,也可以根据数据源的维度手动创建。
例如,获得收入超过某个价值的一组客户。现在,设置数据可以根据应用的条件
动态更新。了解更多

13. Tableau 中的组是什么?


创建组以使用维度可视化更大的成员资格。组可以创建自己的字段来对特定维度
中的值进行分类。

14.什么是架子?
Tableau 工作表包含各种命名元素,如列、行、标记、过滤器、页面等,称为架子。
你可以将字段放在架子上以创建可视化、增加详细程度或为其添加上下文。

15. 告诉我有关 Tableau 中数据混合的一些信息?


数据混合是在一个地方查看和分析来自多个来源的数据。主要和次要是涉及数据
混合的两种类型的数据源。

16. 在 Tableau 中你通常如何执行负载测试?


Tableau 中的负载测试旨在了解服务器在其环境、数据、工作负载和使用方面的容
量。最好在一年内至少进行 3-4 次负载测试,因为随着每个新用户、升级或内容
创作,使用情况、数据和工作负载都会发生变化。

Tabjolt 由 Tableau 创建,专门针对 Tableau 服务器进行即点即运行负载和性能测


试。标签:

自动化用户指定的负载过程
消除对脚本开发或脚本维护的依赖
通过向集群添加更多节点,随着负载的增加线性扩展
17. 为什么有人不使用 Tableau?
使用 Tableau 的限制是:

不划算:当我们将 Tableau 与其他可用的数据可视化工具进行比较时,它的成


本效益并不高。除此之外,它还具有软件升级、正确部署、维护以及培训人员使
用该工具的功能。
不太安全:当涉及到数据时,每个人都格外谨慎。Tableau 专注于安全问题,但
未能提供集中的数据级安全性。它推动行级安全并为每个用户创建一个帐户,这
使其更容易出现安全故障。
BI 功能还不够: Tableau 缺乏基本的 BI 功能,例如大规模报告、构建数据表或
创建静态布局。它具有有限的结果共享功能,电子邮件通知配置仅限于管理员,
并且供应商不支持基于触发器的通知。
中级 Tableau 常见面试题和答案合集
18、什么是 Tableau 数据引擎?
一个分析数据库,用于计算即时查询响应、服务器的预测分析和集成数据。当你
需要创建、刷新或查询数据提取时,数据引擎非常有用。它也可用于跨数据库连
接。

19. Tableau 中有哪些不同类型的过滤器?


Tableau 有 6 种不同类型的过滤器:

提取过滤器:此过滤器从数据源中检索数据子集。
维度过滤器:此过滤器用于非聚合数据(离散)。
数据源过滤器:此过滤器阻止用户查看敏感信息,从而减少数据馈送。
上下文过滤器:此过滤器通过在 Tableau 中应用预设来创建数据集。
测量过滤器:此过滤器应用各种操作,如总和、中值、平均值等。
表计算过滤器:在创建视图后应用此过滤器。
20.什么是双轴?
双轴用于分析同一图形中两个不同尺度的两个不同度量。这使你可以将一个图形
上的多个属性与两个独立的轴一个一层在另一个之上进行比较。

要将度量添加为双轴,请将该字段拖到视图的右侧,并在你看到出现黑色虚线
时将其放下。你还可以右键单击(在 Mac 上按住 Control 单击)“列”或“行”功能
区上的度量,然后选择“双轴”。

21.树和热图有什么区别?
这两张地图都有助于分析数据。热图可视化和比较不同类别的数据,而树状图以
矩形显示数据的层次结构。热图通过以不同颜色描绘维度来可视化度量。类似于
用不同颜色定义值的文本表。

树形图将嵌套矩形中的数据层次结构可视化。从较大的矩形到较小的矩形显示层
次结构级别。

示例 - 下面的树状图显示了一系列产品类别的总销售额:

22. Tableau Server 中的数据提取和计划是什么?


数据提取是从数据源创建的数据子集。计划是在发布工作簿后对数据提取进行的
计划刷新。这使数据保持最新。时间表由服务器管理员严格管理。

23. Tableau 常见面试题有哪些:仪表盘中有哪些组件?


仪表板中显示的组件是:

水平:水平视图允许用户从左到右组合工作表和仪表板元素并编辑元素的高度。
垂直:垂直视图允许用户从上到下组合工作表和仪表板元素并编辑元素的宽度。
文本:所有文本字段。
图像提取:为了提取图像,Tableau 会应用一些代码,提取图像,然后以 XML
格式将其保存在工作簿中。
Web URL:指向网页、文件或 Tableau 之外的其他 Web 资源的超链接
24. 什么是 TDE 文件?
TDE 是带有扩展名 .tde 的 Tableau Desktop 扩展。TDE 文件指向包含来自外部源
(如 MS Excel、MS Access 或 CSV 文件)的数据的文件。TDE 使分析和发现数
据变得更加容易。

25. Tableau 中的故事是什么?


在 Tableau 中创建故事是有效的,它是通过组合各种图表来描绘观众的情节而
创建的。故事是包含用于创建这些工作表的所有方法的工作表。创建故事:

单击仪表板上的新故事。
从左下角选择合适的故事尺寸或选择自定义尺寸。
通过双击工作表开始构建故事并将其添加到故事点。
通过单击添加标题为故事添加标题。
你可以通过单击工具栏中的更新来更新突出显示。你还可以添加布局选项、设置
故事格式或使故事适合你的仪表板。
26. Tableau 文件有哪些不同?
工作簿:工作簿包含一个或多个工作表和仪表板元素。
书签:包含一个更易于共享的工作表。
打包工作簿:包含工作簿以及支持的本地文件数据和背景图像。
数据提取文件:提取包含数据子集的文件。
数据连接文件:带有各种连接信息的小型 XML 文件。
高级 Tableau 常见面试题和答案合集
27. 如何将视图嵌入到网页中?
你可以轻松地将来自 Tableau Server 或 Tableau Online 的交互式视图集成到网页、
博客、Web 应用程序或 Internet 门户中。但是要查看视图,权限要求查看者在
Tableau Server 上创建一个帐户。要嵌入视图,请单击视图顶部的共享按钮并复
制嵌入代码以将其粘贴到网页上。

你还可以自定义嵌入代码或 Tableau Javascript API 以嵌入视图。

28. 最大数量是多少?Tableau 一次可以使用多少行?


最大行数或列数是不确定的,因为即使 Tableau 包含数 PB 的数据,它也会智能
地仅使用你需要提取的那些行和列。

29、提一下 Tableau 中发布的数据源和嵌入的数据源有什么区别?


连接信息是你想要引入 Tableau 的数据的详细信息。在发布之前,你可以创建相
同的摘录。

已发布数据源:它包含独立于任何工作簿的连接信息。

嵌入式数据源:它包含连接到工作簿的连接信息
30. 什么是 DRIVE 计划方法论?
DRIVE 计划方法围绕源自企业部署的数据分析创建了一个结构。驱动方法本质
上是迭代的,包括更快、更有效的敏捷方法。

31.如何在计算字段中使用组?
将“GroupBy”子句添加到 SQL 查询或在数据窗口中创建计算字段以对字段进行
分组。

在计算中使用组。你不能在计算中引用临时组。
使用在辅助数据源中创建的组混合数据:如果组是在辅助数据源中创建的,则
只有计算组可以用于数据混合。
使用另一个工作簿中的组。你可以通过复制和粘贴计算轻松地在另一个工作簿中
复制组。
32. 解释在 Tableau 中你何时会使用连接与混合?
虽然这两个术语听起来很相似,但它们在 Tableau 中的含义和用法有所不同:

而 Join 用于合并同一数据源中的两个或多个表。

Blending 用于合并来自多个数据源的数据,例如 Oracle、Excel、SQL server 等。

33. 什么是假设参照完整性?
在某些情况下,你可以通过从“数据”菜单中选择“假设参照完整性”选项来提高
查询性能。当你使用此选项时,只有当视图中的字段明确引用联接表时 ,
Tableau 才会将联接表包括在查询中。

34. 什么是计算字段,你将如何创建?
计算字段是使用基于其他字段的公式创建的。这些字段不存在,而是由你创建的

你可以创建这些字段以:
细分数据
转换字段的数据类型,例如将字符串转换为日期。
汇总数据
过滤结果
计算比率
你可以创建三种主要类型的计算:

基本计算:在源级别转换数据字段的值
详细级别 (LOD) 表达式:像基本计算一样在源级别转换数据字段的值,但具有
更精细的访问权限
表计算:仅在可视化级别转换数据字段的值
创建计算字段:

在 Tableau 中,导航到“分析”>“创建计算字段”。在计算编辑器中输入详细信息。
并做了!

35. 如何在同一视图中显示前五名和后五名销售额?
借助这些功能,你可以查看前五名和后五名的销售额:

将“客户名称”拖到行,将销售额拖到列。
按降序对 Sum(sales) 进行排序。
创建一个计算字段“销售排名”。
36、Tableau 常见面试题有哪些:Tableau 中的 Rank 函数是什么?
rank 函数用于为数据集中的任何度量提供位置(rank)。Tableau 可以通过以下
方式对度量进行排名:

Rank:Tableau 中的 rank 函数接受两个参数:聚合度量和排名顺序(可选),


默认值为 desc。
Rank_dense:rank_dense 也接受两个参数:聚合度量和排名顺序。这将相同的等
级分配给相同的值,但并没有就此停止,而是随着其他值不断增加。例如,如果
你的值是 10、20、20、30,则等级将为 1、2、2、3。
Rank_modified:rank_modified 将相同的排名分配给相似的值。
Rank_unique:rank_unique 为每个值分配一个唯一的等级。例如,如果值为
10、20、20、30,则分配的等级将分别为 1、2、3、4。

Dimensions(维度)或者 Measures(度量)

字段的背景颜色如果是蓝色,说明它是离散的,如果是绿色,说明它是连续的。

1. What is Tableau?

A. A database management system B. A business intelligence and data visualization tool C. A

programming language D. A web browser

Answer: B

1. Which of the following is a characteristic of a tableau worksheet?

A. A tableau worksheet can have multiple data sources. B. A tableau worksheet can have only one data

source. C. A tableau worksheet cannot have any filters or calculations. D. A tableau worksheet can only

display numerical data.

Answer: A
1. Which of the following is not a type of chart in Tableau?

A. Bar chart B. Line chart C. Pie chart D. Circle chart

Answer: D

1. What is a measure in Tableau?

A. A dimension that can be aggregated B. A calculation that returns a numerical value C. A categorical

variable D. A text string

Answer: B

1. What is the purpose of a filter in Tableau?

A. To exclude specific data from a visualization B. To include specific data in a visualization C. To sort

data in a visualization D. To change the color of data in a visualization

Answer: A

1. What is a dimension in Tableau?

A. A measure that can be aggregated B. A calculation that returns a numerical value C. A categorical

variable D. A text string

Answer: C

1. What is a hierarchy in Tableau?

A. A way of organizing data by category B. A type of chart C. A filter that excludes specific data D. A

calculation that returns a numerical value


Answer: A

1. Which of the following is not a type of join in Tableau?

A. Inner join B. Outer join C. Full join D. Vertical join

Answer: D

1. What is a calculated field in Tableau?

A. A measure that can be aggregated B. A calculation that returns a numerical value C. A categorical

variable D. A text string

Answer: B

1. What is a parameter in Tableau?

A. A filter that excludes specific data B. A way of organizing data by category C. A calculation that returns

a numerical value D. A user-defined value that can be used in calculations and filters

Answer: D

You might also like