BANL 1100 Review [Chinese]

BANL 1100 Review [Chinese]

Assessment

Flashcard

Business

University

Easy

Created by

Derek Nicoll

Used 1+ times

FREE Resource

Student preview

quiz-placeholder

40 questions

Show all answers

1.

FLASHCARD QUESTION

Front

分析像百度搜索日志这样的数据集的第一步是什么?

Back

清理和准备数据

Answer explanation

  1. 分析像百度搜索日志这样的数据集的第一步是清理和准备数据。这确保数据准确且可用于进一步分析,例如创建可视化或运行统计测试。

2.

FLASHCARD QUESTION

Front

以下哪项通常不是数据清理过程的一部分? 处理缺失值, 转换数据类型, 创建数据字典, 进行回归分析

Back

进行回归分析

Answer explanation

  1. 进行回归分析是一种用于预测的统计方法,而不是数据清理步骤。数据清理通常涉及处理缺失值、转换数据类型和创建数据字典。

3.

FLASHCARD QUESTION

Front

如何在R中创建直方图以可视化不同设备类型的响应时间分布?

Back

使用hist()函数和facet_wrap()

Answer explanation

  1. 要可视化不同设备类型的响应时间,请使用 hist() 函数为每个设备创建直方图。将其与 facet_wrap() 结合使用,可以为每种设备类型创建单独的图,从而有效地显示它们的分布。

4.

FLASHCARD QUESTION

Front

我应该使用什么统计测试来比较移动用户和桌面用户之间的点击率?

Back

Z检验

Answer explanation

Z 检验适合用于比较两个独立组(移动用户和桌面用户)之间的点击率,当样本量大且数据呈正态分布时

5.

FLASHCARD QUESTION

Front

如何使用ggplot2创建一个散点图,显示查询复杂性与搜索结果页面上花费时间之间的关系?

Back

使用 geom_point()

Answer explanation

  1. 要可视化查询复杂性与在搜索结果页面上花费时间之间的关系,请在 ggplot2 中使用 geom_point()。该函数创建散点图,有效地显示这两个变量之间的关联。

6.

FLASHCARD QUESTION

Front

哪些R包最适合清理和预处理百度搜索日志数据?

Back

dplyr和tidyr

Answer explanation

  1. dplyr 和 tidyr 非常适合清理和预处理数据,因为它们具有强大的数据操作和重塑功能。ggplot2 和 lattice 用于可视化,而 caret、glmnet、rpart 和 randomForest 则专注于建模。

7.

FLASHCARD QUESTION

Front

使用R可视化搜索量随时间变化的趋势最合适的方法是什么?
Options: 直方图, 散点图, 箱线图, 折线图

Back

折线图

Answer explanation

A使用 R 可视化搜索量随时间变化的趋势,最合适的方法是线图,因为它有效地显示了连续时间变量的变化和模式,便于解释趋势。

Create a free account and access millions of resources

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

By signing up, you agree to our Terms of Service & Privacy Policy

Already have an account?