泛亚电竞
Mou Mou Jidian Generator
发电机维修 发电机回收
发电机出售 发电机租赁
客户统一服务热线

050-572519593
12604669423

4发电机出租
您的位置: 主页 > 产品中心 > 发电机出租 >
泛亚电竞官网-九道数据科学面试题及谜底

泛亚电竞官网-九道数据科学面试题及谜底

本文摘要:几周前,我揭晓了一篇名为“微软数据科学面试问题和谜底”的文章。“这篇文章涵盖了18个问题中的前9个,我的朋侪在微软( Microsoft )的一次数据科学家职位面试中向我提出了这些问题。本周,我将尽我所能回覆剩下的九个问题。我们开始吧!问:处置惩罚贝叶斯问题的简朴概率问题答:我的推测是,他们可能会问关于贝叶斯定理的一般问题,并要求找出一个变量的值,给出其他变量的值。 我将简要先容贝叶斯定理的一个例子。

泛亚电竞官网

几周前,我揭晓了一篇名为“微软数据科学面试问题和谜底”的文章。“这篇文章涵盖了18个问题中的前9个,我的朋侪在微软( Microsoft )的一次数据科学家职位面试中向我提出了这些问题。本周,我将尽我所能回覆剩下的九个问题。我们开始吧!问:处置惩罚贝叶斯问题的简朴概率问题答:我的推测是,他们可能会问关于贝叶斯定理的一般问题,并要求找出一个变量的值,给出其他变量的值。

我将简要先容贝叶斯定理的一个例子。P ( A | B )是事件 A 发生的概率,假定事件 B 发生 P ( B | A )是事件 B 发生的概率,假定事件 A 发生 P ( A )是事件 A 发生 P ( B )的概率我将用一个例子来说明这是如何有意义的:P ( A )即是病人患肝病的概率.已往有10%的病人患有肝病。因此 P ( A )=0.1P ( B )即是病人酗酒的概率.已往5%的病人是酗酒者。

因此 P ( B )=0.05你也知道,7%被诊断为肝病的病人也是酗酒者。因此 P ( B | A )=0.07使用 Bayes 定理,你可以得出这样的结论: P ( A | B )=(0.07*0.1)/0.05=0.14因此,如果病人是酒精,他们患肝病的几率为14%。

如果 Bayes 定理仍然让你困惑,3Blue1Brown 做了一个难以置信的事情,以直观和直观的方式解释它-见这里。问:在应用机械学习算法之前,数据处置惩罚和数据清理有哪些步骤?答:在处置惩罚数据和清理数据时,可以接纳许多步骤。

以下列出了一些最常见的步骤:数据分析:险些每小我私家都从相识他们的数据集开始。更详细地说,您可以使用。

的形状和形貌。description ()。数据可视化:有时,使用直方图、 boxplot 和散点图来可视化数据,以更好地明白变量之间的关系,并识别潜在的离群值是很是有用的。语法错误:这包罗确保没有空格,确保字母巨细写一致,并检查输入错误。

你可以使用。unique ()或使用条形图。

尺度化或归一化:凭据您使用的数据集和您决议使用的机械学习方法,尺度化或尺度化数据可能很有用,以便差别变量的差别比例不会对模型的性能发生负面影响。处置惩罚空值:有许多方法可以处置惩罚空值,包罗完全删除空值行,用均值/中值/模式替换空值,用新的种别(例如未知)替换空值,预测这些值,或者使用可以处置惩罚空值的机械学习模型。其他的内容包罗:删除不相关数据、删除重复数据和类型转换。

泛亚电竞

问:如那边理不平衡二分类?答:有许多方法可以处置惩罚不平衡的二分类(假设您想要识别少数类):首先,您想重新思量用于评估模型的指标。模型的准确性可能不是最好的怀抱尺度,因为我将用一个例子来解释原因。

假设99次银行提款不是欺诈行为,1次提款是欺诈行为。如果您的模型简朴地将每个实例分类为“不欺诈”,那么它的准确度将为99%!因此,您可能需要思量使用准确和召回等指标。

另一种革新不平衡二分类的方法是增加少数民族分类的成本。通过增加这种处罚,该模型应更准确地对少数群体举行分类.最后,您可以将类的平衡提高到过采样的少数类或欠采样的多数类。你可以在这里读到更多。

问:箱形图和直方图有什么差别?答:虽然箱形图和直方图是用来显示数据漫衍的可视化方法,但它们的信息通报方式差别。直方图是图表,表现数值变量值的频率,并用于近似给定变量的概率漫衍。它允许您快速相识漫衍的形状、变化和潜在的离群值。

箱形图通报数据漫衍的差别方面。虽然您无法通过框图检察分发的形状,但您可以收集其他信息,如夸瓦片、规模和离群值。

当你想同时比力多个图表时,箱形图特别有用,因为它们占用的空间比直方图少。问:如何解决 L2正则化回归问题?A :不幸的是,我对脊回归不太相识,不知道 L2回归的问题是什么,可是如果你知道,请评论你的谜底,我会在这里加一个 shout !问:概率基础答:为此,我将检察这里列出的八条概率规则和四种差别的计数方法(请参阅更多)。八种概率规则规则1:对于任何事件 A ,0≤ P ( A )≤1;换句话说,事件的概率可以在0到1之间。

规则2:所有可能效果的概率和总是即是1。规则3: P (不是 A )=1-P ( A );此规则解释事件的概率与其补码事件之间的关系。

补码事件是一个包罗所有可能效果的事件,这些效果不在 A 中。规则4:如果 A 和 B 是不相交事件(互斥),则 P ( A 或 B )= P ( A )+ P ( B );这称为不相交事件的附加规则规则5: P ( A 或 B )= P ( A )+ P ( B )— P ( A 和 B );这称为一般加法例则。

规则6:如果 A 和 B 是两个独立事件,则 P ( A 和 B )= P ( A )* P ( B );这称为独立事件的乘法例则。规则7:给定事件 A 的事件 B 的条件概率为 P ( B | A )= P ( A 和 B )/ P ( A )规则8:对于任意两个事件 A 和 B , P ( A 和 B )= P ( A )* P ( B | A );这称为一般乘法例则计数方法事实公式: n != n x ( n-1) x ( n-2) x … x 2 x 1当项目的数量即是可用位置的数量时使用。

例如。找出5小我私家坐在5个空座位上的方式总数。

=5 x 4 x 3 x 2 x 1=120基本计数原则(乘法):此方法应在允许重复时使用,且填充打开位置的方式数不受以前填充的影响。例如。有3种早餐,4种午餐和5种甜点。

组合总数=5 x 4 x 3=60突变: P ( n , r )= n !/( n − r )!当不允许替换和项目排序重要时,使用此方法。例如。一个代码有4位数字的特定顺序和数字规模从0到9。如果一个数字只能使用一次,有几多排列?P(n,r) = 10!/(10–4)! = (10x9x8x7x6x5x4x3x2x1)/(6x5x4x3x2x1) = 5040组合公式: C ( n , r )=( n !)/[( n − r )!r !]当不允许替换时,使用此选项,排序顺序不重要。

例如。要赢得彩票,您必须从1到52的任意顺序选择5个正确的号码。可能组合的数量是几多?C(n,r) = 52! / (52–5)!5! = 2,598,960问:形貌马尔可夫链?答: Brilliant 提供了马尔可夫链的一个很好的界说(这里):“马尔可夫链是一个数学系统,它凭据一定的概率规则从一个状态转换到另一个状态。马尔可夫链的界说特征是,无论历程如何到达其当前状态,可能的未来状态都是牢固的。

换句话说,转换到任何特定状态的概率仅取决于当前状态和所经由的时间。”马尔可夫链背后的实际数学需要相识线性线性代数和矩阵,因此可能需要您进一步探讨这个主题。问:请形貌差别的正则化方法,例如 L1和L2正则化?答: L1和 L2正则化都是用来淘汰训练数据过拟合的方法。

泛亚电竞官网

最小二乘最小化平方残差的和,这可能导致低偏差但高方差。L2正则化,也称为脊回归,最小化平方残差的和加上 lambda 乘以斜率的平方。这个分外的术语叫做“脊背回归罚款”。

这增加了模型的偏差,使得在训练数据上的拟合更差,但也淘汰了方差。如果您接纳岭回归处罚并将其替换为斜率的绝对值,那么您将获得 Lasso 回归或 L1正则化。L2不那么结实,可是有一个稳定的解决方案,而且总是一个解决方案。L1更结实,但有一个不稳定的解决方案,而且可能有多个解决方案。

StatQuest 有一个关于 Lasso 和 Ridge 回归的精彩视频。问:神经网络基础答:神经网络是一个多条理的模型,灵感来自人类的大脑。

就像我们大脑中的神经元一样,上面的圆圈代表了一个节点。蓝色圆圈代表输入层,玄色圆圈代表隐藏层,绿色圆圈代表输出层。隐藏层中的每个节点表现输入经由的函数,最终导致绿色圆圈中的输出。

这些函数的正式术语称为 sigmoid 激活函数。本文由未艾信息(www.weainfo.net)编译,想看更多译文,接待大家点击上面的链接举行检察~也可以关注我们的民众号:为AI呐喊。


本文关键词:泛亚,电竞,官网,九道,数据,科学,泛亚电竞官网,面,试题,及

本文来源:泛亚电竞-www.syact.org

Copyright © 2005-2021 www.syact.org. 泛亚电竞科技 版权所有  ICP备案:ICP备12598181号-5